はじめに
みなさまこんにちは、脇内と申します。
この記事は、マテリアルズ・インフォマティクス(以下MI)や実験自動化に関するプロジェクトと、その中で私が主に関わった一部研究の概要を紹介するものです。加えて、とりわけこれらの分野にどう取り組んでいこうかなと考えておられる実験科学者・研究開発者の方々に焦点を当てて、何か私からお伝えできないかと思い、自身のこれまでを振り返りながら、あれは大事だったかもしれない、と感じるものを書き連ねました。
なお、結論は「MIに取り組むには、MIから取り組まなくてもよい」になってしまいました。なんてことを!と思われた方は、お付き合いいただければ幸いです。
自己紹介
改めまして、脇内 新樹(わきうち あらき)と申します。JSR株式会社の研究員であり、奈良先端科学技術大学院大学のマテリアルズ・インフォマティクス研究室の共同研究員でもあります。統計数理研究所との共同研究機関にも所属しています。
私のバックグラウンドは高分子合成ですが、今はMIや自動化装置を組み合わせた実験自動化に取り組んでいます。高分子研究開発の新しいかたちを日々考えながら、フラスコと、コンピュータと、そこから繋がったポンプ・ロボットアーム・3Dプリンタを触っています。
どうしてこんなことになったかと言えば、それはもう様々なご縁によって流れ着いたとしか申し上げようがありませんが、なぜこの分野に取り組み続けているのかと問われれば、「ラクをしたいから」です。
最近は世の中も目まぐるしいものです。
大規模言語モデルの普及と発展が目覚ましいですね。これまでは概ね単語の羅列で検索していたものが、会話しながら調べられるようになりました。ハルシネーションに気を付ける必要はありますが、疑問をその場で問いかけて教えてもらえるのは画期的ですね。触るたびに、自分の中の「学習」の定義がどんどん揺らいでいきます。
大きな資本を持ったビッグテックが、マテリアル産業にも手を伸ばしてきています。これまでは現実世界との結びつきが強くデジタル化しづらいために、デジタル化の劇的な変革から多少距離がありましたが、これからはどうなっていくのでしょう。
実験自動化、自律化の研究が盛んです。膨大な実験の実行と分析をマシンに任せてしまう、人間から切り離されて進む科学実験が盛りあがる中、人間としての自分はどうコミットしていけるのだろうと、これからの人生を考える日々です。
目の回るような時代の中でラクをしたい私としましては、これからの学習を、これからの産業を、これからの人生を、おぼろげにでも把握しておかないことには、心配で落ち着きません。少しでも安心するために日々勉強しているところです。
世界が大規模言語モデルの普及で急加速に入る少し前、2021年に、私はNEDO先導プロジェクトに参画しました。「データ駆動科学によるスマートスケーラブルケミストリーの確立」というテーマで、マテリアルズ・インフォマティクス研究室 藤井 幹也 教授を代表として、図1に示す様々な分野の専門家による、化学実験、機械学習、計算科学、実験計画、プロセス開発、ロボット工学を融合した、学際的なテーマでした。2023年度末に終了しましたが、最終評価として最高の「評価基準に適合し、非常に優れている。」をいただきました。
![](https://images.microcms-assets.io/assets/2b0e6e88ed3e4ddb91bb10b27cdc86b0/13d5a26e680346aeb848e76001e03952/e0002_image01.png?fm=webp&w=1920)
図1. NEDO先導プロジェクトテーマ「データ駆動科学によるスマートスケーラブルケミストリーの確立」の概要と代表者の方々
今回対象とした重合反応(フリーラジカル重合)は、長大な分子「高分子(ポリマー)」を形成する反応です。開始剤と呼ばれる分子の分解によって反応性の高いポイントが生まれることに始まり、そのポイントを起点とした連鎖反応によって、文字通り鎖のように繋がっていくモノマー分子から、目的の高分子が形成されます。特に複数種のモノマーを混ぜて繋げる場合は共重合と呼ばれます。このメカニズムから、得られる分子の構造特性に分布があり、また反応液の粘度が時々刻々増大することによる、特有の難しさがあります。特に小規模の実験と、大規模な製造プロセスで、反応環境を完全には揃えられず、それゆえスケールアップの段階で躓いてしまい、大規模な実験を繰り返さなくてはならなくなることもしばしばあります。この困難さが参入障壁でありつつ、デジタル化、自動化が進まない要因でもありました。
この問題を解決するために各分野のプロフェッショナルが集う、極めて異色で先進的なプロジェクトの中で、私は幸運にも揉まれることとなりました。
![](https://images.microcms-assets.io/assets/2b0e6e88ed3e4ddb91bb10b27cdc86b0/2f0ce19409cb42a4a5d3044012bd246d/e0002_image02.png?fm=webp&w=1920)
図2. 高分子の共重合プロセスとその課題
研究紹介
異分野の大胆な掛け合わせにより、本プロジェクトでは様々な成果が創出されましたが、私からは2つほど簡単に紹介いたします。
フロー反応のデジタル制御
一つは、ポンプをデジタル制御することにより、多くの条件を切り替えて実施できるフロー重合装置を用いた実験です。フロー反応装置は、フラスコなどの器に一定量の液を溜めてから反応を進めるバッチ反応装置と異なり、反応させる液をポンプで細長い流路に送り込むものです。ポンプの制御で組成比を簡単に変更でき、かつ反応環境を緻密にコントロールしやすいなど、デジタルと相性の良い特徴があります。特に1mmを下回る幅のマイクロ流路では、複数の流れをぶつけ合わせることで液どうしを緻密に混合できることが知られています。しかしながら、反応の進行に従って粘度が上昇する重合は、細い流路が閉塞してしまうリスクと隣り合わせです。マイクロ流路となれば、さらにリスクは跳ね上がります。
そこで、緻密な混合を実現できるマイクロ流路は、反応前に通過してしまって、反応はミリメートル幅のチューブで行うことにしました。この装置を導入することで、重合実験のデジタル化が進みました。
![](https://images.microcms-assets.io/assets/2b0e6e88ed3e4ddb91bb10b27cdc86b0/757f598dafdd409c8cf2b471fe8de545/e0002_image03.png?fm=webp&w=1920)
図3. フロー実験装置の概略図
モノマー濃度のインライン監視
こうして、均一で連続的な高分子合成を組めるようにはなりましたが、製造を意識するならば、「本当に均一なのか?」という品質に関する懸念に応えなくてはなりません。連続的に液が出て来るものを都度サンプリングして測定するにも限界がありますから、理想的にはチューブ内を流れる液を直接(=インラインで)分析したいところです。
そこで、赤外分光測定の可能性を検討しました。インライン測定装置の中では比較的安価でありつつ、様々なモノマー種に対応できます。出現するピークの面積は、低い濃度域であれば概ね対応する成分の濃度と比例します。しかし、様々な構造に対応するピークが一気に得られるゆえに、ピークどうしが重なり解析を妨げます。特に赤外分光のピークはしばしばブロードになるため、重なりやすい傾向があります。また、微妙な温度変化によってベースラインが揺らぎます。
このような解析における課題を解消するべく、ウェーブレット変換を導入した機械学習手法を開発しました。適した幅のウェーブレット関数を用いて変換すると、ベースラインの変動をある程度打ち消して、ピーク面積に比例する情報を抽出してくれます。様々な幅でウェーブレット変換を適用した結果を、全てまとめて線形モデルに与えることで、重合液中モノマー濃度の赤外分光スペクトルからの予測精度が向上しました。
![](https://images.microcms-assets.io/assets/2b0e6e88ed3e4ddb91bb10b27cdc86b0/1dec4041ae904bd78a88a62da2e123ac/e0002_image04.png?fm=webp&w=1920)
図4. ウェーブレット変換と線形回帰を組み合わせた機械学習モデルの概略図
以上、フローでの重合装置とその監視システムを確立しましたが、やはり製造を考慮しますと、最終的にはバッチのメリットも必要になります。そこで、バッチを組み合わせたフローバッチ装置を開発し、こちらについても現在検討を進めているところです。
問題に取り組むために:”距離”の重要性
MIを含めた、マテリアルをデジタルに扱おうとする試みは、常に複数分野にわたる工夫が求められます。よって、異分野にアンテナを拡げ、新しいことに積極的に取り組んでいく必要があります。
…そう、新しいことに興味を持ち、試してみる。重要ですよね。重要だと思います。とはいえ簡単なことではありません。そんなこと言われたって、すぐに興味を変えられるわけないじゃない、というのが本音。
経験上、最もシンプルに達成する方法は、別の組織に飛び込むことです。
人間の想像力は素晴らしいですが、限界はあるものです。今の自分から距離のあることに対して、たとえそれが重要と分かっていても真剣になりきれないのは、今目の前にある、自分に近しいもののほうが大事だからです。
たとえばそうですね、すぐ近くの机の上にボールペンはありますか?なければ想像いただくとして、そのボールペンが机から落ちそうになったのを見たとします。
とっさに押さえようと手を伸ばすでしょう。つまり、他のことに優先してアクションしたわけです。だからといってまさか、「ボールペンが床に落ちないこと」が他に優先すべき最重要事項だと思ったためではないでしょう。距離が近いから、ボールペンが落ちそうなことを見つけられ、どうアクションすべきかを即座に判断でき、手を伸ばすコストがわずかですんだのです。距離さえ近ければ、まったく些細で大したことのないトラブルにも、優先的に行動できる/してしまう場合があるわけです。距離は、自分が何を見て、どうアクションするかに密接に関わる、極めて重要なパラメータと言えるでしょう。
であれば、興味の対象を変えるための最もシンプルな方法は、対象との“距離”を変えること、すなわち自身の立ち位置を変えることでしょう。当事者でないのに当事者意識を持とうとするよりも、当事者になるほうがシンプルです。
近場で見つける“マイ・イシュー”
とはいえ別の組織に飛び込むのは、誰にとっても気軽なこととは限りません。シンプルな解法だからといって、簡単とは限らないものです。
すぐに立ち位置を変えることが難しいとしたら、どうしましょう。いずれ良いものの近くへ行ける、あるいは良いものがやってくることに期待して、今近くにある課題を考えるのが良いように思います。
それは別にマテリアルについてではなくとも、業務関連でなくとも、“真面目”なものでなくともかまいません。課題のジャンルが何であるかよりも、“距離”のほうが重要です。自分の現在地に近い、自分だけの課題”マイ・イシュー”です。
私自身、振り返れば、MIや自動実験の世界で思い付いたアイデアの出所の多くは、マテリアル関連研究ではありませんでした。そうそう問題の近くに、都合の良いことは転がっていないものです。
そもそも私がPythonによるデータ解析に興味を持ったきっかけは、プライベートで、ゲームキャラクターデザインの特徴を数値として得ようとする記事を見かけたことでした。それ自体はマテリアルとは無関係でカジュアルなものでしたが、しかしもちろん、画像特徴の取得は現在の業務と密接に関係します。
インフォマティクスの最も面白いところは、人間の常識を飛び越えた応用ができることだと思います。具体的な対象が何であれ、得られている情報の形式と最終的に欲しい情報の形式、つまりインプットとアウトプットそれぞれの形式さえ同じ系であれば、常に手法を水平展開できる可能性があります。インプットが画像だとすれば、その画像がスマホのカメラで撮った人物か、顕微鏡で撮ったマテリアル表面か、マンガの1ページかを問わず、人物が誰か、マテリアルが何か、マンガの作者が誰かを表現する特徴を抽出するために、同じ手法を使いまわせます。それぞれの場面で手法が有効かは別の話ですが、それは結果が出た後で考えれば良いことです。
「MIで大事なこと」と、「MIを求める人にとって大事なこと」
しかし、MIに取り組まなければいけないと思っているのに、MIから始めなくていいなんて、なんだかキツネにつままれたようで、受け入れがたい主張かもしれません。そこでより強く、「MIそのものから取り掛からないほうが良い理由」を示します。
MIにとって大事なことは何でしょうか。
第一に、対象とするマテリアルをうまく表現したインプットを作ることです。インフォマティクスはデジタル情報を対象にします。現実の物質であるマテリアルを、コンピュータの中にそのまま突っ込むことができない以上、必ず何らかの変換が必要です。
第二に、知りたいことに関する情報を得られるような、デジタル情報を選定することです。繰り返しますが、インフォマティクスはデジタル情報を対象にします。インフォマティクスから得られる情報もまた、デジタルです。一方でマテリアルのふるまい自体はデジタルではありません。よって、知りたいことに繋がるデジタルなアウトプットを得るところまでが、インフォマティクスの仕事になります。
第三に、インプットからうまくアウトプットを得られるようにすることです。ここでの「うまく」とは、優れた特性のマテリアルを得る合成条件を見つけるであるとか、求めたい特性を精度良く予測できるようになるとかですね。インフォマティクスの中核であり、デジタルで完結する必要があります。
どんなに単純化しても、MIには3つもの要素が絡み合います。
![](https://images.microcms-assets.io/assets/2b0e6e88ed3e4ddb91bb10b27cdc86b0/e4b843eae6d1406e83b802a4857ddbf4/e0002_image05.png?fm=webp&w=1920)
図5. MIで大事なこと
なぜ、これらの手法を洗練することが大事なのでしょう。優れた手法から得られた結果があれば、優れた考察が可能になり、優れた結論を得やすいからです。優れた結論は多くの人を納得させ、行動を変化させる決断に導きます。そして決断が他者より早ければ早いほど、ビジネスも学術研究も、時間的に有利になります。100万回の実験をする前に、その価値に匹敵する結論をもとに決断できたなら、どんなにラクでしょう。
さて。ということは、MIを求める人にとって最終的に大事なのは、「良い決断をいかに早くできるか」です。その一歩手前で大事なのは、「どうしたら納得できるか」です。
図6. MIを求める人にとって大事なこと
あなたが人生の重要な決断を即座に行わなければならない時、財布のコインを取り出して、弾いて決めても良いでしょう。コイントスは裏か表を自動的に吐き出す“モデル”です。それで納得できるなら有効です。
しかし、マテリアルを専門とする組織において、ステークホルダーを納得させるために、コインを投げて決めました、というわけにはいかないでしょう。
申し上げたいのは「ある情報を入れて、自動的にある結果が出てくる」こと自体が重要なわけではない、ということです。どんな予測モデルも、インプットとアウトプットの形式には厳格ですが、そこさえ守られればあとは愚直で、奔放で、空気を読みません。素晴らしい性質ですが、あなたにとって役に立たない情報を無尽蔵に吐き出すことも可能です。
ですから、MIに取り組むよりもまず先に、「何を決断するために、どうすれば納得できるか/させられるか」を決める必要があります。それがあってこそ、インプットは何を入れるべきで、アウトプットは何が得られるべきか決まりますし、MIで解決可能か調査できるようになります。
以上が、あなたの目の前にマテリアルに関する問題があって、MIを使える可能性があると思ったときに、MIの手法から取り掛かるべきではない理由です。もっと重要な「最終的な決断プロセスの定義」が、MIの手法調査に先立つからです。
そして大抵、この調整はかなり大変です。多くの人を巻き込んだ重要な議論となるでしょう。MIがちょっと気になるな…という気持ちと、温度差があると思う方もいませんか?私はそんな方を想定して書いています。
もし挑戦したいという情熱的な方なら、これを“マイ・イシュー”にしましょう。その場合は、MIへの道筋はシンプルです。とはいえ、シンプル=簡単とは限りません。手段と目的の両方が曖昧なままの挑戦は時間を浪費するおそれがあるので、MI手法に詳しい人と組んで開始することを強くお勧めします。
以上を踏まえて、はじめに戻ります。私が申し上げたいのは、「MIに取り組んでみるために、マテリアルから始める必要はないし、インフォマティクスが開始点ではない」ということです。試しに取り掛かってみるなら、そのとき最初に考えるべきは、あなた自身のイシューです。あなた自身の決断と、それを導くあなた自身の納得に関するイシューです。
スポーツ観戦がお好きで、お気に入り選手の強さをデータからアピールしたいかもしれません。楽器がもっとうまくなりたくて、自分の演奏の出来を知りたいと思っているかもしれません。特に料理が好きではないけれど、今日の冷蔵庫の中身で何を作るか悩んでいるかもしれません。新規マテリアル開発業務で次の実験に困っているかもしれません。
あなたのイシューは、どんなインプットとアウトプットを対応づければ解決しそうでしょうか。それらはデジタルに表現できますか?もしそこから一歩進んで何かを試してみて、イマイチだなと感じたらしめたものです。その不満を燃料に、気になることがどんどん増えていきます。
“マイ・イシュー”は誰にも話さず、心に秘めるだけでも構いません。気になった程度の時点では、大抵伝わらないか、奇異の目で見られるかです。相手はあなたとは異なる立ち位置にいる、そのイシューとの“距離”が異なる人ですから。もしあなたに、自分でもよく分かっていない段階の話に付き合ってくれる相手がいるなら、ぜひお話ししてください。そしてその貴重な存在を全力で大事にすることが、いずれ価値ある活動に繋がるでしょう。とはいえ最近なら、大規模言語モデルがその代替になるかもしれませんね。なんだか人情に欠ける気もしますが、便利な時代になったものです。
まとめ
MIが気になっている実験科学者の方に向けて、「MIに取り組むためにMIから始めなくて良い」と言い放つ裏にあるのは、マテリアルはちょっと大変で、インフォマティクスはかなり奔放で、「最後にどう決断するか」を先に固めるべきだという主張なのでした。
もしあなたが、「机の上から落ちそうなボールペン」くらい、身近で些細で明らかなイシューを見つけられたなら、それはとても取り掛かりやすい、素晴らしいイシューです。あなた自身の決断と納得に思いをはせてください。小さく始めてみて、いずれ他人に向けた説得も考えていきましょう。そこからどうしていくかは、詳しそうな組織の門戸を叩くか、親身になってくれる人に尋ねるか、大規模言語モデルに質問しましょう。
Materials Informaticsは、”My Issue”から始めましょう。
From “MI” to MI.
ありがとうございました。
参考文献
- イシューからはじめよ[改訂版]――知的生産の「シンプルな本質」(著:安宅和人, 発行:英治出版)
「My Issueから始めましょう」は、シャレをきかせるために選んだ表現ですが、そういえばそんなタイトルの本があったなと執筆中に拝読しました。とても体系的にまとまった素晴らしい書籍だと思います。イシューの選定に関する主張が異なりますが、対象とする問題の性質が異なるためと考えます。 - A. Wakiuchi et al., “Composition regulation by flow copolymerization of methyl methacrylate and glycidyl methacrylate with free radical method,” Macromolar Materials and Engineering, vol. 308, no. 6, Jun. 2023, doi: https://doi.org/10.1002/mame.202200626.
フロー共重合に関する論文です。 - S. Takasuka et al., “Bayesian optimization of radical polymerization reactions in a flow synthesis system,” Science and Technology of Advanced Materials: Methods, vol. 4, no. 1, Dec. 2024, doi: 10.1080/27660400.2024.2425178.
ベイズ最適化による、目標の合成を実現する条件最適化の共著論文です。 - A. Wakiuchi et al., “Chemometrics approach based on wavelet transforms for the estimation of monomer concentrations from FTIR spectra,” ACS Omega, vol. 8, no. 22, pp. 19781–19788, Jun. 2023, doi: 10.1021/acsomega.3c01515.
スペクトルから成分濃度を予測する機械学習手法に関する論文です。 - A. Wakiuchi et al., “Multiple comonomer concentrations prediction from FTIR spectra with quantum chemistry-based interpretation,” MRS Communications, 2024, doi: 10.1557/s43579-024-00568-x.
スペクトルから複数成分濃度を予測する機械学習手法と、量子化学計算による考察に関する論文です。