AIによるポリマー構造と特性の相関解明

ポリマーは現代生活のあらゆる場面で見られ、その用途はプラスチックや繊維から、電子機器や医療向けの先端材料にまで及びます。これらの多様性は、ポリマーが持つ物理的、化学的、電気的な特性の幅広さに起因しています。これらの特性は、構成単位であるモノマーの化学組成、ポリマー鎖の構造、そして採用される合成法といった多くの要因が複雑に絡み合うことで決定されます。この複雑さは、特定の用途に合わせたポリマー設計に無限の可能性を与える一方で、ポリマーの設計や選択において大きな課題ともなります。

近年、計算能力の急速な向上と、特に機械学習(ML)をはじめとする人工知能(AI)アルゴリズムの進展により、こうした課題に取り組む新たな道が切り拓かれています。機械学習の技術は、分類や回帰のタスクにおいて非常に高い効果を示しており、ポリマーの構造とその特性との間に潜む複雑な関係性を解明することに成功しています。ポリマー設計の文脈では、ポリマーの数値表現をもとに機械学習モデルを訓練し、その結果得られたモデルを用いて、所望の特性を持つ新規ポリマーの開発を導くことが可能となります。

ポリマー記述子:機械学習の潜在能力を解放する鍵

ポリマーの数値表現、すなわち「ポリマー記述子」は、ポリマーの構造と機械学習モデルへの応用をつなぐ重要な要素です。ポリマー記述子は、ポリマーの特性を決定づける本質的な構造情報を捉えることを目的としています。記述子の質や関連性は、機械学習による予測の精度と信頼性に直接影響を与えるため、適切なポリマー記述子の選定と開発は、MLを用いたポリマー設計の成功において効果的です。

ポリマー分子構造から特徴的な構造情報を抽出して数値データ化し、機械学習により与えられたポリマー記述子とターゲット変数となる物性の関係性を学習・予測。物性目標を指定して逆方向に最適な分子構造を探索する逆設計により、所望の物性を実現。

図1. ポリマー記述子と機械学習を用いた特性予測および逆設計

ポリマー構造から生成したポリマー記述子を機械学習と組み合わせることで、複雑な構造と特性をモデルを介して紐づけることができます。このモデルを用いることで、所望の物性を持つポリマー構造を逆設計できる期待が、ポリマーインフォマティクスにはあります(図1)。

ポリマー記述子は、大きく以下の2つの主要なカテゴリーに分類されます。

  1. モノマーレベル記述子
    個々のモノマーの特性に焦点を当てた記述子です。例えば、バックボーン中の炭素原子の数、分子量、リング構造か直線構造か、または官能基の存在などが挙げられます。モノマー・レベルの記述子は、ポリマーを構成するビルディングブロックに関する詳細な微視的情報を提供します。
  2. ポリマーレベル記述子
    ポリマー全体の物理的・化学的特性など、より大局的な特徴を捉える記述子です。ポリマー・レベルの記述子は、ポリマー構造の全体像をより包括的に理解するための視点を与えます。

モノマーレベル記述子

分子記述子は、モノマーにも適用できる重要なツールであり、複雑な化学情報をコンピュータが処理可能な数値データに変換するために不可欠です。詳細については、下記の過去の記事を参照してください。

一方で、ポリマーには独自の課題が存在します。小分子はその構造が明確に定義されているのに対し、ポリマーは多様性や分子量分布(ポリ分散性)を示すため、単一の構造で表現することが困難です。そこで、記述子の計算には、ポリマーを構成するモノマー単位を単純化した「擬ポリマー構造 (pseudopolymer)」を入力として用います。図2に示すように、この擬ポリマー構造を活用することで、関連する分子記述子の計算が可能となります。

ポリマーインフォマティクスではモノマー構造から擬ポリマーと呼ばれるポリマー単位を作成し、それを分子記述子(SMILESやフィンガープリントなど)へと変換し、最終的に機械学習へ入力。ポリマー特性の予測や新規材料設計が可能に。

図2. 擬ポリマー (pseudopolymer) 構造によるモノマーレベル記述子

ポリマーレベル記述子

ポリマーの性質は、数値化が難しい構造的特徴に大きく依存します。そこでポリマーレベルの物理化学的記述子を組み込むことで、機械学習モデルの予測精度が大幅に向上します。例えば、分子動力学(MD)シミュレーションや密度汎関数理論(DFT)といった技法は、様々なスケールで特徴量を提供し、MLを用いた物性予測の精度と解釈可能性を高める役割を果たします。図3は、DFTおよびMDシミュレーションから得られるポリマー性質の例を示しています。

ポリマー記述子としてのDFTとMDを用いたポリマー特性の導出手法を示す。疑似ポリマー構造からDFT計算で光学・電気特性を取得し、MD力場を設定後、ポリマー鎖の3次元構造を作成してMDシミュレーションを実施、熱・機械特性を得る。

図3. DFTおよびMD計算から得られたポリマーレベル記述子の例

(1) DFT計算による量子化学特性の記述子
SMILESで表記される擬ポリマーから、コンフォーメーション探索等を経てDFT計算により光学的・電気的特性を計算します。これらはモノマーレベル記述子として用いることができます。

(2) MD力場パラメータを用いた記述子
続いて、ポリマー鎖の生成から3次元の初期構造を作成し、MDで用いる力場(相互作用ポテンシャル)の設定を行います。結合長・結合角といった結合項や、ファンデルワールス相互作用、静電相互作用といった非結合項を含む力場パラメータは、それ自体として記述子として用いることが可能です。これらのパラメータは物理的に明確な意味を持つため、解釈性が高く、またポリマーの微視的な特性も反映しているものと考えることができます。

(3) MD計算による物理的なマクロ特性の記述子
その後、ポリマーセルを作成し、MD計算を実行します。熱伝導率や比熱容量、体積弾性率など様々な物理特性をシミュレーションの挙動から抽出することができます。

高分子シミュレーションから得られる多様なスケールでの特徴量を、機械学習による物性予測モデルのインプットとしても活用することで、物性予測の精度が向上するだけでなく、結果の解釈性も高まります。その結果、分子の挙動と物性の間の関係性についての新たな発見も期待されます。

ポリマー記述子の課題と進行中の研究

機械学習を用いたポリマー設計の分野では、これまで大きな進展があったものの、いくつかの課題が依然として残っています。化学空間の広大さ、ポリマー構造と性質の間に存在する複雑な関係、そしてポリマー構造を正確に数値表現する難しさなど、これらの要因がMLの応用を一層困難にしています。

現在、ポリマー記述子に関連する研究では、下記3点のテーマが特に注目されています。

  • 効果的な新規ポリマー記述子の開発
  • 革新的な機械学習アルゴリズムの探索
  • より大規模で包括的なポリマーデータベースの構築

これらの取り組みは、幅広い用途に対応する新規かつ改良されたポリマーの開発を加速させる大きな可能性を秘めています。これらのテーマの中で、さらにトピックとして言及されるのが下記の4点です。

  • 記述子の選定:適切な記述子の選択は極めて重要です。研究者はまず多数の候補記述子を生成し、その後、特徴選択技法を用いて最も関連性の高い記述子を特定します。
  • データ品質:MLモデルの精度は、訓練に用いるデータの質に大きく依存します。ポリマーデータベースは正確で、包括的かつ適切に管理されている必要があります。
  • 解釈可能性:MLモデルが正確な予測を行うことは重要ですが、なぜ特定のポリマーが特定の性質を持つのかを理解することも同様に重要です。
  • 実験との統合:MLは実験の指針として活用でき、実験データはMLモデルの改良に役立ちます。この反復的なプロセスは、ポリマー研究のスピードを大幅に向上させる可能性があります。

これらの課題に取り組み、記述子開発およびML応用の両面で限界を押し広げることで、ポリマー科学の分野は今後大きな突破口を迎えると期待されます。機械学習を駆使したポリマー設計は、これまで以上に持続可能で効率的、かつ高性能なポリマーの創出に寄与し、さまざまな応用分野に革新をもたらす可能性を秘めています。

本記事はポリマー記述子について概観のみのご紹介でしたが、今後miLabではより深ぼった技術紹介をしていきますので、ぜひチェックください。

参考文献

  • Zhao, Y.; Mulder, R. J.; Shadi Houshyar; Le, T. C. A Review on the Application of Molecular Descriptors and Machine Learning in Polymer Design. Polymer Chemistry 2023, 14 (29), 3325–3346. https://doi.org/10.1039/d3py00395g.
  • Gurnani, R.; Kamal, D.; Tran, H.; Sahu, H.; Scharm, K.; Ashraf, U.; Ramprasad, R. PolyG2G: A Novel Machine Learning Algorithm Applied to the Generative Design of Polymer Dielectrics. Chemistry of Materials 2021, 33 (17), 7008–7016. https://doi.org/10.1021/acs.chemmater.1c02061.
  • Hayashi, Y.; Shiomi, J.; Morikawa, J.; Yoshida, R. RadonPy: Automated Physical Property Calculation Using All-Atom Classical Molecular Dynamics Simulations for Polymer Informatics. npj Computational Materials 2022, 8 (1). https://doi.org/10.1038/s41524-022-00906-4.