はじめに

近年、AI技術や研究機器のリモート化・スマート化が急速に発展し、研究のデジタルトランスフォーメーション(研究DX)が世界的に加速しています。研究DXによって新たな価値創造が期待されており、その要素としては大きく「データ創出」、「データ統合・管理」、「データ利活用」の3つが挙げられます。これら3つは相互に密接に関連し合いながら、研究活動を効率化・高度化する基盤を形成します。

特に、リモート化・スマート化により実験データの創出効率が飛躍的に向上し、AIや機械学習を活用することでデータを高度に利活用する動きが活発化しています。一方で、データ創出と利活用の橋渡しとなる「実験データの統合・管理プラットフォーム」の整備は未だ十分とは言えず、その具体的な手法や事例が求められています。

本記事では、この課題に対する取り組みとして、「電子ラボノート」を中心に据えた実験プラットフォームと、ロボットアームを用いた自動実験の取組みを紹介します。電子ラボノートを研究活動のハブとすることで、研究DXをさらに加速させるための方策を提案します (図1)。

図1. 電子ラボノートの位置付け

研究DXとFAIR原則、世界の動向

研究DXが進むとともに、研究データの重要性が改めて認識されており、FAIR原則が注目を集めています。FAIR原則とは、"Findable (見つけられる)", "Accessible (アクセスできる)", "Interoperable (相互運用できる)", "Reusable (再利用できる)"の頭文字を取ったもので、2014年にFORCE11で提唱されたデータ共有の指針です。研究データをよりオープンかつ再利用可能な形で蓄積・公開することが、国際的な潮流となっています。

欧州では、FAIR データ基盤を構築するためのコンソーシアム「FAIRmat」が設立され、材料情報を管理・共有するオープンソースサービス「NOMAD」を開発しています。また、米国国立標準技術研究所(NIST)が推進する「FAIR Digital Object Framework」など、世界各地で FAIR原則に基づくデータインフラ整備が進行中です。

一方、材料科学や化学などの分野においては、Materials Research Society (MRS) が開催する国際会議でも機械学習や自動実験に関するセッションが増えています。特に「Automated Experimentation(実験自動化)」「Autonomous Experimentation(実験自律化)」「Large Language Models(大規模言語モデル)」といったトピックが注目を集めており、人間の手を介さない実験手法を実現するための研究が活発化しています。このような最先端の研究を進める上でも、FAIR 原則に基づいたデータの管理と共有が不可欠であり、データの信頼性をいかに確保するかが重要課題となっています。

研究DXにおける統合プラットフォーム構築の要点

研究DXによる成果を最大化するためには、データの創出から統合・管理、利活用までをシームレスにつなぐ統合プラットフォームが求められます(図2)。ここでは、その要点を以下の3つに整理します。

1. 実験データ創出の自動化・効率化
ロボットアームや大規模計算装置等を用いた実験プロセスの自動化、ハイスループット化
リモート操作や遠隔監視による場所・人員的制約の緩和

2. データの一元管理
実験条件、測定結果、解析結果などを統合し、時系列・関連性が分かる形で蓄積
データ解析や機械学習を想定したメタデータ整備

3. 機械学習や情報解析による利活用
蓄積された大規模データを活用し、高度な材料探索や実験条件最適化などを推進
研究者とデータサイエンティストが連携しやすい環境整備

図2. 研究DXによる価値創造に必要な3つの要素

電子ラボノートを活用した研究DXの価値創造

上記の統合プラットフォームを構築するうえで重要な役割を果たすのが「電子ラボノート」です。電子ラボノートを研究活動のハブとして機能させることで、以下のような価値創造が期待できます。

1. 物体とデータの移動の分離により、どこでも誰とでも研究が可能
実験サンプルなど物理的な移動が必要な場面を最小化し、データはすべて電子ラボノート上で共有・参照可能にすることで、場所を問わず研究が可能になります。複数の研究室や企業との共同研究等、地理的な制約が大幅に緩和されます。

2. 加速的な実験サイクルの形成
電子ラボノートで一元管理された実験データをもとに機械学習モデルを構築し、モデルが提案する新たな実験条件を自動実験で実行するというループが高速化します。合成条件の最適化や材料探索など、膨大な組合せを網羅的に検討できます。

3. 研究データのFAIR化と品質向上
電子ラボノート上で実験メタデータやログを蓄積することで、FAIR原則に沿ったデータ管理を実現し、機械学習に活用できる高品質なデータセットを得やすくなります。

自動化プラットフォームを用いた合成条件の最適化 (An integrated self-optimizing programmable chemical synthesis and reaction engine)、自律実験ロボットで8日間に約700回の実験を実施 (A mobile robotic chemist)、VRゴーグルを活用したロボットハンドの遠隔操作 (Intelligent Multi-fingered Dexterous Hand Using Virtual Reality (VR) and Robot Operating System (ROS)) など、近年では自動実験・リモート実験に関する研究が多方面で進展しています。これらの実験から得られる膨大なデータを体系的に電子ラボノートへ記録・活用するプラットフォームを整備することで、どこでも誰とでも研究することが可能になると考えています。

電子ラボノート導入のハードルと対策

電子ラボノートの導入には多くのメリットがある一方、大学や企業を問わず普及率はまだ高くありません。一般的に考えられる理由として、使用感、価格、データ管理、セキュリティ管理および過去(紙)データのデジタル変換等が挙げられますが、これらのほとんどが電子ラボノートの機能に関する課題です。電子ラボノートの導入ハードルは機能面だけでなく、以下に示す3つの心理的ハードルも考慮する必要があります。

電子ラボノートを使用しなければならない理由はあるのか?

  • データをまとめる際、既にデジタルツールを使用している (Excel, Word, PowerPoint, etc.)
  • 測定、分析データはcsv, jpgファイル等のデジタル形式で保存されている

筆者の考え:

電子ラボノートを使用する理由はあると考えています。キーワードは「FAIRデータ」です。ExcelやPowerPointによるデータ共有だと、ファイルの中身までを含めた全文検索が一般的に難しく、FAIRデータとは言い難いです。実験条件、結果が記載された電子ラボノートと分析データを結びつけてデータ共有することで、FAIRデータとして一元管理が可能となります。

多様な実験に対応することができるのか?

  • 同様の実験においても、実験手順や工数が異なる場合が多々存在
  • 手書きより記述の自由度が下がる電子ラボノートを使用する意味とは?

筆者の考え:

現状の検証では対応できていると考えています。合成系や解析系の研究室を含め多様な実験で試していただいています。シミュレーションや情報科学のドライ系の研究室での検証も実施し始めました。

情報共有されてしまうという心理的ハードルが生じてしまう

  • 実験失敗データを共有することに抵抗を感じる
  • 監視されるように感じる

筆者の考え:

オープンコミュニケーションの文化形成が必要だと考えています。普段からオープンな場であるグループウェアやチャットツール等を活用してコミュケーションをとっています。

上記ハードルを超え、多様な実験でFAIRデータの蓄積が可能なプラットフォームの確立を目指します (図3)。

図3. 目指す実験ワークフロー

eLabFTW の採用理由と特徴

上記背景や選定基準(表1)を踏まえ、オープンソースの電子ラボノート"eLabFTW"を導入しました。eLabFTWは研究室のベンチで始まり、研究者を支援するために作られたソフトウェアです。シンプルなGUIであり、Application Programming Interface; APIを用いたデータの入出力が可能であることから、実験科学者とデータサイエンティストにとって適した電子ラボノートであると言えます。また、開発者がCEOを務める保守サービス会社Deltablotを利用することで、データ管理、システム管理、セキュリティ管理を委託することができます。

必要検討項目

内容

① 使いやすさ

使いたい or 使ってもいいと思えるか

② 価格

導入および継続利用できうる価格

③ データ管理

バックアップ、容量管理

④ システム管理

OSやソフトのアップデート対応

⑤ セキュリティ管理

情報漏洩対策、アカウント管理

実装事例:電子ラボノート+ロボットアームによる自動実験プラットフォーム

本研究室では、eLabFTWとロボットアームによる実験自動化を連携させることで、実験条件の設定から測定データの取得・蓄積、さらには利活用までを一元管理する自動実験プラットフォームの構築に取組んでいます。ここでは、その取組みの一部を紹介します。

テンプレートの設計と視認性の確保

実験科学者とデータサイエンティストの双方にとって使いやすいシステムを構築するには、「人が読みやすい形式」と「プログラムが処理しやすい形式」を両立させたテンプレート設計が不可欠です。本研究室では表のヘッダーを2列用意し、双方の形式をそれぞれ記載することで両立させました (図4)。これにより、実験者の負担を最小限に抑えつつ、機械学習やデータ解析に適したデータ構造を同時に実現しています。また、研究室やプロジェクト単位でフォーマットを揃えており、後段の解析効率を考慮した設計にしました。

図4. 実験者の視認性およびプログラム処理を考慮したテンプレートおよびAPI出力結果

QR コードによるサンプル管理

電子ラボノートがURLベースで管理されている点を活かし、サンプル容器に貼付したQRコードから該当ページにアクセスできる仕組みを導入しました (図5)。膨大なサンプルが発生するハイスループット実験においても、実験条件や分析結果の追跡が容易になり、実試料を含めた実験データの一元管理および作業効率の向上が見込めます。また、人が目視で判別しやすくするため、ラベルにサンプルIDとQRコードを併記しました。これにより紛失や取違いを防ぐ効果が期待できます。

図5. QRコードによるサンプル管理

電子ラボノートと自動実験プラットフォームの統合

本研究室では、eLabFTWとロボットアームを連携させ、無機酸化物薄膜作製の自動実験を一元的に管理するプラットフォーム構築に取組んでいます (図6)。

筆者らは、低価格かつ高い基本性能が特徴の「DOBOT Magician」というロボットアーム を導入しました。電子ラボノートの導入や実験自動化は、一見有用であると直感的に感じられる一方で、ユースケースの少なさやコスト面への懸念などから、導入を躊躇もしくは断念してしまうケースが少なくありません。これは承認者側の心理的ハードルや費用対効果の不透明さが主な要因であると考えられ、導入の承認を得やすい環境づくりや気軽に検証できる環境整備が求められます。

こうした課題を打開するためには、多種多様なユースケースを数多く集積し、検討に携わる者同士がコミュニティとして発展させていく必要があります。そこで本研究室では、低価格ロボットアームとオープンソースの電子ラボノートを組合せ、容易に検討でき、かつ実用性の高い自動合成プラットフォームの構築を目指しています。

1. 電子ラボノートの作成および実験条件登録
APIを用いてラボノートを作成し、原料や温度プロファイル、スプレー塗布パラメータなどの実験条件を入力します。

2. ロボットアームによる試料操作
ロボットアームでガラスプレートをホットプレート上へ移動させ、原料をスプレー塗布します。
設定した温度条件で合成し、冷却後にガラスプレートをベルトコンベアへ移送します。
※この時、ロボットアームとホットプレートはプログラム制御しています。

3. 動作ログとセンサー情報の自動取得・登録
ホットプレートの温度ログ、ロボットアームの動作ログ (位置、稼働時間等) をAPI経由でラボノートに自動保存します。

4. データ駆動型科学への展開 (今後の予定)
eLabFTWに蓄積した実験条件、実験結果、各種ログを用いて機械学習モデルを構築し、最適な反応条件やスプレー塗布パラメータを推定する予定です。推定より得られた候補点の実験条件をeLabFTWに自動入力し、最適化ループする研究DXの構築が目標です。

今後の更なる発展として、ベイズ最適化や大規模言語モデル (LLM) を組み合わせ、研究者の介入を最小限に抑えた自律実験装置の実現を目指します。たとえば、LLM が電子ラボノートに記録された既存情報を参照しながら追加実験の条件を提案し、ロボットアームがそれを実行、データを再びラボノートへ蓄積するというサイクルを繰り返すことで、研究DX を一層加速できると期待しています。

図6. 無機酸化物薄膜作製の自動化プラットフォーム

まとめ、今後の展望

本稿では、電子ラボノートと自動実験プラットフォームを組み合わせた研究DXの取組みを紹介しました。テンプレートの設計やサンプル管理手法の工夫、ロボットアームとのシームレスな連携により、実験データの効率的な蓄積と利活用が可能になることを示しました。しかし、電子ラボノートは「導入して終わり」ではなく、組織としてのデータマネジメント体制を構築し、継続的に運用することが重要です。

現在、本研究室では公開用のマニュアルや API のサンプル作成を進めており、これらを広く研究コミュニティと共有することで、導入事例や活用ノウハウの普及を目指しています。また、大学を中心とした研究教育の現場で、実験データをデジタル情報として蓄積する文化を形成し、学生の就職先や共同研究の場での実践を通じて、社会全体への波及効果を狙っています。今後は、さらに多様な実験分野への拡張や、機械学習を活用した自律実験化など、研究DXの新たな可能性を探究していきます。

謝辞

本記事の内容は著者らが所属する奈良先端科学技術大学院大学の同僚である藤井幹也博士、高山大鑑博士、原嶋庸介博士、李帝明博士、杉田陽彩氏との日常的な議論から多くの示唆を得たものです。また、本学の他研究室の先生方ならびに技術職員の皆様にも、実験環境や議論の機会など、多大なるご支援を賜りました。なお、本研究は教育研究組織改革事業「リサーチトランスフォーメーション(RX)プラットフォームの構築事業」の支援を受けて実施いたしました。ここに深く感謝の意を表します。

参考資料

  • FORCE11 Home Page. https://force11.org/info/the-fair-data-principles/
  • FAIRmat Home Page. https://www.fairmat-nfdi.eu/fairmat/
  • NOMAD Home Page. https://nomad-lab.eu/nomad-lab/index.html
  • GO FAIR Home Page. https://www.go-fair.org/today/fair-digital-framework/
  • Leonov, A. I.; Hammer, A. J. S.; Lach, S.; Mehr, S. H. M.; Caramelli, D.; Angelone, D.; Khan, A.; O’Sullivan, S.; Craven, M.; Wilbraham, L.; Cronin, L. An integrated self-optimizing programmable chemical synthesis and reaction engine. Nat. Commun. 2024, 15, 1240. DOI: 10.1038/s41467-024-45444-3.
  • Burger, B.; Maffettone, P. M.; Gusev, V.; Aitchison, C. M.; Bai, Y.; Wang, X.; Li, X.; Alston, B. M.; Li, B.; Clowes, R.; Rankin, N.; Harris, B.; Sprick, R. S.; Cooper, A. I. A mobile robotic chemist. Nature 2020, 583, 237. DOI: 10.1038/s41586-020-2442-2.
  • Suresh, A., Gaba, D., Bhambri, S., Laha, D. Intelligent Multi-fingered Dexterous Hand Using Virtual Reality (VR) and Robot Operating System (ROS). In Robot Intelligence Technology and Applications 5. RiTA 2017; Kim, J. H., Myung, H., Kim, J., Xu W., Matson, E. T., Jung, J., Choi, H., Eds.; Springer,Cham, 2018; Vol. 751, pp 459–474. DOI: 10.1007/978-3-319-78452-6_37.