赤外(IR)分光法は、分子構造の同定や化学組成の解析に広く用いられる強力な分析手法であり、製薬、環境科学、材料研究といった多様な科学・産業分野で重要な役割を果たしています。

しかしながら、ノイズの混入はIRスペクトル解析における主要な課題のひとつであり、スペクトルの特徴を歪め、重要な吸収バンドを隠し、測定精度を低下させる原因となります。特に、手作業での最適化が困難なハイスループット解析においては、この問題が深刻化しやすく、多数のスペクトルを迅速に処理する必要がある場面で精度が損なわれる可能性があります。ノイズが適切に制御されない場合、スペクトルデータの誤解釈、化学種の誤認識、定量分析の誤差といった問題を引き起こすおそれがあります。

このような背景から、高品質なスペクトルデータを確保するためには、効果的なノイズ低減技術が不可欠です。こうした技術には、ハードウェアレベルの最適化から高度な計算アルゴリズムに至るまで、さまざまな手法が存在します。

赤外分光分析におけるノイズの問題

赤外分光法におけるノイズは、主に装置の限界、周囲環境からの干渉、試料そのもののばらつきなど、さまざまな要因に起因します。ノイズがもたらす最大の影響は、シグナル対ノイズ比(S/N比)の低下です。ここで、Sは本来の信号(通常は吸収ピークの高さ)を、Nは背景ノイズを表し、後者は一般にRMS(二乗平均平方根)として定量されます。

S/N比が低下すると、化学物質由来の本来の吸収ピークがベースラインの揺らぎに埋もれてしまい、微弱な信号やわずかな違いを識別することが困難になります。これにより、以下のような影響が生じます。

  • スペクトル上の特徴が不明瞭になることで、官能基や化合物の正確な同定が難しくなる
  • 分解能および感度の低下により、重要な意味を持つ微小なピークが検出されなくなる
  • 吸光度の変動が定量分析に影響を及ぼし、濃度の較正や計算の精度を損なう
  • 分析に要する時間の増加(例えばスキャン回数の増加や信号の平均化処理)により、処理効率が低下する

これらのノイズ源を正確に理解することは、スペクトル解釈の信頼性を高め、分析結果の精度を確保するうえで不可欠なノイズ低減戦略の構築において極めて重要です。

赤外分光法における信号対ノイズ比(S/N比)。マテリアルズ・インフォマティクス(MI)や計測インフォマティクスにおいて、高精度なピーク検出・化学構造推定・定量分析を行うには、S/N比の確保が不可欠。

図1. シグナル対ノイズ比(S/N Ratio)

赤外分光におけるノイズの種類

赤外分光法におけるノイズは、スペクトルデータを歪め、分解能を低下させ、定量解析を困難にします。代表的なノイズには、以下の4種類があります。

  1. 白色ノイズ(ホワイトノイズ)
  2. 1/fノイズ(フリッカーノイズ)
  3. ショットノイズ
  4. 湿度由来ノイズ(大気水分吸収ノイズ)

これらはそれぞれ異なる形でスペクトルに影響を及ぼします。

白色ノイズ(熱雑音、またはジョンソンノイズ)

白色ノイズは、検出器や増幅器といった電子部品内のランダムな熱的揺らぎによって生じます。このノイズはすべての周波数帯に均等に現れ、ベースライン周辺にランダムな散らばりとして観察されるのが特徴です。吸光度や透過率の測定値に不規則な変動を生じさせるため、微弱な吸収バンドの検出が困難になります。

例: ガス状試料のように吸収が非常に弱い系では、白色ノイズによって微小なピークが隠れてしまい、スペクトルの解釈が難しくなります。

1/fノイズ(フリッカーノイズ、またはベースラインドリフト)

1/fノイズは、赤外光源の出力変動や検出器の感度変動など、ゆっくりとした時間変動に起因する低周波のノイズです。スペクトル上では、ベースラインが傾いたり漂ったりするような形で現れます。このようなドリフトはピークの相対強度を変化させ、人工的な傾向を生み出すことで定量解析に誤差をもたらすことがあります。

例: 赤外分光法によるタンパク質の二次構造解析では、アミドIおよびIIバンドの微小なシフトが構造変化の指標とされますが、ベースラインドリフトによってこれらが擬似的に現れると、誤った解釈を招く可能性があります。

ショットノイズ(光子雑音、またはポアソン雑音)

ショットノイズは、光子の検出に伴う統計的なゆらぎから生じます。ポアソン分布に従う性質を持ち、特に検出される光子の数が少ない低照度条件ではその影響が顕著になります。不規則な強度変動を引き起こし、微弱な吸収バンドの識別が困難になるのが特徴です。

例: 医薬品の近赤外(NIR)測定では、オーバートーンや組み合わせバンドといった低強度の信号がショットノイズによって歪められることがあり、成分同定の精度を下げる原因になります。

湿度由来ノイズ(大気水分の吸収ノイズ)

湿度由来ノイズは、試料室や光路中に存在する大気中の水蒸気によって引き起こされます。水分子は中赤外(MIR)領域、特に1600 cm⁻¹付近および3700 cm⁻¹付近に強い吸収バンドを持っており、これらが試料のピークと重なることでスペクトルを歪ませます。このノイズの強度は周囲の湿度に依存して変動し、スペクトル特徴の誤解釈を招くおそれがあります。

例: 生体組織を対象としたFTIR測定では、水蒸気による吸収がタンパク質や脂質の重要なバンドに重なり、正確な分子組成解析を妨げることがあります。これを防ぐには、窒素パージ乾燥した測定環境の確保が有効です。

ノイズ種の比較

白色ノイズ(熱雑音)、ショットノイズ、ピンクノイズ(1/fノイズ)はいずれも、測定機器や電子系統において一般的に見られるランダムな変動であり、分子の赤外吸収現象とは無関係に発生します。これらのノイズは、主に検出器の信号処理や電子回路の揺らぎに起因し、スペクトル上では物理的に意味を持たない不規則な揺らぎとして現れます。

これに対して、湿度由来ノイズは本質的に異なります。こちらは大気中の水蒸気分子がIR光と実際に相互作用することで発生する真の吸収現象であり、スペクトル中に明確なピークを形成します。これは、水分子が気相中で赤外光を吸収する際の分子振動遷移に対応するものであり、試料のスペクトル上に重畳して現れる可能性があります。

したがって、湿度由来のノイズにおける吸光度値には物理化学的な意味があり、他のランダムノイズとは異なり、分子由来の実信号と識別が難しくなる点に注意が必要です。

赤外分光スペクトルに影響を与える代表的な4種類のノイズ(白色ノイズ、1/fノイズ、ショットノイズ、湿度由来ノイズ)を比較。計測インフォマティクスにおけるデータ前処理や、MIを用いた特性予測モデルの精度確保において重要な検討対象となる。

図2. 赤外分光法におけるノイズの種類

赤外分光法におけるノイズ低減技術

ノイズの影響を効果的に抑えるためには、さまざまなノイズ低減技術を適切に活用することが重要です。これらの手法は、大きく分けて以下の4つに分類されます。すなわち、ハードウェアによる最適化、数理的なフィルタ処理、統計的手法、そして機械学習に基づくアプローチです。

本節では、代表的かつ高度なノイズ低減アルゴリズムについて、構造的に詳述します。対象となる手法には、Savitzky-Golay(SG)平滑化、ウェーブレット変換によるノイズ除去、Hilbert-Huang変換(HHT)、主成分分析(PCA)によるノイズ抑制、そして深層学習を活用した手法が含まれます。

Savitzky-Golay(SG)平滑化フィルタ

Savitzky-Golay(SG)平滑化フィルタは、赤外分光データのノイズ除去において最も広く用いられている手法のひとつです。単純な移動平均フィルタとは異なり、スライディングウィンドウ内のデータに対して多項式フィッティングを行うことで、吸収バンドの形状を保持したままノイズ成分を滑らかに抑えることが可能です。

この特徴により、SGフィルタはピークの重なりがあるスペクトル、微弱な信号、ベースラインの歪みがある場合など、複雑なデータに対して特に有効です。ランダムなノイズ成分を除去しつつ、ピーク構造を明確に保つことができるため、スペクトルの解釈精度と定量分析の信頼性を向上させます。

ただし、ウィンドウサイズを過度に大きく設定すると、ピークのぼかしや微弱な吸収バンドの喪失といった逆効果が生じるおそれがあります。そのため、適切なパラメータ設定がSGフィルタの効果を最大限に引き出す鍵となります。

応用例: 製薬分野におけるIR分析では、わずかなピークの違いが不純物や多形(ポリモルフ)の存在を示す重要な手がかりとなる場合があります。SG平滑化を適用することで、過剰なノイズに隠れた微細な差異を明瞭化し、異なる結晶形や混入物の検出を可能にします

ウェーブレット変換によるノイズ除去

ウェーブレット変換によるノイズ除去(WD)は、多重解像度解析に基づく信号処理手法です。スペクトル信号を複数の周波数成分に分解し、それぞれの成分に対して適応的にノイズ除去を行うことで、ノイズを効果的に抑えつつ、重要なスペクトル構造を保持することが可能です。

従来のフーリエ変換に基づくフィルタリングでは、スペクトル全体に一様な周波数構造があるという前提が必要ですが、ウェーブレット変換ではこの前提が不要です。ノイズの性質がスペクトル中で場所によって異なる(=非定常性)場合でも、局所的に適したフィルタリングが可能である点が大きな特長です。

適切なウェーブレット関数やスレッショルド処理を選択することで、細部のディテールを維持しつつ、ランダムノイズやベースライン揺らぎを効果的に抑制できます。

応用例: 環境モニタリングにおけるIR分光では、大気中のCO₂やSO₂などの外因性吸収バンドが混入しやすく、ターゲット成分の検出を妨げることがあります。ウェーブレット変換を適用することで、不要な吸収成分を除去し、目的とする化合物のスペクトル情報をより明確に抽出することができます。

Hilbert-Huang変換(HHT)によるノイズ除去

Hilbert-Huang変換(HHT)は、信号を経験的モード分解(Empirical Mode Decomposition, EMD)によって複数の固有モード関数(Intrinsic Mode Functions, IMFs)に分解し、それぞれの成分に対してヒルベルト変換を適用する解析手法です。フーリエ変換のように事前に基底関数を仮定する必要がなく、信号の内在的な特性に基づいて適応的に分解を行える点が特徴です。

この方法は、特に非線形かつ非定常なノイズを含む赤外スペクトルの処理において有効です。スペクトルの各領域を独立に処理できるため、従来のフィルタリング手法では分離が困難な、信号とノイズの境界を的確に見極めることが可能になります。

ただし、HHTは計算コストが高く、また除去すべきIMFの選定には注意が必要です。誤って有意なスペクトル情報まで除去してしまうリスクがあるため、適切な適用には専門的な判断が求められます。

応用例: 生体試料(例:血漿)の赤外分光分析においては、重なり合うピークや強いベースライン変動がしばしば観察されます。HHTはこうした複雑なスペクトル構造の中から、疾患バイオマーカーに関連する微細な信号を選択的に抽出し、バックグラウンドとなるタンパク質や脂質の影響を低減することが可能です。その結果、診断精度の向上につながります。

主成分分析(PCA)によるノイズ除去

主成分分析(Principal Component Analysis, PCA)は、データの次元削減とノイズ抑制を目的とした統計的手法です。PCAでは、スペクトルデータを主成分に分解し、その中から最も寄与度の高い成分のみを用いて再構成することで、変動の小さい(すなわちノイズと見なされる)成分を排除することができます。

このアプローチは、類似したスペクトルが大量に存在するような高スループット測定において特に効果を発揮します。ノイズ成分がランダムである一方、信号には一貫した構造があるという仮定のもとで、信号成分だけを残して雑音を効果的に除去できます。

ただし、単一のスペクトルしか存在しない場合や、S/N比が極端に変動するデータには適用が難しい場合があります。PCAは統計的パターンに依存するため、データの構造が不明確な場合や外れ値を含む場合には注意が必要です。

応用例: 食品分野における赤外分光分析では、油脂製品の真贋判定や異物混入検出などが行われます。例えば、食用油の品質管理においてPCAを適用することで、真正な油脂と異物が混入した油のスペクトルを明確に分類でき、偽装や混入の検出精度を高めることが可能になります。

畳み込みニューラルネットワーク(CNN)によるノイズ除去

畳み込みニューラルネットワーク(Convolutional Neural Networks, CNN)を用いたノイズ除去手法は、深層学習の力を活用して複雑なノイズパターンを自動的に学習・除去する高度なアプローチです。従来のフィルタリング手法と異なり、CNNは大量のスペクトルデータから特徴を直接学習するため、リアルタイム解析や自動化された高スループット測定において高い効果を発揮します。

CNNは、ピークの重なりや不均一なベースラインの歪み、装置由来のアーティファクトなど、従来手法では困難だった問題にも高い精度で対処可能です。十分な学習データがあれば、多様なノイズ特性に対応できる汎用性の高いモデルを構築できる点も大きな利点です。

応用例: マイクロプラスチックの赤外分光分析においては、有機物や環境粒子由来のノイズによってプラスチック粒子の同定が妨げられることがあります。CNNを活用したノイズ除去モデルは、スペクトルの汚染を高精度で補正し、微小なマイクロプラスチックの分類・定量をより正確に行うための強力な手段となっています。

MI-6によるノイズ除去技術

MI-6では、赤外スペクトルデータの品質向上を目的として、スペクトルの特徴に応じて最適なノイズ除去手法を自動選択するシステムを設計しています。図3に示すように、本ワークフローは、ピーク検出の精度を向上させることを目的とした一連の自動処理プロセスで構成されています。

このプロセスでは、まず生のスペクトルデータを入力とし、それぞれのスペクトルの特性(たとえば、ノイズレベルやピークの半値幅(FWHM)など)をモデルが解析します。その解析結果に基づき、以下のような複数のノイズ除去手法(PCA、Savitzky-Golay、Hilbert-Huang変換、ウェーブレット変換など)の中から、最も適切な手法が動的に選択・適用されます。なお、必要に応じて「ノイズ除去を行わない」という選択も可能であり、これは信号の過剰加工を避けるうえで重要です。

このようなスペクトルごとの適応的アプローチによって、意味のあるスペクトル情報を保持しつつ、ノイズを最小限に抑えることが可能になります。

中央のヒートマップは、ノイズ除去前後におけるピーク検出の性能(F1スコア)を比較したものです。ノイズ除去前は、ノイズレベルやピーク幅によってF1スコアが低く(黄色系)、ピーク検出の信頼性が不十分であることが示されています。一方、ノイズ除去後はF1スコアが大きく改善し、特に中〜高ノイズ条件下での性能向上が顕著です。ヒートマップの色調が黄色から青色へとシフトすることで、この改善が視覚的に示されています。

図の右側では、実際のスペクトルを用いた具体例が示されています。ここでは、ノイズ除去前後のピーク検出結果が比較され、緑色の三角が正しく検出されたピーク(True Positive)、マゼンタ色の三角が誤検出(False Positive)を示しています。上段の例では、高ノイズ条件であった元のスペクトルが、ノイズ除去後に大幅に明瞭化され、ピーク検出の精度が著しく向上している様子が確認できます。

平均的なノイズレベルは、ノイズ除去前の約2.0から、処理後には0.2へと大幅に低減しており、このモデル駆動型ノイズ除去アプローチの有効性が定量的に裏付けられています。

このように、本ワークフローは機械学習と信号処理を融合させることで、スペクトル解析におけるデータ品質を自動的に向上させ、ピーク検出などの下流解析の信頼性を高めることを可能にしています。

さらに現在、MI-6では以下のようなハイブリッド手法の開発も進めています。

  • PCAとディープラーニングの組み合わせ:次元圧縮とニューラルネットワークの融合により、スペクトルの明瞭度をさらに向上
  • Wavelet変換とCNNの統合:ウェーブレットによる前処理をCNNに組み合わせることで、CNNベースのノイズ除去の精度を向

これらのアプローチは、より高精度かつ汎用的なスペクトル解析の実現に向けて期待されています。

MI-6が開発したスペクトル特性に応じた動的ノイズ除去プロセス。機械学習と信号処理の統合は、マテリアルズ・インフォマティクスの信頼性向上、定量解析の精度強化、測定プロセスの自動化に寄与する。

図3. MI-6の自動ノイズ低減プロセス

参考文献

  1. Othman, N. (2023). IR Spectroscopy in Qualitative and Quantitative Analysis. In Infrared Spectroscopy - Perspectives and Applications. IntechOpen. https://doi.org/10.5772/intechopen.106625
  2. Milosevic, M. (2012). Internal Reflection and ATR Spectroscopy. Wiley & Sons, Inc. https://doi.org/10.1002/9781118309742
  3. Hassan, U., & Anwar, S. (2010). Reducing noise by repetition: Introduction to signal averaging. European Journal of Physics, 31, 453. https://doi.org/10.1088/0143-0807/31/3/003
  4. Mark, H., & Griffiths, P. (2002). Analysis of noise in Fourier transform infrared spectra. Applied Spectroscopy, 56, 633–639. https://doi.org/10.1366/0003702021955196
  5. T. Hakkarainen, E. Mikkola, J. Laperre, F. Gensous, P. Fardell, Y. Tallec, C. Baiocchi, K. Paul, M. McNamee, C. Deleu, and E. Metcalfe, "Smoke Gas Analysis by Fourier Transform Infrared Spectroscopy – Summary of the SAFIR Project Results," Fire and Materials, vol. 24, pp. 101–112, 2000, DOI: 10.1002/1099-1018(200003/04)24:23.3.CO;2-U.
  6. Sadeghi, M., & Behnia, F. (2018). Optimum window length of Savitzky-Golay filters with arbitrary order. arXiv.https://arxiv.org/abs/1808.10489
  7. Li, W., Li, S., Zhao, Z., & Sun, Z. (2012). Research on applications of wavelet transform threshold method to strong motion signal processing. Advanced Materials Research, 446-449, 2387–2391. https://doi.org/10.4028/www.scientific.net/AMR.446-449.2387
  8. Wang, H.; Ji, Y. (2018). A Revised Hilbert–Huang Transform and Its Application to Fault Diagnosis in a Rotor System. Sensors, 18(12), 4329. https://doi.org/10.3390/s18124329
  9. Zavyalov, V. & Bingham, G. & Wojcik, M. & Johnson, H. & Struthers, M. (2009). Application of principal component analysis to lidar data filtering and analysis. Proceedings of SPIE - The International Society for Optical Engineering. 7479. 10.1117/12.830126
  10. Sun, C., Pan, M., Zhou, B., & Zhu, Z. (2018). Infrared image denoising based on convolutional neural network. 2018 13th World Congress on Intelligent Control and Automation (WCICA), 499-502. https://doi.org/10.1109/WCICA.2018.8630611