近日,齊魯工業大學(山東省科學院)化學與制藥學部胡偉教授團隊,在分子光譜的人工智能模擬方面取得研究進展。研究成果以“A Deep Learning Model for Predicting Selected Organic Molecular Spectra”為題,于2023年11月13日在Nature子刊 《自然-計算科學》(Nature Computational Science)雜志上在線發表。論文第一單位為齊魯工業大學(山東省科學院),化學與制藥學部2019級本科生鄒子涵為第一作者,化學與制藥學部胡偉教授、光電科學與技術學部張玉瑾副教授、中國科學技術大學羅毅教授和江俊教授為本文的共同通訊作者。
分子光譜作為“分子指紋”,被廣泛地應用于物理、化學、生物、材料、醫學、食品、環境、化工等領域。傳統的分子光譜模擬采用量子化學方法,涉及昂貴的電子結構計算和復雜的光譜模擬,導致效率低下。針對該難題,胡偉教授團隊結合E(3)-等變幾何組、自注意機制,開發了一套深度學習模型:DetaNet,從而建立了更高效、更準確、更快速的分子性質和分子光譜的人工智能模擬方法。研究團隊首先建立了包含 13萬余種分子的紅外、拉曼、紫外-可見吸收、核磁共振光譜數據庫:QM9S 數據集;其次,通過傳遞高階幾何張量信息,使得DetaNet 能夠預測各種分子的標量(能量、原子電荷等)、矢量(電偶極矩、原子力等)以及高階張量(Hessian矩陣、電四極矩、極化率、電八極矩、第一超極化率等)性質。在此基礎上,開發了通用模塊用來預測四種重要的分子光譜,即紅外光譜、拉曼光譜、紫外可見吸收光譜、核磁共振光譜。通過測試,研究團隊發現DetaNet的計算效率比量子化學快3-5個數量級。本研究成果提供了原創的深度學習模型:DetaNet,在世界上首次提出直接預測分子張量性質的機器學習算法,開發了多種分子光譜的人工智能模擬算法,對分子高通量篩選、光譜輔助結構鑒定等重要的領域提供了堅實的理論基礎和高效的軟件工具。
本課題受到國家自然科學基金、山東省泰山學者計劃、濟南市高校20條等項目支持。
文章鏈接:https://doi.org/10.1038/s43588-023-00550-y