中國(guó)科學(xué)技術(shù)大學(xué)一名博士研究生在實(shí)驗(yàn)室調(diào)試機(jī)器化學(xué)家系統(tǒng)“小來”。新華社記者 張端攝
8天完成688次化學(xué)實(shí)驗(yàn),7天研究1000種催化配方……人類夜以繼日多年才能完成的工作,人工智能(AI)在短時(shí)間內(nèi)就能完成。
“AI從一個(gè)研究領(lǐng)域變成了一類賦能技術(shù)?!痹?2月9日至10日召開的香山科學(xué)會(huì)議第768次學(xué)術(shù)討論會(huì)上,中國(guó)科學(xué)院院士白春禮說,在化學(xué)領(lǐng)域,得益于AI的應(yīng)用,化學(xué)反應(yīng)預(yù)測(cè)與新化學(xué)物質(zhì)的發(fā)現(xiàn)、化學(xué)試驗(yàn)的自動(dòng)化與智能化等方面均取得了顯著突破。
AI將如何改變化學(xué)研究?如何進(jìn)一步推進(jìn)AI與化學(xué)的深度融合?這些問題引發(fā)與會(huì)專家學(xué)者熱議。
2個(gè)月內(nèi)完成2000年的工作
AI讓枯燥、危險(xiǎn)、重復(fù)的化學(xué)實(shí)驗(yàn)來了個(gè)“大變身”:機(jī)器人自動(dòng)操作化學(xué)合成平臺(tái),甚至具備觀察、分析實(shí)驗(yàn)結(jié)果的能力。
中國(guó)科學(xué)技術(shù)大學(xué)研發(fā)的機(jī)器化學(xué)家系統(tǒng)“小來”,可以完成文獻(xiàn)讀取、合成、表征、性能測(cè)試、機(jī)器學(xué)習(xí)模型建立和優(yōu)化等全流程任務(wù)。中國(guó)科學(xué)技術(shù)大學(xué)教授羅毅介紹,通過運(yùn)用“小來”系統(tǒng),團(tuán)隊(duì)加速了新材料的發(fā)現(xiàn)過程,2個(gè)月內(nèi)就完成了需要驗(yàn)證2000年才能完成的復(fù)雜優(yōu)化工作,利用火星隕石制備出實(shí)用的產(chǎn)氧電催化劑。
面向“遠(yuǎn)方”,AI能幫助人類探索出一條在地球外星系就地取材研制化學(xué)品的新路;聚焦“眼前”,有研究單位僅用一年時(shí)間,便利用高精準(zhǔn)的預(yù)訓(xùn)練模型,從6000萬(wàn)個(gè)有機(jī)小分子的結(jié)構(gòu)中篩選出符合冷卻液不同性質(zhì)和要求的目標(biāo)分子,并成功完成這些分子的合成及實(shí)際產(chǎn)品的測(cè)試工作。
“科學(xué)研究的基本工具來自理論、實(shí)驗(yàn)和科學(xué)文獻(xiàn)三方面。受工具的限制,過去的化學(xué)研究采取依賴經(jīng)驗(yàn)和不斷試錯(cuò)的方法,組織形式也往往是作坊模式?!敝袊?guó)科學(xué)院院士鄂維南說,AI將助力打造有效的理論、實(shí)驗(yàn)和文獻(xiàn)工具平臺(tái),使科學(xué)研究邁向平臺(tái)化模式。
中國(guó)科學(xué)院院士張錦也認(rèn)為,利用AI、大數(shù)據(jù)、虛擬現(xiàn)實(shí)等工具,人類能夠擴(kuò)展思維,提升理解力,不斷突破認(rèn)知邊界。通過構(gòu)建覆蓋研發(fā)全流程的一系列智能體來彌補(bǔ)短板,可以讓科學(xué)家有工程思維、工程師有產(chǎn)品思維,打破實(shí)驗(yàn)室研究與產(chǎn)業(yè)化要求難以匹配的困境。
高效表達(dá)復(fù)雜微觀世界
微觀層面,AI在化學(xué)研究中的優(yōu)勢(shì)進(jìn)一步顯現(xiàn)。電子自旋、電荷密度、分子勢(shì)能等與化學(xué)性質(zhì)息息相關(guān)的參數(shù),都變得可預(yù)測(cè)、可求解。
阿爾法折疊3這種模型為什么能準(zhǔn)確預(yù)測(cè)蛋白質(zhì)、DNA、RNA、配體等生命分子的結(jié)構(gòu)及相互作用?白春禮介紹,它通過分析大量的輸入和輸出數(shù)據(jù)尋找規(guī)律,掌握分子間相互作用的力、角度等參數(shù),再模擬出現(xiàn)實(shí)情況,預(yù)測(cè)可能的情況。
從讀懂現(xiàn)象到摸清規(guī)律、再到高效表達(dá)復(fù)雜的微觀世界,AI在化學(xué)領(lǐng)域讓“不可能”的探索成為“可能”。
“在化學(xué)動(dòng)力學(xué)理論研究方面,AI展現(xiàn)了巨大潛力?!敝袊?guó)科學(xué)院院士張東輝說,化學(xué)理論中的分子體系勢(shì)能面構(gòu)造存在“指數(shù)墻”困難,即計(jì)算量會(huì)隨分子體系中原子個(gè)數(shù)增長(zhǎng)而呈指數(shù)級(jí)增長(zhǎng)。AI神經(jīng)網(wǎng)絡(luò)能高效表達(dá)復(fù)雜的高維函數(shù),解決了這個(gè)難題。借助AI,團(tuán)隊(duì)解決了包含十幾個(gè)原子的分子體系高精度勢(shì)能面構(gòu)造問題。
張東輝介紹,近年來,神經(jīng)網(wǎng)絡(luò)在求解電子運(yùn)動(dòng)薛定諤方程的基態(tài)波函數(shù)方面也取得了重要進(jìn)展。在不存在費(fèi)米共振的情況下,團(tuán)隊(duì)僅使用15000個(gè)參數(shù),就能精確求解丙烷分子(包含11個(gè)原子)的振動(dòng)能量。而這在此前被認(rèn)為是難以求解的。
針對(duì)求解多電子薛定諤方程這一量子化學(xué)領(lǐng)域的核心問題,AI提供的新范式有望突破計(jì)算消耗隨體系擴(kuò)大呈指數(shù)級(jí)增長(zhǎng)的瓶頸。中國(guó)科學(xué)院院士楊金龍介紹,基于生成式AI的“乾坤網(wǎng)絡(luò)”(QiankunNet)可實(shí)現(xiàn)多電子薛定諤方程的直接求解?!盎麨榱恪⒎侄沃钡牟呗?,使較復(fù)雜材料體系的計(jì)算從“不可能”逐步走向“可能”和“精準(zhǔn)”。
模型建構(gòu)需“垂直發(fā)力”
“化學(xué)是唯一能夠獲得穩(wěn)定新物質(zhì)的科學(xué)。”白春禮說,AI將為發(fā)現(xiàn)更多前所未有的反應(yīng)類型與合成方法帶來無限可能。
然而,要擔(dān)負(fù)起“從0到1”的創(chuàng)新任務(wù),AI仍面臨巨大挑戰(zhàn)。
一方面是化學(xué)數(shù)據(jù)的質(zhì)量與可用性問題?!盎瘜W(xué)研究數(shù)據(jù)類型復(fù)雜且高度多樣化,涵蓋分子表征、光譜圖像、實(shí)驗(yàn)記錄等多模態(tài)數(shù)據(jù)?!敝袊?guó)科學(xué)院自動(dòng)化研究所所長(zhǎng)徐波解釋,現(xiàn)有模型往往難以高效表征、難以整合不同模態(tài)數(shù)據(jù)里的信息?;瘜W(xué)研究還需AI具備更高階的推理能力,以完成化學(xué)反應(yīng)預(yù)測(cè)、分子逆向設(shè)計(jì)、多步合成路徑規(guī)劃等任務(wù)。
另一方面是AI化學(xué)知識(shí)儲(chǔ)備問題。現(xiàn)有算法多為“黑箱式”模型,融入的化學(xué)知識(shí)不夠。換句話說,要拿下“化學(xué)博士學(xué)位”,AI還需“垂直發(fā)力”。徐波說,當(dāng)前許多AI系統(tǒng)主要依賴數(shù)據(jù)驅(qū)動(dòng)的方法,與不同領(lǐng)域知識(shí)結(jié)合程度不足。為解決這個(gè)問題,AI領(lǐng)域?qū)W者與化學(xué)學(xué)者正在進(jìn)行跨領(lǐng)域合作,為化學(xué)領(lǐng)域開發(fā)專用算法和模型,發(fā)展各類科學(xué)化學(xué)語(yǔ)言表征等基本能力,以構(gòu)建更強(qiáng)大的模型。
中國(guó)科學(xué)院院士、南京大學(xué)黨委書記譚鐵牛認(rèn)為,應(yīng)在基座大模型的基礎(chǔ)上,著力建構(gòu)以知識(shí)和數(shù)據(jù)雙驅(qū)動(dòng)的多任務(wù)多目標(biāo)垂直模型。
白春禮也認(rèn)為,加快AI和自動(dòng)化實(shí)驗(yàn)的深度融合,亟需構(gòu)建高質(zhì)量、開放共享的化學(xué)基礎(chǔ)數(shù)據(jù)庫(kù),并考慮數(shù)據(jù)安全管理等因素。他建議,應(yīng)建立自主可控、開放共享的基礎(chǔ)大模型,開發(fā)針對(duì)化學(xué)復(fù)雜問題的專用AI算法等,進(jìn)一步加強(qiáng)學(xué)科交叉并重視AI化學(xué)領(lǐng)域的人才培養(yǎng),加快建設(shè)AI化學(xué)生態(tài)平臺(tái)。(張佳星)
(責(zé)任編輯:蔡文斌)