2016-2022 All Rights Reserved.平安財經(jīng)網(wǎng).復(fù)制必究 聯(lián)系QQ280 715 8082 備案號:閩ICP備19027007號-6
本站除標明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權(quán)歸原作者所有。
具有緊湊但強大的基于結(jié)構(gòu)的分子結(jié)構(gòu)標識符或表示系統(tǒng)是在研究界內(nèi)有效共享和傳播結(jié)果的關(guān)鍵促成因素。這些系統(tǒng)還為機器學習和其他數(shù)據(jù)驅(qū)動的研究奠定了重要的基礎(chǔ)。雖然小分子已經(jīng)取得了實質(zhì)性進展,但聚合物界一直在努力提出一種有效的代表系統(tǒng)。
對于小分子,基本前提是每種不同的化學物種對應(yīng)于明確定義的化學結(jié)構(gòu)。這不適用于聚合物。聚合物本質(zhì)上是隨機分子,通常具有化學結(jié)構(gòu)分布的集合體。這種困難限制了為小分子開發(fā)的所有確定性表示的適用性。在麻省理工學院,杜克大學和西北大學的研究人員9月12日發(fā)表的一篇論文中,麻省理工學院,杜克大學和西北大學的研究人員報告了一種新的表示系統(tǒng),該系統(tǒng)能夠處理聚合物的隨機性質(zhì),稱為BigSMILES。
“BigSMILES解決了聚合物數(shù)字表示方面的重大挑戰(zhàn),”Connor Coley博士解釋說。'19,該論文的共同作者。“聚合物幾乎總是通過隨機過程產(chǎn)生的多種化學結(jié)構(gòu)的集合體,因此我們不能使用相同的策略來記錄它們的結(jié)構(gòu),就像小分子一樣。”
共同作者是Coley; 麻省理工學院化學工程副教授Bradley D. Olsen; 華盛頓大學Karens F. Jensen化學工程教授Warren K. Lewis; 西北大學化學助理教授Julia A. Kalow; 麻省理工學院化學副教授Jeremiah A. Johnson; William T. Miller杜克大學化學教授Stephen L. Craig; 西北大學的研究生艾略特伍茲; 杜克大學研究生Zi Wang; 麻省理工學院的研究生王文聰; 麻省理工學院的研究生Haley K. Beech; 麻省理工學院訪問研究員Hidenobu Mochigase; 麻省理工學院的研究生Tzyy-Shyang Lin。
有幾種線符號可以傳達分子結(jié)構(gòu),簡化的分子輸入線路輸入系統(tǒng)(SMILES)是最受歡迎的。SMILES通常被認為是人類最易讀的變體,迄今為止是最廣泛的軟件支持。在實踐中,SMILES提供了一組簡單的表示,適合作為化學數(shù)據(jù)的標簽,也可作為研究人員之間數(shù)據(jù)交換的記憶緊湊型標識符。作為基于文本的系統(tǒng),SMILES也很適合許多基于文本的機器學習算法。這些特性使SMILES成為將化學知識轉(zhuǎn)化為機器友好形式的完美工具,并已成功應(yīng)用于小分子特性預(yù)測和計算機輔助綜合規(guī)劃。
然而,聚合物已經(jīng)抵制了這種和其他結(jié)構(gòu)語言的描述。這是因為大多數(shù)結(jié)構(gòu)語言(如SMILES)都被設(shè)計用于描述明確定義的原子圖的分子或化學片段。由于聚合物是隨機分子,因此它們沒有獨特的SMILES表示。這缺乏聚合物材料的統(tǒng)一命名或標識符約定是減緩聚合物信息學領(lǐng)域發(fā)展的主要障礙之一。雖然聚合物信息學的開創(chuàng)性工作,如聚合物基因組計劃,已證明SMILES擴展在聚合物信息學中的有用性,新化學的快速發(fā)展以及材料信息學和數(shù)據(jù)驅(qū)動研究的快速發(fā)展使得需要普遍適用聚合物的命名慣例很重要。
“機器學習為加速化學發(fā)展和發(fā)現(xiàn)提供了巨大的機會,”科學基金會(NSF)化學部代理副主任林鶴說。“這種用于標記結(jié)構(gòu)的擴展工具,專門用于解決聚合物固有的獨特挑戰(zhàn),大大提高了化學結(jié)構(gòu)數(shù)據(jù)的可搜索性,使我們更接近利用數(shù)據(jù)革命。”
研究人員創(chuàng)造了一種新的基于結(jié)構(gòu)的構(gòu)造,作為非常成功的SMILES表示的補充,可以處理聚合物材料的隨機性質(zhì)。由于聚合物是高摩爾質(zhì)量分子,因此該構(gòu)建體被命名為BigSMILES。在BigSMILES中,聚合物片段由大括號括起來的重復(fù)單元列表表示。重復(fù)單元的化學結(jié)構(gòu)使用常規(guī)SMILES語法編碼,但具有額外的鍵合描述符,其指定不同的重復(fù)單元如何連接以形成聚合物。這種簡單的語法設(shè)計可以在大量不同的化學物質(zhì)上編碼大分子,包括均聚物,無規(guī)共聚物和嵌段共聚物,以及各種分子連接,從線性聚合物到環(huán)狀聚合物到甚至支化聚合物。與SMILES一樣,BigSMILES表示是緊湊的自包含文本字符串。
“使用BigSMILES標準化聚合物結(jié)構(gòu)的數(shù)字表示將鼓勵聚合物數(shù)據(jù)的共享和聚合,隨著時間的推移提高模型質(zhì)量并增強其使用的好處,”可再生化學品和材料開放式創(chuàng)新的材料主管Jason Clark說。 Braskem,與研究無關(guān)。“BigSMILES是該領(lǐng)域的重要貢獻,因為它滿足了靈活系統(tǒng)以數(shù)字方式表示復(fù)雜聚合物結(jié)構(gòu)的需求。”
Clark補充說:“塑料行業(yè)在循環(huán)經(jīng)濟背景下面臨的挑戰(zhàn)始于原材料來源,并一直貫穿于報廢管理。應(yīng)對這些挑戰(zhàn)需要創(chuàng)新設(shè)計聚合物基材料傳統(tǒng)上經(jīng)歷了漫長的開發(fā)周期。人工智能和機器學習的進步有望加速利用金屬合金和小有機分子的應(yīng)用的開發(fā)周期,促使塑料行業(yè)尋求平行的方法。BigSMILES數(shù)字表示通過應(yīng)用數(shù)據(jù)科學方法促進了結(jié)構(gòu) - 性能關(guān)系的評估,他說,
“通過三個新的基本操作符和原始SMILES符號的組合,可以構(gòu)建多種復(fù)雜的聚合物結(jié)構(gòu),”Olsen說,“化學,材料科學和工程的整個領(lǐng)域,包括聚合物科學,生物材料,材料化學等等。生物化學是基于具有隨機結(jié)構(gòu)的大分子,這基本上可以被認為是如何寫出大分子結(jié)構(gòu)的新語言。“
“我很興奮的事情之一是數(shù)據(jù)輸入最終可能與用于制造特定聚合物的合成方法直接相關(guān),”Craig說,“因此,有機會實際捕獲和處理更多有關(guān)分子的信息比通常從標準特征中獲得的信息。如果可以做到這一點,它將實現(xiàn)各種發(fā)現(xiàn)。“
2016-2022 All Rights Reserved.平安財經(jīng)網(wǎng).復(fù)制必究 聯(lián)系QQ280 715 8082 備案號:閩ICP備19027007號-6
本站除標明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權(quán)歸原作者所有。