導(dǎo)讀:據(jù)外媒NewScientist報道,加拿大哥倫比亞大學(xué)研究小組創(chuàng)造了一種機器學(xué)習(xí)工具——DarkNPS,可以用AI快速篩選新精神活性物質(zhì)
AI連毒品也可以檢測了!
據(jù)外媒NewScientist報道,加拿大哥倫比亞大學(xué)研究小組創(chuàng)造了一種機器學(xué)習(xí)工具——DarkNPS,可以用AI快速篩選新精神活性物質(zhì)(new psychoactive substance,NPS),這是與可卡因和海洛因類似的興奮劑藥物。由于NPS的化學(xué)多樣性及其在非法市場上的存在時間短等性質(zhì),目前該藥物的檢測措施面臨重大挑戰(zhàn)。
DarkNPS可以大大縮短新出現(xiàn)的NPS識別時間,并有效縮短對其化學(xué)結(jié)構(gòu)的搜索范圍。該論文發(fā)表于Nature子刊Nature Machine Intelligence。
01.AI查毒只需幾小時,準(zhǔn)確率達86%
新精神活性物質(zhì)又稱“策劃藥”或“實驗室毒品”,是不法分子為逃避打擊而對管制毒品進行化學(xué)處理所得到的毒品類似物,具有與管制毒品相似或更強的興奮、致幻、麻醉等效果。加拿大不列顛哥倫比亞大學(xué)研究小組成員Michael Skinnider和他的同事創(chuàng)造了一種名為DarkNPS的機器學(xué)習(xí)工具,通過AI工具進行簡單的分析,快速提取出精神活性“新型藥物”化學(xué)結(jié)構(gòu)的可能分子結(jié)構(gòu)。
該工具可以快速開發(fā)實驗室測試服務(wù),以篩選與可卡因和海洛因等毒品具有類似效果的、且無法在當(dāng)前測試中檢測到的藥物使用情況。研究小組從世界各地的法醫(yī)實驗室收集了大約1700種已知新型設(shè)計藥物的化學(xué)結(jié)構(gòu),對其進行訓(xùn)練。訓(xùn)練集包括每種藥物的串聯(lián)質(zhì)譜結(jié)果,也就是翻譯并分析其部分重組蛋白數(shù)據(jù),可以提供有關(guān)分子質(zhì)量及其包含的元素的信息。這使得AI能夠識別串聯(lián)質(zhì)譜數(shù)據(jù)和化學(xué)結(jié)構(gòu)之間的模式。
Skinnider表示:“我們的方法可以將識別NPS所需的時間從幾周或幾個月縮短到幾個小時?!苯o定一種以前未知的NPS的串聯(lián)質(zhì)譜數(shù)據(jù),DarkNPS可以猜測其分子結(jié)構(gòu)。該過程準(zhǔn)確度約為51%。如果AI能夠?qū)ζ浞肿咏Y(jié)構(gòu)的前10項進行預(yù)測,其準(zhǔn)確度將增加到86%,這意味著該工具能有效縮小對分子結(jié)構(gòu)的搜索范圍。Skinnider說:“這不僅節(jié)省了大量時間,還能更快識別新上市的新精神活性物質(zhì)?!?/p>
02.1700個實例生成穩(wěn)健AI模型
研究小組在論文中表示,DarkNPS可以僅使用質(zhì)譜數(shù)據(jù)自動闡明未知NPS的化學(xué)結(jié)構(gòu),并基于化學(xué)結(jié)構(gòu)的深層生成模型。該研究小組的模型橫跨化學(xué)和深度學(xué)習(xí)領(lǐng)域,因為它們有可能根據(jù)需要生成具有任意物理化學(xué)或生物性質(zhì)的分子,從而解決所謂的“逆向設(shè)計”問題。這項工作的大部分集中在分析具有活性的特定藥物對策分子結(jié)構(gòu)可能性上。
研究小組表示,他們在研究過程中尋求生成與一個或多個分析測量特性相匹配的類NPS分子,并使用適用于處理低級數(shù)據(jù)存儲區(qū)的策略來實現(xiàn)這一目標(biāo)。從約1700個實例中學(xué)習(xí)設(shè)計藥物的穩(wěn)健生成模型,并從這個模型中取樣,隨機產(chǎn)生與現(xiàn)有的NPS存儲空間類似的新的分子結(jié)構(gòu)。研究過程顯示,從模型中取樣新分子的頻率可以用來表明最有可能解釋觀測到的精確質(zhì)量的化學(xué)結(jié)構(gòu)。將生成的結(jié)構(gòu)與串聯(lián)質(zhì)譜數(shù)據(jù)相結(jié)合,進一步提高了結(jié)構(gòu)解析的準(zhǔn)確性。DarkNPS最先闡明了2021年2月首次出現(xiàn)在歐洲的NPS的分子結(jié)構(gòu)。該模型的最終結(jié)果是建立新型精神活性物質(zhì)的深層生成模型。
03.AI生成數(shù)據(jù),為模型提供數(shù)據(jù)庫
許多計算工具已經(jīng)開發(fā)出來,能夠在質(zhì)譜數(shù)據(jù)中自動識別藥物及其代謝產(chǎn)物。然而,所有這些工具都需要一個已知化學(xué)結(jié)構(gòu)的數(shù)據(jù)庫,可以將觀察到的質(zhì)譜數(shù)據(jù)與之進行比較。因此,這些工具無法用于識別現(xiàn)有數(shù)據(jù)庫中未發(fā)現(xiàn)的新合成設(shè)計藥物。該研究小組推斷,通過生成一個新的、類似核動力源的化學(xué)結(jié)構(gòu)數(shù)據(jù)庫,就可以自動識別完全未知的核動力源。因此,研究人員著手學(xué)習(xí)核動力源化學(xué)結(jié)構(gòu)的深層生成模型,從中隨機取樣新的核動力源結(jié)構(gòu)(圖1a-b)。目前包含NPS結(jié)構(gòu)最新、最全面的資源數(shù)據(jù)庫是用于NPS篩選的數(shù)據(jù)庫HighResNPS,來自世界各地數(shù)十家法醫(yī)實驗室的貢獻者在生物樣本或執(zhí)法部門緝獲的物品中檢測到新物質(zhì)時,會向HighResNPS提交數(shù)據(jù)。盡管如此,在2020年6月初,該數(shù)據(jù)庫僅包含1753個獨特的NPS結(jié)構(gòu)。
這一數(shù)據(jù)集的有限規(guī)模反映了非法市場上出現(xiàn)并隨后被法醫(yī)實驗室檢測到的核動力源數(shù)量。然而,通常用于訓(xùn)練化學(xué)結(jié)構(gòu)生成模型的數(shù)據(jù)集將包含數(shù)十萬個數(shù)據(jù)。之后,該研究團隊獲得了194種NPS藥物的數(shù)據(jù),發(fā)現(xiàn)其中176種出現(xiàn)在AI生成的數(shù)據(jù)中。研究人員還通過使用AI推斷1億種可能的化學(xué)結(jié)構(gòu),研究未來可能生成的藥物。此外,哥倫比亞大學(xué)梅爾曼公共衛(wèi)生學(xué)院的研究人員正在研究使用機器學(xué)習(xí)來評估法律及其與處方阿片類藥物分配模式的關(guān)系?!皺C器學(xué)習(xí)方法越來越多地應(yīng)用于類似的高維數(shù)據(jù)問題,并可能為其他形式的政策分析提供一種補充方法,包括作為篩選工具來識別需要進一步關(guān)注的政策和法律規(guī)定相互作用?!备鐐惐葋喆髮W(xué)流行病學(xué)副教授Silvia Martins說。
04.結(jié)語:AI+醫(yī)療,落地場景更廣闊
“機器學(xué)習(xí)方法越來越多地應(yīng)用于類似的高維數(shù)據(jù)問題,并可能為其他形式的政策分析提供一種補充方法,包括作為篩選工具來識別需要進一步關(guān)注的政策和法律規(guī)定相互作用?!备鐐惐葋喆髮W(xué)流行病學(xué)副教授Silvia Martins說。NPS特殊的化學(xué)結(jié)構(gòu),使得不法分子有可乘之機,而AI模型能夠快速識別其分子結(jié)構(gòu),并利用AI從藥物分子結(jié)構(gòu)中預(yù)先推斷其可能的情況,提前阻止某些藥物流入市場。這為AI工具的應(yīng)用提供了新范例,能夠評估類似的藥物分子結(jié)構(gòu)、藥物分配模式等問題。