2016-2022 All Rights Reserved.平安財經(jīng)網(wǎng).復(fù)制必究 聯(lián)系QQ280 715 8082 備案號:閩ICP備19027007號-6
本站除標(biāo)明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權(quán)歸原作者所有。
由Google研究人員馬克·德普里斯托(Mark DePristo)和瑞恩·波普林(Ryan Poplin)創(chuàng)建的用于識別貓和狗圖像的人工智能在Google好奇號時代就是如此。這是一年,現(xiàn)在他們正在使用技術(shù)尋找基因突變。
正如Will Knight在麻省理工學(xué)院技術(shù)評論中所寫的那樣,他們?nèi)〉昧肆钊斯奈璧倪M展,“了解編碼人類生活的大量數(shù)據(jù)仍然是一項艱巨的挑戰(zhàn)。”
Megan Molteni,Wired,至少解讀了挑戰(zhàn)的本質(zhì),以便更多地了解我們的人類謎題。“今天,你需要一勺吐痰和一百塊錢才能獲得你的DNA快照。但是全面了解你的基因組中所有30億個堿基對 - 需要一個更加費力的過程。一個,即使是在復(fù)雜的統(tǒng)計數(shù)據(jù)的幫助下,科學(xué)家仍然在努力。“
DeepVariant是由Google Brain團隊的研究人員開發(fā)的,專注于人工智能技術(shù),而Verily則是專注于生命科學(xué)的Alphabet子公司。
它基于相同的神經(jīng)網(wǎng)絡(luò)進行圖像識別,但DeepVariant現(xiàn)在不僅僅是針對貓ID的頭條新聞,而是作為一種掃描遺傳密碼進行突變的方法。DeepVariant已經(jīng)開源了。DeepVariant的GitHub定義:“使用深度神經(jīng)網(wǎng)絡(luò)從下一代DNA測序數(shù)據(jù)中調(diào)用遺傳變異的分析管道。”
研究人員表示,這是一種深度學(xué)習(xí)技術(shù),其“比以前的傳統(tǒng)方法具有更高的準(zhǔn)確性”。
大眾機械師索菲•韋納(Sophie Weiner)表示,“識別基因突變比其他任何程序更好。”
FDA管理的2016年P(guān)recisionFDA真實挑戰(zhàn)評估了(當(dāng)時)盲法評估樣本HG002的幾個社區(qū)提交的變體呼叫集。DeepVariant榮獲最高SNP表現(xiàn)獎。
Weiner說,已經(jīng)知道的一個程序是算法GATK,它使用大量數(shù)據(jù)來試圖找出測序可能出錯的地方。DeepVariant在技術(shù)上非常擅長識別編碼錯誤。
DeepVariant使用不同的方法來嘗試解決這些問題:“它將數(shù)據(jù)轉(zhuǎn)換為圖像。由于Google的AI最初用于圖像識別,因此這種技術(shù)最終運行良好。”
大西洋的莎拉·張(Sarah Zhang)向讀者介紹了DeepVariant發(fā)揮其魔力的方式,甚至對DNA測序機器一無所知。
“ 神經(jīng)網(wǎng)絡(luò)經(jīng)常被類比為'神經(jīng)元'層,逐漸處理更復(fù)雜的概念 - 第一層可能響應(yīng)光,第二層形狀,第三層實際物體。由于DeepVariant采用數(shù)據(jù)訓(xùn)練,它可以了解哪些連接'神經(jīng)元需要加強,哪些要被忽略。最終,它可以根據(jù)錯誤對實際突變進行排序。“
任務(wù)變成了視覺。張說:“字母-A,T,C或G-got分配了一個紅色值;該位置的測序質(zhì)量為綠色值; DNA的兩條鏈?zhǔn)撬{色值。一起,他們形成了一個RGB(紅色,綠色,藍色)圖像。“
DePristo在大西洋引用。“它極大地改變了這個問題,從過分思考數(shù)據(jù)到尋找更多數(shù)據(jù)。”
奈特指出,它“自動識別測序數(shù)據(jù)中的小插入和缺失突變以及單堿基對突變。”
GATK還有一件事就是DeepVariant作為解釋工具:速度。“該計劃的功能大約是GATK的一半,”韋納說。
向前進?“像DeepVariant這樣的程序可以利用其復(fù)雜的數(shù)據(jù)分析能力來預(yù)測突變的影響,預(yù)測哪些基因可能會激活,”Weiner說。“這項技術(shù)的潛力是無限的,盡管我們?nèi)匀挥修k法趕上基因本身的復(fù)雜性。”
在12月4日的谷歌研究博客中,團隊成員表示,DeepVariant作為開源軟件的發(fā)布是為了加速使用這項技術(shù)解決實際問題。
“為了實現(xiàn)這一目標(biāo),我們與Google云平臺(GCP)合作,在GCP上部署DeepVariant工作流程,這些工作流程采用可擴展的GCP技術(shù)(如Pipelines API)針對低成本和快速周轉(zhuǎn)進行了優(yōu)化配置。此配對版本提供一個平穩(wěn)的坡道,供用戶在當(dāng)前的計算環(huán)境中探索和評估DeepVariant的功能。“
他們表示,它還提供了一個可擴展的基于云的解決方案,以滿足最大的基因組數(shù)據(jù)集的需求。
2016-2022 All Rights Reserved.平安財經(jīng)網(wǎng).復(fù)制必究 聯(lián)系QQ280 715 8082 備案號:閩ICP備19027007號-6
本站除標(biāo)明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權(quán)歸原作者所有。