您的位置: 首頁 >科技 >

在測序數(shù)據(jù)中調(diào)用變體的工具是開源的

2019-06-22 11:25:04 編輯: 來源:
導(dǎo)讀 由Google研究人員馬克·德普里斯托(Mark DePristo)和瑞恩·波普林(Ryan Poplin)創(chuàng)建的用于識別貓和狗圖像的人工智能在Google好奇號時代就

由Google研究人員馬克·德普里斯托(Mark DePristo)和瑞恩·波普林(Ryan Poplin)創(chuàng)建的用于識別貓和狗圖像的人工智能在Google好奇號時代就是如此。這是一年,現(xiàn)在他們正在使用技術(shù)尋找基因突變。

正如Will Knight在麻省理工學(xué)院技術(shù)評論中所寫的那樣,他們?nèi)〉昧肆钊斯奈璧倪M展,“了解編碼人類生活的大量數(shù)據(jù)仍然是一項艱巨的挑戰(zhàn)。”

Megan Molteni,Wired,至少解讀了挑戰(zhàn)的本質(zhì),以便更多地了解我們的人類謎題。“今天,你需要一勺吐痰和一百塊錢才能獲得你的DNA快照。但是全面了解你的基因組中所有30億個堿基對 - 需要一個更加費力的過程。一個,即使是在復(fù)雜的統(tǒng)計數(shù)據(jù)的幫助下,科學(xué)家仍然在努力。“

DeepVariant是由Google Brain團隊的研究人員開發(fā)的,專注于人工智能技術(shù),而Verily則是專注于生命科學(xué)的Alphabet子公司。

它基于相同的神經(jīng)網(wǎng)絡(luò)進行圖像識別,但DeepVariant現(xiàn)在不僅僅是針對貓ID的頭條新聞,而是作為一種掃描遺傳密碼進行突變的方法。DeepVariant已經(jīng)開源了。DeepVariant的GitHub定義:“使用深度神經(jīng)網(wǎng)絡(luò)從下一代DNA測序數(shù)據(jù)中調(diào)用遺傳變異的分析管道。”

研究人員表示,這是一種深度學(xué)習(xí)技術(shù),其“比以前的傳統(tǒng)方法具有更高的準(zhǔn)確性”。

大眾機械師索菲•韋納(Sophie Weiner)表示,“識別基因突變比其他任何程序更好。”

FDA管理的2016年P(guān)recisionFDA真實挑戰(zhàn)評估了(當(dāng)時)盲法評估樣本HG002的幾個社區(qū)提交的變體呼叫集。DeepVariant榮獲最高SNP表現(xiàn)獎。

Weiner說,已經(jīng)知道的一個程序是算法GATK,它使用大量數(shù)據(jù)來試圖找出測序可能出錯的地方。DeepVariant在技術(shù)上非常擅長識別編碼錯誤。

DeepVariant使用不同的方法來嘗試解決這些問題:“它將數(shù)據(jù)轉(zhuǎn)換為圖像。由于Google的AI最初用于圖像識別,因此這種技術(shù)最終運行良好。”

大西洋的莎拉·張(Sarah Zhang)向讀者介紹了DeepVariant發(fā)揮其魔力的方式,甚至對DNA測序機器一無所知。

“ 神經(jīng)網(wǎng)絡(luò)經(jīng)常被類比為'神經(jīng)元'層,逐漸處理更復(fù)雜的概念 - 第一層可能響應(yīng)光,第二層形狀,第三層實際物體。由于DeepVariant采用數(shù)據(jù)訓(xùn)練,它可以了解哪些連接'神經(jīng)元需要加強,哪些要被忽略。最終,它可以根據(jù)錯誤對實際突變進行排序。“

任務(wù)變成了視覺。張說:“字母-A,T,C或G-got分配了一個紅色值;該位置的測序質(zhì)量為綠色值; DNA的兩條鏈?zhǔn)撬{色值。一起,他們形成了一個RGB(紅色,綠色,藍色)圖像。“

DePristo在大西洋引用。“它極大地改變了這個問題,從過分思考數(shù)據(jù)到尋找更多數(shù)據(jù)。”

奈特指出,它“自動識別測序數(shù)據(jù)中的小插入和缺失突變以及單堿基對突變。”

GATK還有一件事就是DeepVariant作為解釋工具:速度。“該計劃的功能大約是GATK的一半,”韋納說。

向前進?“像DeepVariant這樣的程序可以利用其復(fù)雜的數(shù)據(jù)分析能力來預(yù)測突變的影響,預(yù)測哪些基因可能會激活,”Weiner說。“這項技術(shù)的潛力是無限的,盡管我們?nèi)匀挥修k法趕上基因本身的復(fù)雜性。”

在12月4日的谷歌研究博客中,團隊成員表示,DeepVariant作為開源軟件的發(fā)布是為了加速使用這項技術(shù)解決實際問題。

“為了實現(xiàn)這一目標(biāo),我們與Google云平臺(GCP)合作,在GCP上部署DeepVariant工作流程,這些工作流程采用可擴展的GCP技術(shù)(如Pipelines API)針對低成本和快速周轉(zhuǎn)進行了優(yōu)化配置。此配對版本提供一個平穩(wěn)的坡道,供用戶在當(dāng)前的計算環(huán)境中探索和評估DeepVariant的功能。“

他們表示,它還提供了一個可擴展的基于云的解決方案,以滿足最大的基因組數(shù)據(jù)集的需求。


免責(zé)聲明:本文由用戶上傳,如有侵權(quán)請聯(lián)系刪除!

精彩推薦

圖文推薦

點擊排行

2016-2022 All Rights Reserved.平安財經(jīng)網(wǎng).復(fù)制必究 聯(lián)系QQ280 715 8082   備案號:閩ICP備19027007號-6

本站除標(biāo)明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權(quán)歸原作者所有。