據(jù)物理學家組織網(wǎng)5月5日報道,zui近,美國能源部聯(lián)合基因組研究所(DOE JGI)、太平洋生物科學公司(PacBio)與華盛頓大學合作,開發(fā)出一種改良的基因組組裝工藝流程,生成的讀取片段達到數(shù)萬個核苷酸長度,zui終的組裝序列準確率大于99.999%。以往的桑格技術(shù)只有700個核苷酸,新工藝大大提高了測序組裝和分析的成本效益。相關(guān)論文在線發(fā)表于5月5日的《自然·方法學》上。
人們在降低成本和DNA測序通量上已取得巨大進步,但在重建基因組過程中,仍面臨很大挑戰(zhàn)。現(xiàn)有技術(shù)擅于造出短DNA字母片段(讀取片段),經(jīng)過計算把它們拼一起(組裝)成為長鏈,以此來確定目標序列中這些字母的序列和功能?;蚪M裝就好比把幾百萬的“拼圖”拼在一起,而事先不知道原圖是什么樣子。由于DNA段非常小而數(shù)量卻極大,用目前流行方法來組裝非常困難。
研究小組描述這一工藝為“從DNA樣品制備到zui終基因組確定的全自動過程”,所用技術(shù)叫做HGAP(分級基因組組裝過程)。利用太平洋生物科學公司的單分子實時DNA測序平臺,生成的讀取片段達到數(shù)萬個核苷酸長度,比人類基因組計劃時期的主力技術(shù)——桑格測序技術(shù)還要長。
桑格技術(shù)只能產(chǎn)出約700個核苷酸的讀取片段,而且要建多個DNA庫控制多種運行,結(jié)合數(shù)據(jù)分析才能填補堿基編碼空缺。后桑格法也需要多個庫,但結(jié)合了優(yōu)選技術(shù)。據(jù)研究小組報告,HGAP則相反, “只需準備一個DNA庫,就會自動連續(xù)不斷地讀取單分子實時測序完成組裝,而不需要循環(huán)一致測序。” 他們還用DOE JGI以往測序過的3種細菌對新方法進行了測試,收集數(shù)據(jù)進行了對比,發(fā)現(xiàn)HGAP方法zui終組裝好的序列準確率大于99.999%。
“我們一直在尋找新做法,在產(chǎn)出高質(zhì)量數(shù)據(jù)的同時提率。”DOE JGI基因組技術(shù)副主管蘭恩·潘那奇奧說,“我們在研究多種改良技術(shù)以實現(xiàn)規(guī)模經(jīng)濟效益,這只是其中之一。”在*已完成或正在進行的兩萬多個基因組項目中,超過20%在使用DOE JGI的測序技術(shù),大多集中在環(huán)境生物學、能源和碳處理方面。目前,研究小組正在進一步擴展這種新方法的應用范圍,以研究更復雜有機生物的基因組。
太平洋生物科學公司科學官喬納斯·克拉奇也表示,通過與JGI微生物和微生物基因組組裝與注釋領(lǐng)域的科學家合作,他們才能改變單分子測序組裝方法,使組裝結(jié)果質(zhì)量更高,而且在速度和價格方面能與下一代測序與組裝方法競爭。