頭條資訊 - 為您提供最新最全的新聞資訊,每日實時更新

將數據存到DNA裡,全世界的信息只有1公斤重!

科學 中科院物理所

以下文章來源於十點科學,作者楊波。

數據不僅可以存在硬盤裡,還可以存在生物的DNA裡。1公斤重的DNA,就可以存下全世界的數據信息。

將數據存到DNA裡,全世界的信息只有1公斤重!

科學家將“Hello World”翻譯成鹼基語言,儲存到大腸桿菌的DNA中。|改編自ChemistryWorld

作者|湯波 分子生物學博士

大數據時代,我們在網絡上每一個動作,比如網上衝浪、觀看視頻,甚至跑步、走路等日常行為,每分每秒都在產生大量數據。它們如一條條河流,匯聚成數據的汪洋大海。

如此大量的信息如何存儲?珍貴的數字記憶要如何長久可靠地保存?科學家們想到了一種方法,將數據寫入活細菌的DNA中!

最近,美國哥倫比亞大學的研究人員通過改變環境電壓,引導“基因魔剪” CRISPR-Cas系統,將“hello world”翻譯成鹼基語言,錄入大腸桿菌的DNA中。在繁衍80代以後,這些大腸桿菌體內儲存的數據仍然基本完好無損。

相關研究發表在1月11日的《自然·化學生物學》雜誌。

數據時代,存儲的革新

在地球生命系統中,DNA 可謂無處不在。自然將生命的遺傳信息存儲在 DNA 中,人類也可以將數據信息存儲其中。

計算機的二進制語言只需要0和1兩個符號,即可編碼所有信息。生命的本質也是一種語言,那就是由 A、T、C、G 四種鹼基串聯而成的 DNA ,四種鹼基的順序蘊藏著生命的信息。

早在上世紀80年代末,就有人提出,或許可以將計算機的二進制數字語言轉換成DNA的四種鹼基語言,從而將數據信息存儲在DNA上。讀取時只要反向進行DNA測序即可。

數據信息可以存儲在DNA中,也可以反過來從DNA中讀取數據信息。|來自網絡

相比於人類津津樂道的硅,DNA 簡直是數據存儲的理想載體。首先,DNA 的存儲密度非常大。如果我們能夠像大腸桿菌那樣包裝DNA,那麼全世界的數據信息都可以儲存在1公斤重、只佔粉筆盒大小空間的一堆 DNA 中。

其次,一般物理存儲設備使用壽命往往不到10年,DNA 則可將遺傳信息完整保存100年以上;如果是在零下18℃以下的低溫環境中,甚至可保存上萬年、數十萬年。

第三,DNA 存儲過程耗能極少。要存儲同樣大小的信息,DNA 的耗能量只相當於閃盤的億分之一。

人工合成 DNA 帶來希望

在實際操作中,二進制數字語言要如何轉換成DNA的四種鹼基語言呢?2012年,哈佛大學遺傳學家喬治·丘奇團隊確立的規則是,用鹼基A、C編碼二進制的0,G、T編碼二進制的1。

經過簡單翻譯,一本包含大約5.34萬個單詞的書籍、11張JPG圖片、一段簡短的計算機程序,全部被編碼進不到億萬分之一克的DNA微芯片中。這些文件大小相當於659千字節。之後,研究人員利用 DNA 測序技術成功閱讀了這本書,雖然略有瑕疵地發現了22個錯誤。

幾個月後,歐洲生物信息研究所採用另一種策略,同樣將大小為739千字節的文件寫入人工合成DNA中,讀取正確率接近100%。

這兩項研究讓人們看到了DNA存儲技術的希望,也開啟了研發熱潮。之後,存儲數據的大小不斷突破上限,從22兆字節,到200兆字節,再到維基百科所有16GB 的數據。

將數據存到DNA裡,全世界的信息只有1公斤重!

DNA數據存儲設備。|Takahashi et al, 2019

不過,人工合成DNA數據存儲技術要實現商業化應用,還有一些重大問題要解決。

一是成本過高,目前人工合成存儲1兆字節數據的DNA,需要3500美元,解碼過程還需要額外的1000美元。二是無論存儲還是讀取過程都需要專業設備,個人使用極不方便。三是DNA保存需要低溫環境,否則長時間容易發生 DNA 降解,導致數據失真或丟失。

活細菌蘊藏著新可能

既然人工合成 DNA 有缺陷,那能不能借用活細菌的 DNA 呢?比如大腸桿菌,在實驗室只需要少量的營養物質就能茁壯成長,成本應該也會低很多。

事實上,早在2017年,丘奇團隊就開創性地利用“基因魔剪” CRISPR–Cas 技術,將編碼信息的DNA片段送入細菌體內。CRISPR–Cas 系統可以對任何DNA序列進行精準修改,如將鹼基A替換成鹼基G,或者刪除、插入、替換一段特異的DNA序列,就像我們使用 Word 軟件編輯文字一樣。

實驗中,丘奇團隊將一些黑白圖像和一張飛馳駿馬動圖編碼為DNA序列,插入大腸桿菌的基因組中。在大腸桿菌經過多代繁殖後,研究人員仍然能夠還原動圖信息,正確率達90%以上。

將數據存到DNA裡,全世界的信息只有1公斤重!

左邊是飛馳駿馬動圖的原圖, 右邊是將該動圖存儲在活細菌中,並經過多代繁殖後恢復的動圖。 |SETH SHIPMAN

這一次,哥倫比亞大學的研究人員則進一步發展了該方法。他們用電化學方法調控 CRISPR 系統看是否行使功能。需要存儲的二進制信息先被轉換為DNA序列,並插入環狀質粒(一種穩定的DNA環),然後隨質粒轉入大腸桿菌體內。

通過改變化學試劑的濃度,就可以改變細菌周圍的電壓,這時一些特定的環狀質粒拷貝數會顯著增加。CRISPR 系統感知到這種變化,並將質粒中的插入片段(目標DNA序列)寫入細菌基因組,在生物體內實現數據信息的自動存儲——這就像為存儲動作設置了一個開關。

將數據存到DNA裡,全世界的信息只有1公斤重!

通過感受周圍電壓變化,大腸桿菌將質粒中的目標片段自動寫入基因組。|Sproetniek/iStock

為了研究該方法的可行性,研究人員將“hello world”錄入大腸桿菌的DNA中,並測試它們繁衍80代後,所攜帶的信息是否仍然穩定,結果發現正確率達90%以上。他們還將大腸桿菌混入土壤微生物中,對混合物進行測序,仍然可以恢復存儲的信息。

將數據存到DNA裡,全世界的信息只有1公斤重!

信息編碼為DNA序列,之後或者直接導入大腸桿菌中,或者先插入環狀質粒,再轉入大腸桿菌。|MDPI

當然,對活細菌存儲數字信息的研究目前才剛剛開始,還有很多技術難題需要攻克。不過,隨著眾多科學家和大型企業的加入,這些技術難題將被一一解決。相信在不遠的將來,DNA數據存儲設備將隨處可見。

那時,我們或許可以通過解碼存放在小試管裡或活細菌中的一段DNA,來閱讀一本科幻小說,聽一段搖滾樂,觀看一部大製作電影。甚至如今存儲在電子設備中的任何文件,將來都能在DNA數據存儲設備中找到。

編輯 | 陳天真

責編 | 高佩雯

封圖 | ChemistryWorld

參考文獻

1.Sang Yup Lee. DNA Data Storage Is Closer Than You Think. https://www.scientificamerican.com/article/dna-data-storage-is-closer-than-you-think/.

2.Craig A. de Ridder, Josh D. Morton. When Will DNA Solve the Data Storage Crisis?

https://www.pillsburylaw.com/en/news-and-insights/dna-data-storage.html

3.數據存儲歷史:http://www.chinastor.com/history/

4.Goldman N, Bertone P, Chen S, et al. Towards practical, high-capacity, low-maintenance information storage in synthesized DNA. Nature. 2013;494(7435):77-80. doi:10.1038/nature11875.

5.Church GM, Gao Y, Kosuri S. Next-generation digital information storage in DNA. Science. 2012, 28;337(6102):1628. doi: 10.1126/science.1226355.

6.Zhirnov V, Zadegan RM, Sandhu GS, Church GM, Hughes WL. Nucleic acid memory. Nat Mater. 2016;15(4):366-370. doi:10.1038/nmat4594.

7.Shipman, S., Nivala, J., Macklis, J. et al. CRISPR–Cas encoding of a digital movie into the genomes of a population of living bacteria. Nature 547, 345–349 (2017). https://doi.org/10.1038/nature23017.

9.Robert F. Service. Scientists ‘program’ living bacteria to store data. https://www.sciencemag.org/news/2021/01/scientists-program-living-bacteria-store-data

來源:十點科學

編輯:蕉

轉載請超鏈接註明:頭條資訊 » 將數據存到DNA裡,全世界的信息只有1公斤重!
免責聲明
    :非本網註明原創的信息,皆為程序自動獲取互聯網,目的在於傳遞更多信息,並不代表本網贊同其觀點和對其真實性負責;如此頁面有侵犯到您的權益,請給站長發送郵件,並提供相關證明(版權證明、身份證正反面、侵權鏈接),站長將在收到郵件24小時內刪除。
加載中...