DVD會變質、機械硬碟會故障,化學家打算用一勺蛋白質保存整個圖書館

DVD會變質、機械硬碟會故障,化學家打算用一勺蛋白質保存整個圖書館

我們怎樣儲存訊息?

寫下來的紙張會被焚燬,電腦可能會被駭,DVD可能會無法讀取。威脅無處不在,從簡單的一盆水到複雜的網路攻擊,都有可能讓我們的記錄化為烏有。

訊息爆炸,數據井噴,可能未來連雲端儲存也無法承載,而且它無法阻擋住所有駭客,還會持續消耗能量。據估計,到2020年,全球數位化檔案估計將達到44萬億Gb,數位化海嘯馬上就要席捲而來,浪潮之下,我們應該如何面對巨量訊息?

哈佛訊息服務中心的伺服器儲存架與笨拙的網路線

現在,有一種儲存訊息的新方法可以穩定地儲存數百萬年的數據,並且不受到駭客的威脅。

它的占用空間非常小,想像一下用一勺蛋白質就可以保存整個紐約市公共圖書館的資料,一鍋蛋白質就可以容納所有地球往事。並且一旦編寫,就不會再消耗能量。所需要的只有一個化學家,一些易得的分子和需要儲存的訊息。

這是哈佛大學與西北大學合作開發的一個項目,研究結果已經在國際學術期刊ACS Central Science發表。該項目提出並實現了利用易獲得、低能耗、穩定且能超長時間保存的寡肽分子儲存資料(以二進制形式),數據檢索準確率超過99%。

從生物學到有機化學:資料儲存的靈感

利用生物儲存能力來儲存資料的想法早已有之,並且已經有了一定的進展。比如,目前我們已經可以透過合成DNA鏈來記錄訊息,記錄的訊息可以從美食照片,烹飪教程一直到玩貓的影片。

但是雖然DNA與電腦晶片相比較小,但還是屬於大分子。並且,DNA的合成需要大量重複的工作。如果每條消息都需要從頭開始設計編譯,那麼大分子儲存可能會因為過於昂貴耗時而無法實現。 

 Brian Cafferty

Brian Cafferty是該研發團隊的成員之一,也是論文的第一作者介紹說,於是他們的研究團隊從生物學轉向有機和分析化學尋求靈感,開發使用一種更小、更低分子量的分子來編碼訊息的方法。

這種儲存方式只需一次合成就可以生成足夠的小分子,用以編碼多個影片,使這種方法無疑比基於DNA的方法更省力也更便宜。

用分子實現聽說讀寫畫

該團隊選擇的低分子量化合物是寡肽(兩個或多個結合在一起的肽),這些肽常見而穩定,並且比DNA,RNA或蛋白質分子量都要小。

而且由於組成寡肽的氨基酸數量和類型不同,它們的分子質量是有差異的。當不同的寡肽分子混合在一起時,這種差異可以實現相互區分,不同質量的分子就像字母表中的不同字母一樣。

將這些「字母」組成單詞會有點複雜,該團隊將不同質量的寡肽儲存在384個不同的「微孔」中,然後將寡肽混合物放置在金屬板的表面上,就像將墨水印在書頁上一樣。如果想要讀取「寫下」的內容,可以透過質譜儀按質量對微孔中的分子進行分類,查看這個孔中存在哪些寡肽、不存在哪些寡肽,由此讀取內容。

圖片來源:Michael J. Fink然後團隊使用二進制編碼將混亂的分子翻譯成字母和單詞。例如,字母「K」在ASCII(美國訊息交換標準程式碼)中被寫作01001011,就可以透過使用八種不同質量的寡肽儲存「K」。將微孔中存在的四種寡肽讀取為「1」,而缺失的四種讀取為「0」(如下表)。這些分子二進制程式碼指向相應的字母;如果儲存的訊息是圖像,則指向相應的像素。使用這種方法,八種寡肽的混合物可以儲存一個字節的訊息; 32種寡肽的混合物可以儲存四個字節,以此類推。

DVD會變質、機械硬碟會故障,化學家打算用一勺蛋白質保存整個圖書館

更快,更便捷,更安全

到目前為止,Cafferty和他的團隊已經用這種方法記錄、儲存並「閱讀」了物理學家Richard Feynman的著名演講、Claude Shannon(他被稱為「訊息理論之父」)的相片和葛飾北齋的畫作《神奈川衝浪裏》。

名畫《神奈川衝浪裏》經檢驗,這種儲存方式的檢索準確率為99.9%。平均「寫入」速度為每秒8bits,「讀取」速度每秒20 bits。雖然目前還比大多數資料儲存設備要慢,但隨著技術的繼續發展,速度肯定還會提升。例如,如果噴墨打印機可以以每秒1,000次的速率產生液滴,就能將更多訊息塞入更小的區域,或者再加以改進質譜儀使之可以同時獲取更多訊息。

未來,還可以透過引入不同類別的分子,提高儲存的穩定性和容量,並降低成本。實驗中使用寡肽是定製的,因此價格較貴。但未來還可以考慮可以購買更便宜的分子(如烷硫醇),實現花1美分就可以記錄1億bits的訊息。

「目前,這種方法還不會取代現有的資料儲存方法,」Cafferty說,「我們認為它是對現有技術的補充,非常適合長期存檔的資料儲存。」Cafferty團隊提出的分子儲存方法是一種穩定的、零能耗、抗腐蝕的儲存可選方案。

寡肽等分子具備復原能力,可以在數百年甚至數千年的時間內保持穩定性。在高溫和乾旱的情況下,這些分子可以在沒有光或氧的情況下存活下來。而且,駭客無法像攻破雲端儲存那樣竊取分子儲存的內容,分子儲存只能透過人工存取。即使被發現藏匿的資料,小偷也需要擁有足夠的化學知識才能實現程式碼檢索。

DVD會變質、機械硬碟會故障,化學家打算用一勺蛋白質保存整個圖書館

所以未來,即使所有的書都付之一炬,所有的電腦都被駭了,所有DVD都被毀壞,這些分子可能還會繼續存在,提醒未來的人類,我們曾經是多麼喜歡那些可愛的影片。

bigdatadigest
作者

大數據文摘(bigdatadigest)成立於2013年7月,專注數據領域資訊、案例、技術,在多家具有影響力的網站、雜誌設有專欄,致力於打造精準數據分析社群。

使用 Facebook 留言
發表回應
謹慎發言,尊重彼此。按此展開留言規則