中国科学家把汉字存入DNA,DNA存储未来如何发展?
“我们的重要突破点就是实现了DNA合成与测序环节的一体化,实现一体化后,DNA存储的效率和准确性会提高,更容易实现大规模的数据存储。”
近年来该领域迎来一个新的研究方向——DNA存储,这项研究有助于解决大数据时代数据存储难题。”
1994年,比尔盖茨坐在33万张纸上,手中拿着一张光盘告诉全世界:一张光盘能记录的内容,比这33万张纸都多。
“未来5-15年,中国科学家将在数据中心,手中拿着一管DNA告诉全世界:这里面记录的是当前全世界的数据。” 日前,中国科学院院士樊春海对未来DNA存储技术的前景作出如此预判。
什么是DNA存储技术?为何它被寄予如此厚望?
DNA存储技术取得新突破
随着互联网和人工智能等信息技术和数字技术的快速发展,信息量呈指数级飞快增长,磁盘、硬盘、闪存等传统存储介质已经逐渐不能满足全世界范围内数据存储的需要。
在此背景下,信息技术和生物技术交融下的DNA存储技术逐渐走入我们的视野。
近日,东南大学师生团队成功将该校校训“止于至善”存入一段DNA序列,实现了DNA存储技术的新突破,并将相关成果发表在国际学术期刊《科学·进展》上。
东南大学师生团队研发的DNA存储电极。供图/刘宏团队
“DNA是一种序列确定的生物大分子。DNA存储技术就是将生物DNA分子进行编码,从而在DNA序列上存储信息。” 东南大学生物电子学国家重点实验室刘宏教授介绍道。
刘宏团队改进传统的化学合成方法,运用电化学方法,将东南大学校训“止于至善”4个字“翻译”为DNA序列,并将其存储在电极上,随后又成功读取出来。“因为我本身就有电化学的背景,电极是我们最常用到的工具,所以就想到以这个为切入点来研究。”
“我们的重要突破点就是实现了DNA合成与测序环节的一体化,目前大多数DNA存储的合成和测序是分开的,实际上这是一个比较偏实验室的基础研究。”刘宏表示,“实现一体化后,DNA存储的效率和准确性会提高,更容易实现大规模的数据存储。”
谈及研究初衷,刘宏表示:“东南大学生物电子学国家重点实验室,一直从事生物电子方面的研究,近年来该领域迎来一个新的研究方向——DNA存储,于是我们在一年前开始了这项研究。更重要的是,这项研究有助于解决大数据时代数据存储难题。”
据国际数据公司IDC统计,全球数据信息总量将从2018年的30ZB(Zettabyte,十万亿亿字节)增长到2025年的163ZB。
“现在数据产生的速度,远远要超过我们生产这些存储介质的速度,所以必须要有新的介质来解决这个难题。”刘宏表示。
而将DNA作为存储介质,刘宏认为其有着天然的优势:一是信息密度高,据微软研究院此前估计,1立方毫米的DNA就能够存储1个EB(Exabyte,百亿亿字节)的数据;二是存储时间长、稳定性强,在合适的条件下,可以存储上万年;三是存储能耗很低。
从正式研究到取得新的突破,刘宏团队只用了一年多时间。“但很多基础研究其实早就开始了。”刘宏说道。2013年,刘宏结束博士后工作回到国内,一直在做电化学传感方面的研究,也正是这8年的沉淀,为DNA存储技术的快速突破打下了坚实的基础。
刘宏教授(左)与学生观察DNA存储电极。供图/刘宏团队
“我们在论文投稿的同时,还在继续完善研究,补充了很多新数据,所以虽然论文只有几页纸,但我们的计算材料大概有几十页。”回想起论文投稿环节,刘宏表示:“做科研其实每一个环节都不容忽视,从投稿到修改稿件,我们用了差不多三四个月时间。”
谈及为何会选择将校训存入DNA序列,刘宏直言:“可能因为校训就刻在每一个东南大学师生的DNA里。”
DNA存储技术面临哪些挑战?
在全球数据信息总量呈指数级增长的背景下,DNA存储技术开始在不同领域探索应用。因其存储优越性,DNA 存储技术也已引起多个国家和地区的重视。
美国是进行相关规划布局最多的国家,其涵盖了从数据“写入”到“读取”的多个技术过程;欧盟虽未明确出台文件政策进行 DNA 存储技术布局,但也对相关研发进行了资助;日本、澳大利亚等国在合成生物学领域的重视程度也进一步提升;我国也已布局相关领域,我国“十四五”规划明确提出“加快布局量子计算、量子通信、神经芯片、DNA存储等前沿技术”。
企业也早已敏锐看到了这一领域的广阔前景。美国微软公司是最早研究DNA存储技术的公司之一,2016年微软宣布购买1000万条DNA用于研究数据储存。2019年,华为宣布成立战略研究院,表示主要研发前沿技术,比如光计算、DNA存储及原子制造。在今年的华为全球分析师大会上,华为董事、战略研究院院长徐文伟表示将要借助DNA存储来突破超大存储空间模型和编码技术,打破容量墙。
对于DNA存储技术的应用场景,刘宏表示,DNA存储适合应用于有长期信息存储需求的地方,主要起到存储功能,不需要经常读取信息。
尽管DNA存储技术潜力巨大,但就其应用来看,依然面临挑战。
据了解,目前DNA存储技术还受到数据覆盖和重写、随机读写等方面的制约。“尤其是DNA合成的成本和效率,仍然是限制DNA存储技术发展的主要挑战。”刘宏表示。据业内分析师估计,目前DNA存储200MB数据,需要耗资80万美元。
“但相信经过技术的不断发展,成本会越来越低。” 刘宏说道。
虽然研究已经取得了重要进展,但刘宏认为这还只是一个初步成果。“为存储更多数据,下一步我们要做基于大规模电极阵列的数据存储。我们现走的只是第一步,用DNA做存储介质实际上还有很长的路要走。”刘宏说道。