Please wait a minute...

当期目录

    2021年 第2卷 第3期    刊出日期:2021-06-30
    本期中英文目录
    2021, 2(3):  0. 
    摘要 ( 416 )   PDF (506KB) ( 542 )  
    相关文章 | 计量指标
    半导体合成生物学 ——DNA 存储专辑序
    DNA数字信息存储:造梦、追梦与圆梦
    钱珑, 沈玥, 元英进, 欧阳颀, 杨焕明
    2021, 2(3):  303-304.  doi:10.12211/2096-8280.2021-033
    摘要 ( 1484 )   HTML ( 240)   PDF (532KB) ( 1459 )  
    参考文献 | 相关文章 | 计量指标
    评论
    基于人工染色体的DNA信息存储前沿进展
    杨洋, 樊春海
    2021, 2(3):  305-308.  doi:10.12211/2096-8280.2021-043
    摘要 ( 1745 )   HTML ( 269)   PDF (1372KB) ( 1246 )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    作为信息存储的替代材料,DNA体现着高信息存储密度和长期稳定等特性。来自天津大学的元英进教授团队最近在酵母菌内完成了从头设计并合成一条人工染色体用于编码两张图片和一段视频数据的研究。这项成果建立了体内组装编码的人工染色体的数据存储策略,可以实现一次写入、稳定复制和多次读取,从而体现出低成本海量数据分发的巨大优势。

    特约评述
    DNA信息存储:生命系统与信息系统的桥梁
    韩明哲, 陈为刚, 宋理富, 李炳志, 元英进
    2021, 2(3):  309-322.  doi:10.12211/2096-8280.2021-001
    摘要 ( 6523 )   HTML ( 583)   PDF (3021KB) ( 3571 )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    DNA信息存储通过编解码、合成、编辑和测序等过程,实现数字信息写入、存储与读出。其在密度、寿命、能耗和抗电磁干扰等方面较磁、光、电等常规的信息存储介质有较大优势。随着全球数据总量的快速增长,DNA信息存储的优势特性和发展潜力受到了研究者的广泛关注。本文阐述了DNA信息存储的基本原理和技术流程,分析了DNA信息存储与生命系统和信息系统的关联,并依据读写技术特点归纳近年来涌现的“DNA硬盘”“DNA光盘”“DNA磁带”等几种主要模式、发展现状及技术路线。在此基础上,探讨DNA信息存储商业化、大规模应用面临的主要挑战,讨论更低成本的数据写入和更快速的数据读出,并指出可行的发展路线。最后,展望了DNA作为新型存储介质在现代存储系统中的发展演化趋势。

    DNA数字信息存储的研究进展
    董一名, 孙法家, 武瑞君, 钱珑
    2021, 2(3):  323-334.  doi:10.12211/2096-8280.2020-086
    摘要 ( 1966 )   HTML ( 209)   PDF (1443KB) ( 1917 )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    随着计算机技术的发展,数字化信息存储改变了我们的生活。信息正在以越来越快的速度产生着,但与此伴生的,是如何有效存储数据的问题。诸如磁盘、硬盘、闪存等磁学或光学等传统存储介质已经逐渐不能满足全世界范围内数据存储的需要。DNA分子凭借其稳定性、高存储密度和低维护成本,有望成为实用的新型信息存储介质。本文首先介绍了利用DNA分子进行数据存储的工作流程,继而介绍了DNA数据存储领域的研究历史和研究进展,包括存储方式、读取方式、编码方式等。为实现DNA信息存储,通过信息编码将二进制信息转换成DNA序列信息;DNA合成实现信息写入;最后通过基因测序获取序列信息,进而进行信息解码得到原始信息。而现代分子生物学技术的发展,尤其是DNA合成和测序技术的飞跃,使DNA分子大规模存储人工数据逐渐成为现实。之后,对比了DNA分子相对于传统数据存储介质的优劣,介绍了基于DNA分子的数据存储的风险与挑战,如数据安全性、信息读写的速度和成本等。最后,对DNA数据存储领域未来研究的方向进行了展望,介绍了一些与该领域具备交叉潜力的新兴生物技术领域,如“DNA条形码”“DNA折纸”。

    人工DNA合成技术:DNA数据存储的基石
    黄小罗, 戴俊彪
    2021, 2(3):  335-353.  doi:10.12211/2096-8280.2020-088
    摘要 ( 2586 )   HTML ( 273)   PDF (1954KB) ( 2630 )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    DNA数据存储由于在存储应用上的诸多优点而日渐受到广泛关注。DNA数据存储流程包括将0/1二进制信息转换为A/T/C/G碱基序列,利用人工DNA合成技术将碱基序列合成为DNA多聚物分子,以及通过测序技术进行数据读出等环节。然而,目前的人工DNA合成成本依然高昂,严重制约了以DNA为介质的数据存储技术的快速发展及其产业化应用。人工DNA合成作为DNA数据存储的基础技术和成本关键,是决定DNA数据存储从理论走向应用的主要因素。本文以DNA合成的发展历程出发,系统地总结了其关键技术的研究进展,包括柱式化学寡核苷酸合成、芯片化学寡核苷酸合成、寡核苷酸纯化、寡核苷酸拼装、基因合成纠错与克隆筛选、大片段基因合成组装及基因组合成,以及新一代酶法合成等。同时,进一步总结和分析了DNA合成技术关键参数长度、成本及速度对DNA数据存储商业化发展的影响,以期为DNA数据存储的全流程技术开发和应用研究提供一定的参考和思路。降低DNA合成成本,开发更加高效的基因组合成策略,进一步发展新一代酶法DNA合成技术,以及建立面向DNA数据存储的长片段、低成本、快写入等功能应用的DNA合成技术等是未来DNA合成技术的重要发展趋势。

    DNA微阵列原位化学合成
    闫汉, 肖鹏峰, 刘全俊, 陆祖宏
    2021, 2(3):  354-370.  doi:10.12211/2096-8280.2020-089
    摘要 ( 1841 )   HTML ( 154)   PDF (3109KB) ( 1863 )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    高通量、快速、低成本DNA合成是合成生物学、DNA信息存储以及DNA芯片等前沿科技领域的重要核心技术。DNA微阵列原位化学合成方法是在亚磷酸酰胺固相化学合成原理的基础上,整合了微电子学、计算科学、分子生物学、光电化学和微纳加工等学科的相关技术,近30年来得到了迅速的发展和应用。DNA微阵列原位化学合成方法根据不同的碱基分配方式可以分为原位光刻法、光敏抗蚀层合成法、光致酸法、喷印合成法、软光刻合成法、电致酸法和压印法以及以这些技术为基础衍生的各种合成方法等。本文对上述不同的DNA微阵列原位化学合成方法及其技术特点进行阐述,并对未来DNA合成方法的发展趋势进行讨论和展望。合成通量和效率方面基于CMOS芯片的电致酸DNA原位化学合成技术在未来10年内将具备较大的发展空间,通过解决芯片上微电极间氢离子串扰问题,有望实现单片TB级的DNA快速低成本合成。

    DNA数据存储:保存策略与数据加密
    周廷尧, 罗源, 蒋兴宇
    2021, 2(3):  371-383.  doi:10.12211/2096-8280.2020-084
    摘要 ( 1895 )   HTML ( 167)   PDF (1994KB) ( 2011 )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    随着信息技术和互联网应用的不断升级,人类社会进入数据爆炸式增长的时代。为缓解海量数据与存储技术不足之间的矛盾,人们开始寻求新一代的存储方式。DNA作为一种新兴的数据存储媒介,具有巨大的发展潜力,其优势包括超高的数据存储密度(理论可达现有技术106倍)、能耗低以及寿命长(理论可达数十万年)。这些特点可有效克服传统存储介质如硬盘、光盘和固体闪存等的不足。本文以DNA数据存储为主线,阐述了DNA数据存储的基本理论和工作流程,重点介绍了DNA保存的方法与策略研究进展,简要总结了信息安全与数据加密的最新研究成果,最后讨论DNA数据存储现阶段面临的主要挑战及发展趋势,特别是,DNA数据存储效率提升、存储读取高度集成自动化以及数据加密新策略等方面将是DNA数据存储的重要研究方向。相信随着合成生物学的不断发展,DNA数据存储将成为未来最具应用潜力的新型存储方式。

    DNA信息存储中关键生化方法的研究
    郜艳敏, 唐梦童, 刘倩, 乔宏艳, 王桃雪, 齐浩
    2021, 2(3):  384-398.  doi:10.12211/2096-8280.2020-085
    摘要 ( 1297 )   HTML ( 95)   PDF (2138KB) ( 1207 )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    随着生物技术特别是高通量的DNA合成和测序技术的发展,DNA信息存储技术在存储容量、稳定性以及可重复读取等方面都取得了重大成就。但目前携带有数据信息的大规模寡核苷酸文库的生化技术的操纵仍面临着巨大的挑战,比如合成、扩增、保存或测序过程引起的寡核苷酸不均一性、DNA序列丢失、碱基突变、DNA分子的衰减等,这些因素限制了DNA信息存储走向实际工业化应用。本文从操纵大型寡核苷酸文库的生化技术角度出发,归纳总结了造成生化问题的原因以及为解决这些问题所开发的一系列方法,包括合成工艺的改进、寡核苷酸文库的均一化、多种DNA保存方法、变体PCR以及恒温扩增反应,论证了它们在DNA信息存储流程中避免上述生化问题的可行性与有效性,最后分析了现阶段DNA信息存储所面临的合成、长时间保存方法以及扩增等方面的挑战。本文旨在为实现对大型寡核苷酸文库的操纵奠定基础,以期促进DNA信息存储迈向实际应用。

    从全球专利分析看DNA合成与信息存储技术发展趋势
    陈大明, 张学博, 刘晓, 马悦, 熊燕
    2021, 2(3):  399-411.  doi:10.12211/2096-8280.2021-040
    摘要 ( 1579 )   HTML ( 149)   PDF (2085KB) ( 1316 )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    随着大数据技术的发展以及数据的快速增长,DNA作为信息存储的介质,受到诸多研究机构和企业的重视。DNA存储技术发展空间和市场潜力巨大。有预测认为,到2024年将有约30%的数字业务开始尝试用DNA存储信息。在巨大的市场需求面前,与之相匹配的专利布局成为在竞争中赢得主动的先决条件。本文从专利的角度,梳理分析了DNA合成与存储技术的发展趋势。要实现DNA的合成及存储,寡核苷酸或多核苷酸的合成是“写”的根本,目前,全球寡核苷酸或多核苷酸合成技术已经经历了三代发展历程,第一代和第二代均采用亚磷酰胺化学合成法,第三代合成以酶促合成为原理。根据全球专利分析显示,每年所公开的专利数量快速增长,一批新创立企业加入到第二代合成技术的开发中。随着利用末端脱氧核糖核苷转移酶等聚合酶的酶促合成技术的开发,一批新专利权人着手布局第三代技术的专利。同时,DNA存储所需的核酸组装、序列设计、信息存储等相关技术也发展迅速,这些技术相对应的专利权人呈现出明显的跨界融合特征,微软、英特尔、华为等信息技术企业纷纷加入到DNA信息存储技术专利的竞争与合作之中。可以预见的是,未来的DNA存储技术必然涉及化学、材料、生物、信息、机械、电子等多领域的技术融合,而技术的进一步融合或将推动DNA存储领域呈现出类似“摩尔定律”技术定期升级的发展路径。

    研究论文
    Chamaeleo: DNA存储碱基编解码算法的可拓展集成与系统评估平台
    平质, 张颢龄, 陈世宏, 倪鸣, 徐讯, 朱砂, 沈玥
    2021, 2(3):  412-427.  doi:10.12211/2096-8280.2020-083
    摘要 ( 1810 )   HTML ( 145)   PDF (3873KB) ( 1431 )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    近年来DNA存储因其数据存储密度与保存时间方面的优势而备受关注,有望在如光盘、硬盘等传统存储介质之外作为一种新型信息存储方式,满足海量数据存储及特殊应用领域数据加密存储的迫切需求。DNA存储流程中,二进制信息到DNA碱基序列的相互转换(即编解码)方法是实现数字信息技术与生物技术衔接的最核心步骤。尽管DNA存储编解码研究已有丰富进展,但与现有上下游衔接技术的兼容性,对不同存储文件的适配性、存储稳健性和数据安全性等尚缺少一个可量化比较与评估的系统。因此,本研究开发了一个DNA存储编解码方法的可扩展集成与评估平台Chamaeleo,以模块化集成方式对已开发的编解码方法进行系统性量化分析与评估,可针对不同类型文件进行编解码方法的择优方案输出。Chamaeleo以开源方式运行,以便于未来新编解码方法和评价指标的持续加载,促进该领域开放交流,推动规范化有序发展。

    细胞内大片段DNA数据存储的多RS码交织编码
    陈为刚, 葛奇, 王盼盼, 韩明哲, 郭健
    2021, 2(3):  428-443.  doi:10.12211/2096-8280.2021-023
    摘要 ( 1165 )   HTML ( 113)   PDF (3400KB) ( 1327 )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    合成DNA作为潜在的数字信息存储介质,存储密度高,可用时间久,有望成为未来数据存储的重要选项。然而,DNA的合成与测序读出往往造成碱基的多种错误,无法满足数据存储的可靠性要求,而保证可靠性的编码方案往往效率较低。针对该问题,提出了一种面向酿酒酵母内大片段DNA数据存储的高效率编码方法。数据编码通过多个极高码率的里德-所罗门(RS)码的码字交织构建数据DNA单元,将其与酵母的自主复制序列(ARS)交替镶嵌,构成酵母人工染色体序列;数据读出时,利用二代高通量测序,组合了读段从头(de novo)组装、ARS导引例,用20×二代测序数据可无错恢复原始数据。该编码方法不仅能实现数据可靠存储,实现的DNA数据部分逻辑密度为1.973 bit/bp,即使考虑生物单元开销,总体逻辑密度仍达到1.947 bit/bp。该设计流程可支持Kb到Mb不同长度的DNA的编码,为大片段DNA数据存储的“湿”实验提供灵活的实验前验证与评估。