新华社天津10月17日电(记者张建新、栗雅婷)随着数据存储需求进入“泽字节时代”(1泽字节约等于1万亿GB),DNA因其环境友好、稳定性高和存储密度大等特点,被视为极具潜力的存储介质之一。然而,DNA数据存储的实际应用仍面临合成过程中的技术瓶颈,尤其是在采用高扩展性、低成本的合成方法(如电化学合成)时,往往伴随较高的核苷酸错误率与合成不均匀性问题,严重影响数据读写的可靠性。
针对这一难题,天津大学应用数学中心与合成生物学国家重点实验室吴华明教授团队推出一项研究成果,实现了DNA数据存储中的高保真数据恢复和强大的错误纠正。该研究提出了一种名为StairLoop的DNA存储框架,旨在提升DNA存储系统在高错误率合成环境下的数据恢复性能。该成果日前发表在国际期刊《自然·通讯》上。
体外存储实验编码框架示意图。新华社发
据悉,该研究通过设计阶梯式交织结构与迭代式软判决解码机制,在不依赖复杂多序列比对的前提下,实现了对插入、删除及替换等典型合成错误的有效校正。该方案还具备并行解码能力,有助于提升大规模数据检索的效率。
基于该存储框架,研究团队成功将代表早期人类文明的甲骨文图像应用电化学DNA合成法写入DNA中。实验数据显示,尽管部分合成区块的核苷酸错误率超过6%、序列丢失率超过30%,StairLoop仍能准确解码并完整复原原始图像。
研究团队表示,这一成果证实了该方案能够有效应对高错误率合成环境下的数据存储挑战,为推进电化学合成等高通量技术的实际应用提供了技术支撑,对DNA存储技术从实验室向产业化过渡具有积极意义。