利用CRISPR系统将数字电影编码到细菌DNA中

【背景】

1878年6月19日,埃德沃德·迈布里奇(Eadweard J. Muybridge)拍下了人类史?#31995;?#19968;部“电影”《骑手和奔跑的马》,虽然这部“电影”只是将一系列照片放在一起运行,从而产生移动的效果,但是它的出现,引领人类正式跨入了“电影和电影摄像的时代”。
2017年7月13日,来自哈佛大学的Seth L.Shipman、 George M. Church等科学家利用CRISPR系统,将《骑手和奔跑的馬》这部“电影”编码进了细菌的DNA中,并在Nature发表。这部未来主义“分子电影?#20445;?#35265;证了人类跨入“DNA信息存储的时代”。

【方法】

  1. 一种比较?#32454;?#30340;方案是(右手图像):4种像素由不同的碱基进行指定的;另外一种相对宽松的方案是(左手图像):21种像素由核苷酸三重表进行定义(图1)。
  2. 图像的编码与解码方案

  3. 编码一段GIF到细菌细胞中
    使用编码左手图像方法——核苷酸三重表进行定义,将《Human and Animal Locomotion》这幅GIF图片编码成5个片段,每个片段含有104条寡核苷酸,最终存入2.6k字节的信息。同时,?#33455;?#20154;员利用CRISPR技术将每一帧的信息?#26469;?#25353;顺序插入到基因组中,最终NGS测序得知,图像重现率达到90%以上(图2) 。
  4. GIF编码与解码方案

【结论】

  1. 静态图像编码与重现
  2. ?#26434;?#21491;手图像来说,每28个核酸编码一个像素值,因此通过112条寡核苷酸序列构建了一个4种颜色,56*56像素的图像,包含784字节信息;?#26434;?#24038;手图像来说,通过核苷酸三重编码表,使用28个核苷酸可以编码9个像素。为了提高效率,?#33455;?#20154;?#22868;?#35774;序列的GC含量在50%左右,相同碱基重复3个以下,没有内置PAM序列。通过100条寡核苷酸序列构建了一个使用了21种颜色,30*30像素的图片,包含了494字节信息。最终通过NGS测序得知,88%的右手图像和96%左手图像的像素序列被准确的还原。

  3. GIF图像编码与重现
  4. 通过使用核苷酸三重表编码方式,将像素转化成碱基序列,并通过基因编辑技术手段,将2.6k字节的信息存入到细菌的基因组中。

参考文献
Shipman, S.L., et al., CRISPR-Cas encoding of a digital movie into the genomes of a population of living bacteria. Nature, 2017. 547(7663): p. 345-349.