什么是基因测序,为什么需要云计算 (2)

好了,知道了基因就是神奇的密码,它可以控制生物的特性。接下来的工作就是要破解这个密码,也就是第一步得先得到DNA的具体序列。于是当前的工作重点就跑到了如何测定每种生物的DNA序列。

2      基因怎么测序   2.1      桑格测序

最早的DNA测序技术,由英国生物化学家弗雷德里克·桑格(Frederick Sanger)于1975年发明的。具体过程太技术化,简单概括就是一个一个按需顺序进行检测。这种检测方法可以做到精度非常高(达99.999%),读长(一次最长检测的DNA长度)很长(1000bp)。可以成为后续其他基因检测仪的判断标准,人类基因组计划(HGP)主要就是使用该测序方法完成的。

image.png

拿了两块诺贝尔奖的桑格

但是这种测序方法也有很明显的缺点,就是成本昂贵,测序速度也比较慢。这也是为什么人类基因组计划需要美、英、日、德、法、中等国耗时10年时间才完成人类基因图谱的绘制。

2.2      基因参考组

人类基因组计划(Human Genome Project, HGP)是一项规模宏大,跨国跨学科的科学探索工程。其宗旨在于测定组成人类染色体中所包含的30亿个碱基对组成的DNA序列,从而绘制人类基因组图谱,并且找出所有基因在染色体上的位置,达到破译人类遗传信息的最终目的。

image.png

该计划于2003年宣布完成,意义巨大。

2.3      二代测序技术

因为不同的人与人之间的基因序列只有不到1%差异。当我们已经有了一份完整的人类基因图谱,那么其他人的基因序列都差不多的。所以就出现了鸟枪法测序(又称散-弹-枪法)。该法的思路独特,好像树林里停了一大群鸟,很多人乱枪射击,在很短的时间内,就可以将林子中的大部分鸟打中。

image.png

“鸟枪法”有点类似人们玩的拼图游戏。拼图游戏是将一个完整的画面分成杂乱无章的碎块,然后重新拼装复原。而“鸟枪法”则是先将整个基因组打乱,切成随机碎片,然后测定每个小片段序列,最终利用计算机对这些切片进行排序和组装,并确定它们在基因组中的正确位置。

由于可以将目标先拆分小粒度,然后分段得出结果,最后合并结果。这就好比是大数据中的并行计算,直接导致的结果就是测序性能大大提升。经过不断的技术开发和改进,第二代测序技术开始诞生了。

image.png

第二代测序技术在大幅提高了测序速度的同时,还大大地降低了测序成本,并且保持了高准确性,以前完成一个人类基因组的测序需要3年时间,而使用二代测序技术则仅仅需要1周,但其序列读长方面比起第一代测序技术则要短很多,大多只有100bp-150bp。

image.png

二代测序技术最大的价值在于它极大的降低了测序的成本,是的基因测序技术普及并开始进入普通消费者的视野。

image.png

而二代测序技术中,属Illumina公司的测序仪,市场占有率最高,属于绝对的控制地位。

image.png

内容版权声明:除非注明,否则皆为本站原创文章。

转载注明出处:https://www.heiqu.com/zwpdsp.html