These new technologies have transformed bioinformatics into an entirely new field of data science that builds on the "classical bioinformatics" to process, investigate, and summarize massive data sets of extraordinary complexity.
2005年左右,二代测序仪的出现,让生物信息学进入了大数据时代。
下面是作者的进一步追问:到底什么是生物信息学?
But what is bioinformatics, really?
So now that you know what bioinformatics is all about, you're probably wondering what it's like to practice it day-in-day-out as a bioinformatician. The truth is, it's not easy. Just take a look at this "Biostar Quote of the Day" from Brent Pedersen in Very Bad Things:
I've been doing bioinformatics for about 10 years now. I used to joke with a friend of mine that most of our work was converting between file formats. We don't joke about that anymore.
Jokes aside, modern bioinformatics relies heavily on file and data processing. The data sets are large and contain complex interconnected information. A bioinformatician's job is to simplify massive datasets and search them for the information that is relevant for the given study. Essentially, bioinformatics is the art of finding the needle in the haystack.
看到同样有人在该领域工作快10年,但还是搞不清楚什么是生物信息学,我就放心了。这里特别强调了数据量,并且最后说生物信息学就是在大海捞针的艺术。
这里推荐一下给作者的这本书,可以作为生物信息学的入门书来看,而且不止我一个人推荐该书,微信公众号"生信媛"的创建人得到授权后翻译了本书,在下面的文章中可以找到所有内容的链接:
英文版:https://www.biostarhandbook.com/
中文版目录:
我的定义
上面介绍了自生物信息学这个词诞生后,从2000年到2018年之间的12个不同的定义。从总体上来看,最开始的定义更强调数据的采集、存储和获取等过程,更偏向于计算机科学;随着相关检测技术和生物数据分析基础平台的发展和完善,现在的定义更多的强调从整体上对数据进行整合分析以及高通量实验带来的大数据的挑战,更偏向于系统生物学。
下面是我基于自己的理解,给生物信息学下的定义:
生物信息学是围绕生物数据展开的,因此与数据科学有着天然的紧密联系。生物数据是各种检测仪器(测序仪、质谱和电镜等)对不同的生物过程进行量化时产生的。生物过程以各类生物大分子(DNA、RNA、蛋白质、多糖等)或小分子代谢物以及肠道菌群等与人体共生的微生物为基本的结构和功能单位,主要包括这些基本单位的新陈代谢(合成与分解,物质与能量的相互转化)和相互作用(信息的交流,即调控)。生物信息学就是利用统计或机器学习等数据科学领域的方法对生物数据进行分析和解释,从静态(结构和功能,细胞内的定位等)和动态(调控,转运等)两个方面来研究生物过程的科学。
为了完成上述任务,大致可以分为三个步骤:数据的管理(已有数据的注释、存储、检索和数据交换,以及新数据的提交);数据分析工具的开发;工具的使用以及对结果生物学意义的解释。我非常认同Dr. Raunak Shrestha在他的博客中的说法:生物信息学的终极目标是在分子水平理解一个活细胞是如何工作的。
如果要问我最喜欢哪个定义,除了我自己的定义之外,我最喜欢在一段视频中看到的定义:Bioinformatics: Where code meets biology.
Reference
https://en.wikipedia.org/wiki/Bioinformatics
https://searchoracle.techtarget.com/definition/bioinformatics
https://edwards.sdsu.edu/research/what-is-bioinformatics/
https://www.scq.ubc.ca/what-is-bioinformatics/
https://tse3.mm.bing.net/th?id=OIP.G1tK2zPG0f3T71ITT84G3wHaHo&pid=15.1
https://www.bioinformatics.org/wiki/Bioinformatics
https://www.sib.swiss/about-sib/what-is-bioinformatics
https://www.sib.swiss/about-sib/what-we-do
https://raunakms.wordpress.com/2010/06/05/what-is-bioinformatics-%E2%80%93-a-general-perspective/
https://www.youtube.com/watch?v=mWbuVlIX5jg