数码细胞:作为数据科学的细胞生物学

The Digital Cell: Cell Biology as a Data Science

 

作者:Stephen J. Royle

出版社:Cold Spring Harbor Laboratory Press

索书号:Q2/R891/2020/Y

ISBN9781621822783

藏书地点:武大外教中心

细胞生物学(Cell Biology)是研究和揭示细胞基本生命活动规律的科学,它从显微、亚显微与分子水平上研究细胞结构与功能。细胞增殖、分化、代谢、运动、衰老、死亡,以及细胞信号转导,细胞基因表达与调控,细胞起源与进化等重大生命过程。细胞生物学是现代生命科学的前沿分支学科之一,主要是从细胞的不同结构层次来研究细胞的生命活动的基本规律。从20世纪70年代基因重组技术的出现到当前,细胞生物学与分子生物学的结合愈来愈紧密,研究细胞的分子结构及其在生命活动中的作用成为主要任务,基因调控、信号转导、肿瘤生物学、细胞分化和凋亡是当代的研究热点。“大数据”一词最初起源于互联网和IT行业,然而随着人类基因组计划的完成,带动了生物行业的一次革命,高通量测序技术得到快速发展,使得生命科学研究获得了强大的数据产出能力,包括基因组学、转录组学、蛋白质组学、代谢组学等生物学数据。21世纪以来,生物大数据在量(多数据种类,海量样本数,多时间点采样等)、质(高时空精度,单细胞测序等)两方面快速发展,大大推动了生命科学的进步,也为生物医学问题的模型建立、数据分析,以及预测和控制,带来了巨大的机遇和挑战。

随着生物学与数据科学的飞速发展,细胞和分子生物学正变得越来越受大数据驱动。技术进步和计算能力使规模巨大的量化实验结果取代了简单地报告定性的、有代表性的观察结果。细胞是构成生命的基本单元,细胞中多种调控机制造就了机体中功能形态丰富多样的细胞群体,并进而构成了早期发育、肿瘤发展等多种关键生理病理现象的生物学基础。利用计算的方法解析细胞大数据中蕴含的新生命规律。具体来说就是基于基因组、转录组等大规模组学测量数据,通过多种计算方法有效挖掘、整合、建模,发现新现象、总结新规律,形成对生命过程的统一解析和理解,进而将其应用于生物医药领域的诊治中,实现精准解析细胞调控图谱。如何在海量的生物学数据中有效挖掘新的生物学知识是利用计算方法解析生命的关键,而无论是新型的深度学习模型、还是经典的统计学习方法,都高度依赖高质量的生物学数据。在此基础上,科研人员可以进一步开发新的计算方法,从多个层面分析细胞,整合和解读不同层面的数据,以全面理解细胞的组成成分和运作机制。进一步地,在临床上,多组学数据能够帮助人们理解细胞在病理状态和生理状态之间的差异,并精准锁定诊断标志物和治疗性靶点。

细胞生物学是一门广泛的学科,包含了从结构生物学和生物化学到免疫学和遗传分析的许多技术。在本书中不可能涵盖作为细胞生物学家可能使用的所有数据类型和方法。相反,本书的内容主要集中在显微镜实验的成像数据上。显微镜学是大多数细胞生物学研究的核心,选择集中研究荧光显微镜学,而不是其他类型的显微镜数据——明场显微镜、电子显微镜、原子力显微镜、单分子定位显微镜等。作者简要介绍了凝胶和印迹的分析方式,而其他细胞生物学数据类型(流式细胞术、蛋白质组学、基因表达分析等)在这里没有详细的讨论,但是这些细胞生物学领域的数据分析与书中描述的方法有许多共同之处,即:实验设计、无偏分析、统计、可重复性和演示等。

《数码细胞:作为数据科学的细胞生物学》一书于2020年由Cold Spring出版社出版,作者为Stephen J. Royle。作者希望提供一个全面的数据科学化指南。它描述了数据应该如何生成和处理,讨论了研究工作流程、管道和存储解决方案。本书的一个关键重点是图像—图像类型和格式的解释,是图像处理和分析的软件,以及分割分析和自动粒子跟踪等技术。这本书检查了各种各样的统计方法,可用于数据分析,强调概念,如重要性和可重复性。它还包括对编码的介绍,以及如何编写和使用R脚本分析结果的示例。此外,还有一些关于如何绘制和展示数据以最有效地传达结果的有用建议。在文中,作者还提出了五条黄金法则:(1)量化是理解细胞生物学的关键;(2)尽可能自动化分析,以尽量减少人为引入的错误和偏见;(3)旨在进行可重复的研究,以帮助未来的你,如果没有其他人的话;(4)原始数据是只读的;(5)输出是一次性的。

本书作为研究细胞生物学与数据科学结合的专业书记,内容专业详实,语言浅显易懂,除此之外还有以下特点:

1、本书介绍了细胞学以及数据科学的基础知识,并结合具体实例的应用,使读者能够更加全面的了解对该领域的研究历程。

2、索引文献丰富,证明了这本书的知识性,真实性。而且,这些索引文献绝大部分都是最新研究,让读者全面了解前沿进展。

3、在本书的最后,将出现的专业词汇都罗列出来,大大方便了大家在阅读过程中对该领域的专业术语的认知。

4、本书最鲜明的特点就是图片生动形象,语言浅显易懂,语言介绍的同时,附上可以说明问题的图片,使得相关专业知识变得简单易读,对初学者有很大的帮助。

 

本书目录

1.       数码细胞哲学

2.       处理数据

3.       图像数据

4.       图像处理与分析

5.       数据

6.       编码

7.       总结

 

 

兰天 武汉大学生命科学学院 博士研究生