生命科学数据挖掘
——Life Science
Data Mining
作 者:Stephen Wong,Chung-Sheng Li
出 版:World Scientific Publishing Co Pte Ltd
索 书 号:Q811.4/L722/2006/Y
I S B N :9789812700650
藏书地点:武大外教中心
数据挖掘(Data mining),又译为资料探勘、数据采矿。它是数据库知识发现(Knowledge-Discovery
in Databases,简称:KDD)中的一个步骤。数据挖掘一般是指从大量的数据中通过算法搜索隐藏于其中信息的过程。数据挖掘通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学习、专家系统(依靠过去的经验法则)和模式识别等诸多方法来实现上述目标。数据挖掘利用了来自如下一些领域的思想:(1)来自统计学的抽样、估计和假设检验,(2)人工智能、模式识别和机器学习的搜索算法、建模技术和学习理论。数据挖掘也迅速地接纳了来自其他领域的思想,这些领域包括最优化、进化计算、信息论、信号处理、可视化和信息检索。一些其他领域也起到重要的支撑作用。特别地,需要数据库系统提供有效的存储、索引和查询处理支持。源于高性能(并行)计算的技术在处理海量数据集方面常常是重要的。分布式技术也能帮助处理海量数据,并且当数据不能集中到一起处理时更是至关重要。
《生命科学数据挖掘》数据挖掘技术对生命科学中存在的数据进行挖掘的过,其利用计算算法及工具在大型数据存档中自动发现有用信息。数据挖掘技术被应用于记录大型数据库以便发现新颖的有用模式。它们还可以用来在有病的情况中预测未来观察的结果或者评估可能的风险。在生命科学中数据生成装置、数据采集和存贮技术的新进展使得生物医学研究和康复医学组织能够积累大量不同类型的数据。
《生命科学数据挖掘》这本书在当今生命科学发生急剧变化与发展的时代及时出现,它识别并强调了最新的数据挖掘范例,将分析、组合、整合、模拟和模拟的方法,大量地运用于生命科学中新兴现实应用的异构多模态多尺度数据。它将进行生物监测、疾病暴发检测、高通量生物成像、药物筛选、预测毒理学、生物传感器等多个生物信息数据处理过程,还能将宏观生物监测和环境数据与微型生物数据整合为个性化医疗。这本书是这一新兴领域始创书籍,为读者提供这个领域的开端。
本书的作者是Stephen Wong教授和Chung-Sheng Li。Stephen Wong是哈佛医学院生命科学系的一名教授,他的研究方向主要是生物信息学和生命科学,Stephen Wong教授在这些领域进行长期的研究和教学活动,在相关的主流的杂志上发过多篇影响力很高的文章;Stephen Wong是IBM(IT公司-国际商业机器公司)的一名技术员,其在信息技术领域有很高的专业水准。
数据挖掘的科学在商业界受到了很多关注,而《生命科学数据挖掘》的出版也是备受瞩目。在本书中,作者Wong(哈佛医学院)和Li(IBM)收集了关于数据挖掘技术在生命科学领域的应用,并在多个章节中进行讲述。集中具体应用包括:生物监测、疾病爆发检测、高通量生物成像、药物筛选、预防毒理学、生物传感器等。这是一个全新的领域,它为寻找其他原因收集的正常数据中的问题区域寻找突破提供帮助。本书是第一次讨论这种尖端技术,仍处于形成阶段,但正在迅速进入主流。除此之外,本书还具有以下几个特点:
1、具有权威性和时效性。《生命科学数据挖掘》一书在内容上十分广泛,语言描述简洁,本书由在生物学领域进行长期研究的学者和在信息学领域拥有超强技术水准的技术员通力合作的结果,因此书本具有较大的权威性。同时,由于关于生物学的内容更新换代很快,很多内容可能仅限于编书的当时,随着时代的发展有了更多的补充,因此,本书内容具有时效性。
2、图文并茂,便于理解。本书在介绍数据挖掘技术时配有相关的图片,包括数据图、技术流程图和信息技术算法。使读者清晰理解相关技术的科学算法以及技术操作过程,同时图文并茂使整本书更具有可读性、趣味性。
4、编排紧凑。该书在每一章开头都以提要和简介引入本章要讲的主要内容作为这一章的提纲挈领,并在章节末尾处对内容进行总结,并给出了关键词的解释,帮助读者对书中内容和概念进行归纳梳理,并自主进行扩展阅读。
总的来说,《生物信息学》内容详实、语言生动,同时提供了多样的学习经验,适合大学生、研究生和希望获得数据挖掘领域的基础知识和应用的研究人员。
目录
1. 对环境和公共卫生使用预警系统的调查;
2.
使用高斯混合模型对细胞周期进行定量数据分析;
3.
数据挖掘集成的多样性和准确性
4.
微阵列数据集成集群
5.
脑电参数模型的复杂性与同步性
6.
疾病暴发分类的综合症监测与贝叶斯传感器数据的融合
7.
针对综合性监测的非处方药销售的评估
8.
协作健康哨兵
9.
药物滥用研究和治疗评估的多模态系统方法:信息系统的需求和挑战
10.
用于预测毒理学的多用途混合智能处理的知识表示
11.
生物医学微阵列数据的集成分类系统实现
12.
高通量延时筛选中细胞相鉴定方法
13.
基于癌症微阵列数据的转录调控网络推断
14.
生物医学数据挖掘
15.
基因本体和微阵列数据挖掘多层关联规则
16.
传感器配置和参数灵敏度分析及其在生物传感器中的应用。
(武汉大学生命科学学院研究生 王鑫)