Prakash Kumar Sarangi, Birendra Kumar Nayak Sachidananda Dehuri

生物信息学中的数据分析:机器学习视角

作者:Rabinarayan Satpathy, Tanupriya Choudhury, Suneeta Satpathy, Sachi Nandan MohantyXiaobo Zhang

出版:Wiley Press

索书号:Q811.4D232s/2021/ Y

ISBN: 978-1-119-78553-8

藏书地点:武大外教中心

       机器学习技术越来越多地用于解决计算生物学和生物信息学中的问题。用于分析序列、基因和蛋白质表达、通路和图像形式的高通量数据的新型机器学习计算技术,这对于理解疾病和未来的药物发现变得至关重要。马尔可夫模型、支持向量机、神经网络和图形模型等机器学习技术在分析生命科学数据方面取得了成效,因为它们能够处理数据噪声的随机性和不确定性以及泛化。生物信息学中的机器学习汇编了机器学习方法中的最新方法及其在解决生物信息学中当代问题中的应用,这些问题近似于疾病的分类和预测,特征选择,降维,基因选择和微阵列数据的分类。

       机器学习技术越来越多地用于解决计算生物学和生物信息学中的问题。用于分析序列、基因和蛋白质表达、通路和图像形式的高通量数据的新型机器学习计算技术对于理解疾病和未来的药物发现变得至关重要。马尔可夫模型、支持向量机、神经网络和图形模型等机器学习技术在分析生命科学数据方面取得了成功,因为它们能够处理数据噪声的随机性和不确定性以及泛化。生物信息学中的机器学习汇编了机器学习方法中的最新方法及其在解决生物信息学中当代问题中的应用,这些问题近似于疾病的分类和预测,特征选择,降维,基因选择和微阵列数据的分类

       疾病的正确诊断需要对疾病进行深入的分析和分类。在过去的二十年中,生物数据的指数级增长成为许多研究人员的机会。"生物信息学"是生物学和计算机科学的整合,用于开发用于理解这个大型生物数据集的方法和软件工具。通过手动方式分析大量数据是很困难的。在这里,计算机科学在提取隐藏的模式方面起着举足轻重的作用。在所有人工智能(AI)技术中,人工神经网络(ANN)被认为是自动化过程模式识别中最有效的模型。ANN是一种数据结构,其灵感来自分层组织的生物神经元网络,其中数据集被馈送到模型,模型从输入中学习特征并预测输出。根据分类准确性对性能进行比较。在本文中,我们将通过将ANN模型的分类准确性与其他现有分类模型进行比较来进行回顾,以获得更多见解来绘制假设。

       医学成像是产生身体内部结构的可见图像以进行科学和医学研究和治疗以及内部组织功能的可见视图的过程。这些医学图像对于治疗各种病理疾病起着重要作用。由于图像处理技术的发展,包括图像识别,分析,增强,分割等,医学成像正在迅速发展。它增加了通过成像检测到的检测到组织的百分比和数量。文献中使用不同的方法研究了许多方法。在文献综述中,作者将视网膜分割技术分为两大类。这些是基于规则的方法和基于机器学习的方法。基于规则的方法通常处理有关算法框架的特定规则,例如基于内核,船舶跟踪,自适应局部阈值等。机器学习方法使用手动分割的图像(地面实况)来形成一个标记的数据集,该数据集进一步用作训练数据集。在训练图像中,像素由它们是否属于血管来识别。基于机器学习的方法使用监督学习方法(需要训练图像)和无监督方法(不需要训练图像)。然而,由于背景和血管表面之间的强度差异较低,因此在夸大视网膜图像的过程中会发生噪声。此外,在分段时保留微小的血管具有挑战性。通常,对比度增强技术会丰富信息内容以及背景中存在的噪声。因此,选择合适的增强技术进行视网膜血管分割起着至关重要的作用。

机器学习是人工智能的一个重要子集,它帮助用户预测问题,并以信息学的方式解决问题,消耗更少的时间和成本。有许多聚类算法用于通过获取数据集之间的相似性实例来从数据集中预测疾病。众所周知的聚类算法是K-meansC-meansDBSCAN,这是一种基于密度的聚类算法,用于从数据集中消除噪声。众所周知的神经网络SOM(自组织特征图)用于聚类和模式识别目的。该神经网络不仅是一种信息可视化过程,而且还有助于从数据集中缩小维度以观察特征的模式。C 均值是一个迭代聚类分析过程,其目标是最小化数据点之间的差异。在此算法中,首先确定聚类的数量,然后确定模糊级别,并随机初始化成员矩阵。之后,计算聚类中心的维数并评估聚类中心和数据点之间的欧氏距离,然后更新成员矩阵。卫生部门可以利用最新的创新进行现代化改造,这将建立普通民众的未来。心脏病,囊肿,癌症等驾驶疾病包括世界各地的路过。包括心血管疾病在内的通过率每年都以令人不安的速度增长。世界卫生组织2016年的报告建议,31%的通过包括心血管疾病,其中85%是因为冠状动脉衰竭和中风。在美国、英国、加拿大和新西兰等发达国家,体重率的上升促使心脏相关问题的危险性上升。考虑到心血管疾病对总人口的影响,早期定位的AI模型被证明是非常有帮助的。利用各种机械进步的稳定努力来管理这个不断上升的危险问题。最近创建了各种生物工程程序,以适应不断发展的医疗问题。在该地区进行的研究表明有助于提高下降率。由于机械的进步,世界各地不同治疗机构和医疗诊所的信息分类和容量已经变得可以想象。然后利用不同的AI计算来分解收集的信息,这些计算可以在数据集中的每个特征中找到某些示例,关系和相似性。第一步是利用各种信息表示技术将基于内容的信息转化为视觉组织,以区分未检测到的模式。从现在开始的一秒钟是利用包含选择来减少过多和琐碎的信息,从而从根本上提高预测率。第三步是利用订单策略来准备模型并对测试数据集进行预测。第四步是提出提高手术预测率的策略。

《生物信息学中的数据分析:机器学习视角》一书于2021年由Wiley Press出版,作者是Rabinarayan Satpathy, Tanupriya Choudhury, Suneeta Satpathy, Sachi Nandan MohantyXiaobo Zhang

《生物信息学中的数据分析:机器学习视角》一书中,研究人员介绍了从机器的角度分析生物信息学中的数据的基本概念,重点是最近的技术发展,讨论的主题主要包括二十个章节。《生物信息学中的数据分析:机器学习视角》一书从各个方面讲解了从机器的角度分析生物信息学中的数据的基础内容和研究方法,旨在为想要进一步研究从机器的角度分析生物信息学中的数据的研究人员提供简明易懂的介绍以及方法技术指导。

《生物信息学中的数据分析:机器学习视角》一书作为从机器的角度分析生物信息学中数据专业研究读物,观点新颖独到,内容饱满详实、语言浅显易懂,除此之外,还包括一些其他的特点:

1、本书分为二十个章节,既讲解了从机器的角度分析生物信息学中的数据的基础知识,还讲解了深入研究从机器的角度分析生物信息学中数据的应用范围,是一本应用性很强的书籍,对于想要学习研究从机器的角度分析生物信息学中的数据的研究人员来说是一本很有意义的指导书籍。

2、每个章节都是由相关领域的专业人士所撰写,因此,本书讲解既详细又专业,读者能够从中了解到从机器的角度分析生物信息学中数据相关的专业知识以及最新的前沿进展。

总的说来,《生物信息学中的数据分析:机器学习视角》一书为想要了解从机器的角度分析生物信息学中数据的研究方法的人员提供了清晰的导读路径,作为从机器的角度分析生物信息学中的数据领域的一本前沿研究图书,是一本值得为想要涉足该领域的人员推荐的专业书籍。

 

本书目录:

1部分:机器学习征集生物信息学的开始

1 监督学习导论

Rajat Verma, Vishal Nagar Satyasundara Mahapatra

2 章生物信息学中的无监督学习导论

Nancy Anurag Parasa, Jaya Vinay Namgiri, Sachi Nandan Mohanty Jatindra Kumar Dash

3 章人工神经网络在生物信息学中的应用综述

Vrs Jhalia, Tripti Swarnkar

2部分:机器学习和基因组技术,特征选择和降维

4 降维技术:原理、优点和局限性

Hemanta Kumar Palo, Santanu Sahoo Asit Kumar Subudhi

5 使用机器学习工具检测植物病害,并概述降维概念

Saurav Roy, Ratula Ray, Satya Ranjan Dash Mrunmay Kumar Giri

6 使用多层次组学数据综合分析的基因选择:系统综述

Saurav Roy, Ratula Ray, Satya Ranjan Dash Mrunmay Kumar Giri

7 不平衡基因组学分类中的随机森林算法

Sudhansu Shekhar Patra Om Praksah Jena Gaurav Kumar Sreyashi Pramanik Chinmaya Misra

8 乳腺癌疾病的特征选择和随机森林分类

Saurav Roy, Ratula Ray, Satya Ranjan Dash Mrunmay Kumar Giri

9 优化在微阵列数据中的应用综合研究

Swati Sucharita, Barnali Sahu Tripti Swarnkar 10

10 聚类分析和特征选择:机器学习和图像处理的视角

3 部分:机器学习和医疗保健应用

11 章面向医疗保健解决方案的人工智能和机器学习

Ashok Sharma, Parveen Singh Gowhar Dar

12 章使用LSTMXG增强算法预测新型日冕病毒病(Covid-19

V. Aakash,S. Sridevi, G. AnanthiS

13 章一种创新的机器学习方法,用于在早期阶段诊断癌症P. Poongodi,E. Udayakumar,K. Srihari

14 章使用机器学习技术基于多导睡眠图的人类睡眠分期行为研究桑托什·库Santosh Kumar Satapathy, D. Loganathan

15 章使用脑电图信号检测精神分裂症

Santosh Kumar Satapathy, D. Loganathan

16 使用机器学习概念的医学应用生物信息学中信号处理技术的性能分析

G. Aparna, G. Anitha Mary G. Sumana

17 传染病本体的各种统计数值和机器学习本体模型综述

G. Aparna, G. Anitha Mary G. Sumana

18 使用机器学习预测肝病的有效模型

Ritesh Choudhary,T. Gopalakrishnan,D. Ruby, A. Gayathri,Vishnu Srinivasa Murthy

4 生物信息学、市场分析

19 章一种使用生物信息学技术预测股票市场行为的新方法

Prakash Kumar Sarangi, Birendra Kumar Nayak Sachidananda Dehuri

20 使用马尔可夫模型的股票市场价格行为预测:生物信息学方法

Prakash Kumar Sarangi, Birendra Kumar Nayak Sachidananda Dehuri

 

 

林岚 武汉大学生命科学学院 博士研究生