图书前言

前言

随着人工智能与大数据的兴起,各个领域与人工智能大数据的融合,使得很多领域有了较新的发展。特别是医疗健康行业,如智能医疗、医疗大数据等,都迎来了一个前所未有的崭新阶段。

本书以零编程基础的拟从事科研数据分析的人员为基础,包括医科院校学生、医院医务科研工作者,考虑到读者没有其他计算机基础或者计算机基础较薄弱,我们特别选择了目前比较流行的大数据处理语言——Python。Python语言简单易学,入门快,只需掌握简单的语法即可上手。本书选用当前比较稳定的3.12版本。

无论您是刚接触数据分析的新手,还是希望提升机器学习技能的专业人士,本书都能为您提供宝贵的知识和实践指导,尤其对于医学生和医务科研工作者,通过多个具体案例和详细的代码解释,读者可以更好地理解和掌握所学知识,并将其应用到解决实际问题中。

书中的内容从基础的Python编程语法开始,逐步深入到复杂的数据分析技术和机器学习算法。每一章节都精心设计,旨在帮助读者构建坚实的理论基础,并提供丰富的实战案例,使读者能够将所学知识应用于解决实际问题中。

基础篇:介绍了Python编程的基础知识,包括语法基础、编辑器使用、数据类型、流程控制等。同时,还深入探讨了NumPy和Pandas这两个数据分析中不可或缺的库,包括数组和数据的操作、条件筛选、数据的增删改及排序等。

进阶篇:聚焦于机器学习的入门知识,包括分类、回归和聚类算法,以及心脏病风险预测分析的案例研究。这一部分还涉及模型的Shap解读与保存部署,帮助读者理解模型的工作原理并将其应用于解决实际问题中。

实战篇:提供了一个综合应用案例研究,基于期刊论文分析与复现,从读取数据、构建模型,到特征选择和模型重构让读者能够将理论知识应用于实际的数据分析项目中,增强实战能力。

高级AI篇:介绍了PandasAI库的使用方法及零代码AI编写编辑器Trae,实现了不编写一行代码由AI对第7章进行数据分析的全过程。

附录:提供了模型App部署和模型评估的额外信息,为读者提供了将模型部署到实际应用中的指导。

特别值得一提的是,书中不仅涵盖了数据处理和可视化的基本技巧,还详细介绍了如何使用NumPy和Pandas进行高效的数据操作,如何通过Matplotlib进行数据可视化,以及如何使用Shap值来解读模型,这些都是当前数据分析领域中的热点话题。

随着逐步深入阅读这本书,读者将发现作者不仅提供了理论知识,还提供了大量的代码示例和实战演练,能够帮助读者快速上手并深化理解。本书是数据分析和机器学习领域的宝贵资源。

本书的主要目的是帮助医学专业的本、硕、博学生学以致用,会使用Python对数据进行处理分析。

由于作者认知水平有限,书中可能存在错漏之处,恳请广大读者批评指正。

作者对零基础读者的忠告:务必跟着书本亲自上手敲写代码,至少第1章中的代码要亲自敲一遍,看书百遍不如上手一遍,以便更好地学习后续高级AI篇中的零代码操作。

余本国

                                                2025年3月25日

于海口海南医科大学