





作者:邹庆士
定价:128元
印次:1-1
ISBN:9787302575337
出版日期:2021.06.01
印刷日期:2021.05.24
图书责编:文怡
图书分类:零售
本书主要介绍大数据分析与应用,包括数据驱动程序设计、数据前处理、统计机器学习基础、无监督式学习、监督式学习、其他学习方式(集成学习、深度学习、强化学习)等6章内容。 本书特色:文字说明、程序代码与执行结果等交叉呈现,有助于阅读理解;提供来自不同领域的资料处理与分析范例;同时掌握数据分析两大主流工具—— R 与 Python;凸显第四代与第三代程序语言的不同之处。 本书读者对象:计算机、人工智能、大数据等相关专业的本科生、研究生,对大数据分析与应用感兴趣的社会读者,以及大数据分析与应用行业的工程技术人员。
邹庆士,明志科技大学机械工程系特聘教授兼人工智能暨数据科学研究中心主任。主要从事人工智能与统计机器学习、博弈理论应用、弹性制造与工业控制等领域的教学、科研工作。1988年在台湾中原大学工学院取得学士学位,1990年在台湾中原大学机械工程研究所取得硕士学位,1994年在台湾科技大学取得运筹学博士学位,毕业后在台湾中华大学企业管理学系暨经营管理研究所、台湾世新大学信息管理学系暨研究所、台北商业大学信息与决策科学研究所任教,长期讲授“数据科学导论”“统计机器学习与决策”“人工智能”等课程。近年来提供大数据分析培训与咨询服务,主持气象、交通、互联网、电子商务、金融科技、智慧养殖、绿能发电、环境辐射、化工制程等跨领域大数据分析建模产学合作案例,协助从业者学习实际应用统计机器学习技术,并与两岸多所大专院校合作开授R/Python语言数据科学讲座,分享跨领域数据解析的实践经验,致力于培育理论与实践兼具的跨域人才。
前 言 本书酝酿已久,走笔至此,不敢说是完美,但总算告一段落了!大数据分析是一个宽阔迷人的交叉学科领域,至少包括计算机科学、统计学与运筹学,让我到现在还不知道如何走出来。任何跨领域的新兴学科,其实很少有人是专家,而我只是众多对大数据充满兴趣的研究者中的一员。 知识探索的过程有时就像充满惊奇变化的自助旅行一样,抓住重要的基本方向,例如大数据分析背后的数学模型与计算机模型,先理论后实践,不断地相互交叉验证,其他就顺势而为,且战且走,享受意外的收获了。关于数据科学工具的采用,我们经历了R 语言因统计机器学习而走红,Python 语言因深度学习而兴起的过程,甚至要思考何时拥抱运算效率更好的Julia 语言。就数据领域而言,气象、交通、社群网络、电子商务、金融科技、物理化学、制造技术、农渔养殖、绿能发电、环境辐射、生物医学等,大数据研究永无止境。 道是本,术是末,因为物有本末,事有终始,知所先后,则近道矣,所以我们“重道轻术”了。但道是灵,术是体,术是道的具体实现,是看得见、摸得着的规律,也算是道的一部分,所以我们得“从术悟道”了。无论如何,笔者建议大数据分析的学习过程避免昨非今是、有我无你的文人相轻式学习。重视与慎选优质灵活工具,不断地动手探索尝试,并从失败中积累经验,努力思索跨领域的源头,方能迈向术道兼修的至高境界。 本书特色: ? 文字说明、程序代码与执行结果等交叉呈现,有助于阅读理解。 ? 提供来自不同领域的数据处理与分析范例。 ? 同时掌握数据分析两大主流工具——R 与Python。 ? 凸显第四代与第三代程序语言的不同之处。 ? 深入浅出地...
目 录
第1章 数据驱动程序设计 1
1.1 套件管理 1
1.1.1 基本套件 5
1.1.2 建议套件 6
1.1.3 贡献套件 9
1.2 环境与辅助说明 11
1.3 R语言数据对象 17
1.3.1 向量 18
1.3.2 矩阵 22
1.3.3 数组 25
1.3.4 列表 28
1.3.5 数据集 31
1.3.6 因子 38
1.3.7 R语言原生数据对象取值 42
1.3.8 R语言衍生数据对象 49
1.4 Python语言数据对象 54
1.4.1 Python语言原生数据对象处理 54
1.4.2 Python语言衍生数据对象取值 62
1.4.3 Python语言类别变量编码 68
1.5 向量化与隐式循环 71
1.6 编程范式与面向对象概念 77
1.6.1 R语言S3类别 80
1.6.2 Python语言面向对象 84
1.7 控制流程与自定义函数 89
1.7.1 控制流程 89
1.7.2 自定义函数 92
1.8 数据导入与导出 99
1.8.1 R语言数据导入及导出 99
1.8.2 Python语言数据导入及导出 101
1.9 程序调试与效率监测 105
第2章 数据前处理 112
2.1 数据管理 112
2.1.1 R语言数据组织与排序 113
2.1.2 Python语言数据排序 119
2.1.3 R语言数据变形 123
2.1.4 Python语言... 查看详情
(2)凸显第四代与第三代程序语言不同之处,掌握数据驱动程序设计的特点。
(3)左手用R,右手用Python,厚植追随数据科学家的实力。
(4)配套资源丰富,来自各行业的数据处理与分析案例、R/Python对比的源代码、完整的教学课件。
(5)深入浅出地介绍统计机器学习理论与实务,做中学、学中做,迈向术道兼修的境界。
查看详情