目录
下载源码
第1章绪论
1.1数据挖掘基础
1.1.1数据挖掘概述
1.1.2数据挖掘演进脉络
1.1.3数据挖掘应用领域
1.2基于Python的数据挖掘
1.2.1本地环境安装
1.2.2简单案例实践
1.2.3本书常用方法
1.3天池平台操作概述
1.3.1天池AI实训平台介绍
1.3.2课程配套环境操作
1.3.3天池数据集介绍
习题1
第2章数据可视化
2.1数据可视化概述
2.1.1数据可视化的概念
2.1.2数据可视化的作用
2.1.3Python数据可视化实战准备
2.2matplotlib绘制简单图表
2.2.1matplotlib简介
2.2.2绘图属性设置
2.2.3简单图形的绘制
2.3高级图表绘制
2.3.1subplot子区
2.3.2Seaborn
2.3.3词云图
2.3.4mplot3d模块
习题2
第3章数据预处理
3.1数据预处理概述
3.1.1数据预处理的概念
3.1.2数据预处理在数据挖掘中的作用
3.1.3数据预处理的主要任务
3.2数据清洗
3.2.1缺失值处理
3.2.2噪声数据处理
3.2.3异常值处理
3.3数据集成
3.3.1数据源识别与整合
3.3.2数据格式统一化
3.3.3数据冗余与相关性分析
3.4数据变换
3.4.1数据变换概述
3.4.2数据编码应用示例
3.4.3规范化应用示例
3.5数据预处理应用案例
习题3
第4章回归分析
4.1回归分析基本问题
4.1.1回归分析介绍
4.1.2回归分析的种类
4.1.3回归分析的发展史
4.2线性回归模型
4.2.1模型的相关概念
4.2.2一元线性回归分析
4.2.3多元线性回归分析
4.2.4实战准备
4.2.5模型案例分析
4.3其他回归模型
4.3.1Lasso回归模型
4.3.2岭回归模型
4.3.3逻辑回归模型
4.3.4实战准备
4.3.5模型案例分析
习题4
第5章关联规则分析
5.1关联规则分析概述
5.1.1概念
5.1.2原理步骤
5.1.3应用领域
5.2Apriori算法
5.2.1基本原理
5.2.2算法流程
5.2.3实战准备
5.2.4Apriori算法案例
5.3FPgrowth算法
5.3.1基本原理
5.3.2算法流程
5.3.3实战准备
5.3.4FPgrowth算法案例
5.4关联规则分析案例
习题5
第6章聚类分析
6.1聚类分析概述
6.1.1聚类分析的基本概念
6.1.2聚类分析的原理和步骤
6.2基于划分的聚类
6.2.1kmeans算法
6.2.2kmeans++算法
6.2.3实战准备
6.2.4划分聚类案例
6.3基于层次的聚类
6.3.1层次聚类的基本概念
6.3.2凝聚层次算法: AGNES算法
6.3.3分裂层次算法: DIANA算法
6.3.4实战准备
6.3.5层次聚类案例
6.4基于密度的聚类
6.4.1密度聚类的基本概念
6.4.2DBSCAN 算法
6.4.3实战准备
6.4.4密度聚类案例
习题6
第7章随机森林
7.1随机森林概述
7.1.1决策树概论
7.1.2随机森林概论
7.1.3决策树与随机森林
7.2决策树
7.2.1sklearn中的决策树模型
7.2.2分类决策树
7.2.3回归决策树
7.3随机森林实践
7.3.1随机森林实践准备
7.3.2随机森林案例分析
7.3.3随机森林的应用案例
习题7
第8章神经网络
8.1神经网络概述
8.1.1概念
8.1.2发展历程
8.1.3应用领域
8.2长短期记忆网络算法
8.2.1基本原理
8.2.2算法流程
8.2.3LSTM算法案例
8.3BP反向传播算法
8.3.1基本原理
8.3.2算法流程
8.3.3BP算法案例
习题8
第9章贝叶斯分类
9.1贝叶斯分类概述
9.1.1贝叶斯定理
9.1.2贝叶斯分类步骤及优点
9.1.3应用领域
9.2朴素贝叶斯算法
9.2.1基本原理
9.2.2算法分类
9.2.3实战准备
9.2.4朴素贝叶斯算法案例
9.3贝叶斯网络
9.3.1基本原理
9.3.2算法流程及实战准备
9.3.3贝叶斯网络算法案例
习题9
第10章文本挖掘
10.1文本挖掘概述
10.1.1基本介绍
10.1.2应用领域
10.1.3基本流程
10.2文本预处理
10.2.1文本清洗
10.2.2分词和词性标注
10.2.3特征选取
10.2.4词向量表示方法
10.3文本挖掘方法实现
10.3.1文本分类
10.3.2文本聚类
10.4文本挖掘结果可视化
10.4.1知识图谱
10.4.2词云图
10.5文本挖掘算法案例
习题10
第11章综合案例实战
11.1代码自动生成
11.2租房案例概述
11.2.1案例背景
11.2.2案例研究目的
11.3数据采集及预处理
11.3.1选取及提取网页
11.3.2使用Scrapy解析页面内容
11.3.3数据清理及存储
11.4数据分析与可视化
11.4.1房源租金可视化分析
11.4.2区域租金均价分布可视化
11.5代码自动生成的租房决策实现
11.5.1找准区域
11.5.2找准商圈
11.5.3找准户型
11.5.4找准朝向
11.5.5找准设施
11.5.6得出结果
11.6数据挖掘应用发布和实践
11.6.1基于Web服务器的应用发布
11.6.2基于钉钉低代码的应用发布