人工智能应用案例实践(微课视频版)
"以项目任务式深入浅出地讲解了项目所涉及的核心模型与关键技术 配套13章教学课件,30个任务源代码,207分钟视频讲解 "。提供课件。

作者:王海军、李海波 主编,王俊林、寇志伟、杨瑞红 副主编

丛书名:跟我一起学人工智能

定价:79元

印次:1-1

ISBN:9787302707868

出版日期:2026.02.01

印刷日期:2026.02.03

图书责编:赵佳霓

图书分类:教材

电子书
在线购买
分享
内容简介
作者简介
前言序言
资源下载
查看详情 查看详情 查看详情

"本书围绕计算机视觉和智能语音处理技术在交通、工业等领域的实际项目案例,深入浅出地讲解项目涉及的核心的模型与关键技术。本书中的案例代码可以在PC和AIE-kit人工智能边缘计算实训设备上进行部署与实施,软、硬件结合实现了教学场景化、学习趣味化。 本书首先介绍计算机视觉和语音识别的基础技术及机器学习技术的应用,例如人脸检测、眨眼检测、实时声源定位、异常行为聚类分析、使用GMM-HMM模型识别孤立词等,然后介绍基于深度学习技术的应用,例如交通标志识别、车辆型号和特征识别、车辆跟踪、车辆违规检测、基于 Transformer 深度学习模型的中文 OCR、老照片自动着色、图像超分辨率、火灾与吸烟检测、生物特征识别等;最后围绕工业产品检测的核心任务,详细探讨了相机建模与校准、立体测距及残次品检测三大核心技术的实现原理与应用场景。 本书适合人工智能相关专业的学生及计算机初学者阅读,既可以作为高等院校人工智能相关专业的教材,也可以作为相关领域从业者的学习和参考用书。本书可以帮助有一定基础的读者查漏补缺,深入理解和掌握相关原理与方法,提高解决实际问题的能力。 "

王海军,男,汉族,首都师范大学研究生学历,工学硕士,鄂尔多斯应用技术学院数学与计算机工程系计算机科学与技术教研室主任,正高级工程师,副教授,信息系统项目管理师,信息系统监理师,高级网络系统架构工程师,内蒙古高等学校教坛新秀,鄂尔多斯市青年优秀人才,主持参与省部级项目十余项,发表论文30余篇,其中SCI、EI及CPCI检索15篇,CSCD及北大核心检索7篇,授权软件著作权7项,实用新型专业1项,编写专著1部,参编教材4部,获得2016年内蒙古教育厅优秀论文三等奖1项,获得2017年内蒙古科技厅优秀论文二等奖1项,获得2019年内蒙古教育厅优秀研究成果三等奖1项,获得2022年内蒙古高等教育协会优秀论文一等奖1项。

前言 随着人工智能技术的飞速发展,计算机视觉和智能语音已成为两个核心应用领域,深刻影响着各行各业的变革。从自动驾驶、智能监控、医疗诊断,到语音助手、智能客服和语音翻译,人工智能技术正在不断改变我们与世界互动的方式。计算机视觉和智能语音的结合,创造了更智能的设备和系统,让机器不仅能“看”和“听”,还能理解和决策。 目前,计算机视觉已经从传统的图像处理发展到目标检测、图像分割、三维重建等更加复杂的应用,例如,自动驾驶汽车依赖计算机视觉技术来感知周围环境,从而进行自主决策和路径规划; 智能监控系统则通过面部识别、行为分析等技术提高了公共安全监控的效率和智能化水平,而智能语音技术也已不再局限于简单的语音命令识别,它不仅可以理解人类的语言,还能进行情感分析、自然语言处理、语音合成等,被广泛地应用于语音助手、语音翻译、医疗健康、客户服务等各个领域。 然而,尽管计算机视觉和智能语音领域的理论研究和技术已经有了较为坚实的基础,但是许多学习者和开发者在面对计算机视觉与智能语音技术时仍然感到迷茫。许多人认为这些技术需要掌握大量复杂的数学公式和算法,尤其是机器学习与深度学习的内容往往让人望而却步。此外,市面上多数书籍侧重理论研究,而缺少结合实际应用的项目案例,导致许多读者虽然学习了理论知识,却难以将其应用于实际问题的解决中。 本书围绕计算机视觉和智能语音在交通、工业等领域的案例(交通标志识别、车辆违规检测、火灾与吸烟检测、残次品检测等)进行讲解,理论结合实际,采用大量插图,辅以实例,力求深入浅出,帮助读者快速理解计算机视觉若干模型和算法的基本原理与关键技术。本书既...

目录
荐语
查看详情 查看详情
目录

教学大纲及教学课件(PPT)

本书源码

第1章人工智能应用体验(15min)

1.1任务1: Python类库安装

1.1.1任务分析

1.1.2必备知识: Python常见类库

1.1.3任务实施

1.2任务2: 中文OCR项目体验

1.2.1任务分析

1.2.2必备知识: 视觉智能

1.2.3任务实施

1.3任务3: 实时语音克隆

1.3.1任务分析

1.3.2必备知识: 语音智能

1.3.3任务实施

第2章使用OpenCV进行眨眼检测(26min)

2.1任务1: 人脸图像处理

2.1.1任务分析

2.1.2必备知识: 图像滤波

2.1.3任务实施

2.2任务2: 人脸检测

2.2.1任务分析

2.2.2必备知识: 图像特征提取与人脸检测基本方法

2.2.3任务实施

2.3任务3: 眨眼检测

2.3.1任务分析

2.3.2必备知识: 眨眼与疲劳状态

2.3.3任务实施

第3章声纹识别与声源定位(23min)

3.1任务1: 端点检测

3.1.1任务分析

3.1.2必备知识: 音频信号处理

3.1.3任务实施

3.2任务2: 声纹识别

3.2.1任务分析

3.2.2必备知识: 音频特征提取

3.2.3任务实施

3.3任务3: 实时声源定位

3.3.1任务分析

3.3.2必备知识: 声源定位

... 查看详情

本书围绕计算机视觉和智能语音在交通、工业等领域的案例(交通标志识别、车辆违规检测、火灾与吸烟检测、残次品检测等)进行讲解,理论结合实际,采用大量插图,辅以实例,力求深入浅出,帮助读者快速理解计算机视觉若干模型和算法的基本原理与关键技术。在内容编排上,本书的每章都具备独立性,能够独立地解决一类实际问题,读者可以根据自身情况进行选择性阅读;同时各章之间循序渐进地形成有机整体,使全书内容不失系统性与完整性。每个章节都围绕一个或几个具体的应用案例展开,从问题的提出到算法的选择,再到最终的实现和优化,每步都配有详尽的讲解和操作步骤。


查看详情