自然语言处理入门
从基础到任务深度讲解自然语言处理的原理和技术,详解热门应用任务。提供课件

作者:李洋、李实

丛书名:计算机前沿技术丛书

定价:49元

印次:1-2

ISBN:9787302644484

出版日期:2024.01.01

印刷日期:2025.02.14

图书责编:刘星

图书分类:教材

电子书
在线购买
分享
内容简介
作者简介
前言序言
资源下载
查看详情 查看详情 查看详情

自然语言处理(NLP)的目标是使计算机能够像人类一样理解语言。近年来自然语言处理作为一门学科发展迅速,得到了越来越广泛的应用。本书从基本概念出发,对于自然语言基础任务进行介绍:中文分词、关键词抽取、词向量、文本分类、命名实体识别和关系抽取。对自然语言处理当前热门应用任务如知识图谱、阅读理解、摘要和对话等进行介绍。全书内容由浅入深,先从基本概念,再引出简单应用实例。本书可作为高等学校相关专业教材,是自然语言处理领域的入门教材。

李洋,副教授,硕士生导师。2017年博士毕业于哈尔滨工业大学计算机应用技术专业,主要研究方向为自然语言处理、社交网络挖掘。中国计算机学会会员,CCF YOCSEF哈尔滨2021-2022副主席,主持国家自然科学基金、黑龙江省自然科学基金面上项目,黑龙江省博士后基金面上项目。累计发表SCI/EI检索论文十余篇,其中包括ACM Transactions on Intelligent Systems and Technology(ACM TIST)、Neurocomputing、Bioinformatics等国际期刊。目前担任国际期刊Knowledge-Based Systems(KBS), Neurocomputing, ACM Transactions on Asian and Low-Resource Language Information Processing (TALLIP)等的审稿人。

前言 人工智能包括运算智能、感知智能、认知智能和创造智能。其中,运算智能是记忆和计算的能力,在这一层面计算机的能力已经远超过人类。感知智能是计算机感知环境的能力,包括听觉、视觉和触觉等。随着深度学习的成功应用,语音识别和图像识别获得了很大的进步,在某种情况下甚至达到了人类水平。自然语言处理(Natural Language Processing,NLP)是集语言学、计算机科学和人工智能于一体的科学,通过对自然语言的处理,使得计算机对其能够可读并理解。自然语言处理属于认知智能和创造智能的范畴。“让机器可以理解自然语言”是自然语言处理的终极目标,阿兰·图灵曾说过: “如果一台计算机能够欺骗人类,让人相信它是人类,那么该计算机就应当被认为是智能的。”因此自然语言处理被誉为人工智能皇冠上的明珠。 在不同时期或针对不同的侧重点,人们把用计算机处理自然语言的过程又称为自然语言理解(Natural Language Understanding,NLU)、人类语言技术(Human Language Technology,HLT)、计算语言学(Computational Linguistics)、计量语言学(Quantitative Linguistics)和数理语言学(Mathematical Linguistics)。人类语言是错综复杂的,且具有多样性、歧义性、鲁棒性、知识性和上下文依赖的性质。自然语言处理则是通过对词、句子、篇章进行分析,对内容进行理解分析和推理,并在此基础上扩展出一系列核心技术(如知识图谱、阅读理解、对话系统等),进而应用到搜索引擎、客服、金融...

目录
荐语
查看详情 查看详情
目录

第1章中文分词

1.1中文分词中的基本问题

1.1.1中文分词规范问题

1.1.2歧义切分问题

1.1.3未登录词识别问题

1.2基于词表的分词算法

1.2.1正向最大匹配算法

1.2.2逆向最大匹配算法

1.2.3双向最大匹配算法

1.3基于统计模型的分词算法

1.4基于序列标注的分词算法

1.4.1基于HMM的分词方法

1.4.2基于CRF的分词方法

1.4.3基于BiLSTMCRF的中文分词方法

参考文献

第2章命名实体识别

2.1基于CRF的命名实体识别

2.1.1CRF基本概念

2.1.2命名实体识别任务

2.2基于BiLSTMCRF的命名实体识别

2.2.1RNN

2.2.2LSTM网络

2.2.3双向LSTM网络

2.2.4BiLSTMCRF

2.3注意力机制

参考文献

第3章关系抽取

3.1实体关系抽取定义

3.2实体关系抽取框架

3.3评测方法

3.4有监督实体关系抽取方法

3.5半监督实体关系抽取方法

3.6远程监督实体关系抽取方法

参考文献

第4章词向量技术

4.1OneHot词向量技术

4.2Word2Vec词向量技术

4.2.1CBOW模型

4.2.2SkipGram模型

4.2.3优化方法

4.3BERT词向量嵌入

4.3.1注意力机制

4.3.2Tr... 查看详情

"(1)以自然语言处理的基本概念为切入点,逐步拓展到自然语言的基础任务。内容讲解循序渐进,深入浅出。
(2)每章遵循先介绍基本概念再引出应用实例的方式,符合初学者学习的认识规律,易于读者学习和掌握。
(3)向新技术发展,接轨新工科教育理念,突显自然语言处理的热门应用,教学配备资料齐全。"

查看详情