绪 论 内容提要   自动识别技术是一种高度自动化的信息或者数据采集与处理技术,是物联网及大数据的主要支撑技术之一。本章主要介绍自动识别技术的含义、分类体系、一般性的工作原理,以及在经济社会中的重要作用、应用现状和发展趋势,并给出本书的内容结构。 学习目标与重点 * 掌握自动识别技术的含义、分类体系。 * 了解自动识别技术的一般性工作原理。 * 理解自动识别技术在经济社会中的重要作用、应用现状和发展趋势。 关键术语   自动识别技术、定义识别、模式识别、物联网 【引入案例】 幸福是什么?   中国移动在多年前推出一款“带你体验前所未有的幸福”广告,截图如图1-1所示,让我们看看我们孜孜不倦追求的幸福是怎样的: (a) (b) 图1-1 “带你体验前所未有的幸福”广告截图 (c) (d) 图1-1 (续)   (a)“幸福是当你等待的时候,有人懂得你的希望;幸福是烦恼的时候,有人指引方向”(智能公交系统——用到自动识别公交IC卡);(b)“幸福是安心享受”(食品安全溯源——用到二维条码识别技术);(c)“幸福的答案在身旁,再也不用匆匆忙忙”(远程物流管理——用到一维条码识别技术);(d)“为了幸福而改变就是我们的理想”(我们日常生活中的方方面面更是全面地用到了各种自动识别技术)。   这些只言片语诉说着我们对幸福的诉求,而各种自动识别技术助力我们对幸福的 追求。   在经济全球化、贸易国际化、通信网络化、信息数字化的推动下,自动识别技术已经广泛地应用于商流、物流、邮政、交通运输、医疗卫生、航空、图书管理、电子商务、电子政务、工业制造等多个领域,并成为物联网及大数据的主要支撑技术之一。   现代高效快捷的社会生活中,自动识别技术与每个人的联系也日益紧密,无论你到超市采购商品、乘公交车刷卡,还是你所使用的银行卡以及身份证,都有自动识别技术的应用,可以说,这项技术已经渗透到现代社会生活的各个领域。   从技术的层面上看,自动识别技术归根到底还是数据采集技术和计算机处理技术。在自动识别系统中,数据的采集是信息系统的基础,这些数据通过计算机信息系统的处理、分析和过滤,成为提高管理工作的效率、准确性和数字化、智能化的重要手段。 一、自动识别技术的基本概念 1.识别的基本概念   识别是人类参与社会活动的基本要求。人们认识和了解事物的特征及信息就是一种识别,为有差异的事物命名是一种识别,为便于管理而为一个单位的每一个人或一个包装箱内的每一件物品进行编号也是一种识别。因此,识别是一个集定义、过程与结果为一体的概念。   随着技术的进步和发展,人们所面临的识别问题越来越复杂,完成识别所花费的人力代价也越来越大,在某些情况下,必须借助一些设备和技术才能完成更高效、更快速和更准确的识别,这就会用到自动识别技术。 2.自动识别技术的含义   自动识别(automatic identification,Auto-ID)技术是指通过非人工手段获取被识别对象所包含的标识信息或特征信息,并且不使用键盘即可实现数据实时输入计算机或其他微处理器控制设备的技术。   下面我们从几个不同的角度对其特征进行定义。   1)综合技术概念   自动识别技术是以传感器技术、计算机技术和通信技术为基础的一门综合性科学技术,是集数据编码、数据采集、数据标识、数据管理、数据传输于一体的信息数据自动识读、自动输入计算机的重要方法和手段,是一种高度自动化的信息或者数据采集与处理技术。   2)应用设备概念   自动识别技术是应用一定的识别装置,通过被识别物品和识别装置之间的接近活动,自动地获取被识别物品的相关信息,并提供给后台的计算机处理系统来完成相关后续处理的一种技术。例如商场的条码扫描系统就是一种典型的自动识别技术,售货员通过条码阅读器扫描条码,获取商品的代码信息,然后将代码信息传送到后台来获取商品的名称、价格,在POS终端即可计算出该批次商品的价格,从而完成顾客所购买商品的结算。   3)技术系统概念   自动识别技术是一个以传感器技术、信息处理技术为主的技术系统,最主要的目的是提供一个快速、准确地获得信息的有效手段,其处理的结果可作为管理工作的决策信息或自动化装置等技术系统的控制信息。   4)自动采集概念   在信息处理系统早期,相当部分的数据处理都是通过人工录入的,这样的录入方法不仅数据量十分庞大、操作者的劳动强度高,而且人为产生错误的概率也相应较高,造成录入的数据不准确,使得对这些数据的分析失去了实时的意义。   为了解决这些问题,人们研究和发展了各种自动识别技术,将操作者从繁重而又重复,且十分不准确的手工输入劳动中解放出来,提高了系统输入信息的实时性和准确性,这就是自动识别技术的目的(主要解决的问题)。   5)多种技术概念   自动识别技术包括条码识别技术、射频识别技术、磁卡识别技术、IC卡识别技术、图像识别技术、光字符识别技术、生物特征识别技术(指纹识别、人脸识别、虹膜识别、语音识别)等多种自动识别技术方法和手段。 3.自动识别技术的特点   自动识别技术是以计算机技术和通信技术的发展为基础的综合性科学技术,它是信息数据自动识读、自动输入计算机的重要方法和手段。归根到底,自动识别技术是一种高度自动化的信息或者数据采集技术,可以完成系统的原始数据的采集工作,解决人工数据输入速度慢、误码率高、劳动强度大、工作简单重复性高等问题,为计算机信息处理提供快速、准确地进行数据采集输入的有效手段,因此,自动识别技术作为一种革命性的技术,正迅速为人们所接受。   自动识别技术近几十年在全球范围内得到了迅猛发展,初步形成了一个包括条码技术、磁条磁卡技术、IC卡技术、光学字符识别技术、射频识别技术、语音识别技术及生物特征视觉识别技术等集计算机、光、磁、物理、机电、通信技术为一体的技术学科。   自动识别技术具有如下特点:   (1)准确性——自动数据采集,彻底消除人为错误。   (2)高效性——信息交换实时进行。   (3)兼容性——自动识别技术以计算机技术为基础,可与信息管理系统无缝连接。 二、自动识别技术分类与本书结构 1.自动识别技术分类   自动识别技术根据识别对象的特征、识别原理和方式可以分为两大类,分别是数据采集技术(定义识别)和特征提取技术(模式识别)。这两大类自动识别技术的基本功能是一致的,都是完成物品的自动识别和数据的自动采集。   (1)定义识别是赋予被识别对象一个ID代码,并将此ID代码的载体(条码、射频标签、磁卡、IC卡等)放在要被识别的对象上进行标识,通过对载体的自动识读获得原ID代码,然后通过计算机实现对对象的自动识别。   (2)模式识别(pattern recognition)是指对表征事物或现象的各种形式的(数值的、文字的和逻辑关系的)信息进行处理和分析,以对事物或现象进行描述、辨认、分类和解释的过程,即通过采集被识别对象的特征数据,并通过与计算机存储的原特征数据进行特征比对,实现对对象的自动识别。模式识别是信息科学和人工智能的重要组成部分。   数据采集技术的基本特征是需要被识别物体具有特定的识别特征载体(如标签等,仅光学字符识别例外);而特征提取技术(特征识别)则根据被识别物体本身的属性特征和行为特征来完成数据的自动采集。如图1-2所示为可用于模式识别的人体生物特征示意图。 【概念辨析1-1】 数据采集技术(定义识别)与特征提取技术(模式识别)   1.研究对象   定义识别的主要研究对象为条码识别、射频识别(radio frequency identification,RFID)、磁识别、IC卡识别等载体、编码方法和识别技术。   模式识别研究主要集中在两方面,一是研究生物体(包括人)是如何感知对象的,属于认识科学的范畴;二是在给定的任务下,如何用计算机实现模式识别的理论和方法,主要涉及图像识别、光符识别、生物特征识别(如指纹识别、脸部识别、虹膜识别、语音识别等)。   数据采集技术(定义识别)包括:   (1)光存储器:条码(一维、二维)、光卡、光标阅读器(OMR)、光学字符识别(OCR)。   (2)磁存储器:磁条、非接触磁卡。   (3)电存储器:接触式IC卡、射频识别(无芯片、有芯片)、存储卡(智能卡、非接触式智能卡)。   特征提取技术(模式识别)中包括以下特征:   (1)身体特征:指纹、虹膜、脸型、掌型、视网膜、DNA、骨骼。   (2)行为特征:签名(签字)、语音、行走步态。   2.研究方法   (1)定义识别是通过将信息编码进行定义、代码化,并装载于相关的载体(如条码符号、射频标签、磁条、IC卡等)中,然后借助于相应的识读设备,实现对定义信息的自动识别、采集、传输和输入计算机信息处理系统。   (2)模式识别目前已形成了两种基本的识别方法:统计模式识别方法和结构(句法)模式识别方法。   ① 统计模式识别方法   统计模式识别方法是受数学中决策理论的启发而产生的一种识别方法,它一般假定被识别的对象或特征提取向量是符合一定分布规律的随机变量。   统计模式识别方法就是用给定的有限数量的样本集,在已知研究对象统计模型或已知判别函数类条件下,根据一定的准则,通过学习算法把多维特征空间划分为若干个区域,每一个区域与每一类别相对应。模式识别系统在进行工作时只要判断被识别的对象落入哪一个区域,就能确定出它所属的类别。   由噪声和传感器所引起的变异性可通过预处理来部分消除;而模式本身固有的变异性则可通过特征抽取和特征选择得到控制,尽可能地使模式在该特征空间中的分布满足上述理想条件。因此,一个统计模式识别系统应包含预处理、特征抽取、分类器等部分。   分类器有多种设计方法,如贝叶斯分类器、树分类器、线性判别函数、近邻法分类、最小距离分类、聚类分析等。   ② 结构(句法)模式识别方法   结构模式识别是用模式的基本组成元素(基元)及其相互间的结构关系对模式进行描述和识别的方法。在多数情况下,可以有效地用形式语言理论中的文法来表示模式的结构信息,因此,也常称为句法模式识别。   结构模式识别的基本思想是把一个模式描述为较简单的子模式的组合,子模式又可描述为更简单的子模式的组合,最终得到一个树形的结构描述。在底层的最简单的子模式称为模式基元。   在结构方法中选取基元的问题,相当于在统计模式识别方法中选取特征的问题,通常要求所选的基元能提供一个紧凑的并能反映其结构关系的描述,又要易于用非结构方法加以抽取。   显然,基元本身不应该含有重要的结构信息。模式以一组基元和它们的组合关系来描述,称为模式描述语句,这相当于在语言中句子和短语用词组合、词用字符组合一样。基元组合成模式的规则由所谓语法来指定。一旦基元被鉴别,识别过程可通过句法分析进行,即分析给定的模式语句是否符合指定的语法,满足某类语法的,即可被分入该类。   3.研究应用领域   定义识别主要研究条码、RFID、磁记录等编码和识别技术,以便更高效地应用于商品零售、物流、银行、医药和医院管理、工业生产流水线控制、铁路运输管理、高速公路不停车及停车场收费、门禁和考勤等系统。   模式识别主要研究如何使机器具有感知能力,主要研究视觉模式和听觉模式的识别,如能识别物体、地形、图像、声音和字体(如签字)的机器人。模式识别的应用领域涉及:①机器识别和人工智能;②医学;③军事;④卫星遥感、卫星航空图片解释、天气预报;⑤银行、保险、刑侦;⑥工业产品检测;⑦字符识别、语音识别、指纹识别。   目前自动识别技术的主要研究对象已经基本形成了一个包括定义识别和模式识别两大类识别的体系,其中条码识别、射频识别、卡类识别、图像识别、光符识别、指纹识别、脸部识别、虹膜识别、语音识别等是目前自动识别技术研究的主要内容。   此外,自动识别技术系统的输入信息还可分为特定格式信息和图像图形格式信息两大类。特定格式信息就是采用规定的表现形式来表示所要表达的信息,如条码符号、IC卡、磁卡、射频标签中的数据格式都属于此类。图像图形格式信息则是指二维图像与一维波形等信息,如文字、地图、照片、指纹等二维图像以及语音等一维波形均属于这一类。 2.本书的主要内容结构   本书主要介绍目前主流的自动识别技术,具体如下:条码识别技术(第二章)、射频识别技术(第三章)、卡类识别技术(第四章)、图像识别技术(第五章)和生物特征识别技术(第六章)。   第四章的卡类识别技术主要介绍光卡、磁卡和接触式IC卡技术,非接触式IC卡在第三章介绍;第五章图像识别技术最后介绍光符识别技术和光标阅读器;第六章生物特征识别技术主要介绍指纹识别技术、人脸识别技术、虹膜识别技术和语音识别技术。本书主要内容结构如图1-3所示,加粗的部分为主要识别技术。 三、自动识别技术的一般性原理   自动识别系统是一个以信息处理为主的技术系统,也是传感器技术、计算机技术、通 图1-3 本书主要的内容结构 信技术综合应用的一个系统,它的输入端是被识别信息,输出端是已识别信息。   自动识别系统中的信息处理是指为达到快速应用目的而对信息进行的变换和加工,例如为抗干扰进行的信道编码处理和为了提高传输效率而进行的信源编码处理,以及诸如调制、均衡等信息处理、信息操作的总称。自动识别技术广泛地应用于各种商务活动和各类行业管理的信息采集与数据交换领域。   抽象概括自动识别技术系统的工作过程如图1-4所示,它是最一般的自动识别技术信息处理系统的模型框图,是适用于自动识别技术领域的通用研究模型。对于各类信息的采集和处理,此模型可以再具体化,不同类别的信息采集对应着不同的信息处理部分。 图1-4 自动识别技术信息处理系统的模型框图   (1)定义识别的数据信息的采集由于其信息格式的固定化,且具有量化特征,数据量相对较小,所对应的自动识别系统模型也较为简单,如图1-5所示。条码识别、射频识别、磁卡识别、IC卡识别等自动识别技术即为这一类。   (2)模式识别的特征信息的采集和处理过程较定义识别的数据信息复杂得多。第一,它没有固定的信息格式;第二,为了让计算机处理这些信息,必须使其量化,而量化的结 图1-5 特定格式信息的自动识别系统的模型框图 果往往会产生大量的数据;第三,还要对这些数据作大量的计算与特殊的处理。因此,其系统模型也较为复杂,如图1-6所示。图像识别、指纹识别、人脸识别、虹膜识别、语音识别等自动识别技术即为这一类。 图1-6 图像形式格式信息的自动识别系统模型   根据两种不同的输入格式信息建立的自动识别系统模型,主要的区别就在于“处理信息”部分,而“处理信息”部分的不同将造成系统构成的巨大差异。   (1)对于定义识别,信息处理就是各种译码。为了顺利地实现译码,需要事先制定固定的编码规则,如各种码制规范;利用载体,如条码标签、射频标签、磁条、IC卡等,按编码规则制作相应的标签附于被识别物品上;采用内置编码规则的译码器,按编码规则译码,识别效率非常高,误码率非常低。   (2)对于模式识别,信息处理过程一般包括预处理、特征提取与选择、分类决策等几部分。   ① 预处理操作是指对图形、图像进行各种加工,即对获得的图形、图像信息进行预处理以消除干扰、噪声,进行几何、彩色校正等,以改善图形、图像的质量,是从图像到图像的过程,强调图像之间进行的变换。有时还须对图像图形进行增强、分割、定位和分离、复原处理、压缩等。常见的图形、图像预处理方法可分成两种:空间域的预处理方法和变换域的预处理方法。空间域的预处理方法有灰度均衡化处理、尺寸的归一化处理、色彩空间的归一化处理等;变换域的预处理方法有离散余弦变换(DCT)、离散傅里叶变换(DFT)、小波变换、滤波处理等。   ② 特征提取与选择是指对处理后的图形、图像进行分类和特征提取,并对某些特征参数进行测量、再提取、分类,有时还要对图形、图像进行结构分析及描述,这是以观察者为中心研究客观世界的一个过程。特征提取是一个从图形、图像到数据的过程,常见的特征提取方法有基于代数特征的提取方法和基于几何特征的提取方法等。   ③ 分类决策是指利用掌握的特征信息,对未知的训练样本按照某种判别准则进行分析,得出分类后的结果。从标记的训练数据来推断分类属于监督学习分类;根据类别未知(没有被标记)的训练样本摸索分类属于无监督学习分类。 四、自动识别技术在经济社会发展中的作用   自动识别技术与计算机技术、软件技术、互联网技术、通信技术、半导体技术的发展紧密相关,正在成为我国数字经济核心产业的重要组成部分,而物联网及大数据技术的兴起和蓬勃发展给自动识别技术带来前所未有的发展机遇。自动识别技术产业的发展及技术应用的推广,将在我国的经济社会建设中发挥举足轻重的作用。   党的十六大报告(2002年11月8日)明确指出:“以信息化带动工业化,优先发展信息产业,在经济和社会领域广泛应用信息技术。”党的十八大报告(2012年11月8日)进一步明确指出:“坚持走中国特色新型工业化、信息化、城镇化、农业现代化道路,推动信息化和工业化深度融合、工业化和城镇化良性互动、城镇化和农业现代化相互协调,促进工业化、信息化、城镇化、农业现代化同步发展。”   党的二十大报告(2022年10月16日)明确提出:“建设现代化产业体系。推进新型工业化,推动制造业高端化、智能化、绿色化发展。推动战略性新兴产业融合集群发展,构建新一代信息技术、人工智能、生物技术、新能源、新材料、高端装备、绿色环保等一批新的增长引擎。加快发展物联网,建设高效顺畅的流通体系,降低物流成本。加快发展数字经济,促进数字经济和实体经济深度融合,打造具有国际竞争力的数字产业集群。”   自动识别技术的推广应用工作是我国数字化、智能化建设的重要基础工作之一,《国家中长期科学和技术发展规划纲要(2006—2020年)》中明确指出,“重点开发多种新型传感器及先进条码自动识别、射频标签、基于多种传感信息的智能化信息处理技术。”《国家中长期科学和技术发展规划纲要(2021—2035年)》《国家“十四五”规划纲要》《物联网新型基础设施建设三年行动计划(2021—2023年)》也对“突破智能感知、新型短距离通信、高精度定位等关键共性技术,补齐高端传感器、物联网芯片等产业短板,进一步提升高性能、通用化的物联网感知终端供给能力”做出了部署,“支持多源、海量数据接入的智能感知技术攻关,推动低功耗、高安全、高速率的新型短距离通信技术发展”,“开展语音识别、视频识别、机器学习、物体运行机理模型、知识图谱等人工智能的研究,丰富感知终端交互手段”。   这对我国自动识别技术产业发展及推广应用提出了更高的要求,也为自动识别技术产业实现跨越式发展,?赶上并超过西方发达国家带来了契机,我国自动识别技术的发展和应用在未来具有广阔和美好的前景。 1.自动识别技术是数字中国建设的重要基础和技术支撑   21世纪是信息高速发展的数字化社会,中国要缩短与发达国家的差距,成为经济强国,必须利用现代信息技术打造数字化中国。2023年2月,中共中央、国务院印发了《数字中国建设整体布局规划》。规划指出,建设数字中国是数字时代推进中国式现代化的重要引 擎,是构筑国家竞争新优势的有力支撑。加快数字中国建设,对全面建设社会主义现代化国家、全面推进中华民族伟大复兴具有重要意义和深远影响。   自动识别与数据采集技术是一种可以通过自动(非人工)的方式获取项目(实物、服务等)的管理信息,并将信息数据实时输入计算机、微处理器、逻辑控制器等信息系统的技术,已成为解决信息采集速度低和准确率差问题的最佳手段。   作为自动识别技术之一的条码技术,在20世纪40年代有了第一项专利,70年代逐渐形成规模,近40年来已取得长足的发展。条码识别技术具有信息采集可靠性高、成本低廉等特点,可以实现信息快速、准确地获取与传递,可以把供应链中的制造商、批发商、分销商、零售商以及最终客户整合为一个整体,为实现全球贸易及电子商务提供了一个通用的语言环境。   在金融、海关、社保、医保等部门,也可以利用条码技术对顾客的账户和资金往来进行实时的信息化管理,并伴随着电子货币的广泛应用,逐步实现资金流电子化。同时,条码技术的应用和发展不仅使商品交易的信息传输电子化,也将使商品储运配送的管理电子化,从而为建立更大规模的、快捷的物流储运中心和配送网络奠定了技术基础,最终及时、准确地完成电子商务的全过程。多年来,条码技术广泛成功地应用于我国的零售、进出口贸易、电子商务以及二维码(消费)支付等行业,为国民经济的增长奠定了重要的基础,并取得了显著的经济效益。   射频识别(RFID)技术是一种非接触式的自动识别技术,它通过射频标签与射频读写器之间的感应、无线电波或微波能量进行非接触式双向通信,实现数据交换,从而达到识别的目的。通过与互联网技术相结合,可以实现全球范围内物品的跟踪与信息的共享。RFID技术是继互联网和移动/无线通信两次技术大潮之后的又一次技术大潮。RFID技术可应用于身份识别、资产管理、高速公路的收费管理、门禁管理、宠物管理等领域,可以实现快速批量的识别和定位,并可根据需要进行长期的跟踪管理;还可应用于物流、制造与服务等行业,大幅度地提高企业的管理和运作效率,并降低流通成本。随着识别技术的进一步完善和应用的广泛推进,RFID产品的成本将迅速降低,其带动的产业链将成为一个新兴的高技术产业群。建立在RFID技术上的支撑环境,也将在提高经济社会数字化水平以及加强国防安全等方面产生重要影响。   生物特征识别技术是利用人体所固有的生理特征或行为特征来进行个人身份鉴定的技术。随着人们对社会安全和身份鉴定的准确性和可靠性需求的日益提高,以及生物特征识别技术的装备和应用系统不断完善,生物特征识别作为一门新兴的高科技技术,正在蓬勃发展。在我国,指纹识别、虹膜识别、掌纹识别等产品已开始在国家安全、金融等领域中得到推广和普及。生物特征识别技术不仅可以大大提升安全防范技术的技术层次,而且还是安全防范技术的三大主导技术之一。生物特征识别产业的发展,将对我国政府的信息安全、经济秩序稳定以及反恐等起到重要的支撑作用。 2.自动识别技术已成为数字经济核心产业的有机组成部分   自动识别技术作为一种快速、适时、准确地收集、储存、处理信息的高新技术, 是实现国民经济现代化,建设大市场、搞活大流通、发展大贸易,建立数字信息网络, 实行电子数据交换,畅通国内大循环,促进国内国际双循环,增强国际竞争能力不可缺少的技术工具和手段。   目前,自动识别技术作为信息技术的一个重要分支,已经渗透到商业、工业、交通运输、邮电通信、物资管理、仓储、医疗卫生、安全检查、餐饮旅游、票证管理以及军事装备、工程项目等各行各业,在国民经济和人民的日常生活中担当着不可或缺的重要角色,成为推动国民经济信息化、数字化发展的一项重要技术。自动识别技术在各行业中的应用,有力地支持了传统产业的数字化转型升级,带动其他行业向数字化和智能化迈进,改变了过去“高增长、高能耗”的经济增长方式,节约了制造成本,增加了国民经济效益。   同时,我国自动识别技术在近40年取得了长足发展,已初步形成了一个包括条码技术、