第一章导论 第一节综合评价概述 评价是人类社会中一项经常性的、极为重要的认识活动。在我们的日常生活中经常遇到这样的判断问题: 哪个学生的素质高?哪个高等院校的声望高?在经济管理中也经常遇到这样的判断问题: 哪个企业的绩效好?哪个地区发展的状况好?等等。 现实社会生活中,对一个事物的评价常常要涉及多个因素或多个指标,评价是在多因素相互作用下的一种综合判断。比如要判断哪个高校的声望高,就得从若干个高校的在校学生规模、教学质量、科研成果等方面进行综合比较; 要判断哪个企业的业绩好,就得从若干个企业的财务管理、营销管理、生产管理、人力资源管理、研究与开发能力等多方面进行综合比较; 等等。可以这样说,几乎任何综合性活动都可以进行综合评价。随着人们的活动领域的不断扩大,人们所面临的评价对象日趋复杂,人们不能只考虑被评价对象的某一方面,必须全面地从整体的角度考虑问题。 我们知道,评价的依据就是指标。由于影响评价事物的因素往往是众多而复杂的,如果仅从单一指标上对被评价事物进行评价不尽合理,因此往往需要将反映评价事物的多项指标的信息加以汇集,得到一个综合指标,以此来从整体上反映被评价事物的整体情况。这就是多指标综合评价方法。多指标综合评价方法是对多指标进行综合的一系列有效方法的总称。它具备以下特点: 它的评价包含了若干个指标,这多个评价指标分别说明被评价事物的不同方面; 评价方法最终要对被评价事物做出一个整体性的评判,用一个总指标来说明被评价事物的一般水平。 综合评价问题是多因素决策过程中所遇到的一个带有普遍意义的问题。评价是为了决策,而决策需要评价。从某种意义上讲,没有评价就没有决策。综合评价是科学决策的前提,是科学决策中的一项基础性工作。其中,排序是综合评价最主要的功能。所以,所谓综合评价即对评价对象的全体,根据所给的条件,采用一定的方法,给每个评价对象赋予一个评价值,再据此择优或排序。综合评价的目的,通常是希望能对若干对象,按一定意义进行排序,从中挑出最优或最劣对象。对于每一个评价对象,通过综合评价和比较,可以找到自身的差距,也便于及时采取措施,进行改进。可以看到,综合评价这种定量分析技术已经得到了广泛的认同,它为人们正确认识事物、科学决策提供了有效的手段。 一般地说,构成综合评价问题的要素有以下几个方面。 1. 评价目的 必须首先要明确评价的目的,这是评价工作的根本性指导方针。对某一事物开展综合评价,首先要明确为什么要综合评价,评价事物的哪一方面(评价目标),评价的精确度要求如何,等等。 2. 被评价对象 评价对象可能是人,是事,是物,也可能是它们的组合。同一类评价对象的个数要大于1,否则也就没有判断和评价的必要了。这一步的实质是明确对象系统。评价对象系统的特点直接决定着评价的内容、方式以及方法。 3. 评价者 评价者可以是某个人(专家)或某团体(专家小组)。评价目的的确定、被评价对象的确定、评价指标的建立、权重系数的确定、评价模型的选择都与评价者有关。因此,评价者在评价过程中的作用是不可轻视的。 4. 评价指标 所谓指标是指根据研究的对象和目的,能够确定地反映研究对象某一方面情况的特征依据。每个评价指标都是从不同侧面刻画对象所具有的某种特征。所谓指标体系是指由一系列相互联系的指标所构成的整体。它能够根据研究的对象和目的,综合反映出对象各个方面的情况。指标体系不仅受评价客体与评价目标的极度制约,而且也受评价主体价值观念的影响。 5. 权重系数 相对于某种评价目标来说,评价指标之间的相对重要性是不同的。评价指标之间的这种相对重要性的大小,可用权重系数来刻画。指标的权重系数,简称权重,是指标对总目标的贡献程度。很显然,当被评价对象及评价指标都确定时,综合评价的结果就依赖于权重系数了。即权重系数确定的合理与否,关系到综合评价结果的可信程度。因此,对权重系数的确定应特别谨慎。 6. 综合评价模型 所谓多指标综合评价,就是指通过一定的数学模型将多个评价指标值“合成”为一个整体性的综合评价值。可用于“合成”的数学方法较多。问题在于我们如何根据评价目的及被评价对象的特点来选择较为合适的合成方法。 7. 评价结果 输出评价结果并解释其含义,依据评价结果进行决策。应该注意的是,应正确认识综合评价方法,公正看待评价结果。综合评价结果只具有相对意义,即只能用于性质相同的对象之间的比较和排序。 从操作程序角度讲,综合评价通常要经历确定评价对象和评价目标,构建综合评价指标体系,选择定性或定量评价方法,选择或构建综合评价模型,分析综合得出的结论,提出评价报告等过程。具体的程序如下。 (1) 确定评价对象 评价的对象通常是同类事物(横向)或同一事物在不同时期的表现(纵向)。 (2) 明确评价目标 评价目标不同,所考虑的因素就有所不同。 (3) 组织评价小组 评价小组通常由评价所需要的技术专家、管理专家和评价专家组成。参加评价工作的专家资格、组成以及工作方式等都应满足评价目标的要求,以保证评价结论的有效性和权威性。 (4) 确定评价指标体系 指标体系是从总的或一系列目标出发,逐级发展子目标,最终确定各专项指标。 (5) 选择或设计评价方法 评价方法根据评价对象的具体要求不同而有所不同。总的来说,要选择成熟的、公认的评价方法,并注意评价方法与评价目的的匹配,注意评价方法的内在约束,掌握不同方法的评价角度与评价途径。 (6) 选择和建立评价模型 评价问题的关键是在于从众多的方法模型中选择一种恰当的方法模型。其中,任何一种综合评价方法,都要依据一定的权数对各单项指标评判结果进行综合,权数比例的改变会变更综合评价的结果。 (7) 评价结果分析 综合评价工作是一件主观性很强的工作,我们在评价工作中必须以客观性为基础,提高评价方法的科学性,保证评价结果的有效性。当然,由于综合方法的局限性,使得它的结论只能作为认识事物、分析事物的参考,而不能作为决策的唯一依据。 更一般地看,评价是评价主体根据一定的评价目的和评价标准对评价客体进行认识的活动。评价是一种主体性活动,总是随着评价主体的变化和发展而变化和发展。评价主体要结合现有的、具有可操作性的评价方法和技术,还要考虑评价的环境。从评价的概念还可知,评价涉及评价主体、评价客体、评价目的和标准、评价技术方法及评价环境,将这些要素有机地结合起来,就形成评价系统。特别应该看到,评价的实质是意识对存在的一种反映。既然是主体对客体的一种反映,而且这种反映是主体根据自身的某种需要,选用一定的指标、模型和方法做出的,显然评价表现出一定的主观性。也就是说,它是一种主观的活动,它的结果随着评价主体、客体、环境的不同而存在差异。这种差异很大程度上是由主观意识产生的,这种差异只能尽量地减小,而不可能消除。总的来看,评价虽然受主观性的影响,但其本身仍具有较强的客观性。因为评价客体即评价对象具有自身真实的价值、属性,客观性显而易见; 评价标准是判断评价客体价值高低和水平优劣的参照系,也都必须有客观的依据,虽然其会受到主体的影响,但还是具有客观性。因此,评价的确有主观成分在起作用,在一定程度上使其客观性受到影响,但不能因此怀疑其客观性。认识其主观性、客观性的特点,便于实践中尊重评价对象的客观事实,真实地去反映它,在对客观对象的认知过程中充分发挥评价主体的能动性、创造性。 评价有多种分类方法。按评价模式,可分为传统评价模式和现代评价模式。 (1) 传统评价模式 这是目前最常用的一种评价模式,如各单位一年一度的“评先”即为其中一例。这一模式存在许多弊端,其一是指标体系不全面、不规范; 其二是评价方法本质上以定性分析或半定性半定量分析为主,主观成分过多,缺乏科学性。 (2) 现代评价模式 这是当今蓬勃兴起的一种评价模式,它代表着评价的发展方向。这一模式的指标体系较全面、规范; 评价方法借助于定性指标定量化,使指标体系能够进行计算,并可通过计算机软件实现。该模式要求尽可能排除主观成分,使评价结果科学化。另外,从评价的指导思想看,早期的评价方法大多贯穿着追求单一目标的思想,而当今的评价方法基本上体现着全面综合评价的思想。所以,本书定位于对现代综合评价方法的讨论。 随着所需考虑的因素越来越多,规模越来越大,对评价工作本身要求也越来越高: 要求它克服主观性和片面性,体现出科学性和规范性。随着评价对象复杂程度的不断提高,当前的评价工作不但要考虑结构化、定量化的因素,而且要考虑大量的非结构化、半结构化、模糊性、灰色性的因素。我们可喜地看到,评价方法在不断地涌现,形成了许多新的评价方法。 综合评价的具体方法有许多,而且各种方法不尽相同,但总体思路是统一的,大致可分为熟悉评价对象、确立评价的指标体系、确定各指标的权重、建立评价的数学模型、评价结果的分析等几个环节。其中确立指标体系、确定各指标权重、建立数学模型这三个环节是综合评价的关键环节。下面就这三方面进行讨论。 第二节指标体系的建立 进行综合评价,确定评价的指标体系是基础。指标的选择好坏对分析对象常有举足轻重的作用。指标是不是选取的越多就越好呢?太多了,事实上是重复性的指标,会有干扰; 太少了,可能所选取的指标缺乏足够的代表性,会产生片面性。评价指标体系是由多个相互联系、相互作用的评价指标,按照一定层次结构组成的有机整体。评价指标体系是联系评价专家与评价对象的纽带,也是联系评价方法与评价对象的桥梁。只有科学合理的评价指标体系,才有可能得出科学公正的综合评价结论。 指标体系的建立,要视具体评价问题而定,这是毫无疑问的。但是,一般说来,在建立评价指标体系时,应遵循以下原则。 1. 指标宜少不宜多,宜简不宜繁 评价指标并非多多益善,关键在于评价指标在评价过程中所起作用的大小。目的性是出发点。指标体系应涵盖为达到评价目的所需的基本内容,能反映对象的全部信息。当然,指标的精练可减少评价的时间和成本,使评价活动易于开展。 2. 指标应具有独立性 每个指标要内涵清晰、相对独立; 同一层次的各指标间应尽量不相互重叠,相互间不存在因果关系。指标体系要层次分明,简明扼要。整个评价指标体系的构成必须紧紧围绕着综合评价目的层层展开,使最后的评价结论确实反映评价意图。 3. 指标应具有代表性与差异性 指标应具有代表性,能很好地反映研究对象某方面的特性。指标间也应具有明显的差异性,也就是具有可比性。评价指标和评价标准的制定要客观实际,便于比较。 4. 指标可行 指标应可行,符合客观实际水平,有稳定的数据来源,易于操作,也就是应具有可测性。评价指标含义要明确,数据要规范,口径要一致,资料收集要简便易行。 以上几条原则供在解决实际问题时参考,在实际中要灵活考虑运用。 需要注意的是,指标体系的确定具有很大的主观随意性。虽然指标体系的确定有经验确定法和数学方法两种,但多数研究中均采用经验确定法。当然,确立指标体系的数学方法可以降低选取指标体系的主观随意性,但由于所采用的样本集合不同,也不能保证指标体系的唯一性。 在实际应用中,专家调研法是一种常用的方法。即向专家发函,征求其意见。评价者可根据评价目标及评价对象的特征,在所涉及的调查表中列出一系列的评价指标,分别征询专家对所设计的评价指标的意见,然后进行统计处理,并反馈咨询结果,经几轮咨询后,如果专家意见趋于集中,则由最后一次咨询确定出具体的评价指标体系。该方法是一种多专家多轮咨询法,具有以下三个特征。 (1) 匿名性。向专家们分别发送咨询表,参加评价的专家互不知晓,完全消除了相互间的影响。 (2) 轮间情况反馈。协调人对每一轮的结果做出统计,并将其作为反馈材料发给每个专家,供下一轮评价时参考。 (3) 结果的统计特性。采用统计方法对结果进行处理,可以说对专家意见的定量处理是它的一个重要特点。 此法可适用于所有评价对象,它的优点是专家不受任何心理因素的影响,可以充分发挥自己的主观能动性,在大量广泛信息的基础上,集中专家们的集体智慧,最后就可以得到合理的评价指标体系。这种方法的主要缺点是它所需要的时间较长,耗费的人力物力较多。该法的关键是物色专家以及确定专家的人数。 一般来说,应以尽量少的“主要”评价指标用于实际评价,在初步建立的评价指标集合当中也可能存在着一些“次要”的评价指标,这就需要按某种原则进行筛选,分清主次,合理组成评价指标集。当然,在大多数情况下,要确定最优指标集也几乎是不现实的。不过,这并不是说我们可以随意地确定评价指标。 不同的综合评价方法,对指标体系的要求存在一些差别。实际构造评价指标体系时,有时需要先定方法再构指标。另外,实践是检验真理的唯一标准,也是评价指标体系设计的最终目的。综合评价指标体系需要在实践中逐步完善。 还需要注意的是,在对备选方案进行综合评价之前,要注意评价指标类型的一致化处理。有些指标是正指标,有些指标是逆指标。而且,有些指标是定量的,有些指标是定性的。指标处理中要保持同趋势化,以保证指标间的可比性。对于效益型指标,越大越好; 对于成本型指标,则越小越好。在综合评价时,会遇到一些定性的指标,定性指标的信息不加利用,又会很可惜,直接使用,又有困难,通常总希望能给以量化,使量化后的指标可与其他定量指标一起使用。也就是说,对于定性指标首先要经过各种处理,使其转化成数量表示的。对于定量指标,其性质和量纲也有所不同,造成了各指标间的不可共度性。为了尽可能地反映实际情况,排除由于各项指标的单位不同以及其数值数量级间的悬殊差别所带来的影响,避免不合理现象的发生,需要对评价指标做无量纲化处理。后面结合实际使用情况再进行详细讨论。 第三节指标权重的确定 用若干个指标进行综合评价时,其对评价对象的作用,从评价的目标来看,并不是同等重要的。为了体现各个评价指标在评价指标体系中的作用地位以及重要程度,在指标体系确定后,必须对各指标赋予不同的权重系数。权重是以某种数量形式对比、权衡被评价事物总体中诸因素相对重要程度的量值。合理确定权重对评价或决策有着重要意义。同一组指标数值,不同的权重系数,会导致截然不同的甚至相反的评价结论。因此,权数确定问题是综合评价中十分棘手的问题。 指标的权重应是指标评价过程中其相对重要程度的一种主观客观度量的反映。一般而言,指标间的权重差异主要是以下三方面的原因造成的。 (1) 评价者对各指标的重视程度不同,反映评价者的主观差异; (2) 各指标在评价中所起的作用不同,反映各指标间的客观差异; (3) 各指标的可靠程度不同,反映了各指标所提供的信息的可靠性不同。 既然指标间的权重差异主要是由上述三方面所引起的,因此我们在确定指标的权重时就应该从这三方面来考虑。其中第三个方面在上面指标体系的确定中已经进行了考虑。 确定权重也称加权,它表示对某指标重要程度的定量分配。加权的方法大体上可以分为两种: (1) 经验加权,也称定性加权。它的主要优点是由专家直接估价,简便易行。 (2) 数学加权,也称定量加权。它以经验为基础,数学原理为背景,间接生成,具有较强的科学性。 目前,权数确定的方法主要采用专家咨询的经验判断法。而且,目前权数的确定基本上已由个人经验决策转向专家集体决策。比如,评委投票表决法(简化了的Delphi法)方便易行,就是一种可以采用的方法。它的过程是每个评委通过定性分析,给以定量的回答,领导小组对回答进行统计处理。在数据处理时,一般用算术平均值代表评委们的集中意见。其计算公式为: aj=∑ni=1(aji)/nj=1,2,…,m 式中: n为评委的数量; m为评价指标总数; aj为第j个指标的权数平均值; aji为第i个评委给第j个指标权数的打分值。 然后,尚需进行归一化处理。因为归一化处理的结果比较符合人们的认识和使用习惯。 归一化的公式如下: a′j=aj∑mj=1(aj) 最后得到的结果就代表评委们集体的意见。 上述方法依据评委专家的知识、经验和个人价值观对指标体系进行分析、判断并主观赋权。一般来说,这样所确定的权数能正确反映各指标的重要程度,保证评价结果的准确性。但是,为了提高科学性,也可采用其他确定权重的方法,比如层次分析法(analytic hierarchy process,AHP)。层次分析法是目前使用较多的一种方法。该方法对各指标之间重要程度的分析更具逻辑性,再加上数学处理,可信度较大,应用范围较广。它由于具有坚实的理论基础,完善的方法体系而深受人们的欢迎,并在实践中创造了多种多样的变形方法。 另外,根据计算权数时原始数据的来源不同,大致也可归为两类: 一类是主观赋权法,其原始数据主要由专家根据经验判断得到; 另一类为客观赋权法,其原始数据由各指标在评价中的实际数据形成。前者的优点是专家可以根据实际问题,合理确定各指标权系数之间的排序,应该说有客观的基础,主要缺点是主观随意性较大; 后者不需征求专家的意见,切断了权重系数主观性的来源,使系数具有绝对的客观性,但一个不可避免的缺陷是确定的权数有时与指标的实际重要程度相悖。这里需要说明的是,并不是只有客观赋权法才是科学的方法,主观赋权法也同样是科学的方法。虽然主观赋权法带有一定的主观色彩,但“主观”与“随意”是两个不同的概念,人们对指标重要程度的估计主要来源于客观实际,主观看法的形成往往与评价者所处的客观环境有着直接的联系。 第四节评价方法的选择 所谓多指标综合评价,就是指通过一定的数学函数(或称综合评价函数)将多个评价指标值“合成”为一个整体性的综合评价值。可以用于“合成”的数学方法很多,问题在于我们如何根据决策的需要和被评价系统的特点来选择较为合适的方法。 20世纪60年代,模糊数学在综合评价中得到了较为成功的应用,产生了特别适合于对主观或定性指标进行评价的模糊综合评价方法。20世纪70~80年代,是现代科学评价蓬勃兴起的年代。在此期间,产生了多种应用广泛的评价方法,诸如层次分析法、数据包络分析法等。20世纪80~90年代,是现代科学评价向纵深发展的年代,人们对评价理论、方法和应用开展了多方面的、卓有成效的研究,比如,将人工神经网络技术和灰色系统理论应用于综合评价。 当前,综合评价已经涉及人类生活领域的各个方面,其应用的范围愈来愈广,所使用的方法也愈来愈多。但由于各种方法出发点不同,解决问题的思路不同,适用对象不同,又各有优缺点,以致人们遇到综合评价问题时不知该选择哪一种方法,也不知评价结果是否可靠。 因此,对现代综合评价方法的理论及其应用进行整理、总结,无疑具有十分重要的意义。当然,对于一个应用者来说,最迫切的问题往往不是去建立一个新的评价方法,更为重要的是如何从纷繁复杂的方法当中,选择出最适宜的方法。 评价方法的分类很多。按照评价与所使用信息特征的关系,可分为基于数据的评价、基于模型的评价、基于专家知识的评价以及基于数据、模型、专家知识的评价。鉴于本书的定位是现代综合评价方法,根据各评价方法所依据的理论基础,这里把综合评价方法大体分为四大类。 (1) 专家评价方法,如专家打分综合法。 (2) 运筹学与其他数学方法,如层次分析法、数据包络分析法、模糊综合评判法。 (3) 新型评价方法,如人工神经网络评价法、灰色综合评价法。 (4) 混合方法,这是几种方法混合使用的情况。如AHP+模糊综合评判、模糊神经网络评价法。 到目前为止,虽然出现了多种综合评价方法,但还有不少的问题。比如,针对同一问题,不同的方法会得到不同的结果,如何解释?如何辨别不同方法对不同问题的优劣?如何衡量评价结果的客观准确性?这些问题还需要我们进一步探索和研究,使综合评价方法和理论不断得以丰富和完善。 总的来说,评价方法是实现评价目的的技术手段,评价目的与方法的匹配是体现评价科学性的重点方面。正确理解和认识这一匹配关系是正确选择评价方法的基本前提。评价目的与评价方法之间的匹配关系,并不是说评价的特定目的与特定一种评价方法的一一对应,而是指对于特定的评价目的,可以选择高效、相对合理的评价方法。 各具特色的综合评价方法,为我们针对某一具体的评价工作选择评价方法提供了借鉴。在选择评价方法时应适应综合评价对象和综合评价任务的要求,根据现有资料状况,做出科学的选择。也就是说,评价方法的选取主要取决于评价者本身的目的和被评价事物的特点。而且,就同一种评价方法本身而言,在一些具体问题的处理上也并非相同,需要根据不同的情况做不同的处理。因此从一定程度上讲,综合评价方法既是一门科学,对该方法的应用又是一门艺术。以下几条筛选原则可供参考。 (1) 选择评价者最熟悉的评价方法。 (2) 所选择的方法必须有坚实的理论基础,能为人们所信服。 (3) 所选择的方法必须简洁明了,尽量降低算法的复杂性。 (4) 所选择的方法必须能够正确地反映评价对象和评价目的。 只要遵循上述原则,一般可以选择出较为适宜的评价方法。不过,这些原则也只是定性的、指导性的原则。当然,在大多数情况下最优的评价方法是不存在的。应该注意的是,不同的选择会产生不同的评价结论,有时甚至结论相左。也就是说,综合评价的结果不是唯一的。 在这里先简单谈谈专家打分评价法,以作为后续要讨论的现代综合评价方法的基础和铺垫。专家评分法是出现较早且应用较广的一种评价方法。它是在定量和定性分析的基础上,以打分等方式做出定量评价,其结果具有数理统计特性。专家评分法的最大优点是,在缺乏足够统计数据和原始资料的情况下,可以做出定量估价。它的主要步骤是: 首先根据评价对象的具体情况选定评价指标,对每个指标均定出评价等级,每个等级的标准用分值表示; 然后以此为基准,由专家对评价对象进行分析和评价,确定各个指标的分值; 最后采用加法评分法、连乘评分法或加乘评分法求出各评价对象的总分值,从而得到评价结果。考虑到各指标重要程度的不同及专家权威性的大小,后又发展了加权评分法。其中,加权和法是人们最经常使用的评价方法。采用加权和法的关键在于确定指标体系并设定各最低层指标的权系数: 有了指标体系,就可以设法利用统计数据或专家打分给出属性值表; 有了权系数,具体的计算和排序就十分方便了。当然,专家评分法还有多种变形形式。专家评价的准确程度,主要取决于专家的阅历经验以及知识的广度和深度。这就要求参加评价的专家对评价的系统具有较高的学术水平和丰富的实践经验。总的来说,专家评分法具有使用简单、直观性强的特点,但其理论性与系统性不强,一般情况下难以保证评价结果的客观性和准确性。 近年来,围绕综合评价,其他相关知识不断渗入,使得综合评价的方法不断丰富,有关研究也不断深入。值得注意的是,国内外近二十年来综合评价技术的实际研究状况表明,从事综合评价技术研究的人员更多的不是统计界人员而是管理数学界与系统工程界的研究人员,他们从决策科学、系统科学中寻找科学的综合评价思想和方法,并不断将其引入和应用到各类综合评价实践中。 本书将挑选介绍当今流行的几种现代综合评价方法,其中包括层次分析法、模糊综合评判、数据包络分析法、人工神经网络评价法、灰色综合评价法。各种评价方法有简有繁,相互独立,但都符合综合评价的要求。读者可以依次阅读,也可以挑选阅读。在本书的最后一章,对几种综合评价方法的两两结合与集成做了讨论,这对综合评价方法的进一步研究和应用将起到导向性的作用。 参 考 文 献 [1]苏为华.多指标综合评价理论与方法研究.北京: 中国物价出版社,2001 [2]秦寿康.综合评价原理与应用.北京: 电子工业出版社,2003 [3]邱东.多指标综合评价方法.统计研究,1990,(6): 4951 [4]张于心等.综合评价指标体系和评价方法.北方交通大学学报,1995,19(3): 393400 [5]王明涛.多指标综合评价中权系数确定的一种综合分析方法.系统工程,1999,17(2): 5661 [6]郭亚军.综合评价的合理性问题.东北大学学报(自然科学版),2002,23(9): 844847 [7]闫风茹等. 略论综合评价方法. 山西统计,2003,(1): 1617 [8]杜栋. 人才评价、预测与规划方法与支持系统的研究. 北京农业工程大学硕士研究生论文,1994