第1章随机事件与概率 本章介绍概率论中的基本概念和术语,随机事件之间的关系及运算,事件的概率及概率的基本性质,概率的基本公式,事件的独立性与n重伯努利概型. 本章内容对于准确掌握概率与数理统计理论体系与应用方法都十分重要. 1.1随机事件 1.1.1随机现象 概率论与数理统计是研究随机现象统计规律性的一门学科. 在自然界和社会实践中,人们观察到的现象各种各样,但归纳起来大体上可分为两类. 一类是确定性现象. 例如,向上抛掷的重物必然自由下落; 在标准大气压下,纯水加热到100℃时会沸腾; 在一批合格的产品中任取一件,必定不是废品等. 这类在一定条件下必然出现某一结果的现象称为确定性现象或必然现象. 几何、代数、微积分等都是研究确定性现象的数学工具. 另一类是随机现象,它是与确定性现象有着本质区别的一类现象. 例如,抛掷一枚均匀的硬币,其结果可能是正面朝上,也可能是反面朝上; 某射手向同一目标射击多次,各次射击的弹着点不尽相同,并且每次射击之前无法预知弹着点的确切位置. 这类现象的共同特点是: 在同样条件下重复进行一系列试验,每次试验的可能结果不止一个,且事先不能预知将会出现哪一种结果,即试验结果呈现出不确定性. 但人们经过长期实践并深入研究之后,发现这类现象在大量重复试验或观察下,其结果却呈现出某种规律性. 例如,在相同条件下多次重复抛掷一枚均匀硬币,出现正面朝上的次数大致占抛掷总次数的一半; 某射手向同一目标射击的弹着点按照一定的规律分布等. 这种在大量重复试验或观察中所呈现出的固有的规律性称为统计规律性. 我们把在个别试验中呈现出不确定性,而在大量重复试验或观察中又具有统计规律性的现象,称为随机现象. 1.1.2随机试验 在概率论中,试验是一个含义广泛的术语,它包括为研究随机现象的统计规律性而进行的各种科学实验或对事物的某种特性进行的观察. 常用字母E表示这类试验. 例如 E1: 抛掷一枚均匀硬币,观察它出现正面朝上与反面朝上的情况. E2: 抛掷一颗骰子,观察它出现的点数. E3: 记录电话交换台在单位时间内收到的呼叫次数. E4: 在一批同型号的灯泡中任意抽取一只,测试它的使用寿命. E5: 在相同条件下,接连不断地向一个目标射击,直到击中目标为止,记录射击的次数. 以上试验都可以在相同条件下重复进行. 试验E1只有两种可能结果: 出现正面朝上或反面朝上,但是在抛掷之前不知道究竟会出现哪一面朝上. 对于试验E4,灯泡的使用寿命(以小时计)是一个非负实数,而在测试之前不能确定它的使用寿命有多长. 概括起来,这些试验具有下列特点: (1) 试验可以在相同的条件下重复进行; (2) 试验的所有可能结果在试验之前是明确可知的,并且不止一个; (3) 每次试验之前不能确定这次试验会出现哪一个结果. 称具有上述三个特点的试验为随机试验,简称为试验.我们是通过随机试验来研究随机现象的. 1.1.3随机事件、样本空间 在随机试验E中,每个可能出现的不能再分解的最简单的结果称为随机试验E的基本事件. 由于随机试验的所有可能结果是明确的,因此试验的所有基本事件也是已知的. 将全体基本事件组成的集合称为样本空间或基本事件空间,记为Ω. 样本空间Ω中的元素,即基本事件又称为样本点,用ω表示. 例1.1抛掷一枚硬币,观察出现正面朝上与反面朝上的情况. 若记ω1={正面朝上},ω2={反面朝上},则样本空间由两个样本点组成,即 Ω={ω1,ω2} 例1.2一个盒子中有10个完全相同的球,分别标有号码1,2,…,10,从中任取1球,观察球上的号码.若记ωi={取出的球的号码为i} (i=1,2,…,10),则样本空间为 Ω={ω1,ω2,…,ω10} 例1.3将一枚硬币连续地抛两次,观察出现正面、反面朝上的情况. 这个试验共有4个基本事件: (正,正),(正,反),(反,正),(反,反),其中(正,正)表示两次都出现正面朝上; (正,反)表示第一次出现正面朝上,第二次出现反面朝上,其余类推. 若记ω1={正,正},ω2={正,反},ω3={反,正},ω4={反,反},则样本空间为 Ω={ω1,ω2,ω3,ω4} 例1.4记录电话交换台在单位时间内收到的呼叫次数. 若记ωi={收到i次呼叫}(i=0,1,2,…),则样本空间为 Ω={ω0,ω1,ω2,…} 例1.5某射手对同一目标进行射击,观察弹着点与目标的距离. 若用x表示 “弹着点与目标的距离” 这一结果,则样本空间为 Ω={x|0≤x<+∞} 在确定随机试验的样本空间时,要注意试验的内容与目的. 譬如,例1.1和例1.3都是抛硬币的试验,但由于试验内容不同,所以样本空间也不一样. 在随机试验中,人们常常关心具有某些特征的样本点所组成的集合. 称样本空间Ω的子集为随机事件,简称事件. 常用字母A,B,C,…表示. 在试验中,称某个事件发生,当且仅当该子集中的某一个样本点在试验中出现. 显然基本事件也是随机事件. 例1.6在例1.2中,若记 Ai={取出的球的号码为i } (i=1,2,…,10),B={取出的球的号码是偶数} 则A1,A2,…,A10,B都是随机事件. 其中B是由A2,A4,A6,A8,A10 这5个基本事件组成的.像这种由若干个基本事件所组成的事件称为复合事件. 我们说事件B发生,当且仅当A2,A4,A6,A8,A10 这5个基本事件中有一个发生. 每次试验中一定会发生的事件称为必然事件,用字母Ω表示; 每次试验中一定不会发生的事件称为不可能事件,记为. 必然事件与不可能事件不具有随机性,但为了讨论问题的方便,也把它们看作是特殊的随机事件. 譬如,在例1.2中 “取出的球的号码不大于10”是必然事件,而 “取出的球的号码为11” 是不可能事件. 因为样本空间Ω是由所有基本事件组成的集合,因此在任何一次试验中,必然会出现Ω中的某个样本点,所以样本空间Ω作为一个事件是必然事件. 空集不包含任何样本点,它作为一个事件在每次试验中都不会发生,所以空集是不可能事件. 由于任一事件A是样本空间Ω的子集,为了叙述方便,不妨把这个子集称为集合A.于是事件之间的关系和运算就可以用集合论的知识来解释. 在概率论中常用平面上的某个矩形区域表示样本空间Ω,该区域内的某个子区域表示事件,见图1-1(a)~(f). 1.1.4事件的关系及运算 在一个随机试验中,可以有许多随机事件,其中有些比较简单,有些则比较复杂,它们之间存在着各种各样的关系. 概率论的任务之一是希望从简单事件的概率推算出复杂事件的概率. 为此,需要研究事件之间的关系和运算. 下面讨论事件之间的几种主要关系和运算. 1. 事件的包含 若事件A发生必然导致事件B发生,则称事件B包含事件A,或称事件A含于事件B,记为BA或AB. 从集合论的观点看,事件B包含事件A,就是A中的每一个样本点都包含在B中,如图1-1(a)所示. 对任一事件A,有AΩ. 2. 事件的相等 若AB且BA,则称事件A与B相等,记为A=B. 相等的两个事件所包含的样本点完全相同. 3. 事件的并 “事件A与B中至少有一个发生” 这一事件,称为事件A与B的并(或和),记为A∪B或A+B. A∪B是由事件A与B的所有样本点构成的集合. 如图1-1(b)所示. 对任一事件A,有A∪A=A,A∪=A,A∪Ω=Ω. 事件的并的概念可以推广到有限个或可列无穷多个事件的情形. “事件A1,A2,…,An中至少有一个发生” 这一事件,称为事件A1,A2,…,An的并(或和),记为∪ni=1Ai或∑ni=1Ai. “事件A1,A2,…,An,…中至少有一个发生” 这一事件,称为事件A1,A2,…,An,…的并(或和),记为∪∞i=1Ai或∑∞i=1Ai. 4. 事件的交 “事件A与B同时发生” 这一事件,称为事件A与B的交(或积),记为A∩B(或AB). A∩B是由事件A与B的所有公共样本点构成的集合. 如图1-1(c)所示. 对任一事件A,有AA=A,A=,AΩ=A. 类似地,“事件A1,A2,…,An同时发生” 这一事件,称为事件A1,A2,…,An的交(或积),记为∩ni=1Ai或∏ni=1Ai. “事件A1,A2,…,An,…同时发生” 这一事件,称为事件A1,A2,…,An,…的交(或积),记为∩∞i=1Ai或∏∞i=1Ai. 5. 事件的差 “事件A发生而事件B不发生” 这一事件,称为事件A与B的差,记为A-B. A-B是由属于A但不属于B的那些样本点构成的集合. 如图1-1(d)所示. 6. 互不相容事件 若事件A与B不能同时发生,即AB=,则称事件A与B互不相容(或A与B互斥). 事件A与B互不相容表示A与B没有公共的样本点. 如图1-1(e)所示. 若事件A1,A2,…,An(或A1,A2,…,An,…)中任意两个事件都互不相容,即AiAj=(i≠j; i,j=1,2,…,n或i,j=1,2,…,n,…),则称事件A1,A2,…,An(或A1,A2,…,An,…)两两互不相容. 7. 对立事件 “事件A不发生”(或事件“非A”)称为A的对立事件,也称为A的逆事件,记为. 是由样本空间中不属于A的那些样本点构成的集合. 如图1-1(f)所示. 对立事件的另一种定义: 若事件A与B满足AB=,且A∪B=Ω,则称事件A,B互为对立事件,记为=B,=A. 显然有 A=,A∪=Ω,A-B=A =Ω-Α,A=A 图1-1 可以验证,事件的运算满足以下规律: (1) 交换律A∪B=B∪A,AB=BA. (2) 结合律A∪(B∪C)=(A∪B)∪C,A(BC)=(AB)C. (3) 分配律A(B∪C)=(AB)∪(AC),A∪(BC)=(A∪B)(A∪C). (4) 对偶律(德摩根律) A∪B=∩,A∩B=∪ 对于有限个事件有 ∪ni=1Ai=∩ni=1Ai,∩ni=1Ai=∪ni=1Ai 概率论中事件间的关系及运算与集合论中集合间相应的关系及运算是一致的. 它们之间的对应关系见表1-1. 表1-1 符号概率论集合论 Ω 样本空间、必然事件 空间  不可能事件 空集 ω 样本点、基本事件 Ω中的元素(或点) A 事件 Ω的子集 AB 事件A发生必然导致事件B发生 集合A含于集合B中 A=B 事件A与事件B相等 集合A与集合B相等 A∪B 事件A与B中至少有一个发生 集合A与集合B的并集(或和集) AB 事件A与事件B同时发生 集合A与集合B的交集 A-B 事件A发生而事件B不发生 集合A与集合B的差集 A的对立事件 集合A的余集 AB= 事件A与事件B互不相容 集合A与集合B无公共元素 在许多场合,用集合论的表达方式显得简练,也更易理解. 但重要的是要学会用概率论的语言来解释集合间的关系及运算,并能运用它们. 例1.7抛掷一颗均匀的骰子,观察它出现的点数. 设ωi={出现i点}(i=1,2,…,6),A={ω1,ω3,ω5},B={ω1,ω2,ω3,ω4},C={ω2,ω4}. 求A∪B,A-B,AC,AB,A∪,AB,A∪B. 解依题意有 A∪B={ω1,ω2,ω3,ω4,ω5},A-B={ω5},AC=,AB={ω1,ω3} A∪={ω1,ω3,ω5,ω6},AB={ω2,ω4,ω5,ω6},A∪B={ω6} 例1.8一批产品中有若干个正品和次品,从中不放回地抽取三次,每次任取一件进行检查,设Ai表示事件 “第i次取到正品” (i=1,2,3),则 (1) “三次都取到正品”可表示为A1A2A3; (2) “前两次都取到正品,第三次取到次品”可表示为A1A23; (3) “三次中至少有一次取到正品”可表示为A1∪A2∪A3 或 A123∪1A23∪12A3∪A1A23∪A12A3∪1A2A3∪A1A2A3 (4) “三次中恰有两次取到正品”可表示为A1A23∪A12A3∪1A2A3; (5) “三次中至多有一次取到正品” 可表示为123∪A123∪1A23∪12A3或12∪13∪23. 1.2随机事件的概率 1.2.1事件的频率与概率的统计定义 随机事件在一次试验中可能发生,也可能不发生,即有偶然性的一面. 但是在相同的条件下,进行大量的重复试验就会发现随机事件的统计规律性. 不同事件发生的可能性有大小之分,而且这种可能性的大小是事件本身固有的一种属性,它是可以用数字来度量的. 概率就是刻画事件发生的可能性大小的数量指标. 下面我们先介绍频率的概念. 在相同条件下,重复进行n次试验,在这n次试验中,事件A发生的次数nA称为事件A发生的频数,比值nAn称为事件A发生的频率,记为fn(A),即 fn(A)=nAn(1.1) 频率具有下述三条基本性质: (1) 对任意事件A,有0≤fn(A)≤1; (2) fn(Ω)=1; (3) 若事件A1,A2,…,An两两互不相容,则 fn∪ni=1Ai=∑ni=1fn(Ai) 事件发生的频率反映了事件在一定条件下发生的频繁程度. 不难理解,一个事件在每次试验中出现的可能性越大,那么它在n次试验中发生的频率也越大. 反之,由频率的大小也能判断事件发生的可能性大小. 例1.9在历史上,曾有人做过大量抛硬币的试验,其试验结果如表1-2所示. 表1-2 实验者掷硬币次数n出现正面朝上(A)的次数nA频率fn(A) 德摩根 2048 1061 0.5181 蒲丰 4040 2048 0.5069 皮尔逊 12000 6019 0.5016 皮尔逊 24000 12012 0.5005 由表1-2可知,“出现正面朝上”的频率fn(A)总是在0.5这个数值附近摆动,而且随着试验次数的增加逐渐稳定于0.5. 例1.10为了得到某种子的发芽率,从一大批种子中抽取9批种子做发芽试验,试验结果如表1-3所示. 表1-3 种子粒数n5107015031060090018003000 发芽粒数nA 576013128254882016312715 发芽率fn(A) 10.70.8570.8730.9100.9130.9110.9060.905 由表1-3可知,随着每批抽取的种子粒数的增多,发芽率fn(A)总是在0.9附近摆动. 从上面两个试验记录可以看出,当试验次数n较小时,频率fn(A)的波动性比较明显,但是当n逐渐增大时,频率的这种波动性明显减小,频率fn(A)逐渐稳定于某个常数p附近,称这种性质为频率的稳定性,它揭示了蕴含在随机现象中的统计规律性. 而常数值p称为频率的稳定值. 下面给出概率的统计定义. 定义1.1在相同条件下,重复进行n次试验,事件A发生的频率fn(A)在某个常数值p附近摆动,而且一般来说,n越大,摆动的幅度越小,则称频率的稳定值p为事件A发生的概率,记作P(A),即P(A)=p. 虽然事件的频率与概率都是事件发生可能性大小的度量,但是频率是试验值,与试验次数有关,而且即使试验次数相同,频率也可能取不同的值. 概率是先于试验而客观存在的理论值,它是一个确定的数值,其大小取决于事件本身固有的规律性. 基于频率的稳定性,当试验次数n充分大时,可以用频率作为概率的近似值. 1.2.2古典概型 概率的统计定义,实际上提供了一种近似计算概率的方法. 但是在某些特殊条件下,我们并不需要做大量的重复试验,而是根据问题本身所具有的某种 “均匀性” 或 “对称性”,直接用理论分析的方法计算事件的概率. 例如,抛掷一颗均匀的骰子,观察它出现的点数,共有6种可能结果. 由骰子的 “均匀性”可知,每种结果发生的可能性相等. 这种随机试验具有以下特征: (1) 试验的样本空间只有有限个样本点,不妨设为n个,记为ω1,ω2,…,ωn. (2) 试验中每个基本事件出现的可能性相等,即 P(ω1)=P(ω2)=…=P(ωn) 在概率论中,我们把具有上述两个特征的试验模型,称为古典概型(或等可能概型). 定义1.2概率的古典定义 在古典概型中,设试验E的样本空间为Ω={ω1,ω2,…,ωn},事件A由其中k个基本事件所组成,即 A={ωi1,ωi2,…,ωik} 则事件A的概率为 P(A)=kn=A中包含的基本事件数基本事件总数(1.2) 并称由(1.2)式所定义的概率为古典概率. 不难验证,古典概率具有下列三条基本性质: 1. 对任一事件A,有 0≤P(A)≤1; 2. P(Ω)=1; 3. 若事件A1,A2,…,An两两互不相容,则 P∪ni=1Ai=∑ni=1P(Ai) 例1.11抛掷一颗均匀的骰子,求出现奇数点的概率. 解设事件A={出现奇数点},记ωi={出现i点}(i=1,2,…,6),则Ω={ω1,ω2,…,ω6},基本事件总数n=6. 事件A={ω1,ω3,ω5},它由三个基本事件组成,即k=3. 由(1.2)式得 P(A)=kn=36=12 这里计算事件A的概率是通过列举法得到的,即把试验的所有可能结果一一列举出来.但这只能解决一些简单的问题. 根据概率的古典定义,在计算事件的概率时,必须搞清楚样本空间是由哪些样本点组成的,并计算它的总数,以及事件A是由哪些样本点组成的,共有多少个. 而在计算样本点个数的运算中,常要用到排列组合的知识. 例1.12(抽样问题)在100件同类产品中,有60件正品,40件次品. 现分别按下列三种方式,从中抽取3件产品: (1) 每次任取一件,测试后放回,然后再抽取下一件(这种抽取方法称为有放回抽样); (2) 每次任取一件,测试后不放回,然后在剩下的产品中再抽取下一件(这种抽取方法称为无放回抽样); (3) 一次从中任取3件. 求取出的3件产品中有两件是正品,一件是次品的概率. 解设事件A={取出的3件产品中有两件是正品,一件是次品}. (1) 有放回抽样. 在这种情况下,每次都是从100件中抽取. 从100件中任意抽取3件的所有可能取法共有1003种,因此,基本事件总数n=1003. 取出的3件产品中有两件是正品,一件是次品,考虑正品出现的次序,A中包含的基本事件数为k=C23×602×40,于是 P(A)=C23×602×401003=0.432 (2) 不放回抽样. 在这种情况下,第一次是从100件中任取一件,第二次是从剩下的99件中任取一件,第三次是从98件中任取一件,故基本事件总数为n=100×99×88. 考虑取出的3件产品中,正品出现的次序,A中包含的基本事件数为k=C23×60×59×40,于是 P(A)=C23×60×59×40100×99×98≈0.438 (3) 一次从中任取3件. 基本事件总数为n=C3100. A中包含的基本事件数为k=C260×C140,于是 P(A)=C260×C140C3100≈0.438 比较(2)、(3)会发现,按不放回抽样与一次抽取3件产品所得到的概率相同. 前者在计算样本点个数时是考虑顺序的,而后者没有考虑顺序. 例1.13盒中装有m个红球和l个白球,现有m+l个人依次从盒中任取一球,取后不放回,求第i(i=1,2,…,m+l)个人取到红球的概率. 解设事件Ai={第i个人取到红球}(i=1,2,…,m+l). 将盒中的每个球进行编号,并把取出的球依次排成一列,则基本事件总数为n=(m+l)!.第i个人取到红球,相当于首先在第i个位置上排红球,共有m种排法; 其次在余下的m+l-1个位置上排剩下的m+l-1个球,共有(m+l-1)!种排法,由乘法原理知,Ai中包含的基本事件数为m×(m+l-1)!,于是 P(Ai)=m×(m+l-1)!(m+l)!=mm+l,i=1,2,…,m+l 注意到,所求概率P(Ai)与i无关,它是一个常数,这表明每个人取到红球的概率是一样的,与取球的先后顺序无关. 也就是说,在实际生活中利用抽签或抓阄解决问题是公平的. 1.2.3几何概型 在古典概型中,试验的每一个可能结果出现的可能性相等且试验的结果是有限的. 实际问题中还有一类随机试验: 试验的每一个可能结果出现的可能性相等,但试验的所有可能结果却有无穷多个. 在这类试验中,一般可以借助于几何度量(长度、面积、体积等)来刻画事件的概率. 若随机试验E具有下述特点: (1) 试验的所有可能结果有无穷多个,而且试验的全部结果可以用一个能度量的几何区域(该区域可以是有限线段、平面区域及空间区域等)来表示. (2) 试验的每个可能结果出现的可能性相等 (等可能性). 则把具有上述两个特点的试验模型,称为几何概型. 在几何概型中,设随机试验E的样本空间可以表示成能度量的几何区域仍记为Ω,随机事件A所对应的几何区域仍记为A(AΩ),则事件A的概率为 P(A)=A的度量Ω的度量(1.3) 称由(1.3)式所定义的概率为几何概率. 图1-2 利用(1.3)式计算事件的概率时,关键在于将问题几何化,即把一个随机试验转化为向一个几何区域中投点的试验.