一、考试要求
1. 熟悉随机变量的概念
2. 掌握随机变量的取值及随机变量分布的概念
3. 熟悉离散随机变量的概率函数(分布列)
4. 熟悉离散随机变量均值、方差和标准差的定义
5. 熟悉连续随机变量的分布密度函数
6. 熟悉连续随机变量均值、方差和标准差的定义
7. 掌握连续随机变量在某个区间内取值概率的计算方法
二、主要考点
1. 离散随机变量的分布
2. 连续随机变量的分布的性质
3. 随机变量的均值、方差的运算性质
三、内容讲解
第二节 随机变量及其分布
一、随机变量
表示随机现象结果的变量称为随机变量。常用大写字母X, Y, Z等表示随机变量,它们的取值用相应的小写字母x, y, z等表示。
假如一个随机变量仅取数轴上有限个点或可列个点 (见图1.2-1),则称此随机变量为离散随机变量,或离散型随机变量。
假如一个随机变量的所有可能取值充满数轴上一个区间 (a,b)(见图1.2-2),则称此随机变量为连续随机变量,或连续型随机变量,其中a可以是 , b可以是+ 。
[例1.2-1] 产品的质量特性是表征产品性能的指标,产品的性能一般都具有随机性,所以每个质量特性就是一个随机变量。例如:
(1)设X是一只铸件上的瑕疵数,则X是一个离散随机变量,它可以取0,1,2,…等值。
为了方便,人们常用随机变量X的取值来表示事件,如 “X=0”表示事件:“铸件上无瑕疵”;“X=2”表示事件:“铸件上有两个瑕”;"X>2"表示事件:“铸件上的瑕疵超过两个"等等。这些事件可能发生,也可能不发生,因为X取0,1,2 …等值是随机的。类似地,一平方米玻璃上的气泡数、一匹布上的疵点数、一台车床在一天内发生的故障数都是取非负整数 {0,1,2,3,…}的离散随机变量。
(2)一台电视机的寿命X(单位:小时)是在 [0, )上取值的连续随机变量。"X=0"表示事件:"一台电视机在开箱时就发生故障";"X 10000"表示事件: "电视机寿命不超过10000小时";"X>40000"表示事件: "电视机寿命超过40000小时"。
(3)检验一个产品,结果可能是合格品,也可能是不合格品。设X表示检验一个产品的不合格品数,则X是只能取0或1两个值的随机变量。"X=0"表示产品时合格品,"X=1"表示产品是不合格品。类似地,若检验10个产品,则不合格品数X是,且仅可能是取0,1,…,10等11个值的离散随机变量。更一般的,在n个产品中的不合格品数X是可能取0,1,2,…,n等n+1个值的离散随机变量。
二、随机变量的分布
虽然随机变量的取值是随机的,但其本质上还是有规律性的,这个规律性可以用分布来描述。认识一个随机变量X的关键就是要知道它的分布,分布包含如下两方面内容:
(1) X可能取哪些值,或在哪个区间上取值。
(2) X取这些值的概率各是多少,或X在任一区间上取值的概率是多少?
下面分离散随机变量和连续随机变量来叙述它们的分布,因为这两类随机变量是最重要的两类随机变量,而它们的分布形式是有差别的。
(一) 离散随机变量的分布
离散随机变量的分布可用分布列来表示, 比如,随机变量X仅取n个值: x1,x2, …,xn,
随机变量X取x1的概率为p1,取x2的概率为p2 ,…,取xn的概率为pn。这些可用一张表清楚地表示:
Xx1 x2 … xn
p p1 p2 … pn
或用一个简明的数学式子表示:
作为一个分布, 满足以下两个条件:
, 满足这两个条件的分布称为离散分布,这一组 也称为分布的概率函数。
[例1.2-2 ] 掷两颗股子,其样本空间为:
考察与这个随机现象有关的一些随机变量:
设X表示“掷两颗子骰子,6点出现的个数”,它的分布列为:
X0 1 2
p25/36 10/36 1/36
(2)设Y表示“掷两颗子,出现的点数之和”
X2 3 4 5 6 7 8 9 10 11 12
p1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36
这些随机变量X, Y都是各从一个侧面表示随机现象的一种结果,每个随机变量的取值都是随机的,但其分布告诉我们该随机变量取每个值的概率,使人们不仅对全局做到心中有数,而且还看到了取哪些值的可能性大,X取哪些值的可能性小,比如:
X取0可能性,X取2的可能性最小;
Y取7的可能性,Y取2或12的可能性最小;
这些分布中的概率都可用古典方法获得,每个概率都是非负的,其和均为1。
[例1.2-3] 设在10个产品中有2个不合格品,从中随机取出4个,其中不合格品数X是离散随机变量,它仅可取0,1,2等三个值。X取这些值的概率为 (详见例1.1-4):
具体计算后可得如下分布列:
X0 1 2
P0.3333 0.5333 0.1334
从表中可见,事件 "X=l"出现的机会。
对同样的问题,若用放回抽样,则从10个产品(其中有2个不合格品)中随机取出4个,其中不合格品数Y是另一个随机变量,它可取0,1,2,3,4等五个值。Y取这些值的概率为(详见例1.1-5):
m=0,1,2,3,4
具体计算后可得如下分布列:
X0 1 2 3 4
p0.4096 0.4096 0.1536 0.0256 0.0016
这个分布显示了Y取哪些值概率大,哪些值概率小。还可计算有关事件的概率,比如:
例[1.2-4],略,见书第27页