跳转至

一维随机变量及其分布

随机变量及其分布函数

随机变量(Random Varible的概念

  • 设随机试验\(E\)的样本空间为\(\Omega\),对每一个样本点\(\omega \in \Omega\),均有惟一确定的实数\(X\)与之对应,则称\(X\)为一个定义在\(\Omega\)上的随机变量
    • 记作\(X=X( \omega )\)
    • 通常随机变量使用\(X,Y,\eta\)等符号表示
  • 可以利用随机变量的某种逻辑关系表示随机事件
    • \(X\)为一随机变量,\(L\)为某实数集,则\(\{X\in L\}\)表示随机事件
      • \(\{a<X\le b\},\{X<b\}\)
      • \(\{-\infty < X < +\infty\}\),则称\(X\)为必然事件
  • 引入随机变量的意义:借助微积分方法将讨论进行到底
  • 随机变量的分类:

#概率论重点 分布函数

  • \(X\)为一随机变量,对于任意实数\(x\),称函数\(P\{X\le x\}\)\(X\)分布函数,记为\(F(x)\),即随机变量\(X\)的分布函数为:\(\(F(x)=P\{X\le x\},-\infty < x <+\infty\)\)

    [!注] - 不论随机变量\(X\)如何取值其分布函数\(F(x)\)的定义域总是\((-\infty,+\infty)\) - 分布函数\(F(x)\)的直观意义为随机变量\(X\)落在区间\((-\infty, x]\)上的概率

  • 使用分布函数表示概率

    • \(P\{a<X\le b\}=P\{X\le b\}-P\{X \le a\}=F(b)-F(a)\)
    • \(P\{X>a\}=1-P\{X\le a\}=1-F(a)\)
    • \(P\{X=a\}=F(a)-F(a-0)\)
  • 基本性质
    • \(0\le F(x) \le 1\)
    • \(\lim_{x\to -\infty}F(x)=0,\lim_{x\to +\infty}F(x)=1\)
    • \(F(x_0+0)=\lim _{x\to x_0^+}F(x)=F(x_0)\)
    • 单调性
  • eg:

离散型随机变量及其分布律

离散型随机变量及其分布律的概念

  • 离散型随机变量:随机变量\(X\)的取值可以为有限个或可列无限多个
  • 离散型随机变量\(X\)的分布律或概率分布:\(P\{X=x_i\}=p_i, i=1,2,...\)
  • 表示方法:
    • 表格法\(\(X\sim\begin{pmatrix}x_1&x_2&...&x_i&...\\p_1&p_2&...&p_i&...\end{pmatrix}\)\)
    • 解析法
    • 图示法
  • 离散型随机变量分布律的性质
    • \(p_i \ge 0, i=1,2,..\)
    • \(\sum_{i}p_i=1\)
    • \(P\{X\in L\}=\sum_{x_i \in L}p_i\)
    • \(F(x)=P\{X\le x\}=\sum_{x_i\le x}p_i, -\infty<x<+\infty\)

几种常见的离散型随机变量的概率分布

  1. 离散均匀分布\(P(X=k)=\frac{1}{n},k=1,2,...,n\)
  2. 概率论重点 0-1两点分布\(P\{X=k\}=p^k(1-p)^{1-k},k=0,1,...,0<p<1\)

    • \(X\sim \begin{pmatrix}0&1\\1-p&p\end{pmatrix}\)
    • 记作\(X\sim B(1,p)\)
  3. 概率论重点 二项分布(伯努利分布)\(P\{X=k\}=C^k_np^k(1-p)^{n-k},k=0,1,2,...\)

    • \(\sum^{n}_{k=0}C^k_np^k(1-p)^{n-k}=1\)
    • 记作\(X\sim B(n,p)\)(n重伯努利试验)
  4. 概率论重点 泊松分布\(P\{X=k\}=\frac{\lambda^k}{k!}e^{-\lambda},k=0,1,2,...,\lambda > 0\)

    • \(\sum^{\infty}_{k=0}\frac{\lambda^k}{k!}e^{-\lambda}=e^\lambda·e^{-\lambda}=1\)
    • 记作\(X\sim P(\lambda)\)
    • 一般来说,在一定时间内,"稀有事件”发生的次数\(X\)服从泊松分布
    • 泊松定理:在n重伯努利试验中,事件A在每次试验中发生的概率为\(p_n\)\(p_n\)与试验次数n有关,若\(\lim_{n \to \infty}np_n=\lambda\),则对于任意非负整数k,有\(\lim_{n\to \infty}C^k_np^k_n(1-p_n)^{n-k}=\frac{\lambda^k}{k!}e^{-\lambda}\)
    • 泊松分布表
  5. 几何分布\(P\{X=k\}=(1-p)^{k-1}p,k=1,2,3,...\)
    • 记作\(X\sim G(p)\)
    • \(\sum^\infty_{k=1}P\{X=k\}=\sum^\infty_{k=1}(1-p)^{k-1}p=\frac{p}{1-(1-p)}=1\)
    • 在一系列独立重复实验中,事件A首次发生时所进行的试验次数满足\(X\sim G(p)\)
  6. 超几何分布\(P\{X=k\}=\frac{C^{n-k}_{N-M}C^k_M}{C^n_N},其中N>1,M\le N,n\le N,\max\{0,M+n-N\}\le k \le \min\{M,n\}\)
    • 记作\(X\sim H(M,N,n)\)

连续型随机变量及其密度函数

连续型随机变量及其密度函数的概念

  • 分布函数\(F(x)=\int^{x}_{-\infty}f(t)dt\)\(X\)连续型随机变量\(f(x)\)\(X\)密度函数或概率密度
    • \(f(x)\)近似等于连续型随机变量\(X\)在点x处附近的无限小区段内,单位长度所占有的概率,反映了连续型随机变量X在点x处附近的概率“密集程度”
  • 概率论重点 性质

    1. \(f(x)\ge 0,x\in(-\infty,+\infty)\)
    2. \(\int^{+\infty}_{-\infty}f(x)dx=1\)
    3. 如果满足以上两个性质,则\(f(x)\)必为某连续型随机变量X的密度函数
    4. 改变概率密度函数\(f(x)\)在个别点的函数值不影响\(F(x)\)的取值,故对固定的分布函数,概率密度函数不是唯一的
  • 定理:设连续型r.v.X的分布函数(CDF)为\(F(x)\),概率密度分布函数(PDF)为\(f(X)\)
    • \(F(x)\)为连续函数(绝对连续函数)
    • \(x\)\(f(x)\)的连续点,则\(\frac{dF(x)}{dx}=f(x)\)
      • 密度函数的确定方式
        1. \(F(x)\)的可导点\(x\)处,取\(f(x)=F^\prime(x)\)
        2. \(F(x)\)的不可导点\(x\)处,取\(f(x)\)为任意非负值
    • 对于任意实数\(c\),则\(P\{X=c\}=0\)
      1. 在有限个点处改变\(f(x)\)的取值,不影响\(X\)的整体分布,则\(f(x)\)的表达式可以不唯一
    • \(P\{a<X<b\}=P\{a\le X< b\}=P\{a<X\le b\}=P\{a\le X \le b\}=\int^{b}_{a}f(x)dx\)

#概率论重点 几种常见的连续型随机变量的概率分布

  1. 均匀分布
    • 记作:\(X\sim U[a,b]\)
    • \(f(x)=\begin{cases}\frac{1}{b-a},a\le x\le b \\ 0, 其他\end{cases}\)
    • \(F(x)=\begin{cases}0,x<a\\ \frac{x-a}{b-a},a\le x<b\\ 1, b\le x\end{cases}\)
    • \(P\{X\in I\}=P\{X\in I\cap[a,b]\}=\frac{I\cap [a,b]的长度}{b - a}\)
  2. 指数分布
    • 记作:\(X\sim E(\lambda)\)
    • \(f(x)=\begin{cases}\lambda e^{-\lambda x}, x\ge 0\\ 0, x < 0\end{cases}\)
    • \(F(x)=\begin{cases}1-e^{-\lambda x},x\ge 0\\0,x<0\end{cases}\)
    • 指数分布的无记忆性:\(P\{X>s+t|X>s\}=P\{X>t\}\)
      • 证明:
  3. 正态分布
    • 标准正态分布表
    • 记作:\(X\sim N(\mu,\sigma^2)\)
    • \(f(x)=\frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{(x-\mu)^2}{2\sigma^2}}\)
    • \(F(x)=\frac{1}{\sqrt{2\pi}\sigma}\int^{x}_{-\infty}e^{-\frac{(t-\mu)^2}{2\sigma^2}}dt,-\infty<x<+\infty\)
    • \(\mu,\sigma^2\)的变化对密度函数图像的影响
    • 标准正态分布:
      • \(\phi(x)=\frac{1}{\sqrt{2\pi}}e^{-\frac{x^2}{2}}\)
      • \(\Phi(x)=\frac{1}{\sqrt{2\pi}}\int^{x}_{-\infty}e^{-\frac{t^2}{2}}dt,-\infty<x<+\infty\)
    • \(P\{X\le b\}=\Phi(\frac{b-\mu}{\sigma})\)\(P\{X>a\}=1-\Phi(\frac{a-\mu}{\sigma})\)

一维随机变量函数的分布

本节介绍当随机变量\(X\)的概率分布以及函数\(g(x)\)均已知时,如何求出\(Y=g(X)\)的概率分布 - 所谓求\(Y=g(X)\)的概率分布是指 - 若\(Y\)是离散型,则求\(Y\)的分布律 - 若\(Y\)是连续型,则求\(Y\)的密度函数 - 若\(Y\)既不是连续型也不是离散型,则求\(Y\)的分布函数 - 首先需要判断\(Y=g(X)\)的类型

离散型随机变量\(X\)的函数\(Y=g(X)\)的概率分布

离散型随机变量X的分布律为:\(\(\begin{array}{c|cccc}X&x_1&x_2&...&x_i&...\\\hline P&p_1&p_2&...&p_i&...\end{array}\)\) - 求\(Y\)的分布律的步骤为: 1. 在\(X\)的分布律中添加一行\(Y=g(X)\),并将\(y_i=g(x_i)(i=1,2,...)\)的值对应填入行中 2. 对其中\(Y\)取值相同的想适当进行概率合并,即得\(Y\)的分布律

#概率论重点 连续型随机变量\(X\)的函数\(Y=g(X)\)的概率分布

  • 步骤
    1. 从分布函数着手:\(F_Y(y)=P\{T\le y\}=P\{g(X)\le y\}\)
    2. 对分布函数求导,得到概率密度函数
  • 定理:
    • 设随机变量\(X\)的密度函数为\(f_X(x)\cdot y=g(x)\)\((-\infty,+\infty)\)内的单调函数,其反函数\(x=h(y)\)具有异界连续倒数,则\(Y=g(X)\)为连续型随机变量,其密度函数为:\(\(f_Y(y)=\begin{cases}f(h(y))|h^\prime(y)|, y在Y的取值范围内\\0,其他\end{cases}\)\)
    • \(aX+b\sim N(a\mu+b, a^2\sigma^2)\)
      • 如果\(a=\frac{1}{\sigma},b=-\frac{\mu}{\sigma}\)
    • 如果连续性随机变量\(X\)的密度函数\(f_X(x)\)在有限区间\([a,b]\)之外取值为0,\(y=g(x)\)\([a,b]\)上的单调函数,其反函数\(x=h(y)\)具有异界连续导数,则\(Y=g(x)\)为连续型随机变量,其密度函数为:(\(f_Y(y)=\begin{cases}f_X(h(y))|h^\prime(y)|, \alpha\le y\le \beta\\0,其他\end{cases}\)\)其中\(\alpha=min\{g(a),g(b)\},\beta=max\{g(a),g(b)\}\)