数理统计基础

数理统计基础

  • 样本
    • 定义
      • 已知总体 XXX1,X2,,XnX_1,X_2,\dots,X_n 互相独立,与 XX 同分布,则 X1,X2,,XnX_1,X_2,\dots,X_n 是简单随机样本。
      • nn 为样本容量。
    • 样本分布
      • 已知总体 XX分布函数,样本 X1,X2,,XnX_1,X_2,\dots,X_n
      • F(x1,x2,,xn)=i=1nF(xi)F(x_1,x_2,\dots,x_n)=\displaystyle\prod_{i=1}^n F(x_i)
  • 统计量
    • 定义
      • 已知 X1,X2,,XnX_1,X_2,\dots,X_n 是来自 XX 的样本,T(X1,X2,,Xn)T(X_1,X_2,\dots,X_n) 不含任何未知参数,则 TT 为统计量。
    • 常用统计量
      • 样本均值:X=1ni=1nXi\overline X = \dfrac{1}{n}\displaystyle\sum_{i=1}^n X_i
      • 样本方差:S2=1n1i=1n(XX)2S^2 = \dfrac{1}{n-1}\displaystyle\sum_{i=1}^n(X - \overline X)^2
      • 样本标准差:S=S2S = \sqrt{S^2}
      • 样本 kk 阶矩:Ak=1ni=1XikA_k = \dfrac{1}{n}\displaystyle\sum_{i=1} X_i^k
      • 样本 kk 阶中心矩:Bk=1ni=1(XiX)kB_k = \dfrac{1}{n}\displaystyle\sum_{i=1} (X_i - \overline X)^k
      • 顺序统计量:将 X1,X2,,XnX_1,X_2,\dots,X_n 排序得到 X(1),X(2),,X(n)X_{(1)},X_{(2)},\dots,X_{(n)}
    • 性质
      • 已知 X1,X2,,XnX_1,X_2,\dots,X_n 是来自 XX 的样本,E(X)=μE(X) = \muD(X)=σ2D(X) = \sigma^2
        • E(X)=μE(\overline X) = \muD(X)=σ2nD(\overline X) = \dfrac{\sigma^2}{n}
        • E(S2)=σ2E(S^2) = \sigma^2
      • 已知 X1,X2,,XnX_1,X_2,\dots,X_n 是来自 N(μ,σ2)N(\mu,\sigma^2) 的样本。
        • XN(μ,σ2n)\overline X \sim N\left(\mu, \dfrac{\sigma^2}{n}\right)Xμσ/nN(0,1)\dfrac{\overline X - \mu}{\sigma / \sqrt{n}} \sim N(0, 1)
        • X\overline XS2S^2 独立。
  • 抽样分布
    • χ2\chi^2 分布
      • 已知 X1,X2,,XnX_1,X_2,\dots,X_n 是来自 XN(0,1)X\sim N(0,1) 的样本,定义 χ2=i=1nXi2χ2(n)\chi^2 = \displaystyle\sum_{i=1}^n X_i^2 \sim \chi^2(n)
      • χ2(2)\chi^2(2)E(12)E(\frac{1}{2})
      • 已知 Xχ2(n)X \sim \chi^2(n),则 E(X)=n,D(X)=2nE(X) = n,D(X) = 2n
      • 已知 Xχ2(m),Yχ2(n)X\sim \chi^2(m),Y \sim \chi^2(n),且 X,YX,Y 独立,则 X+Yχ2(m+n)X+Y \sim \chi^2(m+n)
      • 已知 X1,X2,,XnX_1,X_2,\dots,X_n 是来自 XN(μ,σ2)X\sim N(\mu,\sigma^2) 的样本,则 1σ2i=1n(Xiμ)2χ2(n)\dfrac{1}{\sigma^2} \displaystyle\sum_{i=1}^n (X_i - \mu)^2 \sim \chi^2(n)
      • (n1)S2σ2=nB2σ2χ2(n1)\dfrac{(n - 1) S^2}{\sigma^2} = \dfrac{n B_2}{\sigma^2} \sim \chi^2(n - 1)
    • tt 分布
      • 已知 XN(0,1),Yχ2(n)X \sim N(0,1), Y \sim \chi^2(n),且 X,YX,Y 独立,定义 T=XY/nt(n)T = \dfrac{X}{\sqrt{Y/n}} \sim t(n)
      • 已知 X1,X2,,XnX_1,X_2,\dots,X_n 是来自 XN(μ,σ2)X\sim N(\mu,\sigma^2) 的样本,则 XμS/nt(n1)\dfrac{\overline X - \mu}{S / \sqrt{n}} \sim t(n-1)
        • 注意与 Xμσ/n\dfrac{\overline X - \mu}{\sigma / \sqrt{n}} 是用 SS 近似 σ\sigma 的关系。
    • FF 分布
      • Xχ2(m),Yχ2(n)X \sim \chi^2(m),Y \sim \chi^2(n)X,YX,Y 相互独立,定义 F=X/mY/nF(m,n)F=\dfrac{X / m}{Y / n} \sim F(m,n)
      • 已知 XF(m,n)X \sim F(m,n),则 1XF(n,m)\dfrac{1}{X} \sim F(n,m)
      • 已知 Tt(n)T \sim t(n),则 T2F(1,n)T^2 \sim F(1,n)
      • 已知 X1,,XmX_1,\dots,X_m 来自 N(μ1,σ12)N(\mu_1,\sigma_1^2)Y1,,YnY_1,\dots,Y_n 来自 N(μ2,σ22)N(\mu_2,\sigma_2^2),两者独立,则 S12/S22σ12/σ22F(m1,n1)\dfrac{S_1^2/S_2^2}{\sigma_1^2/\sigma_2^2} \sim F(m-1,n-1)
  • 分位数
    • 定义
      • 已知随机变量 XX 与其分布函数 FX(x)F_X(x),给定 p,α(0,1)p,\alpha \in (0,1)
        • 定义满足 FX(xp)=pF_X(x_p) = pxpx_ppp 分位数。
        • 定义满足 1FX(xα)=α1-F_X(x_\alpha) = \alphaxαx_\alpha 为上 α\alpha 分位数。
    • 性质
      • 标准正态分布的上分位数满足 z1α=zαz_{1-\alpha} = -z_{\alpha}