总体和样本

研究对象的全体称为,组成总体的每一个元素称为

统计量及其分布

来自总体 的一个样本, 元函数,若 中不含有任何未知参数,则称 为样本 的一个 。若 为样本值,则称

常用统计量

样本数字特征

  • 样本均值:
  • 样本方差:
  • 样本标准差:
  •  样本 阶(原点)矩:
  •  样本 中心矩:

顺序统计量

将样本 个观测量按其值从小到大的顺序排列,得到

随机变量 )称为\textbf{第 顺序统计量},其中 是最小顺序统计量,而 是最大顺序统计量。

性质

设总体 的期望 ,方差 ,样本 取自 分别为样本的均值和方差,则:

三大分布

分布

概念

若随机变量 相互独立,且都服从标准正态分布,则随机变量 服从自由度为 分布,记为 ,特别地 Pasted image 20241204113305|200

分位数

对给定的 )称满足 分布的上 分位点。

性质

t 分布

概念

若随机变量 相互独立,则随机变量 服从自由度为 分布,记为 Pasted image 20241204113329|225

分位数

性质

F 分布

概念

若随机变量 ,且 相互独立,则 服从自由度为 分布,记为 ,其中 为第一自由度, 为第二自由度。 Pasted image 20241204113353|224

分位数
性质
  • ,则

正态分布下的常用结论

Note

参数的点估计

设总体 的分布函数为 ,其中 为一个未知参数, \ 是取自总体 的一个样本。由样本构造一个适当的统计量 作为参数 的估计,称统计量 ,一般记为

如果是样本的一个观察值,将其代入估计量中得到值\,并且此值作为未知参数的参数值,统计值称这个值为未知参数

建立一个适当的统计量作为未知参数 的估计量并以相应的观察值作为未知参数估计值的问题,就是参数

矩估计

最大似然估计

\begin{cases} \prod_{i=1}^np(x_i;\theta)(\text{这是离散型总体}X\text{取}x_1,x_2,\cdots,x_n\text{的概率)}, \\ \\ \prod_{i=1}^nf(x_i;\theta)(\text{这是连续型总体}X\text{取}x_1,x_2,\cdots,x_n\text{的联合概率密度)}. & \end{cases}$$ 求参数 $\begin{cases}\text{若似然函数有驻点,则令}\frac{\mathrm{d}L}{\mathrm{d}\theta}=0\text{或}\frac{\mathrm{d}(\ln L)}{\mathrm{d}\theta}=0,\text{解出}\hat{\theta},\\\\\text{若似然函数无驻点(单调),则用定义求}\hat{\theta},\\\text{若似然函数为常数,则用定义求}\hat{\theta},\text{此时}\hat{\theta}\text{不唯一}.\end{cases}$ ### 估计量的评价标准 - 无偏性 - 有效性(最小方差) - 一致性(相和性) $$\lim_{n\to\infty}P\{\mid\hat{\theta}-\theta\mid\geqslant\varepsilon\}=0$$ 切比雪夫不等式 $P\{ \mid X- EX\mid \geqslant \varepsilon \} \leqslant \frac DX{\varepsilon ^2}$ , 辛钦大数定律 (独立同分布、$EX$ 存在) $\Rightarrow\overline{X}\xrightarrow{P}EX$ ## 区间估计 $\text{设}X\sim N(\mu,\sigma^2)\text{,从总体}X\text{中抽取样本}X_1,X_2,\cdots,X_n\text{,样本均值为}\overline{X}\text{,样本方差为}S^2$ $\sigma^2\text{已知,}\mu\text{的置信水平是 1}-\alpha\text{的置信区间为}$ $$\left(\overline{X}-\frac{\sigma}{\sqrt{n}}z_{\frac{\alpha}{2}},\overline{X}+\frac{\sigma}{\sqrt{n}}z_{\frac{\alpha}{2}}\right)$$ $\sigma^{2}$ 未知 $,\mu$ 的置信水平是 1 $-\alpha$ 的置信区间为 $$\left(\overline{X}-\frac{S}{\sqrt{n}}t_{\frac{\alpha}{2}}(n-1),\overline{X}+\frac{S}{\sqrt{n}}t_{\frac{\alpha}{2}}(n-1)\right)$$ $\mu$ 已知 $,\sigma^2$ 的置信水平是 1 $-\alpha$ 的置信区间为 (此种情况一般不出现) $$\left(\frac{\sum_{i=1}^n(X_i-\mu)^2}{\chi_{\frac{\alpha}{2}}^2(n)},\frac{\sum_{i=1}^n(X_i-\mu)^2}{\chi_{1-\frac{\alpha}{2}}^2(n)}\right)$$ $\mu\text{未知,}\sigma^2\text{的置信水平是 1}-\alpha\text{的置信区间为}$ $$\left(\frac{(n-1)S^2}{\chi_\alpha^2(n-1)},\frac{(n-1)S^2}{\chi_{1-\frac{\alpha}{2}}^2(n-1)}\right)$$ ## 假设检验 >拒绝域的形式与备择假设 $H_{1}$ 的形式一致 - $\sigma^{2}\text{已知,}\mu\text{未知 }.H_{0};\mu=\mu_{0},H_{\mathrm{i}};\mu\neq\mu_{0},\text{则拒绝域为}\left(-\infty,\mu_{0}-\frac{\sigma}{\sqrt{n}}z_{\frac{\alpha}{2}}\right]\cup\left[\mu_{0}+\frac{\sigma}{\sqrt{n}}z_{\frac{\alpha}{2}},+\infty\right)$ - $\sigma^{2}\text{未知,}\mu\text{未知.}H_{0}{:}\mu=\mu_{0},H_{1}{:}\mu\neq\mu_{0},\text{则拒绝域为}$$\left(-\infty,\mu_0-\frac{S}{\sqrt{n}}t_{\frac{\alpha}{2}}\left(n-1\right)\right]\bigcup\left[\mu_0+\frac{S}{\sqrt{n}}t_{\frac{\alpha}{2}}\left(n-1\right),+\infty\right)$ - $\sigma^{2}\text{已知},\mu\text{未知}.H_{0};\mu\leqslant\mu_{0},H_{1};\mu>\mu_{0},\text{则拒绝域为}\left[\mu_{0}+\frac{\sigma}{\sqrt{n}}z_{\alpha},+\infty\right)$ - $\sigma^{2}\text{已知},\mu\text{未知}.H_{0}:\mu\geqslant\mu_{0},H_{1}:\mu<\mu_{0},\text{则拒绝域为}\left(-\infty,\mu_{0}-\frac{\sigma}{\sqrt{n}}z_{\alpha}\right]$ - $\sigma^{2}\text{未知},\mu\text{未知}.H_{0}:\mu\leqslant\mu_{0},H_{1}:\mu>\mu_{0},\text{则拒绝域为}\left[\mu_{0}+\frac{S}{\sqrt{n}}t_{\alpha}(n-1),+\infty\right]$ - $\sigma^{2}\text{未知},\mu\text{未知}.H_{0}:\mu\geqslant\mu_{0},H_{1}:\mu<\mu_{0},\text{则拒绝域为}\left(-\infty,\mu_{0}-\frac{S}{\sqrt{n}}t_{\alpha}(n-1)\right]$ ## 两类错误 - 弃真 - $\text{犯第一类错误的概率为 }\alpha=P\{\text{ 拒绝 }H_0\mid H_0\text{ 为真 }\}$ - 取伪 - $\text{犯第二类错误的概率为 }\beta=P\{\text{ 接受 }H_0\mid H_0\text{ 为假 }\}=P\{\text{ 接受 }H_0\mid H_1\text{ 为真 }\}$