Biostatistics
gongxuanwen
·
·
个人记录
基础定义
自由度:df,初始为 n,每使用一个从样本中得到的参数用来估计或假设,就会使得原有的样本中可自由变动的参数降低一(如用 \bar x 估计 \mu,则减去 1)
离均差:x-\mu 或 x-\bar x
方差:S^2=\sum(x_i-\bar x)^2=\sum x^2-\frac{(\sum x)^2}n
标准差:s.d.
标准误:s.e.,表示多次不同抽样的标准差,在每一次抽样中可用 S_{\bar x}=\frac S{\sqrt n} 或 \sigma_{\bar x}=\frac \sigma{\sqrt n} 估算,反应了抽样误差
均值方差:SE^2,为标准误的平方
变异系数:C.V.=\frac S{\bar x}
协方差:cov.=\frac{\sum(x_i-\bar x)(y_i-\bar y)}{n(or\ n-1)},反应两变量相关性的方差
相关系数:\rho=\frac{cov.}{\sigma_x\sigma_y},r=\frac{cov.}{S_xS_y}
| 样本 |
总体 |
| 均值 |
\bar x |
\mu |
| 标准差 |
s |
\sigma |
| 百分比 |
p |
\pi |
统计模型
F检验(联合假设检验):用于验证方差齐性
F=\frac{S_1^2(Larger)}{S_2^2(Smaller)}, df_1=n_1-1, df_2=n_2-1
t检验:通常需要满足三个前提——独立性(不同受试者的测量结果互不影响)、正态性、方差齐性;若正态性不满足,则考虑非参数检验;若方差齐性不满足,则考虑Welch t检验;若独立性不满足,则考虑配对t检验
-
常规t检验:用于方差齐性时
S_{\bar x_1-\bar x_2}=\sqrt{S_C^2(co\ s.d.)\times(\frac1{n_1}+\frac1{n_2})}=\sqrt{\frac{(n_1-1)S_1^2+(n_2-1)S_2^2}{(n_1-1)+(n_2-1)}\times(\frac1{n_1}+\frac1{n_2})}
t=\frac{\bar x_1-\bar x_2}{S_{\bar x_1-\bar x_2}}
df=n_1+n_2-2
-
Welch t检验:用于方差不齐时
S_{\bar x_1-\bar x_2}=\sqrt{\frac{S_1^2}{n_1}+\frac{S_2^2}{n_2}}
t=\frac{\bar x_1-\bar x_2}{S_{\bar x_1-\bar x_2}}
df=\frac{(\frac{S_1^2}{n_1}+\frac{S_2^2}{n_2})}{\frac{(\frac{S_1^2}{n_1})^2}{n_1-1}+\frac{(\frac{S_2^2}{n_2})^2}{n_2-1}}=\frac1{\frac{(rSE_1^2)^2}{df_1}+\frac{(rSE_2^2)^2}{df_2}},rSE_1^2=\frac{S_{\bar x_1}^2}{S_{\bar x_1}^2+S_{\bar x_2}^2}
-
配对t检验:前两者的特殊形式
S_{\bar d}=\frac{S_d}{\sqrt n}
t=\frac{\bar d}{S_{\bar d}}
df=n-1
-
置信区间计算:
\bar x\pm s.e.\cdot t_{\alpha,df}
z检验:与t检验原理基本相同,只是使用 \mu,\sigma 等代替 \bar x,S,适用于总体的检验或大样本(n\ge30)的抽样检验
u检验:一种非参数检验,不要求满足正态分布,适用于数据严重偏离正态分布时,不比较均值,而是比较分布是否相同
方差分析(ANOVA):需满足独立性、正态性、方差齐性,用于比较若干因素下各样本的均值是否显著(以及变异的主要来源),若显著则需进一步进行多重比较;若有不止一个因素,则需考虑两因素或多因素方差分析
SST(total\ SS)=SS_T
df_T=nk-1
SSB(between\ SS)=\sum n_i(\bar X_i-\bar X)^2
df_B=k-1
SSW(within\ SS,SSE,error\ SS)=\sum SS_i
df_W=n-k
(SST=SSB+SSW,df_T=df_B+df_W)
MS(mean\ squares)=\frac{SS}{df}
F=\frac{MSB}{MSW}
多重比较:比较多组数据间两两是否存在显著差异
- 最小显著差数法(LSD):计算不同组平均数之间的差数,与LSD值进行比较
S_{\bar x_i-\bar x_j}=\sqrt{\frac{MSE}{n_1}+\frac{MSE}{n_2}}
LSD_{0.05,df_E=n-k}=t_{0.05,df_E=n-k}S_{\bar x_i-\bar x_j}
- 拟合度检验:
$$\chi^2=\sum\frac{(O-E)^2}E,df=n-1$$
- 独立性检验:
$$\chi^2=\sum\frac{(O-E)^2}E,df=(r-1)(c-1)$$
回归模型:
- 回归计算:
$$\hat b=\frac{\sum(x_i-\bar x)(y_i-\bar y)}{\sum(x_i-\bar x)^2}$$
$$\hat a=\bar y-\hat b\bar x$$
- 拟合优度计算(F检验):
$$df_{regression}=1(only\ par.\ \bar x_i)$$
$$df_{error}=n-2$$
$$MS=\frac{SS}{df}$$
$$F=\frac{MS_{regression}}{MS_{error}}$$
$$F=r^2\cdot\frac{n-2}{1-r^2}(which\ means\ F\equiv t^2)$$
- 拟合优度计算(t检验):
$$r=\frac{cov.}{S_xS_y}=\frac{SP}{\sqrt{SS_x\cdot SS_y}}=\frac{\sum(x-\bar x)(y-\bar y)}{\sqrt{\sum(x-\bar x)^2\cdot\sum(y-\bar y)^2}}$$
$$t=r\sqrt{\frac{n-2}{1-r^2}}$$
- 回归方程差异度分析:
$$S_e^2(residual\ variance)=\frac{\sum(y_i-\hat y_i)^2}{n-2}$$
$$S_a^2=\frac{S_e^2}{n}+\frac{S_e^2\bar x^2}{SS_x}$$
$$S_b^2=\frac{S_e^2}{SS_x}$$
$$t_a=\frac{a_1-a_2}{\sqrt{S_{a1}^2+S_{a2}^2}}$$
$$t_b=\frac{b_1-b_2}{\sqrt{S_{b1}^2+S_{b2}^2}}$$
$$df=n-2(with\ 2\ par.\ a\ and\ b)$$
- Verhulst方程的拟合:
对相邻数据进行相除,使用 $\lambda=1+B(K-N_t)$ 进行拟合
- Logistic方程的拟合:
$$N=\frac{K}{1+e^{a-rt}},a=\ln\frac{K-N_0}{N_0}$$
$$\ln\frac{K-N}N=\ln\frac{K-N_0}{N_0}-rt$$
$$K\approx\frac{N_2^2(N_1+N_3)-2N_1N_2N_3}{N_2^2-N_1N_3}(N\ chosen\ with\ curve\ covered)$$
$$N=\frac{K}{1+e^{a-r(t-\gamma)}}(with\ reprod.\ delay)$$
$$N_t=\frac{K}{1+e^{a-r(t+\tau)}}(with\ react.\ delay)$$