Biostatistics

· · 个人记录

基础定义

自由度:df,初始为 n,每使用一个从样本中得到的参数用来估计或假设,就会使得原有的样本中可自由变动的参数降低一(如用 \bar x 估计 \mu,则减去 1

离均差:x-\mux-\bar x

方差:S^2=\sum(x_i-\bar x)^2=\sum x^2-\frac{(\sum x)^2}n

标准差:s.d.

标准误:s.e.,表示多次不同抽样的标准差,在每一次抽样中可用 S_{\bar x}=\frac S{\sqrt n}\sigma_{\bar x}=\frac \sigma{\sqrt n} 估算,反应了抽样误差

均值方差:SE^2,为标准误的平方

变异系数:C.V.=\frac S{\bar x}

协方差:cov.=\frac{\sum(x_i-\bar x)(y_i-\bar y)}{n(or\ n-1)},反应两变量相关性的方差

相关系数:\rho=\frac{cov.}{\sigma_x\sigma_y},r=\frac{cov.}{S_xS_y}

样本 总体
均值 \bar x \mu
标准差 s \sigma
百分比 p \pi

统计模型

F检验(联合假设检验):用于验证方差齐性

F=\frac{S_1^2(Larger)}{S_2^2(Smaller)}, df_1=n_1-1, df_2=n_2-1

t检验:通常需要满足三个前提——独立性(不同受试者的测量结果互不影响)、正态性、方差齐性;若正态性不满足,则考虑非参数检验;若方差齐性不满足,则考虑Welch t检验;若独立性不满足,则考虑配对t检验

z检验:与t检验原理基本相同,只是使用 \mu,\sigma 等代替 \bar x,S,适用于总体的检验或大样本(n\ge30)的抽样检验

u检验:一种非参数检验,不要求满足正态分布,适用于数据严重偏离正态分布时,不比较均值,而是比较分布是否相同

方差分析(ANOVA):需满足独立性、正态性、方差齐性,用于比较若干因素下各样本的均值是否显著(以及变异的主要来源),若显著则需进一步进行多重比较;若有不止一个因素,则需考虑两因素或多因素方差分析

SST(total\ SS)=SS_T df_T=nk-1 SSB(between\ SS)=\sum n_i(\bar X_i-\bar X)^2 df_B=k-1 SSW(within\ SS,SSE,error\ SS)=\sum SS_i df_W=n-k (SST=SSB+SSW,df_T=df_B+df_W) MS(mean\ squares)=\frac{SS}{df} F=\frac{MSB}{MSW}

多重比较:比较多组数据间两两是否存在显著差异

S_{\bar x_i-\bar x_j}=\sqrt{\frac{MSE}{n_1}+\frac{MSE}{n_2}} LSD_{0.05,df_E=n-k}=t_{0.05,df_E=n-k}S_{\bar x_i-\bar x_j} - 拟合度检验: $$\chi^2=\sum\frac{(O-E)^2}E,df=n-1$$ - 独立性检验: $$\chi^2=\sum\frac{(O-E)^2}E,df=(r-1)(c-1)$$ 回归模型: - 回归计算: $$\hat b=\frac{\sum(x_i-\bar x)(y_i-\bar y)}{\sum(x_i-\bar x)^2}$$ $$\hat a=\bar y-\hat b\bar x$$ - 拟合优度计算(F检验): $$df_{regression}=1(only\ par.\ \bar x_i)$$ $$df_{error}=n-2$$ $$MS=\frac{SS}{df}$$ $$F=\frac{MS_{regression}}{MS_{error}}$$ $$F=r^2\cdot\frac{n-2}{1-r^2}(which\ means\ F\equiv t^2)$$ - 拟合优度计算(t检验): $$r=\frac{cov.}{S_xS_y}=\frac{SP}{\sqrt{SS_x\cdot SS_y}}=\frac{\sum(x-\bar x)(y-\bar y)}{\sqrt{\sum(x-\bar x)^2\cdot\sum(y-\bar y)^2}}$$ $$t=r\sqrt{\frac{n-2}{1-r^2}}$$ - 回归方程差异度分析: $$S_e^2(residual\ variance)=\frac{\sum(y_i-\hat y_i)^2}{n-2}$$ $$S_a^2=\frac{S_e^2}{n}+\frac{S_e^2\bar x^2}{SS_x}$$ $$S_b^2=\frac{S_e^2}{SS_x}$$ $$t_a=\frac{a_1-a_2}{\sqrt{S_{a1}^2+S_{a2}^2}}$$ $$t_b=\frac{b_1-b_2}{\sqrt{S_{b1}^2+S_{b2}^2}}$$ $$df=n-2(with\ 2\ par.\ a\ and\ b)$$ - Verhulst方程的拟合: 对相邻数据进行相除,使用 $\lambda=1+B(K-N_t)$ 进行拟合 - Logistic方程的拟合: $$N=\frac{K}{1+e^{a-rt}},a=\ln\frac{K-N_0}{N_0}$$ $$\ln\frac{K-N}N=\ln\frac{K-N_0}{N_0}-rt$$ $$K\approx\frac{N_2^2(N_1+N_3)-2N_1N_2N_3}{N_2^2-N_1N_3}(N\ chosen\ with\ curve\ covered)$$ $$N=\frac{K}{1+e^{a-r(t-\gamma)}}(with\ reprod.\ delay)$$ $$N_t=\frac{K}{1+e^{a-r(t+\tau)}}(with\ react.\ delay)$$