2010级3班整理
生物统计学基础知识整理
本文档仅供参考,仍有不足,有许多名词没有交待,需自己补充。本资料与课本,课后习题册搭配使用效果更好,有疑问联系大正 生物统计学整理
第一部分 名词解释
1 生物统计学:是一门探讨如何从事生物学实验研究的设计,取样,分析,资料整理与推
论的科学. 是数理统计在生物学研究中的应用,它是应用数理统计的原理和方法来分析和解释生物界各种现象和试验调查资料的一门学科,属于应用统计学的一个分支。
2 总体: 统计学研究的全部对象叫做总体,分为无限总体和有限总体。 3 个体:构成总体的每个成员称为个体。 4 样本:总体的一部分称为样本
5 样本含量:样本内包含的个体数目称为样本含量 6 抽样:从总体中获得样本的过程。
7 连续性数据:与某种标准做比较所得到的数据称为连续型数据,又称为度量数据 8 离散型数据:由记录不同类别个体的数目所得到的数据,称为离散型数据 9 变量的方法:对连续性数据进行分析的方法,通常称为变量的方法 10 属性的方法:对离散型数据进行分析的方法
11对于数据的变异程度,经常使用的度量方法有三中,1范围或称为极差2平均离差3标准
离差或称为标准差
12 概率论:研究偶然现象本身规律性的科学
13 统计学:基于实际观测结果,利用概率论得出的规律,揭示偶然性中所寄寓的必然性的
科学
14 随机实验:在我们做第一次观测时,并不能准确得知下一次的结果,这样的实验叫做
随机实验
随机误差:试验过程中,由于各种无法控制的随机因素所引起统计量与参数之间的偏差,
称之为随机误差。
15 基本事件:试验的每一最基本结果用小写拉丁字母表示
1 / 21
2010级3班整理
生物统计学基础知识整理
16 事件:基本事件的集合,用大写拉丁字母表示
17样本特征数:数据集中点的度量~~平均数,数据变异程度的度量---标准差和数据分布的
对称程度及陡峭程度的度量----偏斜度和峭度,这些数字是描述样本频率分布特征的,称为数据样本特征或简称为样本特征数
18离差平方和:将所有离均差都平方,然后相加,所得到的和,成为~
19样本方差s*s :用样本含量n或者n-1除离差平方和而得到一个平均数,称为~ 20偏斜度:度量数据围绕众数陈不对称得程度即所称的~ 21三阶中心矩 :
m3 =[∑(x-x杠)∧3]/ n 这个m 矩,因为是三次
3
方二称为三阶;又因为(x-x杠)表示x与平均数的离差,所以称为中心的。而不是n-1。相应地
m3的分母是n
m’3=[∑x∧3]/n 称为三阶原点距
二阶见课本16页
22古典概型:随机试验的全部可能的结果(即本事件数)是有限的,各基本事件间是互不
相容且等可能的,这类随机现象的概率类型称为~
23条件概率:事件B已经发生的条件下,事件A发生的概率,这是的概率称为已知事件B
发生的条件下,事件A发生的条件概率
24概率乘法法则:两事件交的概率,等于其中一事件(概率必须不为0)的概率乘以另
一事件在已知前一事件发生条件下的概率
25随机变量:随机试验中被测定的量 26观测值:随机变量所取得的值
27离散性随机变量:如果随机变量可能取得的数值为有限个,或可数无穷个孤立的数值,
则称为~
28连续性随机变量:如果随机变量可取某一(有限或无限)区间内的任何数值,则成为~ 29概率函数:离散型随机变量X,可能取得的数值为有限个或可数无穷个孤立的数值。因此,
对于X的每个值都能得出一个概率值。可以将随机变量X 所取得值x的概率P(X=x)写成x的函数p(x),这样的函数称为随机变量X的概率函数
2 / 21
2010级3班整理
生物统计学基础知识整理
30密度函数 、分布函数 字母太麻烦,课本36
31统计量 :x杠和s方 、 都是从样本数据计算出来的,统称成为~,描述样本特征的数量 32参数:μ和σ是总体恒定的量,称为参数. ,描述总体特征的数量
33总体特征数:描述概率分布特征的数字称为总体特征数,包括随机变量的数学期望,
方差和各阶矩
34数学期望:所谓X 或X 的函数的数学期望,即它们的理论平均数 35二项分布 课本42
36泊松分布:在二项分布中,当某事件出现的概率特别小(?→0),而样本含量又很大(n
→∞)且n?=μ 时,二项分布就成泊松分布了
37标准正态分布 :μ=0,σ=1的正态分布 38中心极限定理 :58页
39抽样分布:从一个已知的总体中,独立随机的抽取含量为n的样本,研究所得样本的各
种统计量的概率分布,即所谓的~
40样本误差、自由度 课本63 41卡方分布 64页
42零假设H0 :总体平均数是未知的,为了得到对总体平均数的推断,可以假设总体平均
数μ等于某一给定的值μ0(μ=μ0)。或者说,μ与μ0的差等于零,这样的假设成为~
43备则假设:与零假设相对立的假设,它是在拒绝H0的情况下,可供选择的假设 44统计假设检验:总体参数估计 课本69页
45显著性检验、显著性水平、检验统计量、拒绝域、临界值 课本70页 46单侧检验、上尾检验、下尾检验、Ⅰ错误 课本71
47无偏估计量:如果一个统计量的理论平均数,即它的数学期望等于总体参数,这个统
计量就被称为~
48点估计:由用样本数据所计算出来的单个数值,对总体参数所作的估计称为~
3 / 21
2010级3班整理
生物统计学基础知识整理
49有效估计量:在样本含量相同情况下,如果一个统计量的方差小于另一个统计量的方
差,则前一个是更有效的估计量
50相容估计量:若统计量的取值,任意接近于参数值的概率随样本含量n的无限增加而
趋于1,则该统计量称为参数的~
51区间估计 96页
52置信水平、置信区间 97
53拟合优度检验:用来检验试剂观测数与依照某种假设或模型计算出来的理论书之间的
一致性,以便判断该假设或模型是否与观测数相配合。也包括两种错误,1如果某一模型正确但拒绝了它,就会犯Ⅰ型错误2当某一模型不正确,却错误接受了它,会犯Ⅱ型错误
54列联表:卡方检验是另一类型的卡方检验,可以用它检验事件间的独立性或者说检验处
理之间的差异显著性
55单因素 117
56固定效应、 随机效应118 57最小显著差数法LSD 126页 58方差分析具备的三个条件128页
第二部分 简答
1. 几种字母的意义
样本各种特征用拉丁字母表示: ˉx~~平均数 s方 ~~~方差 s~~
标准差 ˉx~~平均数,s方 ~~~方差称为统计量
总体各种特征用希腊字母表示:μ~~~平均数 σ方~~~~总体方差 σ~
总体标准差 σ,μ称为参数
4 / 21