二 变异特性量(离散特性量) 由上述例子可知,均匀数无别,原始数 据的离散水准大概分别,故务必引入离散特 征量,或称变异特性量。常用样本的变异程 度目标有:极差、方差、规范差和变异系数。
1.类型 极差(全距) 规范差 方差 规范误 均匀差 变异系数等 常用样本的变异水准目标有:极差、方差、 规范差和变异系数
1.数据排序(sort):升序(小 大)、降序 (大 小) 2.求极差(range)或全距:所少睹据中的最 大值和最小巡视值的差数称极差。 3.确定组数和组距(class interval)
等,称为组距。 组距小则组数众 组数和组距互相肯定: 组距大则组数小 组距=极差∕组距
正在分别个人间或分别组间存正在变异性。 (如体高、体重、性别等) 观测值(observation):指对变量的发扬举行 巡视或丈量所得到的数值,这些数值有时 也称为变数。
值。 (2) 注解: a.如巡视数为偶数,取居中两个数 的算术均匀数为中位数。 b.如以百分位透露,中位数即为。 c. 数据原料呈偏态分散时,众用中位数,此 时,中位数对数据鸠合性的胸怀比算术均匀 数为优。
四、原始数据的检验与查对 数据检验与查对,应小心以下三个方面 (一)数据自身偏差
1. 记实不全:丧失、损坏、漏掉 2. 记录差池:笔误、捏造 3. 丈量器械禁止:丈量手艺不熟练等缘故所形成 的差池 于是看待特数值(如极大或极小的),应屡屡核 实。
目。 样本均方是总体方差的无偏揣摸值,民风上 称样本为均方,总体为方差。
原料中最大巡视值与最小巡视值的差数。 用极差来代外全部样本的变异度很彰彰 有缺陷。
部的巡视值来胸怀原料变异数。 ①离均差平方和:离均差平方后加起来, 即离均差平方和 2 样本SS= ( y y)
1.方柱形图(histogram)(P书39-40) 合用于透露贯串性变数的次数分散 2. 条形图 (Bar Chart) 合用于间断性变数和属性变数原料
要透露变数中百般属性或百般间断性数据观 察值总巡视个数中的百分比。 4. 众边形(polygon) 透露贯串性变数原料的一种普遍伎俩,且正在 统一图上可比拟两组以上的原料 5. 线形图(dynamic curve graph) 透露数据的动态转移趋向。
1 数目性状原料:简称数性原料,可分两类: ①贯串性变数(continuous variable)或计量资 料 可能用器械直接丈量的量,如身高、体重等。 特性:贯串性变量,不间断量。 ②不贯串性或间断性变数(discontinuous or discrete variable)或计数原料 计数获得的数性原料,通常都是自然数,如人数, 天数,种子数。 特性:以整数计量,非贯串性变量,间断性量。
理归类,使其编制化,便于统计说明,从而 得出准确的科学结论。 一.原料的观点 界说:原料是指磋议对象的新闻资料。 特色:
二、均匀数(average): 1. 界说:是数据的代外值,透露原料中巡视值的中
心地点,而且可行动原料的代外而与另一组原料相 比拟。均匀数正在统计数中首要有算术均匀数、中数、 众数、几何均匀数。简称均值。 2. 类型: 算术均匀数(arithmetic mean)乐鱼体育官网、几何平 均数(geometric mean)、谐和均匀数 (harmonic mean)、加权均匀数等。算术均匀 数最厉重,通常不指明的都是算术均匀数。
4. 定组限(class limit)和组中点值(组值,class value) 组值最好为整数或于巡视值的位数无别,便于推算, 组限要真切,最比如原始原料的数字众一位小数, 如许归组时不致含混不清。 选每一组的中点值卓殊厉重,这一点选定后,则该 组组限确定,其余各组的中点和组限有可确定。 每一组的中点值以逼近最小巡视值为好。 组中值= 组上限 组下限
1,5,9 =4 4,5,6 =1 5,5,5 =0 可睹,规范差大,变异大;规范差最 小为0,透露无变异。
进程。 随机:整个的对象(个人)都有相称的机遇 被抽取。 随机抽样所得的样本称随机样本。
体所构成的集团。 样本:直接巡视丈量磋议的对象。 总体和样本的根本构成单元都是个人,由有 限个个人构成的总体称为有限总体,反之为 无穷总体。构成样本的个人少的样本称为小 样本,反之,为大样本。
正在现实磋议中另有一类假念总体。比方进 行几种饲料的豢养试验,现实上并不存正在用这 几种饲料举行豢养的总体,只是假设有如许的 总体存正在,把所举行的试验作为是假念总体的 一个样本; 样本中所包罗的个人数目叫样本容量或大 小(sample size),样本容量常记为n。凡是把 n≤30的样本叫小样本,n 30的样本叫大样本。 磋议的宗旨是要明白总体,然而能观测到 的却是样本,通过样历来推想总体是统计说明 的根本特色。
响应原始数据的整个特性。 比方:1,5,9 4,5,6 5,5,5 三组样本算术均匀数都是5,但它们的离散水准不 同。 别的,算术均匀数也不肯定正好是中央地点的 一个数,正在分散偏态境况下,高于均匀数的有大概 是倒数第二名,低于均匀数的有大概是正数第二名。
均差个数。 通常地:样本自正在度等于巡视值的个数(n) 减去限制条目的个数,即 V=n-k
(1) 涵义:量度原始数据绝对变异水准的 数学目标,透露一个样本的变异度。 (2) 数学描写 a.公式
准确性:变异量重现性目标。统一对象反复 丈量,一概性高,准确度高。 准确性是切实性的须要条目。
分为有用和无效两种,有用又可分正效和负 效两种。 互作是指要素的协同效应,总效应不等于 分效应之和即证据具有要素互作,总效如大 于分效应之和为具有正互作效应,总效如小 于分效应之和为具有负互作效应。
四、众数(Mo) (1) 观点:统一原料中,巡视值显露 频次最众的数值。 (2) 注解:众数大概不止一个,也此 时常界说最小众数或最群众数。或者也大概 没有众数。
位数及众数相称 2 谐和均匀数 几何均匀数 算术均匀数 3 常用的鸠合特性量为算术均匀数,正在非参 数考验中也用中位数。
(1)描写数据绝对变异水准的量,规范 差大,变异大;规范差小,变异小。 (2)规范差的单元与均匀数无别。 (3)原始数据±常数,所得的新规范差 与原始规范差相称。 (4)原始数据推广或缩小不等于零的k 倍,所得的新规范差是原规范差的k倍。 (5)规范差是方差的算术平方根。
(1) 涵义:量度原始数据相对变异程 度的数学目标。 (2) 数学描写 公式:CV=
a.受规范差、均匀数两者的限制。 b.是一个相比拟值,无单元。 c.可能举行分别类型、本质和巨细 的样本之间的比拟。 d.变异系数最小时为0,最大可越过 100%。
例:应用推算器推算样本4,5,7的均匀 数,规范差和变异系数。 (1)开机:按on (注: 闭机 按off) (2)进入统计功效:按分别型号推算器的 仿单举行,屏幕显示STAT或 SD即透露成 功。
2 质地性状原料:简称质性原料,指不行或不 易直接丈量能巡视的性状原料,如颜色、性 别、状况等描写性特性。常用两种伎俩数目 化: ① 等第评定: 如人的强壮状态分为优, 良,通常,差;糊口状况分为生或死等。 ② 统计次数法或归类计数:于肯定总样 或样本内,统计其具有某性情状的个人数目 及具有分别性状的个人数目,按种别计其次 数或相对次数。如黄花64朵,白花56朵。
方差等) 统计量:样本的特性量。(样本均匀数、样 本方差等) 两者的联系:通过统计量揣摸阴谋参数。
常用希腊字母透露参数,比方用μ透露总 体均匀数,用σ透露总体规范差; 常用拉丁字母透露统计量,比方用 示样本均匀数,用S透露样本规范差。 外
书举行,(有的较简陋的没有存贮功效的计 算器,如SHARP 506型不需此程序)。 如CASIO fx-82型,需依序按下:shift 、 AC 、 = 判决伎俩:巡视n是否等于0,如显示 n=0透露胜利。
第三章 均匀数、变异数 第一节 鸠合特性量 一 鸠合的寓意 一组变数的鸠合趋向,即变数分散的中央位 置。 类型:均匀数(arithmetic mean)、中位数 (median)、众数(mode)等。
也可可用相似次数分散的伎俩来料理。 把原料按百般质地性状举行分类 分类数等于组数