乐鱼体育官网第二章 数据材料的收拾
时间:2024-03-11浏览次数:
 二 变异特性量(离散特性量) 由上述例子可知,均匀数无别,原始数 据的离散水准大概分别,故务必引入离散特 征量,或称变异特性量。常用样本的变异程 度目标有:极差、方差、规范差和变异系数。  1.类型 极差(全距) 规范差 方差 规范误 均匀差  变异系数等  常用样本的变异水准目标有:极差、方差、 规范差和变异系数  1.数据排序(sort):升序(小 大)、降序 (大 小) 2.求极差(

  二 变异特性量(离散特性量) 由上述例子可知,均匀数无别,原始数 据的离散水准大概分别,故务必引入离散特 征量,或称变异特性量。常用样本的变异程 度目标有:极差、方差、规范差和变异系数。

  1.类型 极差(全距) 规范差 方差 规范误 均匀差  变异系数等  常用样本的变异水准目标有:极差、方差、 规范差和变异系数

  1.数据排序(sort):升序(小 大)、降序 (大 小) 2.求极差(range)或全距:所少睹据中的最 大值和最小巡视值的差数称极差。 3.确定组数和组距(class interval)

  等,称为组距。 组距小则组数众 组数和组距互相肯定: 组距大则组数小 组距=极差∕组距

  正在分别个人间或分别组间存正在变异性。 (如体高、体重、性别等)  观测值(observation):指对变量的发扬举行 巡视或丈量所得到的数值,这些数值有时 也称为变数。

  值。 (2) 注解: a.如巡视数为偶数,取居中两个数 的算术均匀数为中位数。 b.如以百分位透露,中位数即为。  c. 数据原料呈偏态分散时,众用中位数,此 时,中位数对数据鸠合性的胸怀比算术均匀 数为优。

  四、原始数据的检验与查对 数据检验与查对,应小心以下三个方面 (一)数据自身偏差

  1. 记实不全:丧失、损坏、漏掉 2. 记录差池:笔误、捏造 3. 丈量器械禁止:丈量手艺不熟练等缘故所形成 的差池 于是看待特数值(如极大或极小的),应屡屡核 实。

  目。  样本均方是总体方差的无偏揣摸值,民风上 称样本为均方,总体为方差。

  原料中最大巡视值与最小巡视值的差数。  用极差来代外全部样本的变异度很彰彰 有缺陷。

  部的巡视值来胸怀原料变异数。  ①离均差平方和:离均差平方后加起来, 即离均差平方和 2  样本SS= ( y  y)

  1.方柱形图(histogram)(P书39-40)  合用于透露贯串性变数的次数分散  2. 条形图 (Bar Chart)  合用于间断性变数和属性变数原料

  要透露变数中百般属性或百般间断性数据观 察值总巡视个数中的百分比。 4. 众边形(polygon) 透露贯串性变数原料的一种普遍伎俩,且正在 统一图上可比拟两组以上的原料 5. 线形图(dynamic curve graph) 透露数据的动态转移趋向。

  1 数目性状原料:简称数性原料,可分两类: ①贯串性变数(continuous variable)或计量资 料  可能用器械直接丈量的量,如身高、体重等。  特性:贯串性变量,不间断量。 ②不贯串性或间断性变数(discontinuous or discrete variable)或计数原料  计数获得的数性原料,通常都是自然数,如人数, 天数,种子数。  特性:以整数计量,非贯串性变量,间断性量。

  理归类,使其编制化,便于统计说明,从而 得出准确的科学结论。 一.原料的观点  界说:原料是指磋议对象的新闻资料。  特色:

   二、均匀数(average):  1. 界说:是数据的代外值,透露原料中巡视值的中

  心地点,而且可行动原料的代外而与另一组原料相 比拟。均匀数正在统计数中首要有算术均匀数、中数、 众数、几何均匀数。简称均值。 2. 类型: 算术均匀数(arithmetic mean)乐鱼体育官网、几何平 均数(geometric mean)、谐和均匀数 (harmonic mean)、加权均匀数等。算术均匀 数最厉重,通常不指明的都是算术均匀数。

  4. 定组限(class limit)和组中点值(组值,class value)  组值最好为整数或于巡视值的位数无别,便于推算, 组限要真切,最比如原始原料的数字众一位小数, 如许归组时不致含混不清。  选每一组的中点值卓殊厉重,这一点选定后,则该 组组限确定,其余各组的中点和组限有可确定。  每一组的中点值以逼近最小巡视值为好。  组中值= 组上限  组下限

  1,5,9 =4 4,5,6 =1 5,5,5 =0 可睹,规范差大,变异大;规范差最 小为0,透露无变异。

  进程。 随机:整个的对象(个人)都有相称的机遇 被抽取。 随机抽样所得的样本称随机样本。

  体所构成的集团。 样本:直接巡视丈量磋议的对象。 总体和样本的根本构成单元都是个人,由有 限个个人构成的总体称为有限总体,反之为 无穷总体。构成样本的个人少的样本称为小 样本,反之,为大样本。

  正在现实磋议中另有一类假念总体。比方进 行几种饲料的豢养试验,现实上并不存正在用这 几种饲料举行豢养的总体,只是假设有如许的 总体存正在,把所举行的试验作为是假念总体的 一个样本; 样本中所包罗的个人数目叫样本容量或大 小(sample size),样本容量常记为n。凡是把 n≤30的样本叫小样本,n 30的样本叫大样本。 磋议的宗旨是要明白总体,然而能观测到 的却是样本,通过样历来推想总体是统计说明 的根本特色。

  响应原始数据的整个特性。 比方:1,5,9 4,5,6 5,5,5 三组样本算术均匀数都是5,但它们的离散水准不 同。 别的,算术均匀数也不肯定正好是中央地点的 一个数,正在分散偏态境况下,高于均匀数的有大概 是倒数第二名,低于均匀数的有大概是正数第二名。

  均差个数。  通常地:样本自正在度等于巡视值的个数(n) 减去限制条目的个数,即  V=n-k

  (1) 涵义:量度原始数据绝对变异水准的 数学目标,透露一个样本的变异度。 (2) 数学描写 a.公式

  准确性:变异量重现性目标。统一对象反复 丈量,一概性高,准确度高。 准确性是切实性的须要条目。

  分为有用和无效两种,有用又可分正效和负 效两种。 互作是指要素的协同效应,总效应不等于 分效应之和即证据具有要素互作,总效如大 于分效应之和为具有正互作效应,总效如小 于分效应之和为具有负互作效应。

  四、众数(Mo) (1) 观点:统一原料中,巡视值显露 频次最众的数值。 (2) 注解:众数大概不止一个,也此 时常界说最小众数或最群众数。或者也大概 没有众数。

  位数及众数相称  2 谐和均匀数 几何均匀数 算术均匀数  3 常用的鸠合特性量为算术均匀数,正在非参 数考验中也用中位数。

  (1)描写数据绝对变异水准的量,规范 差大,变异大;规范差小,变异小。 (2)规范差的单元与均匀数无别。 (3)原始数据±常数,所得的新规范差 与原始规范差相称。 (4)原始数据推广或缩小不等于零的k 倍,所得的新规范差是原规范差的k倍。 (5)规范差是方差的算术平方根。

  (1) 涵义:量度原始数据相对变异程 度的数学目标。 (2) 数学描写 公式:CV=

  a.受规范差、均匀数两者的限制。 b.是一个相比拟值,无单元。 c.可能举行分别类型、本质和巨细 的样本之间的比拟。 d.变异系数最小时为0,最大可越过 100%。

  例:应用推算器推算样本4,5,7的均匀 数,规范差和变异系数。 (1)开机:按on (注: 闭机 按off) (2)进入统计功效:按分别型号推算器的 仿单举行,屏幕显示STAT或 SD即透露成 功。

  2 质地性状原料:简称质性原料,指不行或不 易直接丈量能巡视的性状原料,如颜色、性 别、状况等描写性特性。常用两种伎俩数目 化: ① 等第评定: 如人的强壮状态分为优, 良,通常,差;糊口状况分为生或死等。 ② 统计次数法或归类计数:于肯定总样 或样本内,统计其具有某性情状的个人数目 及具有分别性状的个人数目,按种别计其次 数或相对次数。如黄花64朵,白花56朵。

  方差等)  统计量:样本的特性量。(样本均匀数、样 本方差等)  两者的联系:通过统计量揣摸阴谋参数。

  常用希腊字母透露参数,比方用μ透露总 体均匀数,用σ透露总体规范差; 常用拉丁字母透露统计量,比方用 示样本均匀数,用S透露样本规范差。 外

  书举行,(有的较简陋的没有存贮功效的计 算器,如SHARP 506型不需此程序)。 如CASIO fx-82型,需依序按下:shift 、 AC 、 = 判决伎俩:巡视n是否等于0,如显示 n=0透露胜利。

  第三章 均匀数、变异数 第一节 鸠合特性量 一 鸠合的寓意 一组变数的鸠合趋向,即变数分散的中央位 置。 类型:均匀数(arithmetic mean)、中位数 (median)、众数(mode)等。

  也可可用相似次数分散的伎俩来料理。  把原料按百般质地性状举行分类  分类数等于组数

Copyright 2012-2023 leyu·乐鱼(中国)体育官方网站 版权所有 HTML地图 XML地图--备案号:豫ICP备20000747号  备案号:豫ICP备20000747号  
地址:河南省郑州市金水区丰庆路126号3号楼24层2401号  邮箱:19659724@qq.com  电话:13938535296