📄 statistics .htm
字号:
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN">
<!-- saved from url=(0062)http://www.pgjw.bjedu.gov.cn/peixunzx/GANXUNBU/ketang/wang.htm -->
<HTML><HEAD><TITLE>绪 论</TITLE>
<META http-equiv=Content-Type content="text/html; charset=gb2312">
<META content="MSHTML 6.00.2900.3132" name=GENERATOR>
<META content=FrontPage.Editor.Document name=ProgId></HEAD>
<BODY background="绪 论.files/fami_bg.gif"><B><FONT lang=ZH-CN face=??ì?,SimSun
size=5>
<P align=center>绪</FONT><FONT size=5> </FONT><FONT lang=ZH-CN face=??ì?,SimSun
size=5>论</P></FONT><FONT lang=ZH-CN face=??ì?,SimSun>
<P style="LINE-HEIGHT: 200%" align=left>一、教育统计的涵义</P></FONT></B><FONT lang=ZH-CN
face=??ì?,SimSun>
<P style="LINE-HEIGHT: 200%"
align=left>教育统计学是教育统计的理论和方法,是一门研究教育随机现象,以推断为特征的方法论科学,“由部分推及全体”的思想贯穿于教育统计的始终。具体地说,它是研究如何搜集、整理、分析反映事物总体信息的数字资料,并以此为依据,对总体特征进行推断的原理和方法。
用统计来认识事物的步骤是:研究设计<FONT size=3>—></FONT>抽样调查<SPAN lang=EN-US
style="FONT-SIZE: 10.5pt; FONT-FAMILY: 'Times New Roman'; mso-fareast-font-family: 宋体; mso-font-kerning: 1.0pt; mso-ansi-language: EN-US; mso-fareast-language: ZH-CN; mso-bidi-language: AR-SA">—></SPAN>统计推断<SPAN
lang=EN-US
style="FONT-SIZE: 10.5pt; FONT-FAMILY: 'Times New Roman'; mso-fareast-font-family: 宋体; mso-font-kerning: 1.0pt; mso-ansi-language: EN-US; mso-fareast-language: ZH-CN; mso-bidi-language: AR-SA">—></SPAN>结论。这里,研究设计就是制定调查研究和实验研究的计划,抽样调查是搜集资料的过程,统计推断是分析资料的过程。显然统计的主要功能是推断,而推断的方法是一种不完全归纳法,因为是用部分资料来推断总体。</P><B>
<P style="LINE-HEIGHT: 200%" align=left>1.什么是随机现象</P></B>
<P style="LINE-HEIGHT: 200%" align=left>从数学的角度来研究社会和自然现象可以把这些现象分为以下三类:</P><B>
<P style="LINE-HEIGHT: 200%"
align=left>(1)确定现象</B>:事前可预言的现象,即在准确地重复某些条件下,它的结果总是肯定的。如:在一个标准大气压下给水加热到100℃便会沸腾。比如质量守恒定律、牛顿定律反映就是这类现象。研究这类现象的数学工具有数学分析、几何、代数、微分方程等。</P><B>
<P style="LINE-HEIGHT: 200%"
align=left>(2)随机现象</B>:事前不可预言的现象,即在相同条件下重复进行试验,每次结果未必相同,或知道事物过去的状况,但未来的发展却不能完全肯定。如:以同样的方式抛置硬币却可能出现正面向上也可能出现反面向上;走到某十字路口时,可能正好是红灯,也可能正好是绿灯。研究这类现象的数学工具是概率论和统计。</P><B>
<P style="LINE-HEIGHT: 200%"
align=left>(3)模糊现象</B>:事物本身的含义不确定的现象。如:“情绪稳定”与“情绪不稳定”,“健康”与“不健康”,“年青”与“年老”。研究这类现象的数学工具是模糊数学。</P>
<P style="LINE-HEIGHT: 200%"
align=left>确定性现象与随机现象的共同特点是事物本身的含义确定;随机现象与模糊现象的共同特点是不确定性,随机现象中是指事件的结果不确定,而模糊现象中是指事物本身的定义不确定。概率论与统计学将数学的应用从必然现象扩大到随机现象的领域,模糊数学则将数学的应用范围从清晰确定扩大到模糊现象的领域。</P><B>
<P style="LINE-HEIGHT: 200%" align=left>2.产生随机现象的原因--次要因素(随机因素)</P></B>
<P style="LINE-HEIGHT: 200%"
align=left>客观世界是运动的,运动是有规律的。物质运动的规律可以分为必然规律和统计规律。必然规律是指事物本质的规律,它毫无例外地适用于事物所有个体;统计规律是指通过对随机现象的大量观察,所呈现出来的事物的集体性规律。统计规律与事物的单一个体的性质时而偶合,时而近似,时而简直没有什么联系。</P>
<P style="LINE-HEIGHT: 200%"
align=left>客观世界作用于事物各个个体的因素分为基本因素和次要因素两类,基本因素决定事物的必然规律,次要因素使事物呈现统计规律。人们所能认识而且能够控制的因素是基本因素,而大量的次要因素未能为人们所认识或未能被人们所控制,但只要存在次要因素的影响,就必然会有所表现。比如发射炮弹,其基本因素也
是人们所能控制的是它的初始条件--初速、发射角等,这些可以通过弹道方程(必然规律)计算出炮弹的落地点,但炮弹在飞行过程中会受到空气的阻力--风速、风向、空气的湿度、温度等的影响,它们使得炮弹不能落在它的准确的目的地。</P>
<P style="LINE-HEIGHT: 200%"
align=left>科学研究的目的,就是要发现反映事物本质的客观规律,即排除偶然性的掩盖与干扰,为此必须首先认识偶然性。于是统计学应运而生,统计学不是直接研究事物本质的必然规律,而是通过随机现象来发现事物的统计规律,并把它应用于对客观规律的认识和把握。</P><B>
<P style="LINE-HEIGHT: 200%" align=left>二、统计学的内容</P></B>
<P style="LINE-HEIGHT: 200%"
align=left>统计学的研究内容,从不同角度来分,可以分为不同的类型。从具体应用的角度来分,可以分成描述统计,推断统计和实验设计三部分。</P><B>
<P style="LINE-HEIGHT: 200%" align=left>1.描述统计</P></B>
<P style="LINE-HEIGHT: 200%"
align=left>对已获得的数据进行整理、概括,显示其分布特征的统计方法,常常用几个简单的数据来反映一组数据的全貌以及多组数据之间的联系。</P><B>
<P style="LINE-HEIGHT: 200%" align=left>2.推断统计</P></B>
<P style="LINE-HEIGHT: 200%"
align=left>根据样本所提供的信息,运用概率的理论进行分析、论证,在一定可靠程度上,对总体分布特征进行估计、推测,这种统计方法称为推断统计。推断统计的内容包括总体参数估计和假设检验两部分。</P><B>
<P style="LINE-HEIGHT: 200%" align=left>3.实验设计</P></B>
<P style="LINE-HEIGHT: 200%"
align=left>实验者为了揭示试验中自变量和因变量的关系,在实验之前所制定的实验计划,称为实验设计。其中包括选择怎样的抽样方式;如何计算样本容量;确定怎样的实验对照形式;如何实现实验组和对照组的等组化;如何安排实验因素和如何控制无关因素;用什么统计方法处理及分析实验结果,等等。</P>
<P style="LINE-HEIGHT: 200%" align=left>以上三部分内容,不是截然分开,而是相互联系的。</P><B>
<P style="LINE-HEIGHT: 200%" align=left>三、教育统计在中小学教育研究与管理中的作用</P></B>
<P style="LINE-HEIGHT: 200%" align=justify>在现代中小学教育研究管理中,教育统计有着重要作用。</P>
<P style="LINE-HEIGHT: 200%"
align=justify>在教育研究中:现代教育研究不能靠权威、靠经验,更不能凭知觉直觉,要靠科学的手段和方法,要经得起别人的挑战。为此就要有科学的数据。结论要用数据说明,规律要从数据中发现。注重数据就是要注重定量研究。定性和定量是相辅相成的两个方面。定性研究是必要的,但是真科学的认识还在于拿出定量的分析和依据。定量是定性的深化和精确化。没有充分</FONT>
<FONT lang=ZH-CN
face=??ì?,SimSun>大道理研究作基础,定性研究就不易得出广泛而深入的结果。各门科学发展到一定程度,都得要求定量研究。</P>
<P style="LINE-HEIGHT: 200%"
align=justify>过去,我国的教育研究水平低,对定量研究重视不够,近几年,在教育研究中运用统计方法和其它数学方法的文章、报告越来越多。但是中小学教育工作者的教育研究绝大多数还都是描述性的。在北京市某区的中小学教育研究年会上的数百篇研究论文中仅有两篇使用了简单的统计方法,一些使用统计方法的研究论文还不为大多数中小学教育工作者接受。这严重阻碍了中小学教育研究水平的提高。</P>
<P style="LINE-HEIGHT: 200%"
align=justify>在教育管理中:教育研究与教育管理密不可分。教育研究为教育管理提供理论指导,教育管理为教育研究提供数据和实践场所。现代管理的重要特征之一是应用数学进行定量管理。教育管理的工作,在很大程度上是属于教育统计的范畴。教育统计是教育行政工作和学校管理工作的有机部分。比如,学制的制定、各级各类学校的设置、每年招生的人数、教育经费的分配、课程分量的规定、学生成绩的比较、录取新生方案的制定、各种教学和教育方法的比较等等都需要使用教育统计。有了教育统计的帮助,可以提高教育管理工作的效率和科学性,使各级教育领导胸中有数,使中小学教育质量的提高有一个科学的保证。</P></FONT><B><FONT
size=5>
<P align=center><BR></FONT><FONT lang=ZH-CN face=??ì?,SimSun
size=5>第一篇</FONT><FONT size=5> </FONT><FONT lang=ZH-CN face=??ì?,SimSun
size=5>描述统计</P></FONT></B>
<P align=justify> </P><FONT lang=ZH-CN face=??ì?,SimSun>
<P style="LINE-HEIGHT: 200%"
align=justify>描述统计,就是将数据资料加以整理、简缩,使之有序化,制作成次数分布表或分布图;或根据数据的分布特征,如集中趋势、离中趋势、相关强度等,计算出平均数、标准差、相关系数等概括性的统计量数,以便人们从杂乱的原始数据中获得有意义的信息,进行比较,作出结论。</P></FONT>
<P style="LINE-HEIGHT: 200%" align=justify> </P><B><FONT lang=ZH-CN
face=??ì?,SimSun size=4>
<P style="LINE-HEIGHT: 200%" align=center>第一章</FONT><FONT size=4> </FONT><FONT
lang=ZH-CN face=??ì?,SimSun size=4>数据资料的整理</P></FONT></B>
<P style="LINE-HEIGHT: 200%" align=center> </P><FONT lang=ZH-CN
face=??ì?,SimSun>
<P style="LINE-HEIGHT: 200%" align=center>§</FONT>1 <FONT lang=ZH-CN
face=??ì?,SimSun>原始数据</P></FONT>
<P style="LINE-HEIGHT: 200%" align=justify> </P><B><FONT lang=ZH-CN
face=??ì?,SimSun>
<P style="LINE-HEIGHT: 200%" align=justify>一、原始数据的种类</P></FONT></B>
<P style="LINE-HEIGHT: 200%" align=justify><FONT lang=ZH-CN
face=??ì?,SimSun>统计中的数字资料简称为数据。如某学校学生人数等。从教育研究和管理中直接获得的未经整理分析的数字资料称为原始数据。如测验考试中每个学生的分数,可以称为原始分数。</P>
<P style="LINE-HEIGHT: 200%" align=justify>原始数据有不同的种类。</P></FONT>
<P style="LINE-HEIGHT: 200%" align=justify>1<FONT lang=ZH-CN
face=??ì?,SimSun>.测量数据与计数数据:原始数据按其来源可以分为测量数据与计数数据两种。</P></FONT>
<P style="LINE-HEIGHT: 200%" align=justify>(1)<FONT lang=ZH-CN
face=??ì?,SimSun>测量数据:测量数据是借助于测量工具或测量标准对变量进行测量得到的。比如学生的身高是一个变量,借助于米尺对学生的身高进行测量,得到的身高的具体数值</FONT>160<FONT
lang=ZH-CN face=??ì?,SimSun>厘米、</FONT>170<FONT lang=ZH-CN
face=??ì?,SimSun>厘米等就是测量数据。再如学生的学习成绩是一个变量,借助于测验对学生的学习成绩进行测量,得到的学生成绩的具体分数</FONT>100<FONT
lang=ZH-CN face=??ì?,SimSun>分、</FONT>90<FONT lang=ZH-CN
face=??ì?,SimSun>分等也是测量数据。</P></FONT>
<P style="LINE-HEIGHT: 200%" align=justify><FONT lang=ZH-CN
face=??ì?,SimSun>测量数据还可以再分成三类:比率数据、等距数据、顺序数据。</P></FONT>
<P style="LINE-HEIGHT: 200%" align=justify><FONT lang=ZH-CN
face=??ì?,SimSun>对一些变量进行测量时,变量值</FONT> (<FONT lang=ZH-CN
face=??ì?,SimSun>测量数据</FONT>)<FONT lang=ZH-CN
face=??ì?,SimSun>既有相等的单位,又有绝对零点。这类变量称为比率变量,如身高、体重、时间等、其相应的变量值就称为<B>比率数据</B>,如</FONT>160<FONT
lang=ZH-CN face=??ì?,SimSun>厘米、</FONT>60<FONT lang=ZH-CN
face=??ì?,SimSun>千克、</FONT>30<FONT lang=ZH-CN face=??ì?,SimSun>秒等。</P></FONT>
<P style="LINE-HEIGHT: 200%" align=justify><FONT lang=ZH-CN
face=??ì?,SimSun>在比率数据间进行比较,既可以用加减法,也可以用乘除法。比如,甲身高</FONT>180<FONT lang=ZH-CN
face=??ì?,SimSun>厘米,乙身高</FONT>150<FONT lang=ZH-CN
face=??ì?,SimSun>厘米,比较时可以说甲比乙高</FONT>30<FONT lang=ZH-CN
face=??ì?,SimSun>厘米</FONT> (180-150<FONT lang=ZH-CN
face=??ì?,SimSun>=</FONT>30)<FONT lang=ZH-CN
face=??ì?,SimSun>,也可以说甲的身高是乙的身高的</FONT>1.2<FONT lang=ZH-CN
face=??ì?,SimSun>倍</FONT> (180+150=1.2)<FONT lang=ZH-CN face=??ì?,SimSun>。</P>
<P style="LINE-HEIGHT: 200%"
align=justify>在对另外一些变量进行测量时,变量值只有相等的单位,但没有绝对零点。这类变量称为<B>等距变量</B>,如温度、测验成绩等,其相应的变量值就称为等距数据。如</FONT>20<SUP>0</SUP>C<FONT
lang=ZH-CN face=??ì?,SimSun>、</FONT>80<FONT lang=ZH-CN
face=??ì?,SimSun>分等。为什么说这些变量值没有绝对零点呢?因为温度表中的</FONT>0<SUP>0</SUP>C<FONT
lang=ZH-CN
face=??ì?,SimSun>只是一个具体的温度值,并不表示没有温度。一般说绝对零度是一</FONT>273<SUP>0</SUP>C<FONT
lang=ZH-CN face=??ì?,SimSun>,但是在它以下的温度仍然存在。一个学生的某科测验成绩是</FONT>0<FONT lang=ZH-CN
face=??ì?,SimSun>分,并不意味着他这一方面的知识一点儿不会,因为测验题目只是这方面知识的一个样本。</P>
<P style="LINE-HEIGHT: 200%"
align=justify>在等距数据间进行比较时,只可以用加减法,不能用乘除法。比如,甲生考试得了</FONT>90<FONT lang=ZH-CN
face=??ì?,SimSun>分,乙生考试得了</FONT>60<FONT lang=ZH-CN
face=??ì?,SimSun>分,比较时只可以说甲生比乙生多</FONT>30<FONT lang=ZH-CN
face=??ì?,SimSun>分,但不能说甲生的知识水平是乙生的</FONT>1.5<FONT lang=ZH-CN
face=??ì?,SimSun>倍。</P></FONT>
<P style="LINE-HEIGHT: 200%" align=justify><FONT lang=ZH-CN
face=??ì?,SimSun>在对一些变量进行测量时用了等级评定,比如第一、第二、第三,这类数据称为<B>顺序数据</B>。从顺序量表得到的位次,便是顺序变量,位次值就是顺序数据。顺序数据既无相等的单位,也无绝对零点。</P>
<P style="LINE-HEIGHT: 200%"
align=justify>在顺序数据间进行比较时,既不能用加减法,也不能用乘除法。只能说谁高谁低、谁大谁小、谁前谁后、谁强谁弱,但说不出高多少、大多少、强多少。</FONT></P><FONT
lang=ZH-CN face=??ì?,SimSun>
<P style="LINE-HEIGHT: 200%" align=justify>(</FONT>2<FONT lang=ZH-CN
face=??ì?,SimSun>)计数数据:计数数据是对某类中的个体计数得到的。比如把学生按性别分为男、女两类,分别计算出男生有</FONT>60<FONT
lang=ZH-CN face=??ì?,SimSun>人,女生有</FONT>50<FONT lang=ZH-CN
face=??ì?,SimSun>人,这里的</FONT>60<FONT lang=ZH-CN
face=??ì?,SimSun>人、</FONT>50<FONT lang=ZH-CN face=??ì?,SimSun>人就是计数数据。</P>
<P style="LINE-HEIGHT: 200%"
align=justify>从以上分析可知,不论是测量数据,还是计数数据,都不仅仅是孤立的数字,还带有一定的实际单位。</FONT></P>
<P style="LINE-HEIGHT: 200%" align=justify><FONT lang=ZH-CN
face=??ì?,SimSun>原始数据的种类不同,统计处理的方法也不同。如果不了解数据的种类,随便滥用统计方法,会使统计结果变得毫无意义。所以在统计之前,首先应确定原始数据的种类,以采用相应的统计方法。</P></FONT>
<P style="LINE-HEIGHT: 200%" align=justify>2<FONT lang=ZH-CN
face=??ì?,SimSun>.连续数据与间断数据:原始数据还可以分成连续数据与间断数据两类。</P>
<P style="LINE-HEIGHT: 200%"
align=justify>在对一些变量进行测量时,变量之间可以再划分成无限多个细小单位,</FONT> <FONT lang=ZH-CN
face=??ì?,SimSun>如身高,单位可以用米,也可以用厘米、毫米,变量值是连续的。这类变量称为<B>连续变量</B>,其相应的数据就称为连续数据。考试分数也是连续数据</FONT>;<FONT
lang=ZH-CN face=??ì?,SimSun>。</P>
<P style="LINE-HEIGHT: 200%"
align=justify>在对另一些变量进行测量时,变量的单位之间不能再划分成无限多个细小单位,变量值是间断的。如测量学生脉搏,只能是跳动</FONT>1<FONT
lang=ZH-CN face=??ì?,SimSun>次、</FONT>2<FONT lang=ZH-CN
face=??ì?,SimSun>次。测量学生对生字的记忆,只能是记住</FONT>7<FONT lang=ZH-CN
face=??ì?,SimSun>个、</FONT>8<FONT lang=ZH-CN
face=??ì?,SimSun>个。这类变量称为<B>间断变量</B>,其相应的数据就称为间断数据。间断数据的数字形式只能是整数</P>
<P style="LINE-HEIGHT: 200%"
align=justify>单位之间是否可以分成无限多个细小单位,是变量本身的客观特性决定的,而不是由使用上的需要和习惯决定的。</P>
<P style="LINE-HEIGHT: 200%"
align=justify>由以上分析可知,测量数据中,有些是连续数据,有些是间断数据,但多数是连续数据。</P>
<P style="LINE-HEIGHT: 200%" align=justify>计数数据从名称就可明白,一般都是间断数据,。</P>
<P style="LINE-HEIGHT: 200%"
align=justify>在数轴上,间断数据是数轴上一个点,连续数据是数轴上一段距离。</FONT></P>
<P style="LINE-HEIGHT: 200%" align=justify><FONT lang=ZH-CN
face=??ì?,SimSun>在连续数据里,当我们书写</FONT>1<FONT lang=ZH-CN
face=??ì?,SimSun>,</FONT>2<FONT lang=ZH-CN face=??ì?,SimSun>,</FONT>3<FONT
lang=ZH-CN face=??ì?,SimSun>时,这是使用数值的中央点来代表数值所包括的一段距离的。连续数据</FONT>1<FONT
lang=ZH-CN face=??ì?,SimSun>,</FONT>2<FONT lang=ZH-CN
face=??ì?,SimSun>,</FONT>3<FONT lang=ZH-CN
face=??ì?,SimSun>是指</FONT>0.5~1.499<FONT lang=ZH-CN
face=??ì?,SimSun>…,</FONT>1.5~2<FONT lang=ZH-CN
face=??ì?,SimSun>.</FONT>499<FONT lang=ZH-CN
face=??ì?,SimSun>……,</FONT>2.5~3.499<FONT lang=ZH-CN
face=??ì?,SimSun>……,经常表示为</FONT>0.5~1.5<FONT lang=ZH-CN
face=??ì?,SimSun>,</FONT>1.5~2.5<FONT lang=ZH-CN
face=??ì?,SimSun>,</FONT>2.5~3.5<FONT lang=ZH-CN
face=??ì?,SimSun>这种形式。</P></FONT>
⌨️ 快捷键说明
复制代码
Ctrl + C
搜索代码
Ctrl + F
全屏模式
F11
切换主题
Ctrl + Shift + D
显示快捷键
?
增大字号
Ctrl + =
减小字号
Ctrl + -