统计学基础知识汇总
统计学基础知识汇总
统计学是一门阐明如何去采集、整理、显示、描述、分析数据和由数据得出结论的一系列概念、原理、原则、方法和技术的科学,是一门独立的、实用性很强的通用方法论科学。你知道多少统计学基础知识呢?下面是小编为大家带来的统计学基础知识。欢迎阅读。
一、名词解释
1、统计学
统计学是一门阐明如何去采集、整理、显示、描述、分析数据和由数据得出结论的一系列概念、原理、原则、方法和技术的科学,是一门独立的、实用性很强的通用方法论科学。
2、指标和标志
标志是说明总体单位属性或特征的名称。指标是说明总体综合数量特征和数量关系的数字资料。
3、总体、样本和单位
统计总体是统计所要研究的对象的全体,它是由客观存在的、具有某种共同性质的许多个体所构成的整体。简称总体。构成总体的个体则称为总体单位,简称单位。样本是从总体中抽取的一部分单位。
4、统计调查
统计调查是根据统计研究的目的和要求、采用科学的方法,有组织有计划的搜集统计资料的工作过程。它是取得统计数据的重要手段。
5、统计绝对数和统计相对数
反映总体规模的绝对数量值,在社会经济统计中称为总量指标。统计相对数是两个有联系的指标数值之比,用以反映现象间的联系和对比关系。
6、时期指标和时点指标
时期指标是反映总体在一段时期内累计总量的数字资料,是流量。时点指标是反映总体在某一时刻上具有的总量的数字资料,是存量。
7、抽样估计和假设检验
抽样估计是指根据所抽取的样本特征来估计总体特征的统计方法。假设检验是先对总体的某一数据提出假设,然后抽取样本,运用样本数据来检验假设成立与否。
8、变量和变异
标志的具体表现和指标的具体数值会有差别,这种差别就称为变异。数量标志和指标在统计中称为变量。
9、参数和统计量
参数是反映总体特征的一些变量,包括总体平均数、总体方差、总体标准差等。统计量是反映样本特征的一些变量,包括样本平均数、样本方差、样本标准差等。
10、抽样平均误差
样本平均数与总体平均数之间的平均离散程度称之为抽样平均误差,简称为抽样误差。重复抽样的抽样平均误差为总体标准差的1/。
11、抽样极限误差
抽样极限误差是指样本统计量和总体参数之间抽样误差的可能范围。我们用样本统计量变动的上限或下限与总体参数的绝对值表示抽样误差的可能范围,称为极限误差或允许误差。
12、重复抽样和不重复抽样
重复抽样也称为回置抽样,是从总体中随机抽取一个样本时,每次抽取一个样本单位时都放回的抽样方式。不重复抽样也叫不回置抽样,它是在每次抽取样本单位时都不放回的抽样方式。
13、点估计和区间估计
点估计也叫定值估计,就是直接用抽样平均数代替总体平均数,用抽样成数代替总体成数。区间估计是在一定概率保证下,用样本统计量和抽样平均误差去推断总体参数的可能范围的估计方法。
14、统计指数
广义上来说,它是表明社会经济现象的'数量对比关系的相对指标。狭义上来说,它是反映不能直接相加对比的复杂总体综合变动的动态相对数。
15、综合法总指数
凡是一个总量指标可以分解为两个或两个以上的因素指标时,将其中一个或一个以上的因素指标固定下来,仅观察另一个因素指标的变动程度,这样的总指数就叫综合法指数。
16、平均法总指数
平均法总指数是通过对个体指数进行加权平均而求得的反映不能直接加总的多个个体所组成的复杂总体综合变动的指数。分为两种:加权算术平均法总指数和加权调和平均法总指数。
17、时间数列
时间数列是指同一观察现象的观察值按其发生的时间先后顺序排列而形成的数列。时间数列也称为时间序列和动态数列。
18、相关分析和回归分析
相关分析是一种分析几个变量之间是否存在关系以及它们的关系如何的统计方法。回归分析是指对具有显著相关关系的现象,根据其关系形态,选择一合适的数学模式,用来近似地表达变量见的平均变动关系的统计分析的方法。
19、时间序列的最初水平、中间水平和最末水平
时间数列中第一个观察值称为最处水平,最后一个观察值称为最末水平,其余各个观察值称为中间水平。
20、调查对象、调查单位和填报单位
调查对象是所要研究对象的总体。调查单位是所要研究对象的个体。填报单位是提交调查资料的单位。调查单位和填报单位有时相同,有时不同。
21、环比发展速度和定基发展速度
环比发展速度是以报告期水平与其前一期水平对比,所得到的动态相对数。表明现象逐期的发展变动程度。定基发展速度是用报告期水平与某一固定基期水平(通常为最初水平)对比,所得到的动态相对数。它表明所观察现象在一段时期内发展的总速度。
22、经常性调查与一次性调查的区别
两者的区分是以调查单位的登记在时间上是否具有连续性为依据的。经常性调查的对象本身具有连续不断变化的特点。商品零售额。一次性调查的对象是时点现象。如人口普查。
二、简答题
1、指标和标志的区别与联系
两者的区别:(1)指标是反映总体特征的,而标志是反映总体单位特征的。
(2)标志可以用文字来反映,也可以用数字来表示。而指标都是用数量来表示的。
两者的联系:(1)指标是指标的汇总和综合。
(2)根据研究目的的不同,两者有时可以互换。
2、统计总体的特点
(1)同质性。即总体单位都必须具有某些共同的品质标志属性或数量标志属性。这是构成总体的前提。
(2)大量性。即构成总体的总体单位数目要足够多。这是形成总体的充分条件。
(3)差异性。即总体单位必须具有一个或若干个可变的品质标志或数量标志。这是形成总体的必要条件。
3、重点调查、抽样调查、典型调查的区别与联系
联系:都是非全面调查,调查对象都是总体中的一部分
区别:
调查目的 | 调查单位 | |
重点调查 | 了解被研究对象的基本情况,不能推算总体相应指标 | 重点单位是指它们的某一标志在总体标志值总量中占有绝大比重 |
典型调查 | 了解被研究对象的特征及发展变化趋势,可近似推算总体数量,无法估计误差 | 有意识地选取有代表性的典型单位 |
抽样调查 | 用样本指标数值推断总体指标数值,可以计算和控制误差 | 排除主观愿望按随机原则抽取样本单位 |
4、统计绝对数的分类
(1)按其反映总体内容的不同分:总体单位总量和总体标志总量。
(2)按其反映不同的时间状况不同分:时期指标和时点指标。
(3)按其采用的计量单位的不同分:实物指标、价值指标和劳动指标。
5、时期指标和时点指标的区别
时期指标:(1)连续记数,其值可以相加(2)具有时间长度,与时间长短有关 (3)是流量
时点指标:(1)间断记数,其值不可以相加,相加无实际意义(2)不具有时间长度,与时间长短无关 (3)是存量
6、抽样技术的特点
(1)在调查单位的抽取上,遵循随机原则。
(2)以样本数据估计总体数据。
(3)以概率估计的方法对总体进行估计。
(4)在推断理论上,以大数定律和中心极限定理为基础。
(5)抽样误差可以计算并加以控制。
7、抽样误差的种类
(1)登记性误差。又称调查误差或工作性误差,是完全可以避免的。
(2)代表性误差。它又可以分为系统性误差和随机性误差。系统性误差是破坏随机原则造成的偏差,也是可以避免的。随机性误差包括抽样个体误差和抽样平均误差。抽样个体误差不确定,难以计算。抽样平均误差无法避免,但可以计算和控制。
8、影响抽样误差的因素
(1)总体总变量值X间的差异大小。差异越大,误差越大。
(2)样本容量。样本容量越大,抽样误差越小。
(3)抽样方法。重复抽样误差一般大于不重复抽样误差。
(4)抽样调查的组织形式。不同的组织形式,误差不同。
9、统计相对数的种类
(1)计划完成相对数。是实际完成数与计划数的比值。
(2)结构相对数。是总体各组成部分数值与总体总数值的比值。
(3)比例相对数。总体中某一组的指标数值与总体中另一组的指标数值的比值。
(4)动态相对数。某现象报告期数值与同一现象基期数值的比值。
(5)比较相对数。某类现象的数值与不同空间同类现象的数值的比值。
(6)强度相对数。某一现象数值与另一有联系但性质不同的现象数值的比值。
10、强度相对数与平均数的区别
(1)概念含义不同。平均数=总体标志总量/总体单位总量。强度相对数是某一现象数值与另一有联系但性质不同的现象数值的比值。
(2)作用不同。强度相对数是反映某现象在另一现象中的强度、密度或普遍程度,反映现象间依存性的比例关系。而平均数是反映总体各单位的某一变量的各个变量值一般水平的代表值。
(3)表现形式不同。强度相对数的单位多是复合单位,由分子、分母的指标单位复合而成。平均数则是和标志总量单位的一致。
(4)强度相对数分子、分母可以互换,平均数的分子、分母不可以互换,互换无意义。
11、统计指数的种类
(1)按反映对象的范围不同分:个体指数、类指数和总指数。
(2)按反映统计指标的不同内容分:质量指标指数和数量指标指数。
(3)按所采用的基期不同分:定基指数和环比指数。
(4)按表现形式不同分:综合法总指数和平均法总指数。
12、相关关系的种类
(1)从涉及的因素多少来分,可分为单相关和复相关。只研究两个因素之间的相关关系叫单相关。两个以上的为复相关。
(2)从相关关系所呈现形态来分,可分为直线相关和曲线相关。
(3)直线单相关按呈现相关关系的方向划分,又可分为正相关和负相关。正相关表明两个因素的变动方向是相同的,负相关表明两个因素的变动方向是不同的。
三、计算题
1、组距、组限和组中值的计算
例:
某地区工人劳动生产率分布情况见表1
按工人劳动生产率分组(元/人·月) | 企业个数(频数) | 组距 | 组中值(元) | 频率(%) |
3000以下 | 1 | |||
3000~4200 | 3 | |||
4200~5400 | 4 | |||
5400~6600 | 4 | |||
6600~7800 | 3 | |||
7800~9000 | 2 | |||
9000以上 | 3 | |||
合计 | 20 |
要求:根据上述资料计算各组的组距、组中值和频率(填在表中即可)
2、平均数、方差、标准差、离散系数的计算
例:
甲乙两人都是某一零件厂的工人,两人一个星期每天日产量资料如表2
时间 | 甲工人(个) | 乙工人(个) |
周一 | 5 | 6 |
周二 | 6 | 3 |
周三 | 4 | 6 |
周四 | 7 | 4 |
周五 | 2 | 4 |
(1)比较甲乙两工人平均日产量的高低
(2)计算甲乙工人日产量的标准差和离散系数,说明哪个工人的平均日产量更具有代表性
3、抽样平均误差、抽样极限误差和区间估计
例:
某地区采用简单随机抽样方法,对职工文化程度进行调查,抽查100名职工,每个职工文化程度的分布数列如表3
文化程度(年) | 组中值 | 人数(人) |
3~5 | 4 | 15 |
6~8 | 7 | 55 |
9~11 | 10 | 24 |
12~15 | 13.5 | 6 |
合计 | 100 |
求:(1)抽样平均误差
(2)在概率度t=2的条件下的平均文化程度的变化范围
4、综合法统计指数的编制
例:
商品名称 | 计量单位 | 销售量 | 价格 | ||
基期q0 | 报告期q1 | 基期p0 | 报告期p1 | ||
甲 | 米 | 200 | 240 | 15 | 18 |
乙 | 件 | 300 | 320 | 26 | 30 |
丙 | 斤 | 150 | 130 | 12 | 10 |
合计 |
求:(1)商品销售额总指数、商品销售量总指数和价格总指数
(2)分析由于销售量的变动所引起的商品销售额的变动状况
(3)分析由于商品价格的变动所引起的商品销售额的变动状况
5、平均发展水平、环比速度、定基速度的计算
例:
某县财政收入资料如表:
年份 | 1997 | 1998 | 1999 | 2000 | 2001 | 2002 |
财政收入(万元) | 2000 | |||||
逐期增长量(万元) | 300 | 300 | 400 | |||
环比增长速度(%) | 20 | 11 |
求:
(1)计算表中空缺数值
(2)计算1997~2002年平均发展水平、平均增长量、平均增长速度
6、相关系数、回归方程
例:
生产费用与产品产量有一定关系,现从某一行业中随机抽取8个企业,所得产量与生产费用的数据如下表:
企业编号 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 |
产量 | 40 | 42 | 50 | 55 | 65 | 78 | 84 | 100 |
生产费用 | 130 | 150 | 155 | 140 | 150 | 154 | 165 | 170 |
求:(1)计算产量和生产费用的相关系数
(2)求解以产量为自变量,生产费用为因变量的直线回归方程
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 yyfangchan@163.com (举报时请带上具体的网址) 举报,一经查实,本站将立刻删除