第一章 绪论
一、统计的概念
统计一词通常有三种涵义:
1. 统计活动:是根据统计研究的目标,对社会经济现象进行统计资料的搜集、整理和分析的过程。
2. 统计资料:是统计工作所取得的各种数字、文字及图表资料。
3. 统计科学:是研究统计活动的基本理论和基本方法的一门认识论科学,是关于统计活动理论与经验的总结。 二、统计的流派: 1、政治算术学派:
代表人物:英国统计学家威廉·配第。 代表作:《政治算术》 (1690年出版) ,
特点:运用大量的统计资料和基本统计方法,对当时英国、荷兰、法国的综合国力进行了分析。由于该书第一次系统地运用了统计方法进行分析论证,所以威廉. 配第被称为“政治经济学之父”,从某种意义上说也是统计学的创始人。(有统计之实无统计之名) 2、国势学派(记述学派)
代表人物:德国统计学家康令和阿坎华尔。 代表作:《近代欧洲各国国势学概论》
特点:第一次用“Statistik”作为这一学的名称,该词最演化为现在的“Statistics”。 (有统计 之名无统计之实) 3、数理统计学派作
代表人物:比利时数学家和统计学家阿道夫·凯特勒。 代表作:《统计学的研究》、《论人类》
特点:用概率论的方法研究社会经济现象,最后形成了现在的“数理统计学” 三、总体与总体单位
总体:具有一个以上相同属性的客观事物的全体。 总体单位:构成总体的每一个单位。 构成总体的必要条件:
1. 大量性:总体单位数目量的规定性。
2. 同质性:构成总体的每一个单位至少有一种性质是共同的。
3. 变异性:总体各单位除了某些或某种共同性质外,在其他方面各不相同。 总体和总体单位的划分是相对的,是根据不同研究目的决定的。 四、标志、变异、变量
标志:用以反映总体单位数量特征的名称或项目。 统计标志按表现的形式的不同可以分为:
1. 数量标志:用以反映总体单位数量特征的标志,用数值表示。
2. 品质标志:用以反映现象总体单位属性特征的标志。一般不能用数字表示。要特别注意的是,有的标志虽然是以数字形式出现的,但不具备数字的性质,不能视其为数量标志,而应作为品质标志
五、指标与指标体系
指标:是指用以反映总体数量特征的概念或范畴。它可以反映总体的规律性。
1. 指标的构成要素:指标名称、指标数值、指标单位、核算方法、时间限制、空间范围。 2. 统计指标的种类
(1)按统计指标的时间特点不同,可以分为时点指标与时期指标两种。
时点指标是反映社会经济现象在某一瞬间(时点) 上的总量的指标。 时期指标是反映社会经济现象在某一段时间(时期) 内的总量的指标 (2)按统计指标反映现象的内容不同,可以分为 数量指标和质量指标两种。
数量指标是反映总体标志总量或总体单位总数的指标。特点是指标数值与现象的总规模、总水平成正比关系。
质量指标是反映现象总体的结构、强度、质量水平等方面的指标。特点是指标数值一般与现象的总规模、总水平无直接关系,而与现象的一般水平有关系。 3、变异、变量和变量值。
可变标志在总体各单位具体表现上的差别就是变异,包括质(性质、属性) 的变异和量(数值) 的变异。可变的数量标志就是变量。变量的数值表现就是变量值。按变量值是否连续可分为连续变量和离散变量两种。
第二章 统计数据的调查与整理 一、统计调查误差
1. 概念:统计调查所得到的数字与实际数字之间的差别。 2. 种类:
(1)登记性误差:由于主观原因而引起的观察、测量、登记、计算上的差错而产生的误差。 (2)代表性误差:由于只调查了总体的部分单位,由样本指标代替总体指标所产生的统计误差。
代表性误差可分为:
A 系统性误差:由于破坏随机原则而产生的误差。 B 抽样误差:已按随机原则抽样,由于样本结构
与总体结构的不完全一致性,不可避免地产生的抽样误差。 二、统计调查的种类
1、按调查的组织方式不同,分为: 统计报表制度:国家统计系统和各业务部门为了定期取得系统全面的基本统计资料而采用的一种搜集资料的方式。 专门调查:是指为了解和研究某种情况或某项问题而专门组织的调查,包括普查、重点调查、抽样调查和典型调查等。
2、按调查的范围不同,分为: 全面调查 :对构成调查对象的所有个体都进行调查的一种方式,常用的全面调查方式是普查。
非全面调查:对构成调查对象的部分个体进行调查的一种方式。非全面调查主要指重要调查、抽样调查和典型调查。
3、按调查时间的连续性不同,分为: 经常性调查(连续调查):是指对调查对象进行连续不断地调查登记的方法。例如,统计报表制度。
一次性调查:对调查对象不定期地进行调查的方式。一次性,不是说空前绝后地组织一次,而是指两次调查的时间间隔比较长,而且没有规律。 三、专门调查
专门调查是指为了某些特定目的而专门进行的调查。多属一次性调查。
1、普查 2、重点调查 3、 抽样调查 4、 典型调查
第三章统计数据的描述 一、相对指标的种类及计算 1.计划完成相对数
计划完成相对数也称计划完成百分比,它是将某一时期的实际完成数与同期计划数进行对比,一般用百分数表示。基本计算公式为:
计划完成相对数=(实际完成数÷同期计划数)×100% (1)计划数为绝对数 (2)计划数为平均数
计划完成相对数=(实际平均水平÷计划平均水平)×100% (3)计划数为相对数
计划完成相对数=〔实际完成数(%)÷计划完成数(%)〕×100%
〔例〕某企业某种产品的产值计划要求增长10%,该种产品的单位成本计划要求下降5%,而实际产值增长了15%,实际单位成本下降了3%,则计划完成程度指标为: 产值计划完成相对数=115%÷110%=104.55%
单位成本计划完成相对数=(100%-3%)÷(100%-5%)=102.11% 2. 结构相对数 3. 比例相对数 4. 比较相对数 5. 动态相对数 6. 强度相对数
强度相对数是两个性质不同而有联系的总量指标对比的结果。能够反映现象的强度、密度和普遍程度。其公式为:
强度相对数=某一总量指标数值÷另一性质不同而有联系的总量指标数值 [例〕某市人口数为158000人,有零售商店790个, 则该市零售商业网点密度是:
正指标=(零售商业网点数∕人口数) =790∕158=5(个∕千人) 逆指标= (人口数∕零售商业网点数) =158000∕790=200人∕个 二、集中趋势的描述
1、某高校某系学生的体重资料如下:(8分)
试根据所给资料计算学生体重的算术平均数和众数。 计算:
组中值:50. 5 53. 5 56. 5 59. 5 62. 5 (2分)
加权算术平均数 =
=11996 /212=56. 58(公斤) (3分)
众数m 0=Δ1 / (Δ1 +Δ2) = 56. 98(公斤) (3分) 2、某产品收购情况的资料如下:(8分)
要求:按以下三种方法计算产品的平均收购价格: (1)不加权的平均数; (2)加权算术平均数; (3)加权调和平均数。 三、离散程度的描述
1、有甲乙两个生产小组,甲组平均每个工人的日产量为36件,标准差为件9.6件, 乙组工人日产量资料如下:
要求:
(1)计算乙组平均每个工人的日产量和标准差; (2)比较甲乙两生产小组哪个组的产量差异较大? (1)乙组
=
=2950/100=29.5(件)
σ= = =8.99(件)
(2)甲组 v 甲=σ
/ ×100%=9.6/36 =26.67%
乙组 =8.99/29.5=30.47%,甲组标准差小于乙组。 所以,甲
组产量较稳定。
2、有两车间工人的工资资料如下:已知甲车间工人的平均工资是850元,工资标准差141.4元;又知乙车间工人工资的分组资料,见下表:(本题15分)
要求:(1)计算乙车间工人的平均工资、工资标准差和标准差系数;(2)哪个车间工
人的平均工资更具有代表性?为什么?
(1)乙车间工人的平均工资、工资标准差和标准差系数分别为:
∴x 乙=
∑xf 85000
==850(元)∑f 100∑x -x ∑f
2
σ乙=νσ乙=
f
=
=≈126. 5(元)
100
σ乙
x 乙
⨯100%=
126. 5
⨯100%=14. 88%850
又 x 甲=850(元)
(2)
σ甲=141. 4(元)
σ141. 4νσ甲=甲⨯100%=⨯100%≈16. 64%
x 甲
850
而νσ乙=14. 88%∴νσ甲 νσ乙
∴乙车间工人的平均工资的代表性更高!
第四章 指数分析
一、统计指数的概念、作用和分类。 二、同度量因素的作用是什么?
三、综合指数和平均数指数的编制原理和计算方法。 四、什么是指数体系?如何运用指数体系进行因素分析。 1、某厂三种产品的产量情况如下:(9分)
试从绝对数和相对数两个方面分析出厂价格和产量对总产值的影响。 解:总产值指数=∑q 1p 1 / ∑q 0p 0=263700/242000=108. 97% ∑q 1p 1 — ∑q 0p 0=21700(元) (3分)
销售量指数=∑q 1p 0 / ∑q 0p 0=250800/242000=103. 65% ∑q 1p
0 — ∑q 0p 0=8800(元) (3分)
出厂价格指数=∑q 1p 1 / ∑q 1p 0=263700/250800=105.14%
∑q 1p 1 — ∑q 1p 0=12900(元) (3分) 2、某企业生产三种产品的有关资料如下表:(本题13分)
试计算:(1)三种产品的产量总指数及由于产量变动而增加的总生产费用; (2)三种产品的单位成本总指数及由于单位成本变动而增加的总生产费用; (3)结合两因素分析进行简要说明。 解:
(1)三种产品的产量总指数及由于产量变动而增加的总生产费用分别为:
k q =
∑k q ⋅p 0q 0∑p 0q 0
=
111. 25
=111. 25%100
∑k q ⋅p 0q 0-∑p 0q 0=111. 25-100=11. 25(万元)
三种产品的总生产费用总指数和增减的总生产费用分别为:
k pq =
∑p 1q 1115
==115%∑p 0q 0110
∑p 1q 1-∑p 0q 0=115-100=15(万元)
(2)三种产品的单位成本总指数及由于单位成本变动而增加的总生产费用分别为:
k p =
k pq k q
=
115%
≈103. 37%
111. 25%
∑p 1q 1-∑k q ⋅p 0q 0=115-111. 25=3. 75(万元)
(3)结合两因素分析进行简要说明如下:
⎧115%=111. 25%⨯103. 37%⎪
⎨15=11. 25+3. 75⎪⎩
说明:三种产品的总生产费用总指数报告期比基期增长了15%,是因为产量增长了11.25%和单位成本增长了3.37%两因素共同所致;三种产品的总生产费用报告期比基期增加了15万元,是由于产量的增加使得总生产费用增加了11.25万元和由于单位成本的增加使得总生产费用增加了3.75万元这两个因素共同影响的结果。
第五章 抽样推断 一、抽样的含义和特点。
二、重点掌握抽样原理的运用,掌握区间估计的计算方法。
三、掌握抽样推断中常见的几个概念:全及总体和样本总体、参数和统计量、样本容量和样本数、重复抽样和不重复抽样。 四、抽样误差的概念 第六章 相关与回归分析
一、回归分析和相关分析的意义,相关关系的特点以及相关关系和函数关系的区别。 二、相关关系的种类以及判断现象之间有无相关关系的的方法。 三、相关系数的概念和计算,相关系数的意义。 四、回归分析和相关分析的联系与区别
五、应用最小平方法求出Y 对X 的回归方程,理解参数a 和b 的含义。 六、掌握相关系数r 的取值范围以及相关关系密切程度的判断标准。
1、某企业上半年产品产量与单位成本资料如下:
要求:(1)计算相关系数,说明两个变量相关的密切程度.(2)配合回归方程,指出产量每增加1000件时,单位成本平均变动多少?
解:(1)∑x= 21 ∑y=426 r=
即
=—0.9091说明产量和单位成本之间存在高度负相关 (2)配合回归方程 y=a+bx
22
b=(n∑xy ―∑x ∑y)/[n∑x ―(∑x) ]=-1.82 a= -b =77.37
回归方程为:y=77.37―1.82x
(3)当产量每增加1000件时单位成本平均可能下降1.82元。
2
运用最小平方法配合直线,并预测2006年和2008年的产品产量。 解:
设y c =a +bt ∴b =
n ∑ty -∑t ⋅∑y n ∑t 2-∑t 2
=
7⨯789-28⨯182427
=≈2. 18 2
1967⨯140-28
∑ty 61
=≈2. 18 2
28∑t
∑y -b ∑t 182-2. 18⨯28120. 96
==≈17. 28 a =
n 77∑y
=y =26 或a =n
或b =
∴y c =17. 28+2. 18t 或y c =26+2. 18t 预测2006年和2008年的产量资料如下:
y 2006=17. 28+2. 18⨯9=36. 9(万吨) 或y 2006=26+2. 18⨯5=36. 9(万吨)
y 2008=17. 28+2. 18⨯11=41. 26(万吨) 或y 2008=26+2. 18⨯7=41. 26(万吨)
第七章 时间数列
一、序时平均数的计算,特别是由时点数列计算序时平均数时要选对公式。
二、发展速度和增长速度之间的联系与区别,特别是环比发展速度和定基发展速度的联系和区别。
三、平均发展速度的计算方法。
要求:(1)填列表中所缺数字;
(2)计算1997—2001年年平均国民生产总值;
(3)以1997年为固定基期,计算1998—2001年国民生产总值年平均发展速度和
平均增长速度。
(1)填空:定基发展速度等于相应时期内各个环比发展速度的连乘积:
▽ ; 45. 11; ▽; ▽; 61.9
▽ ; 110. 3; 151. 84 84. 67; 106.72 ▽
; 110. 3; 167. 48 141. 81; ▽ ▽ ; ▽ ; 51. 84 -15. 33; 6.72 ▽ ; 10. 3; 67. 48 41. 81; 51.34 (2)平均发展速度(几何平均法)=110。91% (3)平均增长速度 =10。91% 2. 某地区1995~2000年GDP 的有关速度指标如下表:(本题10分)
要求:填出表中所缺数字并列出计算式。
四、采用最小平方法拟合趋势方程。
增减量报告期水平-基期水平= 基期水平基期水平
=
解:
计算式:⑴报告期水平-1=发展速度-1基期水平a 96-1=106%-1=6% a 95
⑵⎛a 97a 96⎫a 97113. 42%⎪-1= ÷-1=-1=7% ⎪a 96106%⎝a 95a 95⎭
⎛a 96a 97a 98⎫a 98⎪ ⑶-1= ⨯⨯ ⎪-1=(106%⨯107%⨯108%)-1≈22. 49% a 95a a a 9697⎭⎝95
⑷⎛a 96a 97a 98a 99⎫a 99⎪-1= ⨯⨯⨯-1=(1. 06⨯1. 07⨯1. 08⨯1. 09)-1≈33. 52% ⎪a 95⎝a 95a 96a 97a 98⎭
⎛a 00a 99⎫a 00146. 87%⎪ ⑸-1= ÷-1=-1≈9. 998%≈10% a ⎪a 99a 133. 52%95⎭⎝95