欢迎来到易发表网,发表咨询:400-808-1701 订阅咨询:400-808-1721

关于我们 期刊咨询 科普杂志

人口统计学变量分析优选九篇

时间:2023-06-01 15:26:34

人口统计学变量分析

人口统计学变量分析第1篇

关键词:竞技体育;教练员;职业压力;压力源

中图分类号:G804.87 文献标识码:A 文章编号:1006-2076(2012)05-0068-05

职业压力问题在国外早已成为研究的热点,而我国关于职业压力的研究迄今尚未成熟,还没有形成特有的“本土化”理论体系。许多研究者对于职业压力问题的理解仍具有一定的局限性,认为职业压力和职业倦怠多发生于人际服务领域,因此研究对象主要集中于教师、护理、医生和管理工作者等职业[1-2],关于教练员职业压力问题一直被人们所忽略,相关领域研究较少涉及。通过检索CNKI中国期刊全文数据库和Elsevier Science外文期刊数据库,发现国内相关文献

甚少,国外研究也不多见。表明体育人力资源管理还未将教练员职业压力问题正式纳入研究。Maslach和Jackson(1984)[3]认为,持续的压力会导致教练员生理和心理上的精疲力竭,最终形成职业倦怠。Dingle(2002)[4]对印地安那州田径教练员的研究显示,性别对其感知到的职业压力无显著差异。而Acosta和Carpenter(2003)[5]研究发现,女性教练员因职业压力有较高离职意愿,得出工作性质、强度在传统性别角色分工影响下女性感知到更多的工作-家庭冲突压力。但同时Burrows(2002)[6]的研究表明,篮球教练职业压力在性别、婚姻和父母地位3变量上无显著差异,表现出结论的不一致性。我国学者顾海勇(2004)[7]认为,足球职业教练员承受的压力是多方面的,其中俱乐部方面、联赛成绩和名次、创新意识、知识水平和指挥能力是主要压力源。许欣(2007)等人[8]经调研证实收入水平高低与教练员工作-家庭冲突程度有显著性差异,积极渗溢和补偿行为对工作满意度有较强预测力。

以上关于职业压力的研究文献,对于研究和认识我国教练员职业压力问题,具有重要的启迪意义。然而,以往零散的教练员职业压力研究尚存在不少的缺憾及不足,具体表现为以下几个方面:1)研究背景:我国与西方的文化背景有着巨大差异,造成了东西方种族价值追求、伦理取向、职业压力等方面迥然相悖。因此,不能将国外的东西直接照抄照搬,而应该加强其“本土化”的研究,更加关注和加强职业压力特征在我国文化背景和组织管理模式下的研究,使以往研究成果与我国实际情况相结合,以真正揭示我国教练员职业压力的跨文化特征。2)研究方法:从依据的研究方法和理论基础看,由于知识及能力偏于一隅,其研究成果也仅是停留于局部定性的描述,或简单的数据罗列分析,缺乏深度及广度的领域拓展。3)研究类型:研究类型只是研究者主观思想观点的阐述和经验总结,而系统的理论分析和实证研究较为匮乏。4)研究内容:研究内容多为现状认识和观点陈述,侧重于表面层次的分析和探讨,特别是研究范围仅局限于工作组织和个体职业压力或职业倦怠一个单独变量上,显得比较片面单一。本研究运用心理学、社会学、管理学的理论,通过问卷调查对山东省“优秀运动队后备人才训练基地”教练员职业压力以及人口统计学变量的差异特征进行实证探究,以希为今后体育领域个体或组织进行压力管理提供理论依据。

研究对象与方法

1.1 研究对象

根据研究内容和样本采集的可行性,本研究主要在山东省济南市体育运动学校、青岛市体育运动学校、烟台市体育运动学校、新泰市业余体育运动学校等59个“优秀运动队后备人才训练基地”(主要考察基层和中层运动队教练员)随机分层抽取278名教练员为被试进行量表的测查;项目包括田径、游泳、举重、摔跤、柔道、跆拳道、拳击、体操、乒乓球、排球、篮球、足球、自行车、射击、帆船帆板、赛艇皮划艇、武术散打、武术套路、手球、射箭、跳水共21个项目。共发放问卷400份,回收312份,经筛查剔除其整份问卷答案成规则作答的,或一个题项选取两个及以上答案的,以及整份问卷漏答题目≥2个的,最后得到有效问卷278份。其中,男性205人,女性73人;年龄30岁以下81人,30岁~40岁109人,41岁以上88人;已婚217人,未婚61人;具有大专学历97人,本科及以上学历181人。

1.2 研究方法

1.2.1 研究工具

1.2.2 数据处理

运用SPSS12.0软件对收集的数据进行探索性因素分析、信效度检验、描述性分析、独立样本t检验、单因素方差分析、事后多重比较等。

2 结果与分析

2.1 竞技体育教练员职业压力总体现状分析

研究表明,有68.9%的教练员压力体验较大或压力感受很大。此数据比国内关于普通教师职业压力的调查数据略高[9-11],且明显高于国外关于竞技体育教练员压力的研究结果[12-14]。

人口统计学变量分析第2篇

[关键词]组织公平感;员工工作卷入;方差分析法;相关性分析

doi:10.3969/j.issn.1673 - 0194.2017.02.054

[中图分类号]C931.2 [文献标识码]A [文章编号]1673-0194(2017)02-00-02

0 引 言

组织公平感一直被认为是影响员工工作卷入的主要因素之一。Masterson和Lewis(2000)提出了组织公平感的三维度结构。Colquitt 等人(2002)验证了组织公平感的四个维度是相互独立的。我国的学者,刘亚、龙立荣、李晔(2003)结合我国国情,提出了四维度结构,即分配公平、程序公平、领导公平和信息公平。工作卷入起源于Allport(1943)对自我卷入和Dubin(1956)对生活兴趣重心的研究。Kanungo(1979)指出工作卷入是指工作能满足个体的强烈需求和期望,是个体对工作的认同。多数研究指出人口统计学变量对组织公平感或工作卷入无显著影响。Brown 等人的元分析结果表明,工作卷入与人口统计变量之间无实际上关系。

虽然研究已比较成熟,但由于以具有时代特性的“90后”员工为研究对象,仍需要实证分析这一群体的人口统计学变量对组织公平感和员工工作卷入的影响,而不能仅凭以往的研究结论做出判定。因此,本文采用问卷调查法,利用SPSS 21.0软件对问卷调查结果进行统计分析,着重探讨了“90后”员工人口统计学变量对组织公平感和工作卷入的影响。

1 组织公平感与员工工作卷入的研究方法

1.1 样本

《2015互联网+时代,就业主力军现状调查报告》指出,互联网行业是“90后”求职的热门选择,2015年“90后”在实际签约行业中占近30%。故选取某互联网公司“90后”员工作为研究对象,共发放问卷200份,回收的有效问卷为171份,问卷的有效回收率为85.5%。

1.2 变量与量表

1.2.1 人口统计学变量

基于文献综述,分别选取性别、年龄、学历、工作年限与职务五方面作为人口统计学的变量,并进行研究。其基本特征如表1所示。

1.2.2 组织公平感与员工工作卷入

组织公平感由分配公平、程序公平、领导公平和信息公平四维度构成。采用刘亚 等人(2003)编制的四维度量表,并对其进行了合理的修缮,构成了组织公平感问卷,共有22个正向题。采用周文霞和李博(2006)修订的9项工作卷入量表,并对其个别表述进行完善,形成了员工工作卷入问卷。二者均通过了信效度检验,能够做进一步的统计分析。

2 组织公平感与员工工作卷入的实证研究

2.1 人口统计学变量对研究变量的影响

根据各人口统计学变量的特征,运用独立样本T检验、方差分析法(ANOVA)及事后检验两种方法,研究样本基本信息的差异对组织公平感与员工工作卷入是否有影响以及影响的程度。

2.1.1 性别差异对研究变量的影响

通过SPSS 21.0独立样本T检验,考察不同性别的员工在组织公平感和员工工作卷入上是否存在显著差异,结果如表2所示。

独立样本T检验结果显示,不同性别对组织公平感各维度、员工工作卷入的概率P值均大于0.05,故接受原假设。这也说明不同性别的“90后”员工在组织公平感和员工工作卷入上不存在显著差异,即性别差异对组织公平感各维度、员工工作卷入无显著影响。

2.1.2 年龄、学历、工作年限、职务差异对研究变量的影响

由于本文中的年龄、学历、工作年限、职务具有多个分组(大于两个),故使用方差法研究其在组织公平感和工作卷入上是否存在显著差异。由SPSS 21.0分析结果得知,仅有“工作年限”变量对组织公平感和工作卷入有影响,具体结如下。

①不同工作年限的分配公平、程序公平和信息公平及工作卷入的概率P均小于0.05,说明工作年限差异对分配公平、程序公平、信息公平和工作卷入均有影响。②基于进一步的方差分析法及事后检验,并结合平均值综合分析得出,工作年限越长则对分配公平、程序公平、信息公平及工作卷入的影响越大。具体的影响方向与影响程度需要做进一步的相关分析。

2.2 人口统计学变量与研究变量的相关分析

采用Pearson相关系数对人口统计学变量与组织公平感、员工工作卷入之间的关系进行分析,结果如表3所示。

相关分析结果显示,人口统计学变量中工作年限与程序公平和信息公平的相关系数分别为-0.157和-0.154,在0.05的显著性水平下相关,且是负相关,这与以往的研究结果有所不同。而其他人口统计学变量的概率P均大于0.05,说明人口统计学变量总体上对组织公平感和员工工作卷入的影响是不显著的。即企业的“90后”员工对企业给予的分配、程序、领导和信息方面的感知是公平的,也认为个人与他人具有相似的工作卷入度。

此外,组织公平感分配公平、程序公平、领导公平和信息公平与员工工作卷入的相关系数分别为0.370、0.329、0.352、0.392,说明组织公平感四维度与员工工作卷入之间具有显著正相关性,其中相关性最大的是信息公平,最小的是程序公平。

4 结 语

“90后”员工人口统计变量对组织公平感和工作卷入影响的实证研究结果表明,人口统计学变量整体上对组织公平感无显著影响,但工作年限对其的程序公平和信息公平维度有较大的影响;人口统计学变量对员工工作卷入也无显著影响,这符合Brown 等人的元分析结论。此外,相关分析结果表明组织公平感及其四维度与员工工作卷入之间存在显著的正相关性。本文为进一步研究组织公平感与员工工作卷入之间的线性回归关系奠定了基础。总之,“90后”员工终将成为就业的主力军,关注其组织公平感与工作卷入的关系,提高其工作卷入度,对构建和谐、稳定的就业关系是至关重要的。

主要参考文献

[1]SD Saleh,J Hosek.Job Involvement:Concepts and Measurements[J].Academy of Management Journal,1976(2).

人口统计学变量分析第3篇

〔实例1〕某调查报告称,某村2001年出生婴儿10人,其中男婴6人,女婴4人,出生性别比高达150,严重失调。

〔实例2〕某乡给某村下达人口计划,其中一项指标是计划生育率,要求当年的计划生育率不低于95%,而该村一般每年出生不足20人。

〔实例3]某地计生委根据群众举报,查出某县一个超生5胎的情况,据此称该县超生问题严重。

〔实例4〕某县总人口不足50万人,近年来在孕妇中推广服用“福施福”。上级要求检查服用“福施福”后,人口缺陷发生率是否逐年下降。还有不少地方把孕产妇死亡率是否逐年下降当作生殖健康服务工作的考核内容。

这几个例子所出现的问题都是以个案或少量发生的情况,说明一个地方宏观的情况。人口和计划生育统计所分析的对象(人口)或事例具有群体性,这个群体是由每个个体的人或事件集合而成。每个个体是否发现这种现象是偶然的,作为表现群体规律的统计数据,只有当群体具有相当的规模后才有意义。群体的规模太小,尽管对每个个体的统计是准确的,指标的计算也是正确的,但计算结果并不能客观地反映群体的规律。

如实例1,一个村的出生人数仅为10人,计算的出生性别比要么是100(“绝对平衡”),要么就是男女比例严重失调。实例2中计划生育率受出生总数的影响,要么计生率正好100%,只要有一个计划外出生,计划生育率就低于95%。例4涉及的出生缺陷发生率或孕产妇死亡率一般统计时均以10万作为分母,对于一个县,每年出生几千人或1万多人,即使按照出生缺陷、孕产妇死亡发生的平均水平,每年也只有几例,偶然性很大,在统计数据上很难表现为逐年下降。至于例3,以一个特例说明全县的情况,更是欠妥。各种人口和计划生育统计教材上并未说明各项统计指标适用的人群至少要达到多少,但一般说来这些统计指标绝大部分不能用于分析规模在几百人到一千多人的村级情况,许多指标在县、乡级使用也不太合适。多年来各级是通过报表收集人口和计划生育统计数据。报表由上级制发,基层单位按统一的口径填报每个项目,然后逐级汇总、上报。这样以来,上、下级的报表式样相同,只是数量大小有差别,于是,上级单位计算哪些指标,下级单位“照葫芦画瓢”计算相同指标。特别是实行人口与计划生育目标管理责任制后,各项工作任务和责任要逐级分解、落实,相应地,工作指标也被层层分解,上一级控制的指标(如出生率、计划生育率)也被一直套用到基层单位。在这种情况下,群体性的要求很容易被忽视。

2自然属性与社会属性

〔实例5〕1995年8月,在全国上半年人口形势分析会上,某省计生委分析本省当年上半年二孩出生数量比上一年同期减少的原因时称,由于自当年起全省广泛推行“三结合”,许多群众为了发家致富,主动退出二孩指标,于是二孩出生明显减少。笔者的同事立即对此理由提出了置疑:既然是主动退出二孩指标导致二孩出生减少,那么原来应在1995年上半年生育二孩的妇女至少在1994年上半年就应退出二孩指标,而那时候,该省并未开展计划生育“三结合”;至于1995年上半年开展“三结合”后退出的二孩指标,其二孩出生减少的效果应在1996年以后才能表现出来。群众退出二孩指标与二孩出生数量的减少在时间上出现了“矛盾”。

〔实例6〕许多文章分析妇女受教育程度越高,生育的孩子越少。

这两个例子说明分析人口出生数量的变化应考虑人口的自然属性和社会属性。人口首先是生物意义上的人口,具有自然属性,同时,人口生活、存在于一定的社会环境中,具有社会属性。人口现象的发生既受自然属性的影响,也受社会属性的影响。从根本上说,社会属性对人口现象的影响和制约是有条件的、间接的。而自然属性的影响和制约是无条件的、直接的。社会属性的影响和制约常常要通过自然属性来实现。在分析人口现象的时候,首先要解释人口的自然属性,然后再解释社会属性。就实例5而言,从妇女退出二孩指标到二孩出生减少,至少间隔10个月,即妇女的怀孕期,无论推行“三结合”力度多大,妇女10个月的怀孕期不能缩短。退指标的发生与出生数的减少在时间上不“同步”,至少要“滞后”一年。也就是说,1995年上半年因开展“三结合”妇女退出二孩生育指标不会影响这个时期的二孩出生数量。关于实例6,一个人的受教育程度属于社会属性,妇女受教育水平提高,的确会影响其生育行为。然而,影响生育的自然因素,直接因素是避孕节育行为,具体地说,影响生育的生物因素包括推迟结婚(不发生)、采取避孕措施和流产(终止妊娠)。妇女文化程度影响到上述生物因素发生变化(如文化程度高,能够更好地掌握避孕知识,可以提高避孕的有效性,减少怀孕的可能),并通过上述因素影响生育孩子的数量。直接讲文化程度与孩子数量的关系,未免有些牵强。

3定量与定性

〔实例7〕各地每年都要分析当年的人口形势,将当年的数据与上一年的数据进行对比。许多分析报告在列举了对比数据后得出结论:“今年的工作比上一年有明显的进步,取得了巨大的成绩,上了一个新台阶”。但如果我们仔细察看各项指标的数量,发现变化并不大,如计划生育率由88.5%上升到89%,出生率由15.4‰下降为14.9‰(这其中由于人口年龄结构的变化也能导致出生率下降),多孩出生由165人减少为149人,多孩率由2.2%下降为2%等等。根据这些数据的变化,得出的定性结论应当是:“工作稳步发展,人口增长保持平稳的态势”。人口和计划生育的统计分析主要是指对数据的分析,并由“定量”的描述引申到定性的判断。如果忽视定性的分析,那么,所谓定量分析不过是数量变化的文字描述而已。把握好定性分析的关键在于,定性分析应以定量分析为基础,即“定量”在前,“定性”在后。那种先“定性”,再计算数量变化的做法,违背了“定量”与“定性”的基本规律。这样进行的定量分析,只是给定性的结论加一些数量的点缀。

4模糊和精确

〔实例8〕某地区的一份材料称,根据20年来每年总和生育率的变化,推算本地区20年来少生了1831275人。

〔实例9〕某县计生委利用农村赶集日人口比较集中的机会,出动服务车,设置咨询台,向群众宣传计划生育知识,提供咨询服务。县计生委的汇报材料称,“一个月来在集日上接受宣传、咨询的群众累计达到127328人次”。

乍一看,实例8和实例9中的人数和人次数的统计和计算十分认真仔细,数字如此精确,令人钦佩。但转念一想,不免生疑:实例8中利用总和生育率计算少生人口,需要以年龄别生育率与分年龄妇女人数相乘计算出生人数,一般来看,每个年龄组的计算结果都不会是整数,只好四舍五入。每一年若干个年龄组累计下来,个位数已经含糊不清了。再把20年的少生人数累计起来,怎么可能精确到个位数呢?况且20年间,该地区的人口并非处于“封闭状态”,各年龄组人数因为人口迁移而变化,也会影响到计算少生的数量。至于实例9,在一个开放的、人们频繁走动的集市上,如何判定哪个人接受了宣传,哪个人接受了咨询,并没有一个客观的标准;即使有标准,实际操作中也很难把握,因此,根本没有可能逐人统计。实例8、实例9中看似精确的数据令人感到滑稽,倒不如模糊一些,说“20年大约少生了18万人”,“一个月在集市上接受了计划生育宣传、咨询服务的人次达10余万”,或许有几分可信。从某种意义上讲,人口和计划生育所涉及的是宏观层面的事情,与此相应的统计数据所反映的是大致的状态或趋势,没有必要也没有可能做到精确。许多同志在应用统计方法时,往往注意的是方法本身的定义和计算过程,而对计算中数据的来源不了解。人口和计划生育统计属于社会经济统计范畴,很多数据是通过抽样调查获得,允许有一定的误差;即使是全面的调查(如人口普查、全局报表),在实施过程中,也会遇到这样、那样的干扰或影响,存在着调查误差,这是无法完全避免的。从某种意义上讲,数据存在一定的误差,这是人口和计划生育统计的特点之一。

5原因与结果

〔实例10〕最典型的例子莫过于“人口出生率每降低1个千分点,人均GDP提高多少个百分点”的说法。这种说法的依据是利用相关分析法对全国各省的人口出生率和人均GDP的数量变化进行计算,得出二者之间的函数关系式和相关系数。把人口出生率作为自变量,看自变量的单位变化影响因变量(人均GDP)变化的数量大小。

在这个例子中相关分析法本身以及有关的数据都是正确的,然而,用这样一个函数式来解释人口增长与经济增长的相互关系是有问题的。其一,就统计方法来说,相关分析只反映变量之间的相关关系,而不说明因果关系;其二,人口增长与经济增长固然相互影响,但从本质上来说,是经济发展影响人们的思想,进而影响人们的生育行为,最终导致生育率下降,人口增长率降低,即经济增长是“因”,而人口增长是“果”。颠倒了因果关系,不仅逻辑上讲不通,数量上的“相关性”也失去了意义。

笔者在多年的工作中体会到,由于人口和计划生育所具有的特点,人口和计划生育统计分析方法的应用和统计数据的解释有别于其它部门和领域对于统计的一般要求。正确地应用统计分析有助于我们认识人口和计划生育的特点和规律,只有科学地认识和把握人口和计划生育的特点和规律,才能避免在统计分析中陷入误区。

社会科学实证研究中的统计分析方法应用

郑真真(北京大学人口研究所副教授)

统计学的应用随着微型计算机的普及越来越广泛,在社会科学实证研究中几乎是无处不在。有了一定规模的数据和一个统计分析软件,就可以很方便地进行各种估算和分析。然而由于统计分析方法本身并不像加减乘除那样简单,而一些统计分析软件已经发展到几乎是人人都可使用的程度,如果使用者在只知其然不知其所以然的情况下操作并得到结果,可能出现对统计分析方法误用或滥用的现象。本文仅对一些统计分析中比较常见的问题进行讨论,以引起各方面的重视。

1描述性统计

描述性统计是社会科学实证研究中最常用的方法。准确、全面、正确的描述是所有实证分析的基础,如果对某个事件或某种现象的描述不清楚或存在偏差,那么其后的所有分析都将是值得怀疑的。一项研究能够将所研究的现象或对象描述清楚,就是一个极大的贡献;而描述的偏差可能会引起公众或学术界对某些社会现象的误解,甚至误导政府决策。但是因为描述性统计所用方法简单易得,往往没有得到足够的重视。

均值的局限普遍用于描述样本集中趋势的测量之一是均值。它对于近似正态的对称分布样本来说是比较好的测量,对于不对称分布则不然,尤其会受到极端值的影响。两个分布完全不同的样本可能会有相同的均值,因此均值在某种程度上抹杀了样本内部的差异,而往往这种内部差异正是需要我们进行深入研究的、或应当引起人们注意的。为了弥补均值的这个缺陷,一般在报告均值的同时也报告方差,或用直方图/散点图的形式描述分布,以提请读者注意群体内部的差异。

不同群体的可比性在描述性统计中,往往涉及到对不同时期或不同人群的总体描述,以反映社会变化或地区差异。在社会科学中、尤其是人口研究中,不少事件的发生都是与年龄密切相关的,如我国妇女大部分在35岁以前完成了生育,从而导致35岁以上育龄妇女中极高的避孕现用率。在这种情况下,两个样本之间存在避孕现用率的差异可能只是年龄结构的差异,而不是年龄别避孕现用率的差异。又如在报告流动人口犯罪问题时,给人的印象往往是流动人口犯罪率高于常住人口,但忽视了流动人口的年龄和性别构成与常住人口完全不同,且青年男性是犯罪率较高的人群。这种对两个不同群体的比较往往会导致错误的结论。

绝对数的使用由于中国人口数量巨大,调查研究也比较容易得到大容量的样本,所以对任何小概率事件用绝对数报告都会出现惊人的巨大数字,单纯对绝对数的强调往往会产生戏剧性的效果。比较合理的方式一般是在报告某事件绝对数的同时,给出该事件的发生率或占研究人群的比例。

小样本的代表性在一次抽样的小样本中求得的率或比例会非常不稳定,与另一次抽样的结果可能会有较大差距。因此当研究仅限于从小样本获得的资料时,应当在报告比例的同时也报告样本量。

2双变量统计分析

在社会科学研究中,首先分析的往往是两个变量之间的关系,如用相关或列联表等方法。一般在确定两个变量之间确实有某种关系,如在经过统计检验后证实两变量有显著相关关系,进行更进一步的分析才有意义。因此,双变量统计分析在实证分析中占有重要地位。但是,由于在应用中对有些问题的忽视,双变量统计分析也很容易出现偏差或错误。

卡方检验的局限在利用列联表对两个定序/定类变量进行相关分析时,需要进行统计检验来判断两个变量的相关是否有统计上的显著意义。不少研究结果都用卡方检验的显著性报告相关状况。但值得注意的是,卡方统计量的计算本身是有局限性的,样本越大,卡方值就会相应增大,因此大样本的卡方检验很容易得到显著结果。所以一般在报告卡方检验结果以说明两变量是否显著相关时,还应当同时报告相关强度,即相应的相关系数,如Gamma,Lambda等。

统计意义上的显著与差别的实际意义在检验两个定距变量的均值差别是否具有统计上的显著性时,也存在相似的问题。由于样本量越大,样本均值分布的方差就越小,因此常用的t检验结果就越可能显著,任何细微的差别都可能有统计上的显著性。但有时具有统计意义显著性的差异,在实际生活中可能意义并不大,如同在两个草堆之间找出一根草的差距,对判断两个草堆的大小没有实际意义。因此,对任何检验结果都应当有符合实际的解释和说明。

虚假相关问题双变量分析中的虚假相关问题,几乎在所有关于社会科学研究方法的教科书中都会涉及到,在统计分析方法的教学中也被视为经典问题。但是多少年来,人们仍然在不断地重复着这个“经典的错误”,即认为可见的或统计检验结果显著的相关就是真正的相关;更为大胆的做法是把这种相关关系推向因果关系。我们知道,对于有的变量来说,即使是经过检验判定两者具有统计上显著的相关关系,也不一定存在实际意义上的关系,因为可能有未考虑到的变量或不可测量的变量在同时对两个研究变量起作用,有时甚至可能完全是偶然的巧合。例如,火灾的大小是以火灾损失来衡量的,而参加灭火的消防员人数是与火灾大小有关的,火灾越大,出动的消防员就越多,但凡是具有常识的人都不会根据出动消防员人数和火灾损失两个变量之间的高度相关,断定出动消防员越多火灾损失就越大,因为火灾的规模是决定因素(但很难直接衡量)。在有关人口科学研究中也有报告虚假相关的现象,如人口增长率的降低导致了经济增长的提法就是一例。因此,在分析相关关系时,应当根据理论、知识、经验、甚至常识来判断这种分析是否有意义、是否存在其他变量的作用(称为外在变量),避免得出有悖于常理的分析结果。有些虚假相关是可以通过统计分析方法判别的,如在控制了另外一些变量后观察两个变量的偏相关,或在双变量分析的基础上,进一步用多变量分析深入研究。

3多变量分析

回归分析是多变量分析中应用最多的方法,尤其是逻辑斯蒂回归更是被广泛地应用。在众多应用中,比较明显的问题是使用方法是否得当和对结果的报告和解释是否规范、合理(见2002年第2期《人口研究》刘金塘文)。此外还有一些应当引起注意的问题。

分析框架的重要性在社会科学研究中,各变量之间往往存在错综复杂的关系,如果在进行回归分析之前没有一个清晰合理的分析框架,那么回归的结果有可能会引起质疑。一般应在报告回归分析结果之前,介绍该分析的框架,如各变量的定义、各自变量与因变量的假设关系及其理由等,对建立的回归模型做出合理性论证。有一些变量可能是作为控制变量纳入回归模型的,如性别、年龄等,最好事先解释清楚。对假设因果关系的模型,应当至少能够说明:(1)该因果关系在理论上是正确的、在实践中是合理的;(2)从事件发生的时间上来说,应当是原因发生在先、结果发生在后。如有些回归分析中,未加说明即把所有与因变量显著相关的变量都囊括在自变量中,甚至有些自变量与因变量有明显的互为因果关系,显得分析逻辑混乱;还有的论文在简单介绍研究背景和数据来源之后,急于建立因果关系并推出回归分析结果,然后再根据各变量在回归模型中的显著性一一说明,这相当于事后解释;这些做法都是错误的。

在具备“奔4”微机和较易操作的软件的今天,转瞬间就可完成一次回归分析,但是在此之前,需要有大量的前期准备工作,包括文献检索和理论框架构建,才能确保统计分析的科学性。

分析方法应用的条件每种多变量方法都有各自的前提条件或假设,如果这些条件不具备或者假设不成立,该方法的应用就成问题。如Pearson相关是考察线性相关关系,多元方差分析只能辨别线性相关因变量的多元差异,线性回归分析假设自变量与因变量之间为线性关系,因子分析方法也是建立在各变量具有一定的线性相关基础之上的;另外,在逻辑斯蒂回归中,每个分类都应保证有足够的频数,如果频数太少就会影响参数估计的稳定性;等等。尽管一般不在报告分析结果时说明各种假设是否成立或条件是否满足,但是在进行分析时应当自觉地进行考察。如果不能满足条件或假设不能成立,就对数据进行转换或调整后再分析,或者改变分析方法。

多变量分析结果的展示和解释多变量分析的结果一般是通过列表来展示的。现在一种并不少见的做法是直接把统计软件的输出直接复制到论文中,我们往往会在文章中看到包括回归参数估计、参数标准差、检验统计值、检验显著性、偏相关系数等等n行m列的大表,使人有目不暇接的感觉。实际上参数标准差和检验统计值是提供给分析者的信息,没有必要列在结果中;如果不是有特别需要的话,偏相关系数也不是关注重点;最主要的应当是回归参数估计及其显著性。

在列出分析结果之后,应当对结果的实际意义进行解释和讨论,而不是复述分析结果的数学意义。此外,在多元统计分析中一个常见的问题是分析者对变量作用不具有预期统计显著性的失望,因此绕开不显著的变量,甚至对数据或模型进行各种调整以获得显著结果。其实,统计分析结果不显著往往也是有实际意义的。例如在分析我国高龄老人的地区分布时发现,高龄老人比例与当地医疗卫生指标没有显著关系,这说明我国医疗系统还没有具备延长老人寿命的功能;另一方面也说明这些高龄老人的存活不是主要靠医药维持的。所以,在解释分析结果时,只要是在分析框架中涉及并参与分析的变量,无论作用显著与否,都应当给予充分的讨论;对于那些由于知识或信息的限制难以下结论的结果,可以作为问题提出,以便进行更有针对性的进一步研究。

此外,任何方法都有其局限性,分析结果也不会十分完美。因此在讨论结果的同时,也应当就此向读者说明。例如当一个多元线性回归分析的确定系数较低时,需要指出该模型有限的解释能力,探讨可能存在但没有纳入分析的更重要的影响因素。

不必求最新、只求最合适有些研究生在撰写学位论文时,常常因为自己没有应用最新的统计分析方法而感到忐忑不安;在评论某项研究的创新性时,有时也出现把学术创新和应用新方法混为一谈的现象,例如认为应用描述性统计方法的研究水平低于应用解释性或预测性方法的研究。新方法是层出不穷的。但是,出现了新方法并不意味着传统方法就不再适用,而是各有千秋。统计分析方法是工具,哪件合适就用哪件,能用锤子解决的问题不必开冲床。有时越是复杂的方法,假设条件也会相应较多,应用的局限性更大。因此,盲目追求方法的新颖并不是高水平研究的保证,真正需要注意的是使用最合适的方法。而对所用方法的真正了解,是正确运用统计分析方法的前提。

总和生育率的内在缺陷及其改进

郭志刚(北京大学社会学系、北京大学中国社会与发展研究中心教授)

1总和生育率的应用目的及评价原则

年龄别生育率及其概括性指标总和生育率(TFR)是生育研究中最常用的指标体系。但是现在它们面临很多实际问题。本文不讨论出生漏报导致统计失实的问题,因为其性质并不在于统计方法,而是一个社会问题。本文只局限于这一指标体系内在的有效性问题的方法论讨论。一个指标是否有效应该以研究目的为标准来判断,因此这一讨论将结合当前实际工作的需要来进行。

统计指标有两种功能:一种是对调查对象本身特征的直接描述,另一种则用于推断估计。很多情况下,统计指标同时承担着这两种功能,比如样本统计量反映了样本对象的特征,同时又服务于推断估计总体参数。既然是一种估计,自然会有推断偏差或误差。评价不同估计的优劣是看谁的偏差或误差更小。

那么通常我们应用TFR到底要反映什么?一是为了在控制育龄妇女结构的条件下概括时期生育水平,二是作为终身生育水平的估计。(注:在这一方面,总和生育率与人口的粗再生产率和净再生产率的性质类似,后两个指标中只不过又控制了下一代的性别和死亡因素的影响而已。)两种性质都反映在各年龄组生育率的合计上。通常,不同基数的相对数指标不可以直接相加(注:如男性平均年龄加女性平均年龄没有意义。)。为什么年龄别生育率可加,是因为设置了假设队列的概念。TFR主要不是平均的概念(注:早期将其翻译为平均生育率的确是错误的。至于年龄别生育率对妇女其他差别所做的均质假设,其实存在于所有汇总指标之中,而不论其分组有多细,但是都不会因此而称为“平均××率”。),而是总和的概念(即假设队列经过所有年龄后生育总和)。因此,TFR一身兼两任,其内容为时期生育率总和,其形式为队列终身生育水平。从前一种意义上使用时描述了该时期生育水平,从后一种意义上使用时则是假设队列终身生育水平的估计(注:但这种估计从原理上不同于一般统计量从样本推断总体的情况,但有关评价原则却是类似的。)。其值实际上涉及了35个实际队列,并且只有在生育水平及年龄模式长期不变的苛刻条件下,它才真正与实际队列终身生育水平相吻合(但是队列仍是泛指的)。尽管这一假设队列与真实队列并不能很好对应,但起码可以及时提供一种队列终身生育的估计来满足实际需要。

2缺陷一:总和生育率对终身生育水平的背离

表现A:最早对TFR的批评是由于其剧烈的时期波动。一逢时期突发事件(如中国1958~1961),实际生育量发生了变化,TFR就会大幅度下降。应该说,批评并不是指向其描述时期生育水平的功能,而是指向其作为终身生育估计的功能。因为,这时TFR的下降只是由于时期特殊原因影响,并不意味着终身生育水平真的下降。实际上,时期效应一过,TFR马上便会出现反弹(即常说的生育补偿),然而反弹的水平也并不能标志终身生育水平真的那样高。总之,TFR短期内剧烈波动时,将其作为终身生育率估计来理解很成问题。其中最引人注目的是,反弹年份的分孩次TFR(i)会超过1,特别是一孩TFR(1)会大大超过1(注:1982年全国1‰人口生育率抽样调查数据显示(姚新武,1995),1963年TFR=7.463,其中各孩次TFR都大于1,最高的是TFR(1)=1.568。作为队列估计,即是说每人生育一个半一孩,显得很荒唐。)。人口统计学对此采取的对策是,避免采用这些年份的TFR来作为终身生育水平的估计,或者采用若干年份的TFR的平均值来作为终身生育水平的估计,希望将欠年与盈年的误差相抵消。

表现B:然而,有时即使社会中似乎并没有什么特殊事件,TFR也会背离终身生育水平。但是,往往只是在TFR提高时才会受到一定关注(注:如1983年左右中国人口学界对TFR的讨论。)。理论分析可以证明,这种背离既可以是正的,也可以是负的。特别是在负偏离的情况下,往往可能持续较长的时间。并且,这种负背离实际上正是当前所面临的实际情况,因此特别需要重视。

这种背离产生的原因是婚育年龄的变化,或者说是队列的年龄别生育模式的改变。而负偏离则对应着婚育年龄的推迟。与时期突发事件对婚育年龄的推迟的暴发性影响不同,生育模式的自身转变具有较长时期的持续性、变化上的渐进性、现象的隐蔽性等特征,并且它并不一定伴随生育补偿现象。甚至有时人们根本没有意识到这种偏离的存在。

人口统计学早就揭示出,晚婚晚育可以延缓人口增长,但这是从长期人口发展的角度来证明的。而晚婚晚育对年份TFR有什么影响,则很少有人涉及。从理论上说,取得同样的终身生育总量,可以有不同的进程表。即假定各队列的终身生育数量不变,从某一时期开始各队列的生育年龄开始推延,这一过程可以持续较长一段时期,直至最终稳定在一个新的生育模式上。我对此做过一些模拟计算,在这种情况下,生育模式转变时期中每年的TFR一定会低于事先所设的队列终身生育量,而这段时期两端及以外各年份的TFR则可以等于事先所设的终身生育水平。这表明,即使将整个转变过程或更长时期中各年的TFR都加在一起平均,得到的还是—个偏低的终身生育估计。

更普遍的情况是生育模式的变化与终身生育量的变化同时发生,这时TFR下降同时受这两个因素变化的影响,由生育模式变化导致TFR对终身生育水平的偏离便较难分析。

实际问题:实际工作需要不允许我们等很多年再提供真实队列终身生育统计,而现在只有TFR一种估计方法,并且我们知道TFR还会经常偏离队列终身生育水平,因此急需寻找一种更好的估计来取代它。否则尽管当前TFR的值虽然很低,即使不论统计失真问题,我们也不知道这是否仅仅反映TFR发生了负偏离,那么我们凭什么肯定生育率已经下降到更替水平了。我们又怎么能知道,当生育年龄推迟告一段落时,TFR向终身生育水平回归时会回升多少。要知道更替水平的真正概念是实际上某队列与其终身生育后代数量的比(注:从这个意义上,净人口再生产率等于1仅是一种时期估计的标准,并且也服从上述偏离,并不是真正的更替水平。)。

有关改进:Bongaarts和Feeney(1998)提出了去进度效应总和生育率(TFR'''')。该方法旨在提供一种根据时期数据对终身生育水平的较好估计(注:Bongaarts和Feeney(1998)警告说,这一方法不适用于那种特殊时期效应(即重大灾害等)的年份。)。郭志刚(2001)对此进行了介绍,并用中国多年生育数据对该方法进行了检测和评价,结果是TFR''''作为终身生育水平的估计的确大大优于TFR(注:郭震威(2000)认为TFR''''不伦不类,既不是时期生育指标,又不是终身生育指标,是个尴尬的指标。我认为,它只是应实际需要而产生的另一种根据时期生育信息对终身生育水平的新估计而已,其实这没有什么可尴尬的。统计中凡是不能直接测量的时候,都得采用估计来代替。真正有意义的问题是,它是否比传统TFR更接近于终身生育水平。)。

该方法基本原理可以这样来理解:现实中生育模式转变时,除了导致该年生育数量有所变化以外,还会有其他共生现象,如分孩次的平均生育年龄(MACi)也会变化(注:Bongaarts和Feeney(1998)强调要用分孩次的平均生育年龄,而不能用总的平均生育年龄,因为后者会抹煞实际变化。)。MACi实际上是生育模式转变的测量值,可以在理论上建立其变化量与时期生育变化量之间的函数关系。TFR''''便是在常规分孩次TFR(i)的基础上利用MACi的变化信息来调整,得到去进度效应的分孩次TFR''''(i),然后再汇总为TFR''''。经过调整,TFR''''可以在相当程度上修正TFR距终身生育水平的偏离,因此TFR''''更接近于队列终身生育水平(这里队列仍是泛指的)。也就是说,我们可以用TFR''''来替代TFR原来所承担的终身生育估计的功能,而TFR还可以继续承担描述时期生育水平的功能,TFR''''与TFR之差可以作为生育推延对当前生育水平影响的估计(注:我曾当面请教Bongarts,问TFR''''方法是否可应用于预测模拟,他毫不犹豫地回答说不能。)。

我认为,尽管TFR''''指标还有继续改进的余地(注:比如某一年的MACi的计算还要前一年和后一年的数据,因而多少丧失了一点及时性。然而,我自己曾尝试过另外的计算,比如只用前一年和当年两年的信息,调整的结果也并不差。),但显然Bongarrts和Feeney为解决这一估计问题指出了极富于科学价值的方法论途径。并且,这一新指标不仅可以用于监测队列终身生育水平,也可以用于分析以往的生育数据(郭志刚,2000),帮助我们更好地理解我国的生育转变史和计划生育史。

3缺陷二:总和生育率不能控制育龄妇女的孩次结构

对某些重要因素进行统计控制可以为不同年份或不同地区的比较提供更大的可比性。尽管TFR控制了育龄妇女的年龄结构,但是它并没有控制育龄妇女的孩次结构。然而,当前许多人口模拟研究都不能再忽略育龄妇女的孩次结构问题,否则会有损其研究结果的有效性(注:比如,与调整生育政策相联系的人口模拟如果忽略现有一孩的妇女人数,便无法计算由于多年积累在一孩的这批妇女在政策调整时将产生的特殊生育效应。另外,有关生育政策后果方面的研究(如四二一家庭结构)也有类似问题。)。

问题的表现:实际上生育过程是严格的递进事件,也就是说,只有未生育者才能生育一孩,只有生育过一孩且尚未生育二孩者才能生育二孩。而常规生育率则是以年龄别所有妇女总数作为基数,因而没有容纳育龄妇女的曾生孩次信息,也就不能控制曾生孩次这种结构影响。因此,比较孩次结构差别较大的年份或地区之间的年龄别生育率(或TFR),便不能区分其差异到底是出于生育水平不同还是出于孩次结构不同。当其用于人口预测模拟时,如果假定两地区育龄妇女年龄结构相同,同样的系列生育率的假设会导致孩次结构十分不同的地区(代表着不同生育政策类型)将会有相同的出生人数,显然这严重地偏离实际情况。因此,面对当前的许多研究需要,基于年龄别生育率的TFR方法无论是用于比较分析上还是用于预测模拟,都会影响其结果的有效性(注:至于分孩次的年龄别生育率,只是对分子(即出生)划分了孩次类别,但是并没有对育龄妇女本身划分孩次结构。其基数没有控制孩次结构,因而从本质上说也没有控制孩次结构。)。

替代方法的产生:实际上,计划生育采取了分类指导原则后,便产生了多种生育政策类型,其显著特征便是孩次控制上的不同。在不同地区实施不同政策时,育龄妇女的孩次结构便取得了越来越重要的意义。从这一角度出发,导致Feeney(1985)和马瀛通等(1986)分别以不同思路创建了孩次递进生育指标体系。

他们的共同点在于采用孩次递进比作为生育测量的基础来构建指标体系。如前所述,每年的出生可以划分孩次。如果再将某一群体生育指标的基数由对应口径的年中妇女总数换成年初对应(即前一)孩次妇女时,便称为孩次递进比(注:实际上可理解为一种概率,如本年年初某年龄组(或孩次间隔组)只有一孩的妇女中在本年生育二孩的比例。)。然后,还可以将孩次递进比换算成递进总和生育率。

Feeney的模型突出地考虑了孩次递进间隔因素,不考虑年龄结构,因而常被称为间隔递进模型。而马瀛通等的模型则突出地考虑了年龄递进因素,因此常被称为年龄递进模型。

这两种方法不仅可用于在控制妇女孩次结构条件下的比较分析,也可以用于预测模拟(注:应该指出,其实中国人民大学人口研究所的老一辈人口学家早在1970年代所自行创建的标准(或可变)生育率预测法中也已经包含了控制孩次结构影响的思想(刘铮、邬沧萍、查瑞传,1981)。)。递进方法不仅可以在预测中控制孩次结构,而且应用于模拟预测时实际上比常规生育率方法更方便(注:这里的方便指,它只需要每年期初妇女的孩次别人口数便可以直接乘以递进比便得到对应的生育量,而不需要再计算其中妇女人数。)。由于递进比的概率性质,还能根本避免孩次别总和生育率出现的那种超过1的现象(注:尽管如此,Bongaats和Feeney(1998)认为这一类应用生命表方法的生育指标仍然没有真正控制生育进程变化的影响。)。

主持人评论

本期论坛邀请的三位专家都有多年从事人口统计和数据分析的经验,对人口学研究方法有很深的造诣。王谦副司长通过从多年工作中积累的大量实例,分析了在人口和计划生育工作中经常发生的统计方法和统计数据被误用的情况;郑真真副教授则对统计分析中比较常见的问题进行丁独到的分析和总结;郭志刚教授对总和生育率指标进行了深入全面的剖析,分析了其内在缺陷和改进方法。

王谦副司长通过10个典型实例说明在人口和计划生育实际工作中,统计方法和统计数据在五个方面经常被误用。这五个方面的问题有些属于统计分析中容易犯的错误,带有普遍性,如,错误地解释变量之间的因果关系,在统计分析中忽视定性分析与定量分析的关系,结论不是由统计分析中得出,使得定量分析只是定性结果的一种点缀。有些问题则由于人口与计划生育领域的特点而显得更为严重,如他指出的,大部分人口和计划生育统计指标在村一级或县、乡不适用是因为总体规模不够。统计所研究的是总体的数量关系而不是个别的数量关系,所以统计指标在一定的总体规模下才有意义,这是统计学中的基本概念,但是在实际中却经常被误用。我们经常看到的错误都是统计学上的一些“基本概念错误”,而不是“高深错误”。统计学上的概念和方法可能很简单,也容易理解,但是要在实际工作中正确地、恰如其分地运用并不容易,需要结合研究对象的特点。

郑真真副教授从另一个角度对描述性统计、双变量统计和多变量统计分析中经常被忽视的问题进行了讨论和分析。她不仅指出了问题的所在,而且告诉大家应该如何做,她所讨论的内容是大部分统计教科书上所没有的,具有很大的实用性,对于正确地应用统计分析方法具有很大的指导意义,具体的问题这里就没有必要再评述了。她的分析源于多年教学和科研工作的总结和升华,很多观点具有独到性,如对描述性统计的重视,多变量分析结果的展示和解释,不必求最新、只求最合适的方法。

王谦和郑真真从不同角度对统计分析和统计数据应用中出现的问题进行了分析,郭志刚教授则对人口统计中的一个重要指标-总和生育率进行了深入分析。他指出指标是否有效应该以研究目的为标准来判断,他从总和生育率对终身生育水平的背离和不能控制育龄妇女的孩次结构这两大缺陷出发,对问题的表现形式、实际工作中的需求以及改进方法进行了分析和介绍,其中渗透了他自己近年来对这一问题的研究结果和体会。我看完他的文章觉得获益匪浅,如90年代以来中国的人口调查所得到的总和生育率指标都非常低,这里面有统计漏报的问题,也有总和生育率指标自身的缺陷所带来的问题,在婚育年龄推迟时,总和生育率会低估终身生育水平。在以往的人口学研究中,对方法论的讨论和重视是不够的。研究方法的创新源于实践的需求,面对21世纪更加错综复杂的人口问题,我们需要研究方法的不断创新与发展,这是目前我国人口科学发展面临的一个巨大挑战。

三位专家的分析和讨论有很大的实用性,值得从事人口和计划生育的实际工作者和学者认真学习,但是毕竟他们不可能把所有的问题都归纳概括全面,这也不是本期论坛的初衷。我们希望通过本期论坛起到抛砖引玉的作用,引起同行对这一问题的重视。中国规范的人口学研究毕竟只有20多年的历史,有问题是可以理解的,统计分析方法的误用和研究的不规范在其他学科领域也同样存在,甚至有可能更严重,但是我们不能漠视这种状况继续下去,问题的解决需要全体同仁的重视和努力。我觉得目前至少可以加强以下几个方面的工作:

(1)提倡学术争鸣,鼓励同行之间开展批评,这将有利于学科的发展与规范;

(2)编审人员把好质量关,使在杂志上发表的文章符合学术规范,杂志上文章的示范作用往往比教科书要大得多;

(3)加强统计分析方法的教学工作。强调方法的适用性和在实际应用中应该注意的问题。

认识人口与计划生育统计的特点避免统计方法和数据的误用

由于工作关系和职业习惯,笔者对各种各样有关人口和计划生育的工作报告、分析文章中的统计方法和统计数据比较关注,经常可以发现统计方法和统计数据被误用的情况。本文通过一些实例,分析由于不了解人口和计划生育的特点而造成统计方法和数据误用的情况。

【参考文献】

1刘铮,邬沧萍,查瑞传.人口统计学.中国人民大学出版社,1981

2马瀛通,王彦祖,杨叔章.递进人口发展模型的提出与总和递进指标体系的确立.人口与经济,1986;1,2

3姚新武.中国生育数据集.中国人口出版社,1995

4郭震威.对“去进度效应总和生育率(TFR'''')方法”的一点看法.人口研究,2000;1

5郭志刚.从近年来的时期生育行为看终身生育水平.人口研究,2001;1

6郭志刚.时期生育水平指标的回顾与分析.人口与经济,2000;1

7Feeney.1985.Parityprogressionprojection.InternationalUnionfortheScientific

StudyofPopulation,InternationalPopulationConference,Florence1985,vol.4

人口统计学变量分析第4篇

关键词: SPSS统计软件 日常教学统计分析 应用

在目前中国的教育体制中,考试仍然是判断学生成绩好坏的重要手段,教师常需要进行诸如考试成绩等的统计分析,但是从信息的采集、分析、处理、显示到记录整个过程一般都要花费较多的时间,因此难以及时获取反馈信息用于适时调控教学。近年来,由于计算机的广泛应用,各种统计软件应运而生,SPSS统计软件能够代替传统的手工计算方法,可以轻松进行总分、平均分计算等多种数据统计和分析,方便快捷。下面就以高三第一次月考的成绩为例,介绍该软件在日常教学统计分析中的应用。

1.数据输入

启用SPSS,软件将自动打开数据编辑窗口,单击“Variable View”,切换到变量视图窗口,视图的每一行代表一个变量的各种属性,如名称(Name)、类型(Type)等。在前五行的中分别输入变量名姓名、语文、数学、英语、物理、化学、生物、总分,设置各变量的属性:将姓名变量的类型变为字符型(string),其余均为默认值。单击“Data Variable”,将窗口切换回数据视图,在各个变量中输入相应的信息和数据。SPSS软件也可以直接读取Excel、SAS等格式的文件。选择菜单【File】【Save】,在弹出的“Save Data As”对话框中选择适当的保存地址。

2.数据统计及分析

2.1数据的简单描述

执行【Analyze】【Descriptive Statistics】【Descriptives…】,出现“Descriptives”对话框,选择语文、数学等七个变量至右边“Variable”空框中,选择“Save standardized value as variables”。单击【Options】,出现“descriptives:Options”对话框,单击【OK】,系统就会弹出SPSS的结果浏览窗口,得到所有学生的语文、数学、英语、物理、化学、生物、总分变量的样本数、最高分、最低分、平均分、标准差、方差、全距等常用的统计量。

Descriptive Statistics

2.2绘制直方图

统计指标只能给出数据的大致情况,而直方图则更加形象直观。执行【Graphs】【Histogram】【Display normal curve】,系统弹出绘制直方图对话框,将“语文”选入“Variable”选择框内,单击【OK】按钮。此时结果浏览窗口内会绘制出如下直方图:

2.3排序

执行【Transform】【Rank Cases…】,弹出“Rank Cases”对话框,将左边选项中需要排列的变量选入右边“Variable(s)”空框中,如“语文”;“By”框是用来选择分组变量的,如“班级”,将班级作为分组变量选入“By”框;“Assign Rank 1 to”单选框组是用于选择将秩次赋给最高分还是最低分,这里选择“Largest value”;【Ties】钮用于定义相同值的处理方式,这里选择默认平均值。单击【OK】,系统就会在数据编辑窗口中建立一个新变量“r语文”(即原变量名前加r),取值为学生的语文成绩在班中的排名。

2.4频数分析

平常教师对成绩的统计,除了计算平均分外,还需要观测各分数段的学生人数,在SPSS软件中,这项工作可以通过重新编码和频数分析两个操作来实现:

执行【Transform】【Recode】【Into Different Variables…】,在对话框中,将左边列表框中的语文变量选入右边的“Numeric VariableOutput Variable:”框中,并在“Output Variable”框中输入“Name”为“语文2”。单击【Change】【Old and New Values…】钮,出现“Recode into Different Variables:Old and New Values”的子对话框,在左边“Old Values”方框中选择“Range”,在下面的两个空格内分别输入130、150;在右边“New Value”方框中选择“Value”,在后面的空格内输入1,然后单击【Add】按钮。重复此操作,分别将110―130分转为2,将90―110分转为3,将70―90分转为4,将低于70分的转为5,输入完毕后,单击【Continue】按钮,再单击“Recode into Different Variables”对话框中的【OK】按钮,数据编辑窗口中就会出现“语文2”新变量,完成对语文成绩的重新编码。执行【Analyze】【Descriptive Statistics】【Frequencies…】,出现“Frequencies”对话框,将左边框中需要分析的变量“语文2”选入“Variable(s):”空框中。单击【OK】,结果输入窗口就会呈现学生语文的各分数段人数分布,以及各种百分数。

语文2

2.5平均数差异显著性检验

在考试结果分析中,教师一般会用平均分高低来简单比较各班的成绩差异,SPSS软件的平均数差异显著性检验可以对此进行更科学的统计分析。例如,用独立样本检验比较两班学生的化学和数学成绩是否有差异:

执行【Analyze】【Compare means】【Independent-Samples T Test…】,选取数学和物理变量进入右边的“Test Variable(s)” 空框中,选取班级为分组变量,进入“Grouping Variable”中,单击【Define Groups…】按钮,在“Group1”“Group2”后分别输入1、3,单击【OK】,就会输出统计结果。

Group Statistics

Independent Samples Test

利用SPSS软件还可以进行“相关分析与回归分析”,可用来验证“数学成绩好的同学物理成绩也一定好”这样一个命题是否成立。

3.结语

SPSS软件为教师实施教学测量手段提供了一个较好的平台,如何运用SPSS软件更好地来分析教学测试结果,还需要我们在使用过程中不断探索。

参考文献:

[1]余建英,何旭宏.数据统计分析与SPSS应用[M].人民邮电出版社,2003.

[2]于水华,郑任儿.浅谈SPSS在教育信息处理中的应用.教育信息技术.

[3]卢纹岱.SPSS for Windows统计分析(第2版)[M].北京:电子工业出版社,2002.

人口统计学变量分析第5篇

【关键词】人口;计划生育;统计方法;数据误用

规范、合理的人口计划生育数据统计,可以为我国制定社会发展规划,构建和谐社会,提供科学准确地统计信息,也为创造良好的人口计生环境奠定基础,有利于我国社会的可持续发展。而统计质量是人口和计生部门进行生育管理的重要依据,统计数据影响着计划生育政策的制定。所以计生部门要采取有效的措施避免统计方法和数据的误用,保证计划生育统计工作的质量。

一、当前我国人口与计划生育工作现状

在计划生育的前提下,我国的人口计生工作取得了很好的成绩,但是仍然面临着严峻的考验与形势。近几年,随着城镇化的发展和户籍制度的放开,流动迁移人口问题给计生工作带来一定的困难。主要表现为:流动人口范围越来越大;村(居)计生干部不重视出生信息上报的准确率;计生管理人员变动比较大,兼职多,管理不到位;我国人口的人群分布复杂多变,影响计生统计工作的质量。

所以说,我国的人口与计划生育工作形式不容乐观,如果不能解决这些问题,不仅影响政府的科学决策,而且会影响我国经济的发展,另外还会影响政府的公信度。所以人口计生工作必须提高质量,在当今复杂的人口管理下,避免统计方法和数据的误用,以便提高计生工作质量。

二、造成人口与计划生育统计方法和数据误用的原因

(一)基层领导对统计工作不够重视。在经济迅速发展下,各级领导把工作重心移到经济建设中,处处以经济建设为中心,忽略了计划生育工作,在日常工作中不重视人口统计工作。致使人口统计工作中经常出现问题,而无人过问,相关人员就更加不重视统计工作的开展。另外,相关各部门间的协调工作上,基层领导也没有负起应有的责任,致使各部门的工作协调能力很差,计生部门在进行工作时,数据很难及时反馈。

(二)信息化进程步伐缓慢。随着信息技术的发展,人口与计划生育管理工作也应该改变传统的管理模式,利用计算机网略技术来进行人口与计生工作的管理。但是我国计生管理部门的工作人员的计算机应用水平不高,管理信息系统没有完全发挥其作用,仅仅满足了其日常计生工作统计、查询以及简单的数据分析。另外,计生部门计算机应用仍然停留在以数字为中心,没有足够的统计分析应用。计算机主要用于对数据的登记与统计,涉及统计分析、预测与研究的方面很少,降低了统计与调查数据的准确性。

(三)人口本身的复杂性。我国人口基数大,分布不均,人口分布具有群体性特征,同时又有一些比较特殊的个案,其自身的模糊性比较大,但又要求统计工作的精确性,致使计生部门在工作中经常出现错误。比如在计划生育统计工作中,各种人口和计划生育统计指标适用的人群虽然没有明确的规定,但是一般说来这些统计指标不适合用于分析规模较大的人口群体情况,也就是说许多指标在县、乡级使用也不太合适。但是在实际工作中,计生统计报表一般都是由上级制发,各级基层单位按统一的口径填报每个项目。这样一来,上级单位与下级单位计算指标是相同的。在这种情况下,人口计生工作的群体性要求被忽视,没有做到具体情况具体分析。很容易致使计生统计工作的错误。

三、如何避免人口与计生工作中统计方法和数据的误用

(一)重视各部门之间的信息共享。首先应该加强各级领导对计生工作的重视力度,转变原有的观念,认识到计生工作的重要性与必要性,在人力、财力、物力上支持人口与计划生育统计工作的开展。加强人口与计生工作的管理,使计生工作于各级部门相互联系,建立信息共享平台,首先把本地区的与计生部门紧密相连的部门(医院、防疫、卫生等)信息共同录入信息共享平台,再次要以省为单位,使全省的相关部门信息都开放共享,确保计生部门人口统计数据的正确性,以便提高人口统计质量。

(二)提高计生部门的信息化建设。计划生育统计工作要改变传统的以数字为中心的统计方式,转化为能够帮助基层人员和计划生育工作解决实际问题的有用的材料。另外,要完善计生统计分析报告,过去的人口与计划生育统计分析报告仅限于反映人口与计划生育资料的数据变动情况,还要求对各种数据的逻辑关系、变化原因等做一定的分析与预测。同时加强分析检查力度,对统计的信息进行及时的检查与修改,纠正信息不准或不全的统计报表。

(三)按照人口定量与定性的特点进行统计。人口计生的统计分析主要是对数据进行相关统计分析,一般情况下,数据分析通过对人口定量的描述,在对人口进行相应的定性分析。如果没有定性的分析,定量分析也就失去了它原有的作用。定性分析应以定量分析为基础,不能颠倒顺序,否则影响统计方法和数据的准确性。

(四)统计方法的模糊性。人口和计划生育统计工作本身就是从宏观方面来分析的工作,统计数据反映的是人口大致的状态或发展趋势,面对如此大的人口基数,统计工作不可能完全精确无误。所以计生工作中的统计方法没有必要特别注意它的精确度。人口与计生统计数据存在一定的误差,这也是其工作的特点,没有必要像圆周率一样精确。

人口和计划生育统计工作不能像其它部门一样,要求其必须这样,或者那样,人口统计有其自身的限制因素与特点,在实际工作中要依据具体情况,实事求是的完成工作。在工作中挖掘人口和计生统计工作的特点和规律,这样就可以根据其特点和规律,有效的避免工作人员陷入统计分析的误区,以便更好的为国家政策的制定提供准确的信息。

参考文献

[1] 王谦.认识人口与计划生育统计的特点 避免统计方法和数据的误用[J].人口研究2002,26(5):19-21.

人口统计学变量分析第6篇

1常用统计学软件的特点

Excel是我们日常工作中最常用的软件之一。主要用于数据处理、统计分析与计算,简单的数据库管理,而且它能绘制图表,具有检查与删除宏病毒的功能,并能与Internet网络共享资源[3]。此外,还能利用VisualBasicforApplication(VBA)语言开发面向特定应用的程序,但实际应用中很少有人使用。实际工作中我们经常用Excel的两大服务,一是自动计算功能,进行一些报表处理,这时Excel相对于Word来说不仅制表容易,更重要的是Excel有自动重算功能,一个数据被改动了,相应的结果会自动重算;二是Excel的制图功能,它能根据输入表中的数据自动生成曲线图、柱形图、饼形图等,大大减轻了手工制图的工作量。SPSS(StatisticalPackagefortheSocialScienceorStatisticProductsandServiceSolution)forWindows,与Excel相比,SPSS的统计分析功能、图表功能和数据库互接功能更为强大。SPSS软件处理庞大的受随机因素影响的数据时具有速度快、无编程、数据接口方便和功能模块组合灵活等特点。它使用Win-dows的窗口方式展示各种管理和分析数据方法的功能,并使用对话框展示出各种功能选择项,只要掌握一定的Windows操作技能,只需粗通统计分析原理,就可以使用该软件为特定的科研工作服务。SPSS集数据整理、分析功能于一身。其基本功能包括数据管理、统计分析、图表分析、输出管理等等。SPSS统计分析过程包括描述性统计、均值比较、一般线性模型、相关分析、回归分析、对数线性模型、聚类分析、数据简化、生存分析、时间序列分析、多重响应等几大类,每类中又分多个统计过程,比如回归分析中又分线性回归分析、曲线估计、Logistic回归、Probit回归、加权估计、两阶段最小二乘法、非线性回归等多个统计过程,而且每个过程中又允许用户选择不同的方法及参数[4-5]。SPSS也有专门的绘图系统,可以根据数据绘制各种图形。其分析结果直观、易学易用,而且可以直接读取Excel及DBF数据文件。由于其操作简单,已经在我国的社会科学、自然科学的各个领域发挥了巨大作用。SAS是一套大型集成应用软件系统,具有完备的数据存取、数据管理、数据分析和数据展现功能。SAS系统中提供的主要分析功能包括统计分析、经济计量分析、时间序列分析、决策分析、财务分析和全面质量管理工具等等。SAS中各模块具有相对独立的功能范围。常用的模块有base,graph,stat,insight,assist,analyst模块等,分别执行基本数据处理、绘图、统计分析、数据探索、可视化数据处理等功能。编程操作功能的无比强大是SAS系统的长处。尽管高级版本的SAS出现了可视化窗口,然而要想完全发挥SAS系统强大的功能,充分利用其提供的丰富资源,掌握SAS的编程操作是必要的,也只有这样SAS在各个方面的杰出特长才能得以体现。

2结合相关分析探讨比较Excel、SPSS和SAS优缺点

2.1变量的相关分析及两个变量的相关分析

相关分析用于属于平行关系的两个变量的分析。在相关分析中,变量无自变量和依变量之分,而且都具有随机误差。相关分析只能研究变量间的相关程度和性质,不能用一个变量的变化去预测另一个变量的变化。事物间的联系是普遍的。生物学中,作物产量与施肥量、气温、土壤湿度等都存在一定的联系。这种说明客观事物相互间关系的密切程度并用适当的统计指标表示出来的过程就是相关分析。现以20种细胞系的细胞膜和细胞质中蛋白质含量的测定结果为例,通过三种软件的操作来进行两者之间的相关分析。如本例题命名X为细胞膜中蛋白质含量,Y为细胞质中蛋白质含量,见表1。

2.1.1Excel操作Excel通过其分析工具库实现统计分析。数据在工作表中组织后,在“工具”菜单中单击“数据分析”命令。如果在“工具”菜单中没有“数据分析”命令,则需要安装Excel的“分析工具库”。安装过程如下:在“工具”菜单中,单击“加载宏”命令,单击“浏览”按钮,定位到Office安装盘所在位置。安装完成后,再打开“加载宏”对话框,选中“分析工具库”复选框。选择“工具”菜单中的“数据分析”命令,此时弹出“数据分析”对话框。在分析工具列表框中选择“相关系数”。在弹出的对话框中选择输入区域,即数据所在区域;分组方式根据输入数据的方式选择“逐列”或“逐行”。如果输入区域的第一行中包含标志项,则选中“标志位于第一行”复选框;如果输入区域中没有标志项,则此复选框不选。“输出选项”中选择相应选项,以确定分析结果的显示位置。选择完成后,点击确定即可显示相关系数的值。Excel中若要显示统计描述需要在“数据分析”中选择“统计描述”。可显示的结果有:平均、标准误差、中位数、众数、标准差、方差、峰度、偏度、区域、最小值、最大值、求和、观测数、最大、最小、置信度(95.0%)等。相关系数结果见表2。本例X与Y的相关系数为0.55461,相关系数检验的P值为0.001,按α=0.05水准,拒绝H0,接受H1,相关系数检验有统计学意义,膜蛋白和质蛋白之间有55.461%的相关性。这样的统计分析结果对于我们的后续实验有一定的指导作用。

2.1.2SPSS操作SPSS相关分析通过Statistics菜单的Corre-late选项完成。该命令允许同时输入两个或两个以上变量,但系统输出的是变量间两两相关的相关系数。此过程通过对变量进行相关关系的分析,计算有关的统计指标,以判断变量之间相互关系的密切程度。初始设置:单击窗口左下角的“变量窗口”(VariableView),在名称、类型、长度、小数点等处适当设置。完成相关设置后,单击窗口左下角的“数据窗口”(DataView),返回数据填充区。在SPSS工作表中输入表1中的实验数据。输入数据后,即可进行相关性分析。具体步骤如下:选择菜单栏中的分析(Analyze)相关分析(C)两个变量相关分析(B),弹出“两个变量相关”对话框。分别将X,Y变量选入“变量”的方框中,点击“选项”(Options),弹出“两个变量相关:选项”面板,选择“统计”中的“描述”(Descriptive),即可显示出“平均值和标准差”(M),交叉乘积的标准差和协方差(C)选项,然后点击“继续”,重新回到“两个变量相关”界面,本例分别选中“Pearson”,“双侧”和“标识显著相关”,然后点击“确定”,即出现SPSS统计的结果见表3(省略统计描述表格)。从表中可以看出,变量X,Y的相关系数为0.555,交叉乘积的标准差和协方差为267.314,14.069。PearsonCorrelation(相关系数)一列中的星号含义是:显著性水平为0.001(默认值)的情况下,变量X,Y相关系数存在显著差异,与“Sig”一列的结果相对应。从给出结果我们可以看到,比起Excel,SPSS的结果内容更详尽,结果分析更全面。

2.1.3SAS操作与上述两种操作不同之处在于,SAS操作在建立数据集时应指定膜蛋白X与质蛋白Y两个变量。再调用CORR过程求出相关系数。1)设定数据库环境:LIBNAMEA''''C:\USER'''';2)数据步,建立数据集:DATAA.YTLI7_1;INPUTYX@@;CARDS;12.2115.214.5416.712.2711.912.0414.07.8819.811.1016.210.4317.013.3210.319.595.99.0518.76.4425.19.4916.410.1622.08.3823.18.4923.27.7125.011.3816.810.8211.212.4913.79.2124.4;RUN;3)CORR过程,进行相关分析:PROCCORRDATA=A.YTLI7_1;VARXY;RUN;CORR过程的默认输出结果主要包括各个变量的简单统计描述(图略)和一个相关系数矩阵。结果见表4。SAS这种程序化操作过程简单,但需熟练掌握相关的编程语言,而且结果内容也没有SPSS的结果详尽。

2.2Excel、SAS、SPSS的评价

2.2.1数据处理Excel是日常办公的通用软件,也是作为计算机文化基础的一部分而被广泛学习。作为简单的数据处理工具,Excel操作简便,结果直观。SPSS的数据编辑器很像Excel,可以输入数据。SPSS的可视窗口界面和下拉列表可以选择特定命令。但运用SPSS一次只能编辑一个数据文件,在一次涉及多个文件的数据处理中并不强大。SAS在数据处理上可谓功能强大,几乎可以进行任何可能的处理。SAS中的sql数据库可以执行sql查询。只是需要耗费大量时间来学习和理解那些在excel和SPSS中相对容易处理的简单命令。但是SAS可以同时处理几个文件相关联的数据,同时SAS还可以处理多达32768个文件,记录的数量能限制在磁盘最大容量范围内,因此它以强大的数据管理和同时处理大批数据文件的功能,得到高级用户的青睐。

2.2.2统计分析三种软件用于统计分析的高级程度从高到低依次是:SAS,SPSS,EXCEL,就像例题中的操作一样,只要是Ex-cel“数据分析”库中包括的统计部分,都能通过简单的操作给出简单的统计结果。但是Excel只能进行有限的几种运算(平均、标准误差、中位数、众数、标准差、方差、峰度、偏度、区域、最小值、最大值、求和、观测数、最大、最小(1)、置信度(95.0%)等)。SPSS可以运行众多统计分析。其长处在于变量分析和多变量分析,可以进行多种特定效应检测。SPSS的缺点是运算方法不多,只能依照软件中提供的模式进行运算。SAS可以运行多数常用的统计分析。SAS和SPSS一样都属于专业分析统计软件,而SAS的强势在于方差分析,混合模式分析和多变量分析,其不足在于依次多项逻辑回归,运算方法受到SAS语言的限制。

2.2.3图表Excel的图表生成简单,可视化窗口模式形象直观,是日常图表生成的有利工具,而且修饰加工的图形尤其美观,单元格数据与数据分析结果具有“联动”关系,改变其中一个单元格数据,与之相关的Excel公式或图表就会发生相应的改变,具有“即改即见”的效果。Excel2007使之更加完善,这些功能均为SAS、SPSS所望之不及。SPSS窗口界面可以像Excel一样轻松的创建图表。图片质量较高,因此被很多发表文章的作者采用。SAS包括最强大的图表工具SAS/Graph,但是SAS/Graph学习起来很有难度。这种图表大多是通过程序性语言创建的。尽管SAS8以后的版本在创建图表方面出现可视化界面,但还是没有SPSS容易操作,一般适用于高级人士。

人口统计学变量分析第7篇

李春喜教授主编的第五版生物统计学教材中,前一章内容分别为概论。结合SPSS特点,在讲授本章内容的同时,SPSS上机实验课应设置为SPSS软件的界面介绍、基本特点和作用,数据的建立、导入与导出部分。SPSS软件的特点与作用:SPSS(StatisticalPackagefortheSocialScienceorStatisticProductsandServiceSolution)软件是于1968年由美国斯坦福大学(StanfordUniversity,USA)的三位研究生研发而成,并以此名创立SPSS公司。该软件操作简单,易学易用,具有较强的统计功能和强大的作图功能,特别是能够快速准确地完成大量的、烦琐的、专业的和复杂的数据统计分析,是国际上认可的专业统计分析软件之一。其可广泛应用于统计分析(例如均值比较、相关分析、方差分析等)以及统计图形(例如柱状图、散点图、饼状图等)的制作和编辑。在介绍这些功能的同时,打开SPSS窗口,兼并介绍SPSS视图窗口中标题栏、菜单栏、数据单元格显示、工具按钮、数据视图和变量视图的一些简单用法。数据文件的建立:SPSS软件打开之后,会进入数据编辑窗口,新建一组数据后可将变量依据实验内容进行命名,并选择输入数据的基本变量类型(例如数值型、逗号型、句点型、科学计数型、日期格式型、美元型、定制货币型和字符串型等)。数据文件的导入与导出:SPSS可以导入SPSS(*.sav),Exce(l*.xls),dBASE(*.dbf),ASCⅡ(*.dat,*.txt),Access(*.mdb),Lotus(*.w*),Foxpro(*.dbc)等数据文件,以及各类SASS数据文件。即从菜单选择File中选Open,弹出OpenFile对话框,文件框内显示以选择所需文件后缀类型,之后选择对象,单击打开(O)按钮,或双击对象文件,从而将文件导入。同样文件的导出通过File中的save/saveas(保存数据对话框),选择保存路径,键入文件名,确定数据类型,单击保存(S)按钮,其导出文件。

二、应用SPSS软件的基本统分析

教学材料第二、三章内容为资料的整理与特征数的计算、概率和概率分布,结合教学内容SPSS上机实验课应设置基本统计分析课程,该部分包括数据汇总报告和描述性统计分析两方面的内容。基本统计分析可通过菜单栏的分析(Analyze)窗口进入,点击分析栏之后,鼠标放置数据汇总报告(Reports)栏,即可显示分层报告(OLAP—OnlineAna-lyticalProcessing)、数据汇总(CasesSummarize)、行汇总报告(ReportSummariesinRows)、列汇总报告选项(ReportSummariesinColumns)。其中分层报告主要用于中位数、最大值、最小值、方差、偏度系数等统计描述;数据汇总可用于对编辑窗口中的数据在结果窗口中罗列出来,以便浏览和打印,同时也可对数据的基本特征进行描述;行汇总报告可罗列原始数据,其格式是以观察单位和统计量为行标目,以报告变量为列标目;列汇总报告主要用来生成按列显示统计量计算结果的报告,同时也可以完成许多统计计算。当鼠标放置描述性统计分析(DescriptiveStatistics)位置后,选中响应的功能即可进入频数分析(Frequen-cies)、描述性分析(Descriptives)、探索性分析(Ex-plore)、多维交叉表分析(Crosstabs)、比值分析(Ratio)窗口从而根据自己的目的进行响应的数据分析。

三、应用SPSS软件的均值比较和方差分析

生物统计学基本知识熟悉之后,在随后在课堂教学中会开始进行统计推断和方差分析部分的内容。SPSS实验课在此部分结合课堂教学相应的设置均值比较和方差分析上机内容。均值比较可通过菜单栏的分析(Analyze)窗口进入,点击分析栏之后,鼠标放置数据均值比较(Com-pareMeans)上即可显示相应分析栏:平均数基本分(Means)可用于定量资料的统计分析,按分组变量计算因变量的描述统计量值,如均值、方差、标准差、偏度、峰度等统计量,并显示结果;单样本T-test(One-SampleTTest)单样本t检验主要用于样本平均数和已知总体平均数的比较;独立样本T-tes(tInde-pendent-SamplesTTest)可用于检验两个独立样本的总体平均数之间是否有显著差异;配对样本T-test(Paired-SamplesTTest)用于配对计量资料的比较,检验配对样本差值的总体均数与0的差异有无显著意义,以及配对样本是否相关方差分析包括单因素方差分析和多因素方差分析。其中单向方差分析(One-WayANOVA)可通过均值比较(CompareMeans)进入,其用于完全随机设计资料的多个样本均数比较和样本均数间的多重比较,也可进行多个处理组与一个对照组的比较。多因素方差分析可通过分析栏里的多因素方差分析(GeneralLinearModel)选项进入,进入之后会设置四个不同要求的选择:单变量多因素方差分析(Univariate)可用于一个因变量受一个或多个自变量影响的方差分析;多因变量方差分析(Multivariate)主要用于多个因变量受一个或多个因素变量或协变量影响的方差分析;多因变量方差分析(Multivariate)对同一因变量进行重复测量的方差分析;混合效应分析(VarianceCompo-nents)用来估计每个随机因素对因变量方差的贡献。在分析过程中可根据不同的需要和要求,选择相应的方差分析。

四、应用SPSS软件的回归和相关分析

人口统计学变量分析第8篇

摘要:随着社会经济的发展,人口老龄化问题日趋严重,如何通过政策调整缓解这种现状是值得关注的问题。建立了基于系统动力学的河南省老龄化系统模型,然后利用GM(1,1)灰色模型对系统中部分因素进行预测,再将预测值导入模型,从而对2012~2020年河南省人口总量、老年人口量和老龄化系数进行预测。最后,通过政策模拟,预测了不同政策情况下老年系数的变化情况,结果表明,计划生育政策和医疗投入对老龄化系数的影响比较大。因此,政府应从这两个方面着手制定相应措施。

关键词:老年系数;GM(1,1);系统动力学

中图分类号:F2 文献标识码:A 文章编号:16723198(2013)18003303

1 引言

随着社会经济的发展,人民生活质量得到很大提高,医疗卫生条件也得到改善,人口发展出现低生育率、低死亡率以及人口寿命延长等现象,这必然导致人口老龄化问题的出现。人口老龄化指社会人口结构呈现老年状态,进入老龄化社会。根据联合国人口老龄化标准,老龄化社会指当一个国家或地区60岁及以上的老年人口达到总人口的10%(简称老龄化系数)或65岁及以上老年人口占总人口比重超过7%。老龄化系数指老年人口占总人口的比例,是反应地区人口老龄化程度的一项重要指标,老龄化系数的高低取决于人口年龄结构的变化。2002年河南人口老龄化系数为7.38%,2011年老龄化系数上升至8.61%,河南正处于老年型社会的行列。由此带来的劳动力缺乏、老年抚养负担加重、财政压力等都给社会带来消极的影响。如何在一定的政府调控下实现河南老年人口量和人口总量的有机结合,是值得关注的问题。

大多数学者只是对全国老龄化问题进行分析研究,对区域的老龄化研究却很少。杜鹏等利用联合国最新数据对中国和亚洲各国人口老龄化进行比较,提出在未来60年内中国都是世界上老年人口最多的国家。吕盛鸽等利用生命表理论、联合国平均预期寿命增长模型及年龄移算法对北京市人口老年化系数进行预测,结果表明在预测期内老龄化系数一直呈上升趋势。包玉香等运用新古典经济增长模型方法对人口老龄化对区域经济效应进行分析,得出人口老龄化对区域经济发展的双重效应存在的结论。

2 研究方法概述

2.1 GM(1,1)模型

GM(1,1)表示灰色模型是一阶方程,含有1个变量。设系统数列为:X(0)(k)={X0(1),X0(2),…,X0(n)},

第一步对该序列作一次累加生成(1-AGO)得:

(1)

第二步对X(1)作紧邻均值生成得:

(2)

第三步建立GM(1,1)模型的白化方程:

(3)

其中,-a为发展系数,b为灰色作用量。

方程3的时间响应式为:

(4)

第四步求出X(1)的模拟值

(5)

第五步还原求出X(0)的模拟值

(6)

第六步检验误差,并求出相对误差的值。

2.2 系统动力学的建模机理

系统动力学(System Dynamics,SD),被誉为“政策实验室”,由美国麻省理工学院Jay Forrester教授于1956年创立。采用定性与定量结合的方法,从系统内各变量的因果关系出发,分析各种因素之间构成的因果反馈,从复杂的现象中分析出这些现象的内在原因及形成机制。通过获得主要变量随时间变化的解析表达式,并确定如何对系统实施最优控制,使政策变量有效控制系统状态的发展变化。系统动力学具备处理时间滞延、信息回馈、非线性问题、动态性复杂的能力和优点,经多年发展渐渐发展为一门体系完备的学科,广泛地应用于社会、经济、生态、企业管理等复杂系统决策的实验和制定。

3 人口老龄化系统SD模型

3.1 人口老龄化系统边界的设定

根据人口统计学原理,生育和死亡是引起人口变动的两大基本原因,为预测河南老龄化系数,初步选取青少年人、成年人、老年人、总人口量、出生率、死亡率和女性比例等指标序列,并用牛眼图表示(图1)。

牛眼图又被称作边界图,内生变量放在中心,外生变量放在环外,能明显的表示出建模者对这个系统边界的界定,能显示模型的重点和需要的输入。青少年、成年、老年等7个内生变量放在内环,生育率、死亡率、女性比例等5个外生变量放在外环,系统排除在外的变量迁移率放在环以外的地方。牛眼中心变量较多这是一个好的标志,表明需要的输入与内生变量之间是相对平衡的。

3.2 人口老龄化系统因果关系图

系统边界确定后,就可以用因果关系图(Causal Loop Diagrams)来描述各要素之间的相互关系。因果关系图中的因果链可标明影响作用性质的正负,正号表明箭头指向的变量将随箭头源发的变量的增加而增加,减少而减少,而负号则表示变量间与此相反的关系。通过对人口老龄化系统各因素之间的关系分析,可建立因果关系图(图2)。

系统中主要的反馈回路有:

正反馈回路:青少年成熟成年人成年女性出生青少年

负反馈回路:老年人死亡老年人

3.3 人口老龄化系统SD流图

系统设计的变量主要有状态变量、目标变量和控制变量三种,本模型具体包括:

(1)状态变量:青少年、成年人和老年人,是人口总量的重要组成部分。

(2)目标变量:老龄化系数,是系统研究的最终目标,不同的控制条件会产生不同的目标结果。

(3)控制变量:计划生育政策和医疗投入是为协调老龄化现状而调整的手段。

系统动力学流图可以反映出因果关系图中没能反映出来的变量性质和特点,使系统各指标之间的作用机制更加清晰,通过数学逻辑关系式量化,实现仿真目的。人口老龄化系统的SD流图见图3。

4.1 数据处理

本模型仿真时间设为2002~2020年,其中2002~2011年的数据均来自《河南统计年鉴》和《中国统计年鉴》;2012~2020年,生育率、女性比例和死亡率的数据由GM(1,1)预测得到。建立GM(1,1)模型,预测得到生育率、女性比例和出生率数据(见表1)。

模拟结果表明,生育率、女性比例和死亡率的相对误差都在3%以内,说明GM(1,1)模型的拟合度非常好,可以真实地反映实际情况。将表1中的数据代入模型。

4.2 模型有效性检验

以2002年的数据作为状态变量初始值,模型的仿真时间设为2002~2020年,取DT=1。应用SD建立的人口老龄化系统的仿真模型并运行,仿真结果对比见表2。

表中数据显示,模拟数据的相对误差均控制在10%以内,模型预测值与实际值拟合度较好。系统动力学模型的误差范围在10%之内是合理的,此模型运行结果符合要求,证明所建立的SD模型是可行的。

4.3 政策模拟

政策模拟是通过改变SD模型中的某些政策变量来分析政策对系统的影响。计划生育政策是人口研究必须考虑的现实基础,20世纪70年代以后,计划生育政策使我国人口增长速度减缓,随之带来人口老龄化、人口性别比不平衡等负面影响。因此需要对人口未来发展状况进行预测研究,为决策者提供必要的参考,以推动河南省人口结构的优化。而老年医疗投入则直接影响老年人的生活质量及其寿命,在此基础上探索适合河南省发展的老年人医疗投入,从而为缓解人口老龄化对河南省经济和社会的影响。

因此,应从计划生育和医疗投入两方面,利用政策模拟分析不同的政策对河南省人口结构的影响。一方面放宽计划生育政策,从2012年开始实行一对夫妻生两个孩子的生育政策;另一方面从2012年开始改变医疗投入将医疗投入分别增大20%、减小20%。本模型模拟的是在其他政策不变的情况下,放宽生育政策,将医疗投入分别增大20%和减小20%时人口结构变化的情况。

图4 不同政策下人口总量预测值图4表明,放宽计划生育政策、增加20%医疗投入将使人口总量增加,减小20%医疗投入将使人口总量减少。放宽计划生育政策对河南人口总量的影响最大。放宽计划生育政策实施后,2020年河南人口总量将迅速增至11050.6万人。由此可见,计划生育政策影响河南总人口的数量变化。

图5 不同政策下老年人数预测值 图5表明,放宽计划生育政策对老年人口数量的影响较小、增加20%医疗投入将提高使老年人口数量的增长速度,而减小20%医疗投入将减小老年人口数量的增长速度。增加20%医疗投入,2020年老年人口总量将增至1013万人;减小20%医疗投入,2010年老年人口总量将增至977.02万人。由此可见,医疗投入影响老年人的数量变化。

图6 不同政策下老年系数预测值图6表明,放宽计划生育政策、增加20%医疗投入,减小20%医疗投入对老年系数的变化都有一定程度的影响。2012年开始实施相关政策,放宽计划生育的情况下,2020年老年系数将达到8.95%;减小20%医疗投入的情况下,2020年老龄化系数将达到9.26%。两种政策的实施将减小老年系数的增长速度。增加20%医疗投入的情况下,2020年老年系数将达到9.57%,老年系数的增长速度加快。

5 结论

通过SD模型仿真分析可以看出,老年系数增加一方面受到计划生育政策的影响,另一方面受到医疗投入的影响。放宽计划生育政策将在短时期内减缓老年系数的增长速度;增大医疗投入将加快老年系数的增长速度,减少医疗投入将减小老年系数的增长速度。因此,政府应从计划生育和医疗投入两个方面着手对河南人口老龄化问题该制定相应措施,从而减缓人口老龄化现状,实现社会的可持续发展。

参考文献

[1]邬沧萍,杜鹏等.中国人口老龄化:变化与挑战[M].北京:中国人口出版社,2006.

[2]杜鹏.中国和亚洲各国人口老龄化比较[Z].人口与发展,2009,(2):7580.

[3]李扬,刘慧.北京市人口老龄化的时空变化特征[Z].中国人口资源与环境,2011,(11):131137.

[4]包玉香.人口老龄化的区域经济效应分析基于新古典经济增长模型[J].人口与经济,2012,(1):39.

人口统计学变量分析第9篇

1 历史分析和地理尺度相结合    

在地理学中,尺度分析是一个重要的方法学上的考量,尺度分析在地理学上主要指代空间尺度和时间尺度。而在过去的研究中,如Zhang等和Pei等,都将地理尺度的思考模式,明确地应用到了历史气候变化和社会经济发展的研究之中。在时间尺度上,章典和裴卿等论证出在短期和长期的时间尺度中,气候变化的影响到底有何不同。同时,在不同的空间尺度下,Pei等以移民为例,定量地论证了空间尺度不同,所得出的研究结论也将有所不同。    

但是需要特别提出,虽然在不同尺度上得出的结论可能有所不同,但是并不相互排斥和抵触,尺度的选择是展开研究的基本立足点,同时也需要再次指出,在研究人地关系领域中,长时期和大空间的宏观尺度更有利于反映气候变化和人类社会之间的联系。

2 统计因果关系的提出    

以往的历史研究中,往往是基于个别事件或某一时段进行深入剖析、综合评价所有可能的影响因素,给出对此特定案例或者特定时段的历史解释。当然,在此相对微观尺度上,如果单纯认为气候变化是这些历史事件发生的原因,这将难免会落入“环境决定论”的陷阱之中。但是在宏观尺度上,往往可以更有效地从统计上证明气候变化作为一个不可忽略的角色在社会经济发展中的存在。因此,Pei等[[36]明确提出了统计因果关系(statistical law)。统计因果关系的提出,不是单纯地建立在数据和统计方法基础上,而是将因果关系理论中的5个标准和统计方法相结合,在大历史数据和统计分析方法之上提出的。虽然该统计因果关系不代表会适用于每一个案例,但是能从一个整体上发现气候变化的作用。同时,统计因果关系是建立在大量的历史资料和宏观尺度上,所以,统计因果关系与现有的传统历史研究得出的结论并不相悖,因为正如前述所说,两者的研究尺度有所不同。

3 历史“大数据”    

在目前的学术研究中,大数据是一个重要的理念。而在历史、环境史或者历史地理中,应该有更多的基于大数据理念推行的研究。目前存在的难度主要有:第一,尺度的选择,在传统的微观尺度上,大数据几乎很难实现,主要是因为历史资料相对缺乏;第二,在传统微观尺度上,即使要展开统计分析,但是样本量较小,这时候加入一个或者减少一个影响因子,对于统计结果而言,会存在较大的统计敏感性。    

然而在现阶段的发展中,由于在宏观尺度上能够使样本量有所增加,即使是减少或增加个别数据,也较难影响最终统计结果的显著性。并且,大量的数据会加强自变量和因变量之间统计关系的稳定性。随着史料的进一步发掘,相信在资料完善的基础上,历史大数据的理念将会被进一步接纳,这需要史学家的不断深入研究。

4.4重新审视马尔萨斯理论    

马尔萨斯学说认为,资源的增长遵循线性模式,而人口增长是指数模式,因此人口增长会超过资源增长,当人口规模超过农业生产,人间悲剧即大规模的人口锐减和非正常死亡将会发生,因此,马尔萨斯辩称人类悲剧的成因是人口的迅速增长。但是,Zhang等和Lee等的研究中,都发现实际上人类的这些悲剧更多是由气候变化导致的农业减产造成的,因为气候变化影响下资源的波动比人口的波动更加明显和剧烈。马尔萨斯学说强调日渐增长的食物需求是起因,而上述发现起因是气候变化导致了食物供给稀缺,这些研究从长时间和大空间尺度上重新审视了马尔萨斯学说。

4 中国与欧洲实证对比研究