统计分析报告编写要略新探

来源:    发布时间:2002-06-12

打印本页

分享到:

    数据与文字如何融合是写好统计分析报告必须解决的重要问题,两者结合不好造成顾此失彼,结构紊乱的通病已严重影响了统计分析报告的表述效应。而用现代系统论的观点指导写作,在“质”、“量”、“序”三个方面求得数据与文字的最佳融合,就能取得理想的写作系统效应。

    按照现代系统论的观点,任何一个具体的系统总是由两个或更多个要素按照一定的结构方式结合起来的,而整体的属性大于其各孤立部分属性的简单总和,即“1+1>2”。决定系统整体性质的具体因素有三个:一是构成要素的性质;二是构成要素的数量;三是构成要素的联结方式即结构,系统理论分别称之“质”、“量”、“序”。在一个系统整体中,这三个因素总是交织在一起的,其中一个因素的变化,往往会引起整个系统功能和性质的改变,即质、量、序三者共同决定了系统的整体效应。统计分析报告同样是一系统整体,由于数据和文字是基本构成要素,所以统计分析报告就成了由数据和文字按照一定形式组合起来的整体,它们的性质,数量及联结方式,即数据与文字的“质”、“量”、“序”三者制约着统计分析报告的质量和功效。而以往统计分析报告的编撰者对数据,文字的“质”与“量”较为注重,往往忽略了两者结合“序”。笔者认为要提高统计分析报告的整体质量,就必须三者并重,从“事物是质与量的统一”的认识观转变到“事物是质、量、序的统一”的认识观上来,力求数据与文字的最佳融合,实现统计分析报告“l+l>2”的系统效应。具体而言,在编写中应把握以下三个原则:

    一、“质”的优化原则“质”的优化是指对统计分析报告所用数据与表述文字的性质要求。撰写统计分析报告时统计数据的选择与表述文字的组织不可马虎了事,必须反复优化,使之“质量上乘”,极具说服力。

    具体要符合以下要求:

    第一,要准确,有真实性。采用的数据要准确可靠,否则一个不实的数据就会影响全篇的说服力。如某乡上报的春耕生产统计报告中的数据:“全乡已积上渣肥30000公斤,可保证每亩稻田施上渣肥2500公斤。”照此一算,这个有两万多人的乡仅有12亩稻田,令人啼笑皆非。此外,依据统计数据进行的分析判断要正确,符合客观实际,如某纺织厂的季度统计报告说该厂主导产品宽幅装饰布的销量比上年同期增加 1.25%,得出的却是“有大幅度提高”的结论,前后搭配失调。这些现象须防止。

    第二,要新颖,有时效性。从事统计分析要具有敏锐的眼光,善于及时捕捉最新的统计数据,并及时作出中肯的分析报告,为上级科学决策提供有力的依据,如 1982年,墨西哥发生火山喷发,亿万吨火山灰直冲云霄,形成罕见而又十分壮观的景象,当人们对此赞叹不已的时候,美国的一个专家小组敏感地意识到此事对农业的巨大影响,立即采集了大量的气象统计数据,着手进行分析研究,并向美国政府及时提供了一篇统计分析报告,指出这些悬浮在半空中的大量火山灰,将会造成大面积的低温多雨天气,使全世界范围的粮食作物受到损害,于是政府的农业部门根据这篇报告,马上采取了相应的促进粮食增产与储备的措施。果然,第二年世界各国的粮食产量大幅度下降,而美国粮食大量出口,在国际市场上大大地赚了一笔。这个例子就很有说服力。而统计分析中若采用滞后的统计数据或过时的文字描述不仅会弱化统计分析报告所提供的统计信息的使用价值,甚至会得出不正确的结论,误导人们对事物的认识和决策。

    第三,要典型,有代表性。写统计分析报告要精心选用最有代表性的统计数据,使之以一当十,反映出事物发展的规律;文字分析则要能一语破的,揭示出经济发展与社会生活的本质特征。2000年6月12 日的《信息日报》曾有一统计分析报道:“1990年各种部门向健力宝公司伸手要钱631次,总额1.98亿元,其中职能部门开出‘红头文件’索要1736.32万元;各种媒介索要3323.71万元,各种研讨会和出书赞助索要1042万元,各类社会管理部门索要1.4亿元。而健力宝公司一年利润仅两、三个亿。”文章据此分析:“国内各部门无穷索要这种‘打’‘压’形成的杀伤力已远远大于外国品牌的封堵,企业已招架不住。”切中时弊,发人深思。

    二、“量”的均衡原则

    “量”的均衡指的是统计分析报告中数据与文字二者在用量上要适度。这是统计分析报告的编写中常常易被人忽视的问题。某些统计分析报告要么从头到尾全是统计数据的堆砌罗列,就数字论数字,脱离实际,既不生动又缺乏表现力;要么全是依赖主观判断,凭经验进行的文字描述,由于没有准确数据的支撑,缺乏说明力。因此,编撰统计分析报告一定要注意两者搭配的适度,不可顾此失彼。数据引用应控制在篇幅的10~30%之间,分布也要均衡。作者授引统计数据,必须具备基本的统计知识和运用计算机处理复杂数据的能力,善于运用综合指标法、时间数列分析法、统计指数分析法、抽样推断法、相关与回归分析法等统计方法对原始数据作科学的处理分析,援用数据要与精要、中肯的文字分析有机结合,使之有理有据。

    例如一篇统计分析报告为了说明某山区贫困的主要原因除了恶劣的自然环境外,还与该地“人口与经济增长不协调”有关的观点,就用了这样的统计数据“950~1995年该地区粮食增长50%,年平均增长0.91%,而同期人口增长3倍,年平均增长3.13%,人口增长大大快于粮食增长,致使人均产量锐减,1950年人均粮食产量为320公斤,1995年人均粮食产量锐减到110公斤。”这里作者运用统计方法计算和精心提炼出6个统计指标数值,其中有两个定基增长速度指标值,两个平均增长速度指标值和两个平均发展水平指标值,它们在时间上的纵向比较,就具有很强的说服力。文章中统计数据与文字阐述有机结合,相互关照,使读者感受到了人口无节制增长的严重后果。

    当然,如果统计分析报告要用一连串的统计数据才能说清问题,就可以在文中列表显示或绘制成统计分析图,这样可以一目了然,形象直观地说明问题。统计分析报告中的文字阐述同样要简炼紧凑,不要繁杂冗长。两者用量恰当,搭配均衡,就可以产生相得益彰的整体效应。

    三、“序”的合理原则

    统计分析报告在数据、文字“质”的优化与两者搭配“量”的均衡的基础上还须进一步讲究内在组织“序”的合理,才能实现“l+1>2”的最优系统效应。这里的“序”指的是数据与文字在文中的组织艺术,涉及的是统计分析报告的结构章法。文章数据与文字的组合技巧表现在三方面:一是全文的谋篇布局,二是层次、段落的内在结构安排,三是自然段中句间意义的搭配。要使数据、文字的组织合理“序”,必须从这三方面着手:

    全文布局要服从统计分析的目的,突出全文主旨。所有统计数据的运用和文字语言的描述都要围绕主题。统计分析报告“大体须有,定体则无”,分析的目的不同,报告的章法也就不同,没有僵化的模式。可以先叙后议,先摆出数据,后作量化分析,予以议论阐述,揭示事物的规律与本质,提出针对性的建议;也可以夹叙夹议,边列数据,边量化分析,边作理论阐述。

    层次段落安排要条理清晰,井然有序。层次的安排要反映事理逻辑,各段内容要清楚地体现层次意义。要注意段落的单一性和完整性,即每一段只说明一个中心意思。各层、各段既要相对独立又彼此关照,前呼后应。

    段内句子意义要精心搭配,使之增强文章的表现力和可读性。统计分析报告数据较多,文字简朴,易使人感到单调枯燥,但如果讲究文句的组合技巧,适当地运用修辞手法,就可使文章既准确精要又生动活泼,激发读者的阅读兴趣。如一篇反映我国耕地面积面临严峻形势的统计分析报告这样表述:“我国耕地本来就少,近几年平均每年又占用700多万亩耕地以作他用,这相当于青海全省的耕地。每年种植烟叶又占去耕地1600多万亩,比宁夏的全部耕地还多。饮酒更有过之,全国一年喝掉白酒、啤酒944万吨之多,耗用粮食1400多万吨,相当于10亿人口一个月的口粮,而生产这些粮食需要4000多万亩耕地,差不多等于新疆的耕地总面积。如此看来,我国耕地面积每年将被占用一个‘青海’,抽掉一个‘宁夏’,喝掉一个‘新疆’”。作者巧用比拟辞格,比较换算手法,使本来单调枯燥的数据文字鲜活起来,既能晓之以“理”,又能感之以“形”,实现了文句组合合理有“序”的最佳效应。

    综上所述,统计分析报告数据与文字融合“质”的优化,“量”的均衡,“序”的合理是系统理论思想的具体体现,运用这些原则来解决统计分析报告中数据与文字搭配不当的突出矛盾,实现“质”、“量”、“序”的有机结合,提高写作的质量,可以说是一种有益的尝试。

    众所周知,统计数据的准确性是统计工作的生命,提高统计数据质量是统计工作的重中之重。然而,对如何评价统计数据质量的统计误差指标,却是统计部门和统计工作者秘而不宣或者忌讳的问题,甚至在《统计学原理》中都很少讨论,广大群众对此颇有微词,笔者认为有必要进行探讨并澄清一些事实。

    一、统计误差的分类

    顾名思义,误差是指一个量的观测值或计算值与其真值之差;统计误差,即反映某客观现象的一个量在测量、计算或观察过程中由于某些错误或通常由于某些不可控制的因素的影响而造成的变化偏离标准值或规定值的数量。那么统计误差有哪几种呢?

    1.按产生统计误差的性质来分有:空间误差、时间误差、方法误差和人为误差四种。

    空间误差是指统计调查范围所产生的误差,包括重漏统计调查单位,跨区域统计等;

    时间误差是指统计调查对象因时期或时点界定不准确所产生的误差。如企业核算时间不能满足统计部门的报表制度要求而估报所产生的误差;延长或缩短时期所产生的误差;时期错位产生的误差等。

    方法误差是因使用特定的统计调查方法所产生的误差。如抽样调查中的代表性误差(抽样平均误差),它是指采用抽样调查方法中的随机样本(非全面单位)来推算总体所产生的误差的平均值,不是绝对的统计误差。对代表性误差可以根据组织方法和抽取本的容量,一般可以计算其平均误差,而且通过扩大样本量或优化调查的组织方法来缩小。又如统计部门因人力、物力和财力等资源不足,致使报送渠道不畅通,统计调查不到位,推算方法不科学、不规范所产生的误差。

    人为误差是指在统计设计、调查、整理汇总和推算等过程中因人为过错产生的误差。人为误差是统计误差中产生因素最多的一类,它又分为度量性误差、知识性误差、态度性误差和干扰性误差。度量性误差是指统计指标因计量或者从生产量到价值量换算所产生的误差;知识性误差是指统计人员因统计知识不够,对统计指标的涵义不理解或错误理解所产生的误差;态度性误差是指统计人员因对统计工作不负责而随意填报统计数据而产生的误差,包括乱报、漏填或不按规定的计量单位填报等;干扰性误差是指统计对象或统计部门受某种利益驱动而虚报、漏报或者捏造统计数据所形成的误差。

    2.统计误差按工作环节来分有:源头误差、中间环节误差和最终误差三种。源头误差是指起报单位或申报者所产生的误差;中间环节误差是指统计调查数据在逐级上报过程中所产生的误差,包括加工整理、汇总和推算等环节;最终误差是指下级各基层数据汇总数或规范的方法得到的推算数与最终使用数之间的差异值。按工作环节划分的统计误差类别是相对的,中间环节误差在不同的场合有可能是源头误差,也可能是最终误差。源头误差在有些场合也叫调查误差,或叫登记误差。

    二、对统计误差的几点认识

    1.宏观统计的误差是客观存在的,不以人们意志为转移的,统计部门的任务就是尽可能缩小统计误差。如计量误差,比方人的高度都有早晚不一致的现象存在,不同调查单位因量器质量不同、标准不同也必定产生误差。再如空间性误差,在实际统计过程由于社会经济现象的复杂性无法涵盖所有的调查单位所产生的误差。又举个最通俗的例子,菜贩买入100斤菜零售最后加总后可能是98斤,也可能不断往菜上泼水买出102斤,这就充分说明统计误差的客观存在性。

    2.当前中国统计基础薄弱,统计数据质量不可高估,有些统计指标的误差还相当大。统计部门不要“黄婆买瓜,自买自夸”了,一定要有忧患意识。我记得一位香港统计专家曾指出:“中国统计好比建在沙漠的房子”,言外之意就是基础不牢。如GDP核算,全国数据与各省汇总数据有不少的差距,由地市汇总的数据与省一级的差距也很大,据说有些省差异率高达30%,如果以“各对50大板”计,其误差率也达到15%。又如1998年全国GDP的增长率为7.8%,而全国只有个别省低于7.8%,各省加权的平均增长速度近10%,全年新增GDP数值全国与各省的差异率高达25%以上。

    3.计划和各类政绩考核对统计数据干扰不可低估。如果有兴趣的话,你可以统计一下各地GDP增幅比计划高或者持平的比率,可能是相当高的,这并不是说明计划部门的计划多么精确合理,而是说明统计数据确实受到干扰,当然干扰数据不一定是各级领导,而是统计部门或者方法不规范所致。再比如我市某乡镇若干年上造和下造的水稻播种面积一致,而且与考核指标有惊人的相似。又如有些乡镇不再需要村文书报数据,而是给乡镇反馈数据。

    4.统计工作不是生长在“真空”中,统计数据也受到党风、社会风气、法律氛围和各种秩序的影响,因此统计部门无法完全控制统计误差。如统计源头数据或者原始凭证是财务核算或业务核算的数据,在这个环节出现误差,光靠统计部门是远远不够的。

    5.统计误差与投入的人力、财力密切相关。现在上级统计部门动不动增加统计调查任务,根本不考虑基层的承受能力,导致数据质量严重下滑,统计职业道德有“沦丧”的危险,所谓“车到山前必有路”、“越难统计越好做”都说明了这些。

    6.在统计工作中应有估计的合法地位。我们在推行抽样调查过程中,一般都采用点估计,实际是利用样本均值来推算,这本身就有代表性误差,应该在误差控制范围允许做适当的调整,以保证历史数据的平滑。在统计守法方面,往往政府统计部门及其统计人员可能是最大的违法者,在日常统计工作中有大量的估计成份,如基层报不齐需要估报,基层数据不符合逻辑需要调整等,这些都得不到统计法律、法规的保障,还好统计部门在守法和执法既是运动员又是裁判员。因此,统计工作中应在科学、规范的基础上允许进行必要的估计,并在《统计法》上明确给予综合统计部门这一权利。

    7.统计部门要有科学的态度,不能做数字游戏,不要亵渎《统计法》赋予的“权威”。一是对每一项工作不能敷衍了事,要有求真务实的精神和精品意识,当前普查工作过多过滥的嫌疑,数据质量也不高,基层政府财政苦不堪言,而普查数据对当地经济建设或者决策的作用却不大;二是不能在人力、财力和物力不许可的情况下,不能层层布置落实新统计项目,如乡镇一级计算国内生产总值;三是要善用抽样调查,有些地方为考核乡镇政绩,每一个乡镇整群抽取10户农户登记(不超过总体1%)计算农民纯收入,显然代表性误差非常大,人为作假更为方便;四是基层政府统计部门的人员配置只能应付数据采集、处理任务,对社会经济运行的分析研究不是统计部门的优势,要扬长避短,不要顾此失彼,如果没有准确的统计数据,就不可能有高质量的统计分析,若只是数据文字化则本身就是徒劳。

    8.要关注“富瞒穷虚”的统计现象。不少富裕地区没有完善全面反映社会经济的发展情况,反映总量指标时瞒的成分非常大,美言“留有余地”,而且在反映增长速度时大搞“橡皮筋”游戏,有很好的伸缩力,想缓速度少报几个单位,想加快速度多挖潜几个单位;而穷的、经济基础比较薄弱的地区,有强烈的“赶超”意识,千方百计地利用统计上的“盲点”,提高经济总量及其发展速度。如无法详尽搜集到统计资料的限额以下工业总产值、农业总产值等大做文章,来料加工产品按全值计算等。

    三.统计部门在缩小统计误差中的应有作为

    1.统计设计中必须对登记误差有要补救措施,建立所谓“测谎”系统。源头数据质量问题统计部门往往把责任推给受调查者,有无能为力之感。如农业普查采取逐户登记的办法进行,农户往不往不能或不敢如实申报,多数应该是少报,而我们在实际普查过程中,事后质量抽查实质是为了“测谎”,可惜很多普查机构对这一环节重视不够,面上调查完成后有大功告成的感觉,对这一阶段工作敷衍了事,不敢揭露问题,不深入开展工作,往往得到的误差几乎为零,使这一环节气扎扎实实走过场,得到结果可想而知,如农普的畜牧生产情况数据与原来的统计数据甚远,究竟哪个为准都没有说服力。在抽样调查方案设计中,也应建立“测谎”系统,否则调查误差始终是统计数据质量的“瓶颈”。 “测谎”系统要建立必要指标体系和评价方法,要广泛使用数理统计中的假设检验方法。

    2.必须有完善的指标体系及其计算方法。目前在总结国民经济核算体系中就速度问题的计算方法重视不够,五花八门,无所适从。而且到目前为止是继续采用过去一起沿用的不变价方法,还采用价格指数剔除法都不很明确,甚至专业统计和综合平衡统计计算方法截然不同,甚至省和市一级的计算方法也不同,公布的速度也不一样,造成不良的社会影响。

    3.在抽样调查工作中,上下应该采取不同的样本,对总体单位较少的总体不宜采用抽样调查。上下采用同一样本最容易受到人为的干扰,特别是统计部门为了保持数据的延续性所作各种“技术性”调整。抽样调查在国家一级和省一级大面积推广积极作用不容质疑,但在地市一级、县级进行就不是“一抽就灵”, 如某县在商饮抽样调查中,抽3-5单位推算全县的饮食业零售额,其误差和人为因素就可想而知。因此,统计部门要在对总体分析的基础分析再选择调查方法。

    4.在统计体制上必须进行彻底的变革。国家、省一级的正常统计任务今后应以三支调查作为其调查骨干,不应再采取逐级上报的方式。市、县及以上统计机构的统计任务以为当地党政领导决策服务为主,统计基本内容可统一,但要赋予更大的主动权。

    5.加大统计执法力度,保证源头数据的准确性。基层统计部门今后应在加强统计信息工程建设的基础上从数据采集的圈圈中跳出来,重点加大统计执法检查,对弄虚作假的单位要坚决严肃查处,在立法上罚款数额应该大幅增加,以威慑统计违法者,逐步建立全社会的统计诚信体系。

    本文是作者对统计误差的肤浅认识,旨在唤起统计部门更重视统计数据质量,提高统计服务水平,抵制统计上弄虚作假的行为,同时希望得到领导和社会各界对统计工作的理解和支持。