数理统计学及其应用领域

来源:    发布时间:2007-09-05

打印本页

分享到:

    数理统计学是“数学的一个分支学科。研究怎样去有效地收集、整理和分析带有随机性的数据,以对所考察问题作出推断或预测,直至为采取一定的决策和行动提供依据和建议。” 此一定义明确了数理统计学的研究对象与研究目的。
 
    数理统计学是应用性很强的学科,它已被应用于各种专门领域(如物理、化学、工程、生物、经济、社会等),但只涉及其中有关带随机性的数据的分析问题,而不是以任何一种专门的知识领域为研究对象。但是,在应用数理统计方法分析带有随机性数据时,从统计模型的选择、实验方案的制定、统计方法的正确使用以至所得结论的恰当解释,都离不开所论问题的专门知识。
 
    数理统计学内容庞杂,分支学科很多,难以作出一个周密而无懈可击的分类。这些分支学科大体可以划分为以下三类:
 
    第一类分支学科包括抽样调查和试验设计,主要涉及与数据收集有关的理论和方法问题。
 
    第二类分支学科主要涉及统计推断的原理与方法,包括:(1)与特定的统计推断形式有关的参数估计和假设检验,(2)与特定的统计观点有关的贝叶斯统计和统计决策理论,(3)与特定的理论模型或样本结构有关的非参数统计、多元统计分析、相关分析、回归分析、方差分析、序贯分析、时间序列分析和随机过程统计。
 
    第三类分支学科是一些针对特殊的应用问题而发展起来的分支学科,如产品抽样检验、可靠性统计、统计质量管理等。这类分支学科都不涉及或很少涉及任何一种专门学科的知识,但一般需要考虑数据的收集和统计推断两方面的问题。例如,产品抽样检验的任务是制定从一批产品中作随机抽样的方案,并依据由此获得的样本去决定是否接受该批产品。这里,有抽样方案的统计问题,也有使用数据作统计假设检验的问题。
 
    除以上三类分支学科之外,还有一类称之为边缘学科分支,如生物统计学、医学统计学、气象统计学、地质统计学、教育统计学、经济计量学、社会计量学、政治计量学、语言计量学、历史计量学等。这类分支学科所讨论的是统计方法在某一特定学科中的应用,涉及大量有关学科的专门知识,故不适宜当作数理统计学的分支。
 
    从上面对数理统计学的分支学科的划分,我们大致可以看出数理统计学的应用领域与范围。数理统计方法在工农业生产、自然科学和技术科学以及社会经济领域中都有广泛的应用。数理统计方法的恰当应用依赖于所论问题的专门知识、经验,以至良好的组织工作,故从本质上来说,数理统计方法基本上是一种辅助性的工具。
 
    1.在农业中的应用。数理统计方法在农业中应用的一个主要方面,是对田间试验进行适当的设计和统计分析。试验设计的基本思想和方法,就是从田间试验开始发展起来的。数理统计方法在农业中应用的另一领域就是数量遗传学。例如,在培育高产优质农产品的研究中,其数据分析就需要使用多种统计方法,如应用很复杂的回归和方差分量分析的方法来计算遗传力。
 
    2.在工业中的应用。数理统计方法在工业中的应用,主要有二方面。一是应用正交设计、回归设计、回归分析、方差分析、多元统计分析等统计方法来解决以下一系列问题:试制新产品和改进老产品,改革工艺流程,使用代用原材料和寻找适当的配方,判定影响产品质量的重要因素、次要因素,决定一组最优的生产条件。二是应用统计质量管理的统计方法,通过种种形式的质量控制图、抽样检验、可靠性统计分析以解决下面一些与工业中大批量及连续生产有关的问题:工序控制,制定成批产品的抽样验收方案,对大批生产的元件的可靠性及包含大量各种元件的系统的可靠性。
 
    3.在医、药学中的应用。医、药学是较早使用数理统计方法的领域之一。在医学研究中,为防治一种疾病,统计方法常被作为重要的研究工具,用来发现和验证导致这种疾病的种种因素。例如,应用统计方法证实肺癌与吸烟的关系。数理统计方法在医学中的应用,就形成了医学统计学、生存分析等边缘分支学科,也构成了理论流行病学。临床流行病学的主要内容。在药学研究中,通过临床试验,应用正交设计、交叉设计、回归分析、方差分析、列联表分析等统计方法,来确定一种药物对治疗某种疾病是否有效,用处多大,以及比较几种药物或治疗方案的效力。
 
    4.在自然科学和技术科学中的应用。在基础理论研究中,一方面,一种学说或假说是否正确,或在多大程度上正确,要诉诸于大规模的实验验证,其中就有实验的设计和数据的统计分析问题;另一方面,统计分析也有助于发现某种规律性,并在寻求理论上的解释中可以形成新的理论。一个著名的例子就是孟德尔的遗传定律的发现。孟德尔在豌豆试验中发现了此一定律,以后由许多人通过进一步的试验,并用数理统计学的拟合优度检验法验证了该定律。在寻求该定律的理论解释的过程中,便诞生了“基因学说”。
 
    在应用性研究中,由于对所研究现象的规律性认识不充分,人们不得不依靠对实验和观测数据进行统计分析(统计推断与统计预测),以提出解决问题的办法。例如,统计方法用于地震、气象和水文方面的预报,都有一定的效果;在地质勘探中,人们在一个地区的若干点(点的选择也有统计上的考虑)进行观察,对其结果用种种统计方法,如趋势面分析、对应分析等进行处理,以建立某种经验性质的规律,用以指导找矿。
 
    数理统计方法在自然科学和技术科学中,已得到很广泛的应用,随之便产生了许多诸如统计物理学、计量化学、地质统计学、气象统计学、数量遗传学、生物统计学、水文统计学、技术计量学等边缘分支学科。一般而言,无论是自然科学还是技术科学,都离不开实验观察,都有处理数据的问题,因此也就有统计方法的用武之地。可以这样说,凡是有数据的地方,都是数理统计方法的应用去向。
 
    5.在社会、经济领域中的应用。数理统计方法在社会、经济领域中,有着重要的应用。在西方发达国家,数理统计方法在这些领域中的应用,要比其在自然科学和技术领域中的应用更早且更广泛。例如,社会学中的抽样调查、列联表分析,人口学中的人口发展动态模型、随机过程统计,经济学中的经济计量模型等使对社会现象研究的定量化发展趋势日益彰显。在经济科学中,定量化的趋势要比其他人文社会科学部门更早且程度更深,如早在本世纪的二、三十年代,时间序列分析方法就已经用于市场预测,继之一门边缘分支学科——经济计量学便应运而生。值得注意的是,自1969年设立诺贝尔经济学奖以来,其得主三分之二以上的都是经济计量学家,曾担任过“经济计量学会”这一国际性学术团体的会长。
 
    如教育统计学、人口统计学、经济计量学、社会计量学、政治计量学、语言计量学、历史计量学等边缘分支学科正是数理统计方法在社会、经济领域中的应用结晶。
 
    6.在企业经营管理中的应用。
 
    ①市场研究。在市场经济的今天,开展市场研究尤其重要。市场研究是为某一特定的市场营销问题的决策而开发和提供其所需的信息的一种系统的、有目的的活动或过程。这里所说的信息,不仅是市场调查所得的数据资料,还包括市场研究人员对资料进行分析所得的结果(如结论、建议等)。市场研究的范围包括:产品研究、销售研究、市场与销售潜量的估计、价格研究、购买行为研究、竞争分析、广告及促销研究、销售成本和利润分析、营销环境研究。这些研究又可归结为四类:
 
    (1)探测性研究,适用于需要研究的问题和范围不是很明确,无法确定调查内容,引起问题的原因不很清楚的情形。通常的做法:收集与分析第二手资料,集中专家或相关人员的意见,进行小规模的试点调查、定性研究、实例分析。
 
    (2)描述性研究,回答事先计划好的问题,如“什么”、“何时”、“怎样”。通常的做法是:给出统计图;计算基本统计量(如相对指标、平均指标、变异指标等);进行相关分析,确定市场营销中有关问题的相关因素、相关关系及关联程度。
 
    (3)因果关系研究,用于寻找问题的原因,或确定变量之间有无因果关系。通常的做法是先确定分析对象及其影响因素,然后建立具有单方程或联立方程形式的经济计量模型,应用回归分析方法进行测定。
 
    (4)预测性研究,用于对市场潜力、企业产品前景等进行预测,以此作为市场营销决策的依据。通常的方法包括:专家意见法,移动平均法,指数平滑法,Box-Jenk-ins法,经济计量模型法,投人产出模型法等。
 
    在市场研究中,常用且有效的方法就是应用数理统计方法,比较基本的有列联表分析、相关分析、方差分析;比较高级的有多元统计分析中的聚类分析、判别分析、主成份分析、因子分析、多特性模型等。
 
    聚类分析的目的在于辨别在某些特性上相似的事物,并按这些特性将样本划分成若干类(群),使在同一类内的事物具有高度的同质性,而不同类的事物则有高度的异质性。在市场研究中,聚类分析主要用于对消费者群进行市场细分,对产品进行分类,选择试验市场,确定分层抽样的层次,分析消费者的性格特征和行为形态等方面。
 
    判别分析的原理是:依据样本的某些特性,以判别样本所属类型。与聚类分析不同的是,判别分析是在已知研究对象用某种方法分成若干类的情况下,建立判别函数,用以判定未知对象属于已知分类中的那一类。在市场研究中,判别分析主要用于对一个企业进行市场细分,以选择目标市场,有针对性地进行广告、促销等活动。
 
    主成份分析是把多个指标化为少数几个综合指标的一种多元统计方法。它采用一种降维的方法,即通过适当的变换,找出几个综合因子来代表原来众多的变量,使这些综合因子能尽可能地反映原来变量的信息量,而且彼此之间互不相关。在市场研究中,主成份分析主要用于分析消费者的嗜好,以此对消费品进行分类。
 
    因子分析是这样的一种多元统计技术:从众多变量中提取出少数共同“因子”,用最少的因素综合解释大量资料,简化变量间的关系,从而分析影响变量、支配变量的共同因素(又称公共因子)有几个,各因素的本质如何,以由表及里地探索事物之间的本质联系。在市场研究中,因子分析常用来分析消费者对各种消费品的态度,研究消费者选择消费品的因素,以对制定营销策略和拟定广告宣传主题提供参考依据。
 
    多特性模型就是利用与产品有关的多种特性来选择产品的一种统计模型,是一种总合所有消费者意见的多元统计分析方法。
 
    ②经济活动分析。多元统计分析中的聚类分析、判别分析、主成份分析,因子分析等方法除了应用于市场研究之外,还可用于进行企业或部门的经济活动分析。例如应用聚类分析方法按经营状况对企业或部门进行分类;根据已有的关于企业经营状况的分类及某一企业的一些经济效益指标,应用判别分析方法确定该企业的经营状况的类属;根据一些经济效益指标,应用主成份分析方法进行综合评价,确定企业的排名;根据反映企业经营状况的大量指标,应用因子分析方法确定影响经济效益的潜在因素。
 
    经济活动分析本质上是事后分析,或称为影响因素分析,即在明确分析对象的影响因素的基础上,要确定各因素影响的显著性及影响程度,并从中找出主要的影响因素。此时,有统计软件包帮忙,经济计量学的经济计量模型就可以使经济活动分析变得容易得多了。
 
[作者:伍超标  杨维权 摘自《统计与预测》2000年增刊]