您现在的位置: 新语文 >> 市场营销 >> 广告销售 >> 培训教材 >> 正文
辅助信息及在抽样调查中的应用         ★★★ 【字体:
辅助信息及在抽样调查中的应用

作者:佚名     人气:532    全球最全的财富中文资源平台

本文介绍了辅助信息的内涵、分类,重点阐述了它的应用:改进抽样方法、改进估计方法、同时改进两者和进行样本轮换。
  一、辅助信息及其分类
  抽样调查是通过对样本的调查达到对总体目标量的估计。在抽样调查中,调查指标的样本信息是估计总体目标量必不可少的信息。通过对样本调查并对所得数据加以整理,获得调查指标在总体中分布的某些特征,由此给出总体目标量的估计。我们把调查指标的样本信息称为基本信息。由于样本是总体的一部分,抽样又是按照一定概率进行的,故样本提供的是不全面的且带有随机干扰的信息,这就是说,基本信息不仅信息量极其有限,而且这极其有限的信息在反映总体特征时常常伴有不可消除的偏差,这就必然使估计量精度受到一定限制分。
  在许多情况下,我们在抽样调查之前对总体及抽样单元并不是贫乏到一无说知的地步,往往是事先掌握某些可资利用的总体信息及抽样单元信息,而在抽样调查中除了获得调查指标的样本信息之外,常可伴随获得其它可资利用的样本信息。这些信息对改善样本的代表性、提高估计量的精度有积极作用,若不能充分地利用,势将造成信息资源的浪费。我们把除调查指标样本信息以外的一切有关总体、抽样单元及样本的信息统称为辅助信息。在不扩大调查规模的情况下,充分利用辅助信息是提高估计精确度的有效手段。
  辅助信息就其性质可分为以下几类:
  第一类是反映总体结构的信息。如总体抽样单元按调查指标取值差异程度可分为若干层,各层的构成及其在总体中所占比重等信息。
  第二类是反映抽样单元规模的信息。如在总体分为不同级别的抽样单元时,常可用某一级别抽样单元包含下一级别抽样单元的数目或其它度量值表示这一抽样单元的规模或大小。
  第三类是与调查指标密切相关的辅助指标的信息。例如在对居民支出进行调查时,居民收入就是一个与支出有着高度相关性的辅助指标。这种辅助指标的信息可以是总体的,也可以是抽样单元和样本的。在一些经常性的抽样调查中,常取上期调查指标作为现期调查指标的辅助指标,有时也可用同一调查项目的近期普查指标作为现期抽样调查指标的辅助指标,这时辅助指标提供的信息即调查指标的历史信息。
  二、辅助信息在抽样调查中的应用
  1.应用辅助信息改进抽样方法,改善样本的代表性
  在抽样调查中除了样本容量之外,抽样方法、估计方法都对估计量的精度有重要影响。评价抽样方法优劣的标准就是看按这一 方法抽得的样本其代表性如何,也就是考察样本特征的能力如何。如果一个样本可以作为总体的缩影,能够反映总体分布的基本特征,那么其代表性就好,调查资料的偏差就比较小,据此对目标量进行估计时精度就比较高,否则就比较低。因此,在抽样调查中为了使样本具有较好的代表性,常常通过改进抽样方法来实现。调查前已掌握的总信息和抽样单元信息就可用于抽样方法的改进。
  例如在总体抽样单元调查指标值差异悬时,采用简单随机抽样有可能得到极端的样本,使估计值出现很大偏差。这时如果已总体可分为若干层,层内抽样单元之间差很小,不同层之间差异较大,就可改简单随油样为分层随机抽样,从而避免出现极端样本,使样本能较好地反映总、体分布的特征,使估计有较小的偏差。再如等距抽样是一种极方便的抽样方法,但是当总体抽样单元徘列具有线性趋势时,随机起点等距样本往往提供过高或过低的估计值。如果已知抽样单元排列具有线性趋势,则可把随机起点等距抽样改进为随机起点对称等距抽样,从而大大改善了样本的代表性,避免出现有较大偏差的估计值,有利于估计精度的提高,效果极为显著。在实际工作中,不可能根据调查指标的取值来获得总体单元的排列,然而若存在与调查指标有高度线性相关性的辅助指标,各抽样单元取值已知,就可根据辅助指标为造总体单元的排列。如果排列呈线性趋势,由相关性,各单元按调查指标排列也必呈线性趋势,就可应用对称等距抽样。在应用上常取调查指标的前期指标为辅助指标,此时两者之间往往呈高度线性相关,且前期指标取值已知。例如我国农产量抽样调查就采用按近三年平均每公顷粮食产量由低到高顺序排列,使排列具有明显的线性趋势,实施随机起点对称等距抽样。在上面这些例子中,总体信息、辅助指标信息在抽样方法的改进中起了关键作用。

  在抽样调查中,尽管等概率抽样是一种应用最广泛的抽样方法,但并不是对任何总体都是最适宜的方法。当抽样单元规模(大小)不等从而在总体中所处地位不一致时,对抽样单元的等溉率抽样将压缩大的抽样单元对总体的影响,扩大小的抽样单元对总体的影响,因此等概率抽样提供的信息是扭曲的信息,对总体目标量的估计效果一股不会很好。如果事先已知抽样单元规模(大小),从而改等概率抽样为不等溉率抽样,使大单元入样概率大,小单元人样概率小,就可使样本按照抽样单元在总体中所处地位的程度反映总体分布的特征,有助于提而估计的精度。 在这里,抽样单元的规模(大小)作为一种辅助信息对确定抽样单元人样概率、改变样本特性起行决定性作用。
  2.应用辅助信息改进估计方法,提高估计的精度
  评价估计量精度的常用标准是估计量的方差。在抽样方法固定的条件下寻求具有较小方差的估计量历来是抽样调查的核心问题之一。通常的简单估计量仅仅使用调查指标的样本信息,除此之外不再使用其它信息,包括抽样调查之前已知的辅助指标总体后息及抽样调查中可伴随获得的辅助指标样本信息,信息使用的种类单一,信息量利用率低,因而精度不高。如果在构造估计量时不仅使用调查指标的样本信息,而且同时使用辅助指标的总体信息和样本信息,那么在抽样方法和样本容量固定的前提下,这种估计量的信息量就会比简单估计量丰富得多,必然有助于提高估计精度。调查前己掌握的总体信息连同调查时伴随获得的辅助指标样本信息常可用于估计方法的改进。
  在抽样调查中,如果存在与调查指标y有较高正相关性的辅助指标x,就可利用辅助指标的总体信息及样本信息构造比估计量:
   yk= y∕x*x
和回归估计量:
    ylr=y+b(x-x)
  作为调查指标总体均值Y的估计、在这两种估计量中,除了调查指标样本信息y外,还使用了辅助指标的总体信息X和样本信息x,其信息量比通常的简单估计量y大为丰富,因而可望有较高的精度。事实上,不论调查指标和辅助指标线性相关程度如何。回归估计量的精度都不低于简单估计量,而两指标线性相关程度较高时,比估计量的精度将优于简单估计量。这类估计量的一个典型应用场合是农产量抽样调查。在正常年景下,当各方面条件基本不变时,相邻两年的产量具有较高的正相关性;以上年产量作为辅助指标构造比估计量变和回归估计量,在相同的样本下,可以获得比简单估计量精度高得多的估计。           
  3.应用辅助信息同时改进抽样方法和估计方法
  将辅助信息应用于抽样调查,除单独用于改进抽样方法以改善样本代表性或单独用 于改进估计方法以提高估计精度外,也可同时应用于两者,以最大限度地发挥辅助信息的作用。在抽样和估计两个阶段,可同时使用同一种辅助信息,也可将两种辅助信息有机结合使用。

  例如在农产量抽样调查中,由于各种因素的影响,不同的抽样单元农产量亩产之间存在显著差异。对这种总体要提高样本代表性最好的方法是实施分层抽样。如前所述,在正常年景下相邻两年产量具有较高的正相关性,因此可以上年产量作为辅助指标对总体实施分层以获得有较好代表性的样本,其效果与应用 当年指标分层基本相当。在构造估计量时再次利用这种正相关性构造分层比估计量或分层回归估计量,使相关性辅助指标的信息在抽样和估计两个阶段得以充分利用。
  众所周知,整群抽样是一种有着广泛应用的抽样方法。在实际问题中,群的划分通常是基于某种方便的原则,例如按行政区划、部门行业、地理区域或时间顺序分群,此时群的大小往往差异显著。为提高估计精度,可采用PPS整群抽样,即按与群的大小成比例的概率抽样。在这里使用了作为初级单元的群的规模辅助信息。但是当群内方差过小,群间方差过大时,估计精度仍可能不高。在这种情况下,如果存在与调查指标有着较高的正相关性的辅助指标,就可用此辅助指标构造PPS比估计量或PPS回归估计量提高估计精度。反映抽样单元规模的辅助信息和相关性辅助指标的信息、结合运用,最大限度地发掘了辅助信息的效益。
  4.应用辅助信息进行样本轮换
  为了获得具有一定间隔时期的资料并使其具有可比性,在经常性的抽样调查中往往采用固定样本的调查方式。但是这种固定样本的调查方式存在严重缺陷,主要是当样本代表性下降即呈老化状态时估计精度低。 因此,对周期性进行的抽样调查.为了样本具有较好的代表性以获得精度较高的估计。 不能采用固定样本的方式,必须对样本实施轮换。
  样本轮换的核心问题是确定样本轮换率,即被轮换的抽样单元在样本中的比例,这 可应用相关性辅助指标确定。在周期性的抽样调查中,以y记现期调查指林,以x记上期调查指标,以y1,y2…,yn记上期样本现期观察值,以x1,x2…,xn;记上期样本当期观察值,得两期观察值间的样本相关系数:
      r=∑(xi-x)(yi-y)/      
  在某种条件下,由于事物发展过程呈现连续性,相邻两期指标间具有正的相关性,从而0≤r≤1。 如果r=1,表明y和x以概率1有完全的线性关系,即上期样本现期观察值y1,y2…,yn完全可以由上期观察值x1,x2…,xn解释,因此现期指标观察值对于估计现期总体目标量毫无新的价值,也就是说这样的样本完全老化,应全部轮换。如果r=0,表明y和x没有线性关系,上期样本现期观察值完全不能由上期观察值解释,可以认为上期样本对现期调查来说仍有很好的代表性,不必轮换。如果 0<r<1,表明 y与 x有一定的正相关性,其程度视r值而定。这时可以认为上期样本有一定程度的老化,其大小可用r描述。r越大,现期观察值可用上期观察值解释的比重也就越大,样本老化程度就越严重;r越小,现期观察值可用上期观察值解释的比重就越小,样本老化程度就越不严重。因此上期样本相邻两期观察值的样本相关系数r可作为样本老化程度的质量,其数值就是现期观察值可被上期观察值解释的比重c这样,以上期调查指标为辅助指标,可用调查指标与辅助指标之间的相关系数作为样本轮换率来决定样本轮换量。
统计与预测   俞纯权  
财富论今——新的理念  心的飞越   
  • 上一篇财富:

  • 下一篇财富:
  • 打造全球最全最实用的财富中文资源平台!     的理念   的飞越