您的当前位置:首页正文

规模以下工业调查的若干问题研究

来源:化拓教育网
第36卷第3期统计研究Vol. 36, No. 32019年3月Statistical ResearchMar. 2019规模以下工业调查的若干问题研究金勇进姜天英内容提要:规模以下工业调查作为工业统计调查的重要组成部分,是收集规模以下工业数据的主要 工具。自1996年试点调查以来,规模以下工业调查制度已经过多次调整,但仍有部分问题尚待解决。 在系统梳理了规模以下工业调查发展历程的基础上,本文对我国现行的抽样调查设计进行了详细总结; 而后结合实地调研,从数据角度出发研究了规模以下工业调查存在的若干问题:抽样框问题、数据质量

问题和工业统计规模划分问题。最后针对以上三大类问题提出了相对应的改进建议。关键词:规模以下工业抽样调查;抽样框;调查误差;地域抽样;工业规模划分标准DOI: 10. 19343/j.cnki. 11-1302/C.2019. 03. 004

中图分类号:C811 文献标识码:A 文章编号:1002-4565(2019)03-0042-09A Study on Some Issues in Industrial Surveys under a

Designated SizeJin Yongjin & Jiang TianyingAbstract: An industrial survey under a designated size is one of the most important components of the

industrial statistical survey and a primary tool for collecting industrial data under a designated size. Since the

pilot suwey conducted in 1996, there have been many adjustments in industrial surveys under a designated

size, but still there are so many issues to be confronted. Based on the hackle of the history of industrial surveys

under designated sizes, this paper sums up the current sample survey designs in China. Then taking the field work findings into account, it studies some related issues existing in the industrial surveys under the designated

sizes from the data point of view, such as: sampling frame, data quality and standards of categorizing industrial sizes. Finally, proposals on dealing with all these issues in these three categories are raised.Key words: Industrial Sample Survey under a Designated Size; Sampling Frame; Survey Error; Area

Sampling; Standards for Categorizing Industrial Sizes规模以下工业是工业生产活动的重要组成单位,其在解决就业、增加收入、促进创新等方面具

有突出贡献,发展意义重大。我国现行规模以下工业的调查标准为年主营业务收入2000万元以下

的工业法人单位和全部个体经营工业单位,通过对抽取的目录企业样本和样本村(居委会)中的非 目录企业、个体经营工业单位进行调查并推估总体以反映规模以下工业生产经营情况以及面临的 突岀问题。规模以下工业调查作为收集数据的工具,由于各方面的主客观原因,在实际调查中已暴

露出诸多弊端。本文通过实地调研数据,以湖北省为例,对规模以下工业调查存在的问题进行定量

含哲说皂译出相应的改进建议,以期推动规模以下工业调查的进一步完善。*本文获国家社会科学基金项目“大数据背景下非概率抽样的统计推断问题研究\"(15BTJ014)、中国人民大学“中央高校建

设世界一流大学(学科)和特色发展引导专项资金”、中国人民大学科学研究基金(中央高校基本科研业务费专项资金资助)项目 \"规模以下工业企业捕样框问题研究\"(I8XNH090)的资助..第36卷第3期金勇进姜天英:规模以下工业调查的若干问题研究• 43 •一、规模以下工业调查的发展历程和调查设计(一) 规模以下工业调查的发展历程1996年11月,规模以下工业首次进行试点调查,将限额指标定为工业总产值,限额值定为500

万元,调查对象为乡及乡以上独立核算法人工业企业和工业活动单位(雷平静,1997)⑴;1997年在

全国范围内试行。1998-2005年,调查的限额指标调整为产品销售收入,调查对象修订为非国有工 业企业和全部个体工业单位(“规模以下工业抽样框问题研究”课题组,2003)⑵。其中,1998年获

取年度数据;1999-2001年,每年调查两次,分别获取前三季度数据和年度数据;2002-2005年每年 调查四次,分为年报(1-H月)和三次定报(1-3月,1-5月和1-9月),其中在1-3月和1-9月调

查中实行以国家为总体的调查方案,采用小样本进行调查,在1-11月和1-5月的调查中采用以省

为总体的大样本调查(田秀华,2002)⑶。2006-2010年,调查对象调整为年主营业务收入500万元 以下的工业企业和全部个体工业单位,企业和个体工业每年均开展三次定期报表和一次年报;2011

-2017年,限额值调高到年主营业务收入2000万元(国家统计局,2017)⑷。(二) 规模以下工业抽样调查设计规模以下工业总体分为企业子总体(包括目录企业和非目录企)和个体工业子总体,其中目录 企业的调查方法为一阶段分层简单随机抽样,非目录企业和个体工业单位的调查方法为分层随机 整群抽样。调查的精度为在95%的置信度下,最大相对误差控制在10%以内。下文分别对目录企

业、个体工业单位和非目录企业抽样设计进行说明。1. 目录企业抽样设计。目录企业的调查是依据企业名录库,同时以31个省(自治区、直辖市,以下简称省)和41个行

业大类为总体,采取一阶段分层随机抽样获取样本。其具体流程为:第一,整理抽样框。目录企业 抽样框的范围是包括全部有名录的规模以下工业企业,其内容包括企业基本属性和基本价值量指

标,如企业代码、地址、行业分类、主营业务收入等。第二,确定样本量。样本量的确定需要同时满 足以省和以行业为总体的抽样精度要求,该步骤由国家统计局完成。第三,确定分层方式。该阶段

是按照行业大类分成41个行业层,若某行业层没有分配到样本单位,则在该层增加2~4个样本单 位。若分配给某行业层的样本量较大时,则需要在行业层内部进一步分层。第四,抽取样本。采用

“永久随机数”方法抽取样本。第五,确定权数。在基础权数(该样本企业入样概率的倒数)的基础

上,当遇到应报送但未上报等情况时对其进行调整,得到最终权数,并最终进行目录企业的总量 估计。2. 个体工业单位抽样设计。针对个体工业子总体,按照地域抽样框,采用分层随机整群抽样方法。其具体步骤为:第一,确

定抽样框。包括全省范围内所有的村(居委会)。抽样框的内容主要包括:村(居委会)的基本信息

和经济信息,如果该村(居委会)内没有个体工业单位,则该村(居委会)的相关指标数据记为“0”。 第二,确定样本量。该阶段的样本量由各调查总队根据要求精度计算的。第三,确定分层方式。以 村(居委会)的个体规模进行分层,可灵活掌握分层数量,并以累计平方根法确定分层界限;在抽取

样本和确定权数上则与企业子总体相同,最终进行个体工业子总体的总量估计。3. 非目录企业抽样设计。非目录企业一般是由于建立企业名录库时遗漏或者是建立名录库后新生的企业。其样本的确 定必须满足不在目录企业抽样框中且位于村(居委会)整群样本地域范围之内。抽样方法与个体

工业单位相同。• 44 •统计研究2019年3月综上,对于规模以下工业的调查主要采用的是一阶段分层随机抽样和分层随机整群抽样。其 中,工业子总体是以分层随机抽样为主抽选目录企业,以分层整群抽样为辅获取非目录企业,而后

将二者加总,得到企业子总体的估计(王文颖,2007)⑸。同时,规模以下工业抽样调查会依据经济

普查结果,每五年进行一次样本轮换,以提高样本的代表性。二、规模以下工业调查存在的问题规模以下工业自试点调查以来,已经过20多年的探索和修改,但仍有一些难点问题尚未得到

有效解决。本文通过实地调研和数据分析发现,难点问题主要有以下几个方面。(-)抽样框缺乏稳定性以及更新维护滞后规模以下工业抽样调查涉及两类抽样框:目录企业抽样框和地域抽样框。其中,地域抽样框是

以村(居委会)为样本单位,因村(居委会)的划分或变动与行政管理系统有关,稳定性较高;而相比

下,由于市场竞争加快,企业新增和消亡现象发生频繁.使得目录企业抽样框变动较大,因此,本文 研究的抽样框稳定性和更新维护工作主要针对的是目录企业抽样框。为了更好地说明目录企业抽

样框的稳定性情况,以下分别从总体框和样本框两个角度进行说明。一是总体上的对比。本文将2013年湖北省在第三次经济普查后核实的目录企业抽样框(主要 是对第三次经济普查的数据进行过滤、核查及更正名录库内的有关信息,该数据可作为湖北省当年 的总体数据)与截至2017年底湖北省企业名录库的动态更新数据进行对比,从总体角度说明总体

框的变动情况。由2013年核查后的目录企业抽样框数据可得,规模以下目录企业分布在41个行 业大类,共计34880家,其中正常营业企业数量占比90. 05% ;由2017年底的企业名录库数据可得,

规模以下工业企业数量上升至93890家,其中正常营业企业数量占比82. 54%。可以发现,2013-

2017年,规模以下工业企业数量增长率高达169%,正常营业的企业数量增长率达147%,可见规模

以下工业企业数量突飞猛进,保持了较高的增长率;同时也说明,新增企业的数量大于2013年已存 在的企业数量。从企业消亡来看,2017年正常营业企业数量占比低于2013年,企业的消亡速度也

在加快。二是样本上的对比。在新一轮的样本轮换中,湖北省在目录企业抽样框中共抽取865家目录

企业,同时在320个样本村(居委会)中确认非目录企业。在这里将湖北省2016年和2017年的样 本数据进行对比来说明样本框变动情况。在2016年的865家目录企业中,正常上报的有358家,

处于关闭、停产、转产、被合并状态的企业占比超过一半,同时也有部分企业经营状态良好,转入规 模以上企业;2016年共有301家非目录企业,其中正常上报的有207家,而其余不能正常上报的企

业主要原因是关闭和停产。在2017年的865家目录企业中,正常上报的有301家;非目录企业共

有406家,正常上报的有235家。对比发现,2016-2017年,正常上报的目录企业(不包含升规企

业)数量减少了 15.92%;非目录企业虽然在数量上增加了,但正常上报的企业数量占非目录企业 的比例却在减少。由此可得,2016-2017年,规模以下工业企业总数量在增加,但正常上报的企业

数量却在减少,说明湖北省规模以下工业样本企业消亡速度过快。由以上两个角度的数据分析可得,规模以下工业企业总体框和样本框均处于不断变动中,企业

新增和消亡速度较快,使得调查样本延续性较低。因目标总体处在不断变化中,抽样框缺乏稳定 性,由此将会导致抽样框误差,从而影响对规模以下工业目标量估计的准确性。同时,在实地调研 中发现,企业名录库的来源较为广泛,各来源渠道数据均不完整且缺乏信息共享渠道,使得更新维 护工作量较大,从而导致处理滞后;而且,很多企业存在虚假信息或无法找到等情况,因此在对企业 名录库的维护更新上主要是存续状态的核实,相关的价值量指标仍需进一步核查。第36卷第3期金勇进姜天英:规模以下工业调查的若干问题研究• 45 •(二) 样本与总体存在差异规模以下工业一般在经济普查年份获取全部企业数据,在经济普查后的非普查年份,按照经济 普查数据制定抽样框对样本企业进行调查。为了比较样本与总体间的差异,本文选取湖北省2013 年核查后的目录企业作为总体,选取依据2008年第二次经济普查抽取的2013年规模以下工业企

业抽样调查的目录企业作为样本进行对比来说明二者间的差异,其中2013年规模以下工业样本企

业共包括984家企业(859家目录企业,125家非目录企业)。第一步,对相关变量进行样本-总体分布的一致性检验。采用K-S检验对主营业务收入、从业人员数进行分布一致性检验。结果表明,在99%的置信

水平下,两个变量在样本和总体中的分布均存在明显的差异。说明在2013年规模以下工业企业抽 样调查时,基于第二次经济普查构建的抽样框的样本和当时实际总体之间的分布已经发生了较大

改变,样本代表性不高。第二步,对相关变量进行样本-总体的代表性检验系数。将主营业务收入作为目标变量,从业人员数和行业分类作为辅助变量。其中主营业务收入和 从业人员数为连续型变量,其代表性检验系数计算公式为:V = ------L X 100%

I y - y|y(1)其中,y指依据样本推断的总量,y指总体真值,y—般要求控制在3%以内。行业分类为离散型变量,其代表性检验系数计算公式为:n n - P nu=Y —P, =ZIa-^I (2)i = 1 尸i i= 1P — P其中,将-―-X 100%称为第i个水平下的结构差异率,P,和P,分别表示第i个水平下样本和总体的频率,\"一般要求控制在10%以内(宋子轩等,2012)[6]。通过数据计算可得,主营业务收入的代表性检验系数为19. 8%,说明样本与总体的偏离程度 较高;从业人员数的代表性检验系数为5. 4%,偏离程度较主营业务收入较小,主要原因是对于规

模以下工业企业来说,除非是经历技术革新,替代大量劳动力,否则从业人员数较为稳定。行业分 类的代表性检验系数高达60. 3%,主要原因是部分企业由于总体较少,可能全部入样,使得该行业 在全部行业内的结构差异率较大,从而使得从全部行业的角度上代表性检验系数较高。第三步,计算辅助变量的整体差异率。将辅助变量分别与目标变量计算相关系数,将其标准化作为辅助变量的权重。对第二步得到

的从业人员数和行业分类的代表性检验系数做加权求和,得到辅助变量的整体差异率为20. 3%。 结合第二步计算的目标变量主营业务收入的偏离程度为19. 8%可以发现,不管从目标变量角度还 是从辅助变量角度,两者衡量所得的样本相对于总体的差异都在20%左右,说明样本与总体的偏

离程度较高,样本代表性不足。通过以上分析可以看出,依据经济普查获得的抽样框在新一期样本轮换的开始年份可能具有

较强的代表性,但随着时间变化,目标总体结构也在不断变化,而样本却保持不变,样本代表性将会 降低,从而在一定程度上影响估计精度。(三) 存在调查误差在实地调研中发现,规模以下工业调查存在着抽样误差之外的调查误差,而调查误差主要是由 调查数据本身引起的,一般不能通过增加样本量来解决,总结起来主要有以下几点。• 46 •统计研究2019年3月首先,调查对象配合度不高。在对样本企业进行规模以下工业调查时,湖北省相关人员给样本 企业送达统计法律事务告知书、统计信用事务告知书和调查业务告知书,现场宣讲《统计法》和《统

计法实施条例》,并由企业签字确认,但仍会遇到企业不愿意配合调查的情况,有些企业即使上报 也不愿意上报真实数据。归结原因主要有三方面:一是规模以下工业企业都是自主经营,主观上认 为上报对自己并无好处,以“无意义”拒绝上报;二是企业缺乏统计法律相关知识,担心上报会影响

后期经营,对调查心存疑虑;三是担心会“露富”,上报时采取报少不报多、报费用不报利的原则,从

而使得真实数据难以取得。其次,规模以下工业普遍没有核算资料,难以取得精准的调查数据「-是规模以下工业企业和

部分个体工业单位规模较小,大多是亲戚朋友间的合伙式经营,并没有专门的会计和统计人员,因 此对企业的经营状况较为模糊,账目为“糊涂账”,数据准确性较低。二是即使有统计人员的企业,

可能其统计专业知识也较为缺乏,尽管进行过多次培训,但在填报时仍会出现数据不合逻辑、乱填

的现象。三是许多规模以下工业企业和个体工业单位并没有生产台账、财务报表等,在经营时没有 核算票据,或者经营收入与家庭生活开支混在一起,所报数据难以找到依据。以上三方面问题很容

易导致规模以下工业源头数据质量不高,调查误差较大。最后,报表时间偏紧,调查压力大,人员配备不足。据了解,县级市调查队的工业企业报表需在

每个季度的15号前报送上级单位,个体工业报表每个月20号前报送,上报时间相对紧张。在湖北

省,规模以下工业调查中的865家样本企业分布在765个村(居委会),加上对个体工业单位抽取 的320个村(居委会),剔除38个二者共有的村(居委会),湖北省规模以下工业的样本共分布在

1047个村(居委会),调查范围分布较广;而且规模以下工业企业抽样调查一般包括10个左右的指 标,包括指标的上年和本年的值,如主营业务收入、主营业务成本等。而个体工业单位的调查指标 则较少,并且只包括指标的本年值。相比下,规模以下工业企业的调查指标繁多,这在一定程度上

也增加了统计人员的工作量。另外,在实地调研中发现,部分个体企业的营业收入较高,达到了微 型或小型企业的标准,但由于各种原因,不愿更改注册类型,这在一定程度上也加重了对个体工业

单位的调查任务。从2017年抽样调查数据来看,有7个村的个体工业单位数超过100户,但各级 调查机构的人员配备不足,并且调查机构同时承担其他调查任务。虽然在重点村(居委会)聘请了

辅助调查员,但辅助调查员质量参差不齐且多为兼职,在任务繁忙和补贴较少的错位下,工作责任 心有待提咼。(四)其他问题在规模以下工业调查中,还存在一些其他的问题有待解决,例如与规模以上工业衔接、非目录

企业的测算以及组织实施等。工业统计调查划分为规模以上工业调查和规模以下工业调查,目前在二者的划分标准上仍有

部分问题亟待解决。当前的划分标准是年主营业务收入2000万元,该标准容易导致如下问题:一 是该指标采用全国统一标准,但各地区经济发展水平不平衡,容易导致部分地区规模以上工业企业

数量较少,而部分经济发达地区数量则较多。二是对于湖北省来说,规模以上工业企业的主营业务

收入占全省工业企业总主营业务收入比重已达约93%,规模以上工业比重过高,规模以下工业比 重过低,从而使得规模以下工业抽样调查略显乏力。三是随着经济的发展,2011年制定的2000万 元的限额值与当前的经济发展并不适应,同时在该限额值附近的企业过多,存在频繁跳动现象,即 有部分企业由于经营不善从去年的规模以上工业落入到今年的规模以下工业中,也有部分企业由

于经营状况良好从去年的规模以下工业升入到今年的规模以上工业中。四是2018年以前,规模以

下工业调查是由国家统计局调查队负责,规模以上工业由各地统计局负责,容易导致规模以上工业

第36卷第3期金勇进姜天英:规模以下工业调查的若干问题研究• 47 •和规模以下工业衔接错位;但2018年国家统计局将规模以下工业调查移交各地统计局,由统计局

统一组织工业统计调查,这将有利于提高组织调查效率和数据质量,但需要确保数据的平稳对接。非目录企业的调查与个体工业单位调查同步进行,非目录企业在测算过程中,其权重与个体工

业单位权重相同,基础权重是村(居委会)的入样概率倒数;在个体工业单位调查中,以个体规模进 行分层,对个体工业单位的测算有较好的解释力,但对非目录企业的适用性可能有所欠缺。另外,

非目录企业作为目录企业的补充能力尚显不足,从前文提到的2016年和2017年规模以下工业企 业的调查结果来看,2017年目录企业正常上报的比2016年减少了 57家,虽然非目录企业在这期

间增加了 105家,但正常上报数却只多了 28家。总体来看,这期间的目录企业和非目录企业的正

常上报数量是在减少的,说明非目录企业对目录企业的补充能力较弱。综合来看,问题(一)、(二)和(四)中的非目录企业问题都可归为由抽样框引起的。将问题

(二)样本与总体存在差异归为抽样框问题是由于在样本轮换的开始年份,样本对总体的代表性较

高,随着时间的发展,在样本轮换的结尾年份,由于企业的新增和消亡,目标总体已发生较大变化, 抽样框难以及时更新,不能形成有效的样本替换,造成样本没有很好地反映总体。抽样框是抽样总

体的具体体现,因此可将其归为抽样框问题。同理,对于非目录企业,作为目录企业的补充,由于在 抽样框制定时遗漏或者是在后续年份新增,因此只能独立于目录企业抽样框之外,采用地域框的方 式获取,因此本文也将其归为抽样框问题。加上调查数据质量问题,与规模以上工业相关的工业统 计规模划分问题,本文将所有问题总结为三大类,并在下一节提出有针对性的改进建议。三、规模以下工业调查的改进建议第二部分将规模以下工业调查的问题归结为三大类,该部分将依次对以上问题提出有针对性 的改进建议。(-)使用地域抽样对规模以下工业企业进行抽样调查随着经济的快速发展,市场中的企业新增和消亡变动频繁,这种变动给抽样框的维护带来了极 大的挑战。抽样框的这种不稳定性,使得样本代表性降低,影响估计准确性。当前解决该问题的主

要方法是采用多重抽样框(Hartley, 1962[71 ;陈光慧和刘建平,2014⑻),而根据本文实地调研发现, 多重抽样框(针对目录企业)的使用仍有较大困难。主要原因是规模以下工业的目录抽样框主要 来源于工商和税务部门,但二者的信息是包含与被包含的关系,即税务部门提供的信息都包含在工 商部门内。因此,在名录库频繁变动的情景下,没有更好的企业目录来源构造抽样框,可以考虑采

用地域框,参照与个体工业单位相类似的整群抽样方法对规模以下工业企业进行调查。为了更好 地阐释该解决办法,以下运用2013年湖北省在第三次经济普查后核实的目录企业数据,以主营业

务收入为目标变量进行测算。为了说明测算结果的稳定性,所有的测算方法都重复了 500次。第一步,按照现有的对目录企业进行一阶段分层随机抽样方法,随机抽取865家样本企业,得 到的目录企业主营业务收入总量的估计方差为2.03E+13,相对误差为2.91%,将该结果视为后续

测算方法的比较基础。第二步,因对个体工业单位的调查采取的是按个体规模分层的整群随机抽样,为了与之相契

合,本部分也按照个体规模分层,以全部的村(居委会)为地域框的抽样总体,依据现有抽样精度进 行样本量的计算,得到共需样本量为2097个村(居委会),并通过奈曼分配确定各层样本量,得到

目录企业主营业务收入总量的估计方差为1. 19E+14,相对误差为7. 12%。可以发现,该方法要差 于第一步的计算结果,因此认为以个体规模进行分层的方法并不适用于目录企业。第三步,鉴于第二步的结果,由于目标变量是目录企业的主营业务收入,所以考虑以目录企业

• 48 •统计研究2019年3月的相关指标对目录企业分层并进行后续测算。与第二步不同的是,这里选取的分层变量是目录企 业的主营业务收入,选择的样本分配方式为比例分配(因有一层内无目录企业,称为空心层,因此

无法采用奈曼分配),计算得到的目录企业主营业务收入总量的估计方差为3. 13E+13,相对误差

为3.44%。该方法比第二步的结果要好,但仍要差于第一步的基础结果。因此,考虑进行第四步 测算。第四步,将第三步的空心层从抽样总体中剔除,仅保留含目录企业的村(居委会),分配方式选

用奈曼分配,根据样本量的计算公式共需660个村(居委会),计算得到的目录企业主营业务收入 总量的估计方差为1.59E+13,相对误差为2. 65%,可以发现该结果要优于前三步的结果。下面对

第四步的测算方法进行详细的抽样设计说明。首先,整理抽样框。包括全省范围内有目录企业的

村(居委会),整理得到湖北省共有9969个村(居委会)含有目录企业。抽样框的内容包括村(居委 会)的基本信息(如名称等)和经济信息(如主营业务收入等)。其次,确定样本量。按照抽样调查 精度,依据样本量的计算公式,湖北省共需样本量为660个村(居委会)。再次,分层及样本在各层 之间的分配。按照村(居委会)的主营业务收入进行分层,以累计平方根法确定分层界限。然后, 抽取样本。采用随机抽样,也可以按照现有抽样设计采用“永久随机数”方法抽取样本。最后,确

定权重和总量估计。与现有调查设计中个体工业抽样设计的权数和总量估计方法相同。从以上分析结果来看,第四步的方法在相对误差和方差上都优于一阶段分层随机抽样,且该方

法的工作量也低于现有的两种抽样方法之和(即660小于1047)。但该方法下,虽然抽取的样本村

(居委会)的数量低于现有的方法,但村(居委会)内的目录企业数量较多(约为9028家目录企业), 增加了群内调查的工作量。采用地域抽样进行规模以下工业调查也存在不足之处,如群内所有目 录企业数远大于865,增加了调查工作量和调查实施难度,有可能导致调查成本的增加;而且地域

抽样无法兼顾行业平衡.有可能导致部分行业内无样本企业,无法进行行业推估。虽然该方法仍有 不足的地方,具有继续讨论和改进的空间,但该方法给地域抽样的实施提供了可能性,而且还可以

考虑同时兼顾目录企业和非目录企业的调查,为规模以下工业抽样调查的抽样框构造提供了一个 改进的途径。(二)加强数据的审核和控制,提高数据质量首先,从企业和工作人员双重渠道持续加强统计相关法律的宣传和建设。一是以国家统计局

举办的统计执法资格考试为契机,加强专业人员统计法律知识学习;二是加大对基层调查专业人员

的法制培训;三是继续加强送法进企业,广泛宣传《统计法》。同时,调查机构要全面落实检查,从

严审核数据质量。调查机构要对样本企业进行定期检查,严格填报流程,确保数据质量追溯和问责 机制,对数据进行逻辑性检验,并与其他来源数据进行比对审核,最后积极将结果反馈到企业以促

进整改。湖北省推出针对试点企业的参数核实等方法来提高源头数据质量。参数核实法是指针对 试点企业的行业特点确定核查参数指标,采取多种办法收集基础数据,测算核查参数指标值,据此 与规模以下工业样本企业常规调查数据进行核查比对,必要时可深入企业进一步调研,找出数据差

异原因。其次,健全企业生产台账,提高培训企业填报技能。建立健全企业生产台账的登记制度,定期

记录企业生产原材料、销售数量、销售价格等项目和内容,将其作为对主营业务收入核对的辅助依 据。针对既没有会计账又没有生产台账的企业,湖北省曾提岀记账调查法,通过借鉴城乡住户调查 户记账的办法,请企业主按月记录与生产相关的收支情况。另一方面,通过入厂检查、专题调研、现 代信息技术手段等多种方法结合的方式,对样本企业采取全覆盖培训,尤其是对新的样本企业进行 重点培训。第36卷第3期金勇进姜天英:规模以下工业调查的若干问题研究• 49 •最后,调整调查频率,简化调查指标,对部分样本村(居委会)内的个体工业单位做典型调查。

2017年个体工业单位调查采取的是年报的形式,但2018年又修改为季报。鉴于个体工业单位数

量众多,为确保数据质量,可适当调整个体工业单位的调查频率。对于调查指标,因企业的调查指 标远多于个体工业单位,可针对指标类别对调查指标进行适当简化。在个体工业单位规模较大的 村(居委会)可实行典型调查。笔者在实地调研中了解到,某两个样本村(居委会)有95%的个体工

业均为服装加工业及其衍生行业,这些企业的规模相近,经营方式、经营状况也大同小异。因此,为 了更好地集中力量控制源头数据质量,可考虑对这些同质性较高的样本村(居委会)采取典型调

查,从而也可以在一定程度上减少辅助调查员的工作任务,提高工作积极性。(三)提高工业规模划分标准随着经济的发展,年主营业务收入2000万元的工业划分规模可能与工业发展并不相适应。如 何合理地提高限额值,使得规模以上工业和规模以下工业所占比重均恰当,且能准确地反映工业发

展现状是值得讨论的问题。参照曾五一等(2011)⑼的做法,本文以湖北省的数据为例来确定适合

当前工业发展的最优限额值。由于规模以上工业是全面调查,可以获得每年的总体数据;规模以下工业是抽样调查,非普查 年份只有抽样数据,因此本部分使用的数据为2016年规模以上工业全部数据和模拟得到的2016

年规模以下工业数据,共包括50852家企业;选取的目标变量为主营业务收入。首先按50852家样

本企业的主营业务收入大小降序排序,按照主营业务收入进行分组,分别计算工业企业主营业务收 入的累计比重和企业个数的累计比重,分组数据分布见表1。表1

按主营业务收入 分组(万元)2016年湖北省全部工业企业按主营业务收入分组数据分布表企业个数(个)企业个数占 总体比重(%)企业个数 累计比重(%)主营业务 收入(亿元)主营业务收入 占总体比重(%)主营业务收人 累计比重(%)15000以上12000-1500010000-12000536810.51.91.610.537460. 41305.980.52.880.583.397212.414.08031048877.4939.5915.51.92.085.287.289.28000-100006000-80002. 12.63.716. 118.722.429.01320189033472.04000 - 6000932.0946.82.02.06.891. 293.22000 - 40000-20006.671.036104100.03145. 1100.0由表1可知,规模在1亿元以上各组中,企业个数占总体比重均小于工业企业主营业务收入占

总体的比重;而在8000万元~1亿元组中,企业个数占总体的比重略大于工业企业主营业务收人占 总体的比重;在8000万元以下的各组中,企业个数占总体的比重都远大于工业企业主营业务收入

占总体的比重。也就是说,当企业主营业务收入约为1亿元以上时,每增加1%的企业个数都可获 得比1%更多的工业企业主营业务收入信息,其成本收益呈递增趋势;当为1亿元以下时,增加1%

的企业个数只能获得不到1%的工业企业主营业务收入信息。因此,湖北省工业企业的最优划分

标准约为主营业务收入1亿元,此时规模以上工业企业个数占所有工业企业个数的比重大约为

14. 0%,有利于规模以下工业调查的实施。另外,因主营业务收入为敏感性指标,部分企业对该指标的填报存在虚假信息,因此可以考虑 适当选取其他稳定性的指标,如从业人员数作为限额指标来进行工业规模的划分。采用同样的方

法,以从业人员数作为目标变量,计算所得结果为最优标准约为从业人员数80人,此时规模以上工 业企业个数占所有工业企业个数的比重大约为1&6%。• 50 •统计研究2019年3月以上三种改进方法分别针对的是第二部分的三大类问题,用地域抽样的方法解决样本代表性

较差、抽样框的不稳定等问题;控制并提高源头数据质量,降低调查误差;通过适当的调高限额值, 提高规模以下工业所占比重,从而更加准确地反映工业发展现状。四、结束语规模以下工业调查是工业统计调查的重要组成部分,是收集规模以下工业数据的主要渠道。 本文通过实地调研,与基层调查机构、调查人员、代表性企业深入接触,对规模以下工业调查中的重

点和难点有了直观的理解,同时用实地调研数据进行定量说明,更好地反映了规模以下工业调查存 在的问题。需要说明的是,本文的研究是以湖北省为例进行的,并未考虑其他地区,因此无法做到

地区间的横向比较以及从全国的角度对调查方案进行设计,但本文的研究并不失一般性,仍具有一 定的参考价值。针对规模以下工业调查存在的问题,本文提出了相应的改进建议,但仍有一些需要继续研究的

问题。如在地域抽样中,仅考虑了目录企业,没有考虑个体工业单位。虽个体工业单位的调查原本 即为地域抽样,但关键在于如何将企业和个体工业单位有效地结合在一起,使用一套地域样本,共

同调查企业和个体工业单位以降低调查实施的复杂性;在解决规模以上工业比重过大,限额值过低 的问题时,主要解决了限额值的选取问题,并没有深入地研究限额指标的合理性问题,也就是并没

有研究主营业务收入是不是最合适的指标,这都是后续研究的重点。2018年是第四次全国经济普查的年份,针对上述问题的研究,有助于在最新的经济普查数据 基础上,对规模以下工业调查的抽样设计进行完善,从而为经济社会的高质量发展提供精准的统计 保障。参考文献[1 ]雷平静•《工业统计定期抽样调查试点方案》的设计[J]•统计研究,1997(5):69-74.[2 ]“规模以下工业抽样框问题研究”课题组.我国规模以下工业抽样框的问题与解决思路[J].统计研究,2003(7):41-45.[3]田秀华.永久随机数(PRNs)在工业抽样调查中的应用[J].统计研究,2002(4):42-44.[4 ]中华人民共和国国家统计局.规模以下工业抽样调查统计报表制度[EB/OL]. http://www.stats.gov.cn/tjsj/tjzd/gjtjzd/201701/

t20170109_1451439.html,2017-01-09.[5 ]王文颖.企业抽样调查方法及其应用[M].北京:中国统计出版社,2007. 106.[6 ]宋子轩,冷燮,陈瑶瑶.概率抽样条件下样本代表性事后评估方法探讨[J].统计研究,2012 (7):96-100.[7 ] Hartley H 0. Multiple Frame Surveys [ A ] . In : Proceedings of the Social Statistical Section [ C ]. Alexandria: American Statistical

Association, 1962: 203-206.[8 ]陈光慧,刘建平.我国基本单位多水平连续性抽样调查体系改革研究——以规模以下工业调查为例[J] •统计研究,2014(7):

50-57.[9 ]曾五一,苗晓宇,游家兴.关于进一步完善我国工业企业统计调查制度的研究[J].统计与信息论坛,2011(4):94-100.作者简介金勇进,男,中国人民大学统计学院教授,教育部重点研究基地“应用统计科学研究中心”主任,中国人民大学

调查技术研究所所长。研究方向为抽样技术。姜天英,女,中国人民大学统计学院在读博士研究生。研究方向为抽样调查理论与方法:(责任编辑:倪立行)

因篇幅问题不能全部显示,请点此查看更多更全内容