海洋捕捞业渔获量抽样调查中样本选取问题研究
2022-01-03
来源:二三四教育网
现代农业科技2014年第17期 动物科学 海洋捕捞业渔获量抽样调查中样本选取问题研究 何国毅孙兆群朱玉贵 (中国海洋大学水产学院,山东青岛266003) 摘要 随着抽样调查在国内外各领域的成功应用,近年来国内渔业生产统计也逐渐引用此法,但尚未系统解决海洋捕捞业渔获量抽 样调查中样本代表性、样本数量、样本轮换等关键问题的理论构建问题,本文旨在通过剖析上述关键问题,为海洋捕捞业渔获量抽样调查 方案设计及其实际应用奠定理论基础。 关键词海洋捕捞业;渔获量;抽样调查;样本代表性;样本量;样本轮换 中图分类号F302.5;C811 文献标识码,A 文章编号1007—5739(2014)17—0281—03 Sample Selection Issues in Sampling Survey of Fishing Catches in Marine Fishing Industry HE Guo-yi SUN Zhao—qun ZHU Yu-gui‘ (FisheriesCollege,OceanUniversityofChina,Qingdao Shandong266003) Abstract With the suecessful application of sampling in various ielfds at home and abroad recent years.the domestic ishery prfoduction statistics also gradually lead this method.but the system still need to be accomplished by establishing the key theoretical issues of fishing catches in marine industy,irncluding sample representativeness,sample size,sample rotation,etc. I’his article aims to analyze these key issues with a view to the ocean ifshing catches sample survey design nd aits practical application to lay the theoretical foundation. Keywords marinefishingindustry;catches;sampling survey;sample representativeness;sample size;sample rotation 认识事物的途径多种多样,基本途径是通过各式统计 获取资料,用科学方法进行处理和分析,并据此得出相应的 结论。统计调查法在实践中逐渐从普查发展成了普查、抽样 于1895年提出,其观点是认为样本是总体的缩影,选出少 量正常合理的样本就能反映总体情况,对总体评估准确与 否主要取决于样本的代表性【3】。后来在如获取代表性样本问 调查及其他调查等多种方法并行的状况。抽样调查法是一 种科学的统计调查方法,因其灵活性、时效性、精确性等诸 多优点,在国外社会、经济、科技、自然、渔获量统计等领域 发挥了巨大作用。抽样调查法在中国发展缓慢,直到改革开 放以后才得以较快发展。主要应用于人口、经济、科教文卫、 资源等领域。 近年来,抽样调查法在渔业生产统计领域的应用曰渐 广泛。袁兴伟等【 】对南海区三省渔业生产统计研究表明相同 题上先后出现了目的抽样和概率抽样2种观点,前者根据 抽样调查的目的有意识地抽取样本单元,使所得样本与总 体特性相近。 目的抽样观点认为所选样本应当在结构上与总体相 似。例如,若将渔业生产调查区的渔船根据主机功率按大小 分为A(20%)、B(30%)、C(50%)3层后,样本包括a(20%)、 b(30%)、C(50%)才最具代表性。实际上,研究调查的主体不 是渔船,而是基于渔船的捕捞活动记录数据。各层样本渔船 单元数量分配应依据该层渔获量对总体渔获量的贡献而 定,而不是只考虑该层渔船单元数在总体中的的比例,如果 条件下分层抽样的精度高于简单随机抽样;甘喜萍等[21论述 了应用于渔业生产统计的经济分层抽样原理;Bannermanl与 Lamptey研究了分层抽样在小规模渔业生产数据中的应用。 世界粮农组织(FAO)与中国合作在湖北梁子湖、浙江象山 及山东莱州等地区对渔业生产开展抽样调查。调查结果较 为客观地反映了各地捕捞生产实际情况。目前关于海洋捕 各层渔获量贡献率也符合该比例,那这样的样本组成就有 很高代表性。一个与总体结构相似的样本并不一定能保证 充分体现出总体信息,这也是在分层抽样样本分配中最优 分配精度优于比例分配的原因。 捞业渔获量抽样调查中的样本代表性、样本量的确定、分配、 样本轮换等关键问题的系统理论探究报导很少,本文旨在 解决这一问题,以期为海洋捕捞业渔获量抽样调查方案设 计及应用奠定理论基础。 1样本代表性 1.1样本代表性的含义与作用 目的抽样只涉研究员认为符合调查目的部分总体渔船 单元单元,却没有依据说明余下部分不能够代表总体,至少 是总体的一部分,而这些渔船单元却没有作为样本的机会。 英国统计学家鲍菜(A.L.Bowley)提出中心极限定理应用于 概率抽样的总体参数估计,认为应当赋予每个单元都有作 为样本的机会[41。每个渔船单元的机会是否相等与总体渔船 单元间的差异程度相关。若差异程度不大,等概率比较适 宜;反之,不等概率较为宜。例如,调查某海域捕捞渔获量 时,按渔船主机功率(kW)将渔船分为A(1.0~44.1,30%)、B 捕捞产量抽样调查只需少量渔船单元作为样本,统计分 析这些样本渔船单元的捕捞数据,然后推断评估总体渔船 捕捞产量情况,因此要求所选样本渔船单元有较高的代表 性。抽样调查中首次出现“代表性”由挪威凯尔(A.N.Kiaer) 基金项目 中央高校基本科研业务费项目(201413017);海洋公益性行 业科研专项预算(201305030)。 作者简介何国毂(1989一),男,四川安岳人。在读硕士。研究方向:渔 业生产统计。 通讯作者 (4.1~147.0,40%)、C(147.0~441.0,30%)3层,相同条件下, 功率越大,渔获量越大,故对区域总体渔获量而言,B层和 C层的贡献率比A层大很多,选样时,应考虑不等概率抽 样,使A层样本渔船单元数量向B层和C层倾斜。无论是 等概率还是不等概率抽样,目的都是尽可能提高总体参数 精度。 281 收稿日期2014—07—21 动物科学 事实上,代表性是一个泛概念,与抽样分布有关,即所 现代农业科技2014年第17期 在FAO渔业抽样调查捕捞活动记录数确定中,最大允 许误差范围~般设定在0一l0%,即对应的准确度100%~ 90%t ̄。其他渔业内容和渔获量调查也一样,除极少数要求 有可能样本的估计量的概率分布,单纯认为某一具体样本 有多大的代表性是片面的。在众多可能样本中,一次调查抽 到的样本有优劣之分.且优劣程度还与概率有关。例如,某 海域所有拖网渔船的渔获量的均值是1 000 ks/(d・艘),根 非常精确l%外。多数采用的是5%和10%。这个n只是理 论所需的全部有效样本渔船单元数,即保证这n个样本渔 据2种抽样方案 、l,所得的样本均值方差V( )=50,V(’,)= 100,显然,方案 属较好,能更好反映总体情况;在既定的 置信水平下, 方案所得均值的置信区间比y的窄,所得 船单元在每调查次数内都有捕捞活动记录数据。而实际上, 预算也是限制样本渔船单元数量多少的重要因素,可用线 性关系式C=Co+on。来表示预算与样本量的关系,其中,c 为预算。 表示设备、工资、宣传等与样本渔船单元无关的 费用,e表示单位渔船单元调查的平均费用,可通过试点调 查或从以往的渔业调查评估获取;此外,渔船(渔民)样本的 结果也更精确。样本代表性是属性概念。不能用具体数值说 明它的高低。一些观点认为其高低可用(e—E)/E或(P—P),P 等相关系数来表示,只要样本均值e(或比例P)和总体均值 E(或比例P)越接近,比值越小,样本代表性越高,但或忽略 了总体参数E(或P)则是未知的,需要根据样本均值e(比 例P)分析推断。需要说明的是,不同的抽样设计,样本代表 性不具可比性,而同一抽样设计所得不同样本的代表性却 有高低之分。 1.2代表性较高的样本获取方法 只要是统计调查,就会存在误差,即使普查也依然存 在。因此。为更好反映总体渔业生产情况,要选择高代表性 的渔船单元样本。尽管有抽样方法、样本量、总体渔船单元 差异度、辅助信息等其他诸多因素影响,很难说明抽到的样 本代表性高低。但仍能采取一些措施以获取代表性较高的 样本渔船单元。首先是改进抽样方法和评估方式,例如采用 分层抽样,设计公式或模型计算样本量、分配量、估计量等; 其次是适当增加渔船单元样本量;再次是利用渔业辅助信 息,渔业辅助信息对于渔船分层标准划分、层间渔船单元分 配、有效回答率等方面具有重要作用;最后还要减少其他非 抽样因素引起的误差,如人员操作、问卷设计等方面。 2样本量 2.1样本总量确定 由于渔船主机功率变化范围大,渔获量差异程度高,捕 捞记录数据就构成了一个方差很大的总体,考虑到分层抽 样精度高、便于实施、获得信息多等优点,在渔获量调查中 采用分层抽样法。不仅仅是渔获量调查,其他设计复杂的渔 业抽样调查也一样,样本量确定也很困难,但却比相同样本 量的简单随机抽样结果的精度更高。因此,本文用简单随机 抽样计算所需渔船捕捞记录数,并根据除以调查次数得到 样本渔船单元数。 简单随机抽样法计算所需样本渔船单元捕捞记录数时 运用到一系列的公式及其相关推断公式『5】。根据置信区间 公式,PlX—A≤X≤ +△l=1一 ,式中, 表示均值,1—0c表示 概率;( 一△)和(X+A)分别为置信区间的2个极限, 是置 信水平,△为极限误差,即设计的渔获量统计方案允许的最 大误差。渔获量调查是不重复抽样,样本渔船单元捕捞记录 数表达式m=三 (1一n):,m除以相应的捕捞次数就是所 需样本渔船单元数n,t表示既定自由度和置信水平下的 Student t分布t的取值。可从t—test临界值表中查询; 表 示总体方差,用样本方差Sz代替,nlN为抽样比,当n/N> 0.05时,也可以忽略其影响。 282 有效回答率P也是一个不能忽略的因素.结合理论有效样 本渔船单元数,实际所需样本渔船单元数nt=nl(1-p)。通过 比较n 和n 大小以确定最终样本渔船单元数,若n。≥n , 预算能够支撑方案设计的样本量;若n <n ,则预算不能满 足最初设计的样本量,此时就需要在两者之间折中,重新设 计抽样方案。 关于确定样本渔船单元数.试点调查是一个值得研究的 问题。上述公式中的总体方差 (样本方差s2),总体以及 各子总体渔船(渔民)有效回答率P,单位渔船单元调查平 均费用c都是未知的。来源主要有2种:一是从以往的渔业 调查及相关资料中获取;二是通过试点调查获取。从以往资 料获取信息能节省试点调查的费用,但是试点调查却能发 现更多其他问题,从而反馈,有利于正式调查的顺利进行。 2.2样本分配 采用分层抽样调查法,确定样本渔船单元数后,需要在 各层分配。比例分配、最优分配和尼曼分配是3种经典的分 配方法嘲。 比例分配:根据各层渔船的权重 ( = )来分配, 即h层样本渔船单元数 =n・ =n・ ,这种分配使渔船 单元作为样本的几率相等,也最便于后续数据资料处理,常 被研究员应用于各种实际抽样调查。 ‘ 最优分配:整合预算来分配,c=Co+∑ ,chrth,简化得到 n. 里b !b ( :1,2,…,三),式中Sh表示h层子总 ∑::】 hsll,、/ch 体标准差,e 表示h层单位渔船单元调查费用。因此,h层样 本渔船单元数n 与其权重 和标准差 成正比,与单位 渔船单元调查费用的平方根成反比。 尼曼分配是在最优分配基础之上发展而来,适用于 当各层单位渔船单元调查费用c 都相等时,即Ch=c,此时 nII=n・— ,L(h=l,2,…,L)。 ∑ 。 甘喜萍等[21研究表明,满足预设条件下,奈曼分配最精 确,最优分配最省。虽然最优分配和尼曼分配在预算和精确 度上有优势,但在满足精度下,比例分配因其简便特点应用 更普遍。实际调查中往往还存在很多其他因素影响样本渔 船单元的分配。渔业调查的对象和内容很多,既有单一目的 也有多目的的调查,既有数量性状、质量形状也有属性形状 何国毅等:海洋捕捞业渔获量抽样调查中样本选取问题研究 的调查,选择分配方法时不能一概而论;若仅对某一渔区某 种作业方式的单一捕捞目标种的渔船开展抽样调查,条件 允许时,优选奈曼分配;如果预算不足,可退而选择最优分 配或比例分配。若是一些渔业生产中的属性问题开展抽样 调查,如渔民对渔业可持续发展、渔业政策等问题的看法, 则可用比例分配法简化调查过程。若渔业调查对象涉及大 范围内各型功率和作业方式的渔船,且调查主题还比较多, 比例分配则较为方便可行。渔获量统计调查涉及到的不仅 是渔获量问题,为节约成本,常与其他主题(如CPUE、渔获 物初次交易价格、捕捞活动经济收支等)集合在一张问卷中 同时进行,因此一般选择比例分配法。因此,选择样本分配 方法时.应具体问题具体分析。 3样本轮换 3.1轮换原因 渔获量调查是连续性的调查,如果样本长期不更换,就 会出现样本老化问题。这里的样本渔船单元老化是指广义 的渔船老化,既指渔船本身老化,也包含渔船改装、渔民合 作等渔船不适宜再作样本等情况。因此,需要更换不能再作 样本的渔船,数量取决于预算和精度。 为解决样本渔船单元老化问题,需要重新抽取渔船单 元来替换老化部分。如果全部更换,则会额外增加预算,一 是用于与调查对象(渔民及其相关人员)沟通,以便得到他 们的配合:二是用于培训渔民完成相关任务。一旦样本更 换,又需要重新与新的渔民建立合作关系。因此,短时间内 不宜频繁地更换大比例的渔船单元,除非有特殊原因,一般 不进行全部样本渔船单元的更换。 渔获量调查是连续型调查,更换样本渔船单元最重要 的原因在于通过后期样本渔船单元的更换来解决前期抽样 调查中样本渔船单元出现的问题。例如,分层抽样调查渔获 量过程中,样本渔船单元在出海捕捞作业过程中遭遇恶劣 天气,船体损坏严重降低捕捞能力;部分合作渔民私自改装 渔船功率或者船体,使得原本属于A层抽样层的样本变成 了B层样本。而仍统计在A层。有些原因是可以量化计算改 变的.但那些不能人为量化的因素则不得不替换这些样本 渔船单元。例如,少数样本渔船单元的渔民在合作后期基于 个人私利而增加或者减少捕捞活动,甚至故意编造渔获量 数据;一些样本渔船单元随着时间的推移,性能退化,不再 满足最初设计条件,则需要用其他更合适的渔船单元予以 更换。以保证这一层次的样本仍具有较高代表性。 3.2轮换原则 渔获量抽样调查工作具有长期性和周期性等特点。为 解决样本渔船单元老化问题,需要适时予以轮换,但轮换过 程中应遵循下列原则。 (1)代表性。样本代表性降低是样本轮换最主要的原 因。正是因为在连续性渔获量调查中,渔船性能和渔民合作 行为等方面的变化,使得先前的样本渔船单元不再满足该 层次的要求,或者是样本数据不真实,从而导致不宜继续作 为该层次的样本。如果没有这些方面的变化,该层次先前的 样本渔船单元仍具代表性,可不用更换这些样本渔船单元。 (2)连续性或者衔接性。渔获量调查如同其他国民经济 调查一样,并非一次性调查,需要建立相应的渔获量数据 库.根据样本渔船单元数据的时空序列特征反映渔获量状 况。即使换了渔船单元,也要保证前后样本渔船单元数据时 空序列上的衔接性。换言之,用于更换的渔船单元也必须通 过最初设计的抽样方案选取。 (3)条件性。频繁更换全部样本渔船单元并不科学,一 般是在一段时间内更换一定比例的样本。实践证明样本单 元更换的速度以及比例与样本的变化并不同步171。从渔业其 他内容的抽样调查来看,考虑到渔船老化的速度以及1年 内合法作业时间段。样本渔船单元轮换的周期为1~2年、比 例以25%~50%为宜,这样可有效避免样本频繁更换导致的 数据不连续问题的出现。 3.3样本轮换流程与技术 样本轮换的基本流程是更新总体渔船单元目录框,检 查原样本,抽取新渔船替换。在周期内,从渔业管理部门获 得最新渔船信息,剔除无效渔船单元,补人新增渔船单元。 在更换程序中最复杂的是检查原样本,和总体渔船单元一 样,把原样本中老化的剔除,包括不能继续捕捞作业、渔民 转行、渔船大幅改装等情况。抽取新样本渔船单元相对容 易,根据最初设计的渔获量统计抽样方案,在更新的总体渔 船单元中选取即可。目前主要有2种流行的方法:一是在更 新的目录框中随机抽取满足要求的新渔船单元替换;二是 在分层抽样的最终抽样层中,把满足条件的所有渔船单元 分成几个组,然后周期性进入调查期轮换[81。 4结语 综上所述,抽样分布是从总体中以一定的样本容量进 行随机抽样,样本的统计数所对应的估计量与其概率的分 布。渔船代表性对抽样分布有意义,但不能理解为某一具 体样本代表性很好,不同的抽样设计或分布之间代表性不 具可比性,而相同抽样分布中的不同样本却可比,同样的 抽样设计中,可以适当采取措施来获取高代表性的样本, 以提高抽样精度。公式得来的作为样本的渔船单元数只是 有效样本数,实践表明,渔业生产调查中的无效样本率不 能忽略,其比例因渔业抽样内容而异,应将其应用于最终 实施所需渔船单元数的确定和分配。渔获量调查属于连续 性调查。随着时间的推移,样本渔船本身及其合作关系的 变化会导致代表性降低,因此需要进行轮换以减小影响。 轮换过程中应当注意代表性、连续性等原则以及与之相关 的轮换方法。 5参考文献 [1】袁兴伟,刘勇,程家骅.分层抽样误差分析及其在渔业统计中的应 用[J].海洋渔业,2011,33(1):116-120. 【2】甘喜萍,卢伙胜,冯波,等.分层抽样法应用于渔业生产统计的研 究[J],安徽农业科学,2008,36(20):8401-8402. 【3】冯士雍.抽样调查理论与方法【M】.2版.北京:中国统计出版社,2012: 15-22. 【4】李金昌.正确理解样本代表性【J】.中国统计,2010(8):4O-4l。 【5】李金昌.应用抽样技术[M].2版.北京:科学出版社,2013:56—62. [61 STAMATOPOULOSC.Sample-BasedFisherySurveys:ATechnicalhand- book[M].Rome:FAO Fisheries Department,2010:25-39. 【7]张勇.中国农产量抽样调查若干问题研究【M】.北京:中国统计出版 社.2007:144—146. [8】卢宗辉,陈仁恩.社会经济调查中的样本轮换问题研究叨.广播电视 大学学报:哲学社会科学版,2005(1):82—85.