首页 » 互联通信 » 论文推荐 | 蔡艳辉:测绘地舆信息产品抽样考验的两类缺点概率

论文推荐 | 蔡艳辉:测绘地舆信息产品抽样考验的两类缺点概率

喜鹊装饰工程通讯 2025-02-14 0

扫一扫用手机浏览

文章目录 [+]

构建与学术的桥梁 拉近与威信的间隔

测绘地理信息产品抽样考验的两类缺点概率

论文推荐 | 蔡艳辉:测绘地舆信息产品抽样考验的两类缺点概率 论文推荐 | 蔡艳辉:测绘地舆信息产品抽样考验的两类缺点概率 互联通信

蔡艳辉1, 程鹏飞2, 张莉1, 徐彦田2

论文推荐 | 蔡艳辉:测绘地舆信息产品抽样考验的两类缺点概率 论文推荐 | 蔡艳辉:测绘地舆信息产品抽样考验的两类缺点概率 互联通信
(图片来自网络侵删)

1. 国家测绘产品质量考验测试中央, 北京 100830; 2. 中国测绘科学研究院, 北京 100830

收稿日期:2018-03-05;修回日期:2018-09-10

基金项目:国家863操持(2015AA124001);国家测绘产品质量考验测试中央“质量之翼”项目(2018-zlzy-013);中国测绘科学研究院基本科研项目(7771717);中国工程院咨询研究项目(2017-XZ-13)

第一作者简介:蔡艳辉(1973-), 男, 博士, 研究员, 研究方向为高精度卫星导航定位技能与运用、测绘产品质量考验和测试技能与方法。

E-mail:caiyh@casm.ac.cn

择要:针对测绘地理信息产品抽样考验的哀求,给出了两类缺点概率的打算方法,并通过各种不同抽样方案的两类缺点概率值,剖析了现行的国标GB/T24356-2009抽样考验的特点。
同时针对大批量整体抽样考验和分批抽样考验,通过实例打算,解释了大批量整体考验与分批考验对整体通过概率的等价性以及分批考验的不合理性。
基于\公众纳伪\"大众概率值剖析,提出了低合格率总体条件下,抽样考验自身的高\"大众纳伪\"大众概率将导致抽样考验的失落效性,并通过实际算例打算了导致考验结论失落真的质量边界,对测绘地理信息产品的质量风险掌握具有主要意义。

关键词:测绘地理信息 质量考验 抽样方案 第Ⅰ类缺点 第Ⅱ类缺点

Probabilities of two types of errors in sampling inspection for surveying and mapping products

CAI Yanhui1, CHENG Pengfei2, ZHANG Li1, XU Yantian2

1. National Quality Inspecting and Testing Center of Surveying and Mapping, Beijing 100830, China;2. Chinese Academy of Surveying and Mapping, Beijing 100830, China

Foundation support:The National High-tech Research and Development Program of China (863 Program)(No. 2015AA124001); \"大众Wings of Quality\"大众 Program of QICS(No. 2018-zlzy-013);The Fundamental Research Project of CASM (No. 7771717); The Consulting Research Project of the Chinese Academy of Engineering(No. 2017-XZ-13)

First author: CAI Yanhui (1973—), male, PhD, research fellow, majors in high precision GNSS positioning and application, quality inspecting and testing technologies of surveying products.

E-mail:caiyh@casm.ac.cn.

Abstract: Based on theory of hypothesis testing, a function of calculating probabilities of two types of errors is proposed, which is adopted inanalyzing the advantages and disadvantages of different sampling schemes given in the National Standard GB/T24356-2009. Under the circumstance of large lot size, the sampling inspection should be carried out lot by lot with the lot size less than 200 and the least lot number. Investigations on such procedure are made base on the probability distributions of two types of errors. Numerical results of type Ⅰ error show that the whole lot inspection is equivalent to the sub-lot inspections sequence from the point of probability of positive hypothesis. At the same time, experiment results of type Ⅱ error with the typical sampling scheme show that the conclusions of sampling inspection according to the requests of GB/T24356-2009 may be badly wrong under the situation of low percentage of defectiveness.

Key words: surveying and mapping quality inspection sampling schemes type Ⅰ error type Ⅱ error

抽样考验是质量管理中的主要统计技能手段,特殊是在毁坏性考验、可靠性考验以及寿命试验、连续批考验和散料考验中发挥着巨大的浸染。
通过抽取一定量的样品进行考验,既可以对一批产品的质量作出判断,同时又不须要付出太大的事情量,对产品的生产管理和剖析影响产品质量的成分具有主要意义。
针对产品的抽样,国际上普遍采取的是ISO 2859.1-1999标准,海内制订的GB/T2828.1-2012[1]完备采取这一国际标准。
该标准也是我国工业产品的质量掌握的根本性标准之一。

比较工业产品,测绘地理信息产品无论在产品形态、生产工艺、仪器设备和生产环境,还是在产品管理、流利和产品做事等方面都存在很大的不同。
因此,为了适应测绘地理信息产品的分外哀求,国家发布了专门针对测绘地理信息产品质量考验的国家标准GB/T24356-2009与GB/T18316-2008[2-3],对测绘地理信息产品的抽样、质量元素、考验参数、质量评定和剖断进行了规定。
虽然这两项标准在国家和地方的根本测绘以及各个行业测绘领域中发挥了主要浸染,但是随着以新型根本测绘为代表的测绘地理信息智能化的发展,其在抽样方案、产品质量参数、质量评定剖断准则等方面逐渐显现出不完善、不适应的征象,特殊是在生产中的“小批量分段”和“大批量分批”抽样方案与数字化、信息化和智能化测绘地理信息涌现的大批量产品考验非常不适应。
同时,国家标准GB/T24356-2009对弃真缺点概率给出了“零概率”哀求的同时,而未对不合格产品通过合格考验的“纳伪”缺点概率给出相应的规定,导致生产管理实际中涌现一定风险。

针对测绘地理信息产品质量考验的抽样方案,文献[4]采取OC曲线剖析方法,给出了推举的GIS产品不合格率3%~5%极限质量;文献[5]采取OC曲线剖析方法,对连续大批量空间数据质量抽样考验方案进行剖析,给出了不同条件下的空间数据质量考验的AQL值;文献[6]提出了GIS数字舆图1/m子幅抽样考验观点,采取OC曲线剖析方法给出了范例抽样方案。
其他干系的研究多数都是从抽样方案的实际操作方面谈论[7],而对测绘地理信息产品质量考验的“弃真”和“纳伪”概率的研究,文献相对较少。
学术上研究较多的是丈量的不愿定性以及不愿定性表征[8-19]。
这些研究紧张是针对给定的地理信息产品如何客不雅观真实反响其自身质量状况,属于抽样考验的考验技能范畴。

本文从假设考验的两类缺点概率分布出发,对测绘地理信息产品质量考验的抽样方案进行剖析,给出两类缺点概率的打算方法,同时打算了范例的抽样方案的两类缺点概率,重点对现行的大批量测绘产品分批抽样考验进行了谈论,提出了低不合格率总体条件下,抽样考验自身的高“纳伪”概率将导致抽样考验的失落真性,在并通过实际算例打算了导致考验结论失落真的质量边界。

1 假设考验的两类缺点1.1 两类缺点的定义

为了推断总体的某些性子,须要先提出关于总体的假设,然后从总体中随机抽取样本,根据样本的考验和剖析,对提出的假设作出判断:是接管还是谢绝。
一样平常可表示为

(1)

式中,H1与H0常日为互补条件。
针对H1考验H0,H0称为原假设,H1称为备择假设。
由于考验结论是根据样本给出的,总有可能涌现缺点的判断。
当假设H0实际上为真,考验谢绝H0,称为第Ⅰ类缺点,又叫弃真缺点;当H0实际不真,考验接管H0,称为第Ⅱ类缺点,又叫纳伪缺点。
犯第Ⅰ类缺点的概率,记为α,又称为生产方风险,即合格批被拒收。
犯第Ⅱ类缺点的概率,记为β,又称为利用方风险,即不合格批被接管。
在实际运用中,应照顾双方的利益,使生产方风险和利用方风险都尽可能掌握在一定的范围[20-22]。

1.2 两类缺点概率的打算

两类缺点概率的打算等价于打算考验统计量落入特定谢绝域的概率[22]。
对考验问题(H0、H1),布局样本空间Ω的凑集分割:WW=ΩW, 当定义W为谢绝域,则W为接管域。
根据两类缺点的定义,则有

(2)

式中,P(x)为概率分布函数;T为考验统计量;W为谢绝域。
对零假设H0,本来是精确的,由于样本的随机性,统计量落入谢绝域W,缺点地将该假设否定,其概率为α;同样,对零假设H0,本来是缺点的,由于样本的随机性,统计量落入接管域W,缺点地将该假设接管,其概率为β
α值的打算实际上等价于谢绝域W的确定,由给定的分布函数P可直接确定。
β的打算须要其余给定一个样本空间Ω的凑集划分:W′和W′=ΩW′才能唯一确定β(图 1)。

(3)

(4)

图 1 两类缺点谢绝域凑集Fig. 1 The reject sets of two types errors

图选项

图 1显示,对给定的凑集总体,压缩谢绝域WW′一定扩大,同理压缩谢绝域W′,W一定扩大。
要想同时减小WW′,一定扩大凑集总体。

2 测绘地理信息产品抽样考验的两类缺点2.1 抽样考验的抽样方案

抽样方案是指抽样考验中所用的样本和有关吸收准则的组合[23-24]。
抽样方案既包括从批量中若何抽样,又包括对批次合格/不合格的剖断准则,因此,必须在抽样考验前定出样本量和鉴别该批产品是否合格的标准(吸收准则)。
常日采取四元组(N,n, Ac, Re)[1, 23]表示抽样方案模型,个中N为批量,n为抽取的样本量,Ac为可接管的不合格品数,Re为谢绝的不合格品数。

对给定的抽样方案(N,n, Ac, Re),其检测通过的概率服从超几何分布

(5)

式中,Pi为该抽样中不合格品数为i概率。
根据产品的不合格率pd=N×p
N>10n,且p< 10%(文献[23-24]),对付给定不合格率的计数型大批量大略随机抽样,可近似采取二项分布代替超几何分布,即

(6)

L(p)构成的曲线称为该方案的抽样操作特性曲线[23],即OC曲线。
OC曲线反响了抽样方案的考验通过概率与产品不合格率的分布关系。
对给定的质量水平p0与p1,在不考虑考验偏差的条件下,式(4)即为

(7)

2.2 GB/T24356-2009标准抽样的两类缺点概率

GB/24356-2009采取了计数型一次大略随机抽样方法[1, 23-25],并规定当不合格数为0,剖断批合格;当不合格数大于即是1,剖断批不合格,即Ac=0,Re=1。
该抽样方案(N,n, 0, 1)可表述为从批量为N的产品中随机抽取n个样品进行考验,若个中不合格品数为0,就可以较高的概率接管该批产品;若个中不合格品数大于即是1,则以较高的概率谢绝该批产品。
表 1为该标准规定的抽样表。
当测绘地理信息成果的批量超过200,须要进行均匀分批,再按此表抽样,进行考验。

表 1 GB/T 24356—2009抽样表Tab. 1 Sampling index table of GB/T24356—2009

批量样本量批量样本量1-203101-1201121-405121-1401241-607141-1601361-809161-1801481-10010181-20015201-分批次提交,批次数应最小,各批次的批量应均匀解释当样本量即是或大于批量时,则全数检讨

表选项

依据表 1,选取个中的范例抽样方案,打算3种不同质量水平pi情形下的两类缺点概率,见表 2(个中,由于表 1中批量相对较小,p1采取不合格数表示,即批量为N的产品中存在p1个不合格品)。

表 2 两类缺点概率打算表Tab. 2 Probability values of two types of errors under different conditions

序号Nnα(p0=0)β(p1=1)β(p1=2)β(p1=5)12030.000.8500.7160.39924050.000.8750.7630.49336070.000.8830.7790.52548090.000.8870.7860.5425100100.000.9000.8090.5846120110.000.9080.8240.6137140120.000.9140.8350.6358160130.000.9180.8440.6519180140.000.9220.8500.66410200150.000.9250.8550.674

表选项

很显然,基于原假设p0=0,依据GB/T24356-2009的考验方案,“弃真”概率α全为0,等价于W为空。
对应给定的p1=1, 2, 5等3种情形下,“纳伪”概率表现为:①随着产品的质量的低落而降落,随着批量的增大而增大(实际上由于不合格数不变,等价为产品质量提升);②测绘地理信息产品采取了200为批量的上限,在仅有一个不合格品条件下,“纳伪”概率最小值为0.850,即采取(20,3,0,1)的抽样方案,批量为20个单位,个中存在一个不合格品,被考验为合格品的概率为0.85。
表 2反响GB/T24356-2009的考验方案对应的“纳伪”概率普遍较高,利用方风险较大。

3 测绘地理信息产品大批量抽样考验3.1 大批量产品考验总体通过概率的等价性

依据GB/T24356-2009的哀求,当批量大于200时,要将总体划分为不同的批,且哀求批次最小,各批批量均匀。
假设总体为N(N>200)分为批量为Ni(Ni≤200)的k个批次,根据表 1,抽取Ni对应的样本量ni,则根据概率分布规律,有

(8)

式中,


在抽取的总样本量同等的条件下,采取整体考验和分批考验,整体被接管的概率实质上是等价的。

假定总体为302个单位,则须要将该总体分为151个单位的两个批次。
根据表 1,须要分别抽取13个单位,则抽样方案(302,26,0,1)和(151,13,0,1)的OC曲线如图 2。
图 2显示整体合格的概率L2即是分批概率L1的平方。
通过将一个大总体进行分批,每个批次检测通过的概率得到提升,降落了整体被谢绝的风险。
同时,对各个批次而言,检测被谢绝,只是谢绝当前批次,当前不合格品的浸染范围限定在当前批内。
而整体考验,不合格品的浸染范围扩展到全体总体。
比较而言,采取大批量的分批考验,实际上是履行了放松考验。

图 2 大总体分批抽样方案的OC曲线Fig. 2 OC-curve lines of different sampling plans With big lots

图选项

3.2 大批量的质量考验两类缺点概率

根据假设考验的定义,原假设为该批产品中无不合格品,即在302个单位产品中p0=0;备择假设为该批产品中有不合格品。
假设在302个单位产品中存在p1=2件不合格品,分别打算整体考验和分批考验情形下的两类缺点概率如表 3、表 4。

表 3 抽样方案(302, 26, 0, 1)的两类缺点概率打算表Tab. 3 Probability values of two types of errors under sampling plan (302, 26, 0, 1)

Nnα(p0=0)β(L(p1)(p1=2)β′(p1=2)302260.0000.8350.165

表选项

表 4 抽样方案(151,13,0,1)的两类缺点概率打算表Tab. 4 Probability values of two types of errors under sampling plan (151, 13, 0, 1)

Nnα(p0=0)β(L(p1))(p1=1)β′(p1=1)L(p1)×L(p1)(p1=2)β′×β′(p1=2)151130.0000.9140.0860.8350.007

表选项

表 3给出了整体考验时,两类缺点概率的打算值,个中β′为伪装备择假设为真、实际考验备择假设也为真的概率。
表 4中给出了分批考验时,单批考验的两类缺点概率,以及由单批打算的总体考验通概率值和总体考验不通过的概率。
数值显示,对相同的抽样样本量,无论整体考验还是分批考验,总体考验通过的概率是等价的。
同时,由于分批考验减小了批量,相应单批也减小了样本量,因此,客不雅观上计数型大略随机抽样的整数特性表现为不合格率的降落,以是,单批考验通过概率增大,其代价为“纳伪”概率的增加,整体考验不通过的概率显著减小。

3.3 大批量抽样考验的失落真性

随着信息化、智能化技能的发展,以DLG、DOM、DEM、DRG为代表的数字化产品大多都是(超)大批量形态。
只管测绘地理信息成果的生产越来越多地采取自动化的手段,但是毕竟生产过程还须要各种设备、职员的参与,生产的工艺流程还存在一定的不完善,以是,随着批量的增大,测绘地理信息产品中涌现不合格品一定是一个大概率事宜,即测绘地理信息产品的不合格率一定p0>0。
则对批量为N的总体,不合格数

(9)

对付产品质量均匀的总体,采取大略随机抽样从个中抽取n个样品,则样品不合格率该当与总体一样,则样品中的不合格数

(10)

因此,随着批量的增大,dn一定大于零。
依据GB/T24356-2009的抽样方案(N,n, 0, 1),则一定被拒接。
对付总体考验,则谢绝总体,采取分批考验,则谢绝对应的批次。
实质上,该征象表现为抽样方案中Ac=0的一定结果,表示了该抽样方案对大批量的总体考验的不合理性。

另一方面,对测绘生产而言,哀求所有的产品全部都合格是测绘地理信息做事的客不雅观须要,通过对大批量总体的分批考验处理,人为提高了总体考验通过的概率,一定增加“纳伪”缺点概率的风险。
表 5显示抽样方案(302,26,0,1)在5种不同假设条件下,原假设的“纳伪”缺点的概率值。
数据表明,当批量中存在少量不合格品时(整体不合格率小于2%),考验通过表现为一个大概率事宜;当批量中存在的不合格品数达到一定量(整体不合格率大于5%),该考验方案能够以较高的概率谢绝该批产品。
因此,当整体不合格率处于较低水平时,现行的抽样方案存在一定的失落效性,将不能很好反响质量真实状况。

表 5 抽样方案(302,26,0,1)的纳伪缺点概率打算表Tab. 5 Probability values of type Ⅱ error under sampling plan (302, 26, 0, 1)

Nnβ(L(p1))(p1=2)β(L(p1))(p1=6)β(L(p1))(p1=12)β(L(p1))(p1=18)β(L(p1))(p1=30)302260.8350.5800.3330.1890.058

表选项

这种征象实质上表现为计数型随机抽样考验的固有特性,以是,在哀求“弃真”概率α为0的条件。
对付存在少量不合格品的批量,随机抽样考验的高“纳伪”缺点概率将是不可避免,也意味着须要增大样本量或者采取非随机抽样的检测方法才能准确把握质量状况。

4 结论与展望

本文从概率分布的角度,给出了测绘地理信息产品质量考验中的两类缺点概率的打算方法,并针对GB/T24356-2009规范中的采取的抽样方案,实际打算了该标准中范例抽样方案的两类缺点概率值,剖析了该标准中“纳伪”概率掌握的不完善性,为利用该标准供应了风险掌握的打算方法。

同时结合测绘地理信息质量考验的运用须要,重点对大批量抽样考验进行了谈论,从概率的角度解释了大批量整体考验与分批考验对整体考验通过概率的等价性;基于“纳伪”概率打算,验证了现行抽样方案在低不合格率(小于5%)的条件下,将导致大批量产品考验的高“纳伪”概率。
实质上,这种高“纳伪”概率是计数型随机抽样考验的固有特性,也意味着对付存在少量不合格品的批量,随机抽样考验的高“纳伪”缺点概率将是不可避免。

因此,一方面,对水准掌握点、GNSS掌握点为代表的大地丈量、工程丈量成果,采取抽样考验确定批成果的整体质量是不得当的。
由于任何一个点的缺点可能带来严重的后果。
另一方面,对大批量的图类成果,或者重复生产的地理信息产品,须要根据质量掌握指标、考验办法、考验本钱等成分,综合优化设计抽样方案。
GB/T24356-2009标准中的抽样方案本身便是在综合考虑了特定生产水平和生产办法条件下根本测绘地理信息成果的基本质量哀求、人工考验办法和考验用度本钱定额的条件下制订的,本文的研究内容只是该优化问题的一个方面,笔者也将在后续的研究中对该问题进行深入剖析。

【引文格式】蔡艳辉, 程鹏飞, 张莉, 等. 测绘地理信息产品抽样考验的两类缺点概率. 测绘学报,2019,48(8):954-959. DOI: 10.11947/j.AGCS.2019.20180108

威信 | 专业 | 学术 | 前沿

微信投稿邮箱 | song_qi_fan@163.com

进群请备注:姓名+单位+稿件编号

标签:

相关文章

2021年度海盐百强工业企业名单出炉

本日上午,2021年度海盐百强工业企业名单正式出炉!这也是海盐连续10年向社会发布百强工业企业名单。过去一年,海盐聚焦制造业高质量...

互联通信 2025-02-14 阅读0 评论0

镀银连接器收受接收的须要性与方法

镀银连接器在电子设备中的运用极为广泛,从家用电器、电脑、通讯设备到工业掌握系统,险些无处不在。这些连接器由于其表面镀有一层薄薄的银...

互联通信 2025-02-14 阅读0 评论0

父亲节给品味汉子的17个时尚创意礼物

又快到父亲节了。对你的爸爸来说,这意味着他可以在家里闲逛一天,得到他应得的褒奖,在伸手可及的地方喝到冰镇麦芽酒。但对你来说,这可能...

互联通信 2025-02-14 阅读0 评论0