在以往的问卷调研中,有的同学总会问到两个关键性问题:
Q1.“做问卷调研,须要多少的目标用户?”
Q2.“调研的目标用户难以触达,只有X份问卷数量够吗?”(问卷数量少,不敷百份)

常日来说,用户研究员的建议是根据调研要回答的问题,至少能回收384份有效问卷,有条件的话可以在此根本长进步回收量。那么“384”这个数字是怎么得出来的?问卷调研的回收量一定要达到这个标准吗?如果达不到这个标准,对调研的结果有什么影响?要回答这些问题,我们首先须要理解问卷调研是什么。
一、问卷调研1. 问卷调研适用场景
问卷调研指的是调查者利用统一设计的问卷向被选取的调查工具理解情形或征询见地的调查方法(源自百度词条“问卷调查”)。与其他的用户研究方法比较,问卷具有低本钱、高匿名、高效率的特点,因此在调研中被广泛利用。
问卷调研的适用场景包括网络被调查者的个人信息、理解被调查者的不雅观点态度、行为习气等。问卷可以通过一系列精心设计的问题,帮助研究者达成摸底、评估、预测的研究目的。
图1 问卷调研的适用场景
2. 普查与抽样调查
根据抽样原则的不同,问卷调研可分为普查和抽查。
普查是指对所有的目标群体进行调查。例如我们想要理解北京居民的收入水平,采取普查的办法就须要对北京市的所有居民做调查。对,你没有看错,是“北京市的所有居民”,严格地说不能有遗漏。
这样做的好处是所有人都能被调查到,网络到的资料非常全面不会有偏差性。但缺陷也显而易见,弘大的事情量须要投入大量的人力物力,调研周期也很长。目前我国的人口普查采取的便是这种办法,由全国各地的调查职员,深入到每家每户进行核查。受制于普查耗时耗力的特点,实际的调研中险些不会采取这种方法,利用更普遍的方法是抽样调查。
抽样调查是从调研的全部目标群体中抽取一部分人,根据这部分人的调研结果对全体群体的状况做估计和推断。个中全部的目标群体称为总体,抽取的一部分人称为样本。延续上面的例子,我们想要理解北京居民的收入水平,用抽样调查的方法仅须要从北京市的居民中选取一部分人做调查。在这里,全体北京居民是总体,抽取的部分居民便是样本。根据抽取居民的调研结果,可以推论全体北京市的居民收入水平。
这样做的好处是方便快捷,仅须要调研一部分人就能推测全体群体的状况。而它的缺陷也非常明显,由于无法覆盖所有的调研工具,调研结果会存在一定的偏差性。
图2普查与抽样调查的差异
如何保障抽样调研的可靠性,减少结果的偏差呢?这就须要降落样本的代表性偏差。
二、代表性偏差
在上一部分我们已经知道,抽样调查的目的是“窥一斑而知全豹”,即从调研的目标总体中抽取样本,用样本的调查结果推论总体的状况。而推论结果的可靠性取决于样本是否具有代表性,是否可以将样本的调研结果推论到总体。因此代表性偏差指的便是由样本数据向总体数据做推论时产生的偏差。代表性偏差紧张受抽样办法和样本数量的影响。
1. 抽样办法的随机性
抽样的随机性哀求总体中的每个个体都有均等的机会被抽取到,没有方向性或主不雅观性。如果抽样方法的随机性无法担保,就会导致抽取的样本有偏差,从而得出错误的调研结论。
范例案例便是火车票购买难度的调查:想要理解春运的火车票是否难买,于是随机选择了一列春运火车做采访。采访结束后,创造火车上的搭客都买到了票,于是得出结论春运火车票很好买。这个调查的疏忽在于选取的调研样本有问题,存在很大的偏差。只调查了购买到车票的群体,遗漏了没有买到车票的群体,因此得出的结论是缺点的。
图3抽样偏差推论出错误的调研结论
随机抽样紧张有四种办法:大略随机抽样、整群抽样、分层抽样、系统抽样。目前平台利用的调研大多采取大略随机抽样,确定调研的目标人群后,向这部分用户定向推送调研问卷。图4大略总结了四种办法的操作流程和各自的优缺陷,详细内容不在此做详述,感兴趣的同学可以自行深入学习。
图4 随机抽样的四种办法
2. 调研样本的数量
除了抽样方法的随机性外,调研的样本数量也会影响代表性偏差。样本量越大,代表性偏差越小,样本的调研结果也就越靠近总体结果。
为了更好的理解样本量对结果的影响,我们用一个案例来做解释:
某校共有5000逻辑学生,在一次英语考试中5000逻辑学生的均匀成绩为76.4分(百分制)。按照抽样调查的思路,可以从5000逻辑学生中随机抽取一部分学生,用他们的考试成绩推测总体情形。结果如图5所示,抽取的样本量越大,结果越靠近总体均分76.4。
图5 样本量与调研结果
因此,问卷调研对付样本量的哀求本色上是为了担保结果的可靠性,即让调研结果更靠近总体的真实情形。虽然样本量越高,调研结果会越趋近于真实状况,但出于回收本钱的考虑,也须要掌握样本量的上限,减少不必要的人力物力摧残浪费蹂躏。
三、确定样本量的方法
说了这么多理论性的内容,最关键的问题还没有回答,用研建议的384份样本量到底是怎么得来的?在这一部分,我们将回答这个问题,通过理解三种确定样本量的方法,进一步明确如何确定问卷调研所须要的样本量。
1. 履历值估计
这种方法最为大略粗暴,完备依照研究者个人的过往履历决定,样本量的数字也大相径庭。有的人用30作为标准,有的人用50作为标准,也有的人用100乃至是300作为标准……你看,这样拍脑袋式的估算不仅无法达成统一,更主要的是缺少理论依据,科学性难以担保。
2. 公式推算
利用打算公式(公式见图6)可以求出问卷调研所须要的样本量。个中n代表样本量;Z代表置信水平的统计量,统计考验中一样平常设置95%的置信水平,对应的统计量是1.96,置信水平越高,得出的结论可信度越高;p代表的是选项的可能性,调研中可取0.5;e代表抽样偏差,一样平常取5%,抽样偏差越小,得出的结论可信度越高。
打算后得到的结果是384,以是用研一样平常建议根据调研要回答的问题,至少能有384份有效问卷,这是担保调研结果可信的最低哀求。须要把稳的是,有时调研会有精确的细致需求,例如在全国的数据中看某个城市或某个区域的调研结果。如果要回答这类细致的问题,该类样本的数量也须要达到384的哀求。
当然,如果我们想要进一步提高调研结果的信度,也可以通过提高置信水平或是降落抽样偏差来实现,但这也意味着须要更多数量的调研问卷(见图6)。
图6 不同置信水平和抽样偏差所须要的样本量
3. 考验效力剖析
随着统计学的发展,严谨的学术研究对付样本量的打算提出了更加精确的哀求。通过考验力剖析,研究职员能打算出更加精确的打算出须要的样本量。大略来说,在样本量(sample size)、效应量(effect size)、显著水平(Alpha)、考验力(test power)四个统计量之间,知其三可推断另一个。
详细的利用场景紧张是两个,一个是在研究前打算所须要的样本量;另一个是在研究结束后,打算研究的效应量。一些软件已经能够供应相应的打算功能(如GPower),并有较好的可视化展示。
图7GPower绘制的所需样本量曲线
四、结语
得益于低本钱、高匿名、高效率的特点,问卷在用户研究中被广泛地利用。样本的代表性是问卷调研结果是否可信的关键成分,通过随机抽样、增加样本量可以提高样本的代表性,从而得出更靠近真实总体状况的调研结论。384份有效问卷是担保调研结果可信的最低样本量哀求,如果回收量无法担保,在推导结论时就须要考虑与真实情形存在偏差的风险。条条大路通罗马,能够达成目的、办理问题的便是好的调研方法。
作者:艾露尼,"大众年夜众号:贝壳KEDC
本文由 @贝壳KEDC 原创发布于大家都是产品经理。未经容许,禁止转载
题图来自 Unsplash,基于CC0协议。