【转载】美国大选民调是如何统计的?
美国大选主要有三种民意调查方式。
1.固定电话(Landline)调查
2.移动电话(Mobile)调查
3.在线(Online)调查
以上是根据调查渠道区别的。按照调查方法区别,则可以分为:
1.人工调查,即由调查员人工拨通电话之后提问的调查。
2.自动调查,即由自动拨号程序引导进行的调查。
这里有一个严重问题:美国法律禁止用自动拨号程序拨打移动电话,所以自动调查只包括固定电话,这样就会遗漏大量只有手机的年轻选民。所以很多人认为,同时包括固定电话和移动电话的人工调查,才是最可信的。
不过这里又引发了另一个问题:人工调查就可信吗?人工调查的最大缺点是每个受访者得到的具体问题都不一样。例如:请问您更支持奥巴马还是罗姆尼?以及:请问奥巴马和罗姆尼,您更支持谁?以上两个问题可能有微妙差别。再加上调查员提问时的心理状态、语气可能不一样,人工调查其实带来了更多的干扰变量。
折中手段是采取自动调查的方式收集有固定电话的选民意见,然后通过人工拨打移动电话或在线调查的方式,覆盖那些没有固定电话的选民。例如,Rasmussen Report就是采取以上调查方式。
调查样本的大小也是一个严重问题。对于全国选民的调查,很容易凑齐1000个甚至2000个有效受访者,误差会很小。但是美国大选是以州为单位进行的,要在单个州,尤其是在新罕布什尔、衣阿华这种人口较少的战场州凑齐1000个受访者,很困难。所以,这种小州的民调要么更新很慢,要么误差很大,经常爆冷。
样本数量的滚动也很成问题。包括Gallup在内的绝大部分民调,使用的数据是滚动的,一般是5天。也就是说,今天发生的新闻,要到5天之后才彻底释放到民调成果中。所以罗姆尼对奥巴马的第一场辩论大胜之后,是在下个星期才出现明显的民调访谈的。这也是没有办法,民调公司无法在短期内凑齐大量的有效样本,只能滚动。此外,滚动能够克服一些短期新闻事件的影响,让民调结果更稳定。
在线收集的民调数据是否可靠,一直存在争议。抛开技术和统计上的问题不说,在美国这样一个地广人稀、区域发展不平衡的国家,不是人人都能做到每天上网的(当然,中国也不是)。美国南部和中西部存在许多田园牧歌式的乡村社区,在线民调很难覆盖他们。所以,现在大家的一致意见是在线民调仅供参考,或者作为对电话民调的一种补充,不能单独挑大梁。
根据受访对象的不同,有两种民调:Registered Voter民调,以及Likely Voter民调。前者的样本空间涵盖一切注册选民,后者则只涵盖有可能去投票的选民。例如,有一位选民从来不去投票,或者从人口统计学指标上看投票的可能性很低,那么Likely Voter民调就不会包括它。但是,区别鉴定谁是Likely Voter的过程的主观性太大。民主党经常攻击Likely Voter会夸大共和党的优势,因为共和党的基本盘要么是富人,要么是宗教保守派,投票热情都很高,民主党的基本盘则经常不出来投票。
在收集民调原始数据之后,调查公司一般会对原始数据做平衡,常见的包括性别、地区、种族平衡等。因为电话调查的有效回收率很低,一般在10%以下,也就是打10000个电话才能收集大约1000个有效问卷(自动电话调查的回收率更低,都是个位数)。所以,假设回收问卷里面某一群体的比例过高,要对此进行修正。
这里就涉及到一个有趣的问题:到底什么数据需要修正?例如,某电话调查公司回收了1000个问卷,其中600个是共和党人,400个是民主党人;而人口统计显示,该地区的共和党与民主党是50对50的比例,那么调查公司需要剔除一部分共和党数据吗?有人认为不需要,因为这很可能显示了共和党支持者的参与度更高,投票倾向更强。
举一个最近的例子:2012年10月3日,美国大选第一场电视辩论之后,罗姆尼的支持率强劲攀升,平均上升4个百分点,在某些调查中甚至上升9个百分点。民主党支持者指出,罗姆尼的支持率上升不是因为真的有那么多选民改变主意,而是共和党选民的热情提高了,更乐意回答电话调查。共和党支持者则反驳说,如果共和党选民更乐意回答电话调查,那么他们当然更乐意出来投票,不是吗?
所以无论如何,民意调查结果的精确度,是一个大问题,只有事后才能验证。
-- 完 --
下载知乎 iPhone 客户端:http://zhi.hu/ios
来源:
知乎每日精选
http://www.zhihu.com/rss
http://www.zhihu.com/question/20537900/answer/15422116
1.固定电话(Landline)调查
2.移动电话(Mobile)调查
3.在线(Online)调查
以上是根据调查渠道区别的。按照调查方法区别,则可以分为:
1.人工调查,即由调查员人工拨通电话之后提问的调查。
2.自动调查,即由自动拨号程序引导进行的调查。
这里有一个严重问题:美国法律禁止用自动拨号程序拨打移动电话,所以自动调查只包括固定电话,这样就会遗漏大量只有手机的年轻选民。所以很多人认为,同时包括固定电话和移动电话的人工调查,才是最可信的。
不过这里又引发了另一个问题:人工调查就可信吗?人工调查的最大缺点是每个受访者得到的具体问题都不一样。例如:请问您更支持奥巴马还是罗姆尼?以及:请问奥巴马和罗姆尼,您更支持谁?以上两个问题可能有微妙差别。再加上调查员提问时的心理状态、语气可能不一样,人工调查其实带来了更多的干扰变量。
折中手段是采取自动调查的方式收集有固定电话的选民意见,然后通过人工拨打移动电话或在线调查的方式,覆盖那些没有固定电话的选民。例如,Rasmussen Report就是采取以上调查方式。
调查样本的大小也是一个严重问题。对于全国选民的调查,很容易凑齐1000个甚至2000个有效受访者,误差会很小。但是美国大选是以州为单位进行的,要在单个州,尤其是在新罕布什尔、衣阿华这种人口较少的战场州凑齐1000个受访者,很困难。所以,这种小州的民调要么更新很慢,要么误差很大,经常爆冷。
样本数量的滚动也很成问题。包括Gallup在内的绝大部分民调,使用的数据是滚动的,一般是5天。也就是说,今天发生的新闻,要到5天之后才彻底释放到民调成果中。所以罗姆尼对奥巴马的第一场辩论大胜之后,是在下个星期才出现明显的民调访谈的。这也是没有办法,民调公司无法在短期内凑齐大量的有效样本,只能滚动。此外,滚动能够克服一些短期新闻事件的影响,让民调结果更稳定。
在线收集的民调数据是否可靠,一直存在争议。抛开技术和统计上的问题不说,在美国这样一个地广人稀、区域发展不平衡的国家,不是人人都能做到每天上网的(当然,中国也不是)。美国南部和中西部存在许多田园牧歌式的乡村社区,在线民调很难覆盖他们。所以,现在大家的一致意见是在线民调仅供参考,或者作为对电话民调的一种补充,不能单独挑大梁。
根据受访对象的不同,有两种民调:Registered Voter民调,以及Likely Voter民调。前者的样本空间涵盖一切注册选民,后者则只涵盖有可能去投票的选民。例如,有一位选民从来不去投票,或者从人口统计学指标上看投票的可能性很低,那么Likely Voter民调就不会包括它。但是,区别鉴定谁是Likely Voter的过程的主观性太大。民主党经常攻击Likely Voter会夸大共和党的优势,因为共和党的基本盘要么是富人,要么是宗教保守派,投票热情都很高,民主党的基本盘则经常不出来投票。
在收集民调原始数据之后,调查公司一般会对原始数据做平衡,常见的包括性别、地区、种族平衡等。因为电话调查的有效回收率很低,一般在10%以下,也就是打10000个电话才能收集大约1000个有效问卷(自动电话调查的回收率更低,都是个位数)。所以,假设回收问卷里面某一群体的比例过高,要对此进行修正。
这里就涉及到一个有趣的问题:到底什么数据需要修正?例如,某电话调查公司回收了1000个问卷,其中600个是共和党人,400个是民主党人;而人口统计显示,该地区的共和党与民主党是50对50的比例,那么调查公司需要剔除一部分共和党数据吗?有人认为不需要,因为这很可能显示了共和党支持者的参与度更高,投票倾向更强。
举一个最近的例子:2012年10月3日,美国大选第一场电视辩论之后,罗姆尼的支持率强劲攀升,平均上升4个百分点,在某些调查中甚至上升9个百分点。民主党支持者指出,罗姆尼的支持率上升不是因为真的有那么多选民改变主意,而是共和党选民的热情提高了,更乐意回答电话调查。共和党支持者则反驳说,如果共和党选民更乐意回答电话调查,那么他们当然更乐意出来投票,不是吗?
所以无论如何,民意调查结果的精确度,是一个大问题,只有事后才能验证。
-- 完 --
下载知乎 iPhone 客户端:http://zhi.hu/ios
来源:
知乎每日精选
http://www.zhihu.com/rss
http://www.zhihu.com/question/20537900/answer/15422116

评论
发表评论