科技前沿

《财经》杂志   

2016年11月15日 12:38  

本文2123字,约3分钟

这次选举可能是传统媒体与新媒体在预测领域的决战,也使AI预测更易让人信服

成功预测美国大选,AI成为“神算子”?

这次选举可能是传统媒体与新媒体在预测领域的决战,也使AI预测更易让人信服

本刊记者 孙爱民/文 王小/编辑

 

唐纳德·特朗普击败希拉里·克林顿,当选美国第45任总统。这一结果出乎很多人的意料,多年来展现了“神预测”本领的美国民意调查机构纷纷“猜中了开头却错失了结局”。不过,这一结局却“神同步”般应验了印度的一个人工智能系统MogIA的预测。

早在2016年10月,MogIA就一反众民调机构之道——预测特朗普将取胜。MogIA由一家名为Genic的人工智能科技公司研发。研发者称,此前其已经连续成功预测了三次美国大选。而且,在此次美国大选前,已成功预测了民主党与共和党的初选结果。

预测到像总统大选这样充满不确定性的复杂事件?MogIA是连续四次“蒙”对了,还是背后精细的科学计算?

据研发者Sanjiv Rai对外媒介绍,MogIA 对美国大选的预测,基于从谷歌、Facebook、Twitter、YouTube等收集的2000万个数据源,视频直播也被计算其中。该AI系统的经验表明,在大选周期内,在社交网络上被讨论次数越多的候选人,一般最终赢得选举。

中科院计算技术研究所研究员张云泉对《财经》记者分析,MogIA采集包括视频、音频、图像、文字在内的多维数据,对所有数据分析一遍后,对样本进行画像,利用大数据技术对数据进行建模,确定其支持态度。

Sanjiv Rai承认,MogIA仍有缺陷,不能正确识别抓取到社交媒体数据中的正面与负面涵义。比如,有人在社交网站上提到了“Trump”,AI无法识

别出说话者是支持还是反对。此前他也担忧过:如果Trump输掉大选,这成为过去12 年来互联网数据第一次失效。

张云泉在选前就坚信特朗普一定会赢,“对于人工智能来说,预测选举不是难事”,MogIA的缺陷与误差,在任何模型都置信度区间、是有一定误差的,但AI 对语言的理解技术发展很快,对语义、情绪表达的理解越发准确,“只要样本量足够多、数据足够大,只要有足够大的数据,误差可以人为纠正”。

在人工智能界,专家们对MogIA褒贬不一。对于MogIA的表现,《人工智能学家》主编、计算机博士刘锋接受《财经》记者采访时说,通过提取关键词,统计谁的名字出现在社交网络上多谁就会赢得大选,“这种预测没有什么技术含量”。

刘锋认为,在预测方面,AI在流感等流行疾病和金融领域的预测还是有一定准确度的。这些基于大量数据与通用模型的预测,都有规律可循,而情况复杂多变、一个选前的突发事件就能影响走势的总统大选,用关注度统计来做预测有些不太靠谱。

利用大量可公开获取的社交数据,来预测大选,已经越来越流行。今年9月份,美国东北大学政治学助理教授Nick Beauchamp发表的一篇论文表明,他研究了1亿条与2012年大选有关的推特,发现作为使用率和自由度最高的言论交流平台,社交网络推文的分析结果与当年的选情吻合度非常高。

“这一结果并非只是为产生数据提供有效工具,而且还可以协助研究者,来研究人们的想法与说法如何反映,甚至影响投票行为。”Beauchamp 说。

除了“一算成名”的MogIA,其他不少AI也在做预测。11月2日,人工智能预测平台Unanimous AI预测的结果是:希拉里将以微弱优势胜出。该平台此前成功地预测了肯塔基赛马会,以及奥斯卡奖的大部分获奖情况。

Unanimous AI失败了,一同失败的还有以美国总统大选预测成名的纳特·西尔弗,和他的数据博客“538”(FiveThirtyEight)。

有“数据巫师”之称的美国统计学家西尔弗,在“538”上多次发表选情分析,预测希拉里有八成可能击败特朗普。西尔弗团队收集了美国各州和全国范围的大部分民意调查结果,重复模拟了2万次选举,最终得出预测结果。“538博客”持续跟踪美国选情,根据最新民意调查每天更新预测结果,直到11月8日大选。

要分析“538”和传统的民意调查为何“大意失荆州”,可能需要数月、甚至数年。美国蒙纳士大学民意调查机构负责人Patrick Murray 说,包括我们的系统在内的几乎所有传统民调都沦陷了。

每个民意调查都会有偏差,有些源自数据噪声,有的则源自无应答误差。有分析人士认为,一些特朗普的支持者在接受民意调查时会羞于表明自己的投票倾向,也有不少支持者对民意调查机构与调查本身,持不信任的态度。

张云泉告诉《财经》记者,传统媒体民意调查的样本量有限,而且样本具有偏向性,对于选民之间的互动无法用数据呈现。“社交网络可以真实反映人的态度,这次选举可能是传统媒体与新媒体在预测领域的决战。”