AI正在学习预测未来——并已击败人类
(SeaPRwire) – 每三个月,Metaculus 预测竞赛的参与者试图预测未来,以争夺约5,000美元的奖金。Metaculus 作为一个预测平台,提出具有地缘政治重要性的问题,例如“泰国是否会在2025年9月前发生军事政变?”以及“以色列是否会在2025年9月前再次袭击伊朗军队?”
预测者估计事件发生的概率——这比简单的“是”或“否”更有信息量——通常提前数周到数月进行,并且准确性惊人。Metaculus 用户提前两周准确预测了俄罗斯入侵乌克兰的日期,并在堕胎权判例 Roe v. Wade 被推翻前近两个月,预测其有90%的可能性发生。
然而,本周三公布获奖者的比赛中,前十名之一却让预测者们都感到惊讶:一个人工智能。“这确实令人震惊,” Mantic 的首席执行官 Toby Shevlane 说,Mantic 是最近成立的英国初创公司,开发了该人工智能。当比赛于六月启动时,参与者预测顶级机器人得分会是顶级人类表现者平均分的40%。然而,Mantic 的得分超过了80%。
“预测——它无处不在,对吧?” Nathan Manzotti 说,他曾为美国国防部和总务管理局以及大约六个美国政府机构从事人工智能和数据分析工作。“随便挑一个政府机构,他们肯定都在进行某种形式的预测。”
RAND(一家美国政府智库)预测倡议的联合主任 Anthony Vassalo 解释说,预测者帮助机构预见未来。它也帮助他们改变未来。Vassalo 说,提前数周或数月预测地缘政治事件有助于“阻止意外发生”并“协助决策者做出决策”。预测者根据立法者颁布的政策更新他们的预测,这样他们就能预测假设的政策干预将如何改变未来的结果。Vassalo 说,如果决策者处于一个不理想的轨道上,预测者可以帮助他们“改变他们所处的局面”。
但预测广泛的地缘政治问题是出了名的困难。顶尖预测者对单个问题的预测可能需要数天时间,而且成本很高。Vassalo 说,对于像 RAND 这样的组织,需要在许多地缘政治区域追踪多个主题,“让人类预测者对所有这些问题进行初步预测需要数月时间,更不用说定期更新了”。
机器学习长期以来在数据量大、结构良好的领域非常有用,比如天气预报或量化基金交易。Metaculus 的首席执行官 Deger Turan 说,在预测地缘政治或技术进步时,“你会遇到许多复杂、相互关联的因素,而人类的判断在预测方面可能既更容易获得也更经济实惠”。
大型语言模型处理与人类预测者相同的混乱信息,并且能够模拟这种人类判断力。它们也以与人类相似的方式不断改进:通过对许多问题进行预测,观察结果如何演变,并根据结果更新其预测方法——其规模远超人类所能达到的。
LightningRod(一家为预测开发人工智能、并在 Metaculus AI 锦标赛中取得竞争性名次的的公司)的首席执行官 Ben Turtel 说:“我们主要认识到,预测未来实际上是一个可验证的问题,因为这就像人类学习的方式,对吧?”该公司在一个大型预测问题数据集上训练了一个最近的模型。
人工智能接受的训练正在排名中显现出来。六月,由 Metaculus 在 OpenAI 的 o1 推理模型基础上构建的顶级机器人在比赛中名列第__位。这次,Mantic 在549名参赛者中排名第八——这是一个机器人首次在该系列比赛中进入前十名。
Metaculus 的工程师 Ben Wilson 负责对人工智能和人类在预测挑战中的表现进行比较。他表示,这一结果应持保留态度。这项比赛只包含相对较少的60个问题。此外,600名参赛者大多是业余爱好者,其中一些人只在比赛中预测了少数问题,导致他们的得分较低。
最后,机器拥有不公平的优势。参赛者不仅因准确性得分,还因“覆盖率”得分——包括他们预测的早晚、预测的问题数量以及更新估计的频率。一个准确性不如人类竞争者的人工智能,仍然可以通过持续根据新出现的新闻更新其估计来在排名中取得好成绩,这种方式对人类来说是不可行的。
对 Vassalo 而言,人工智能的不公平优势解决了其最大的剩余问题:获得所有他需要预测问题的高质量预测。他说:“我实际上不需要它达到‘超级预测者’的水平,”他指的是对顶尖预测者的称呼。“我需要它和大众预测一样好。”
这比听起来要难:Metaculus 社区预测(所有用户对每个问题的预测总和)是该平台上表现最稳定的预测之一。如果它是一个人,它将在网站上排名第四——这就是群众的智慧。在季度杯中,Mantic 落后社区预测五名。
一个可靠的人工智能预测者可以同时追踪数百个问题,从而让 Vassalo 仅将顶尖人类预测者部署到那些人工智能认为值得进一步审查的问题上。
Manzotti 说:“关于预测或预测分析,有一点是它提供的是决策支持。”“如果许多领导者有不同的直觉,他们就会将数据置之不理。”这是一个人工智能无法解决的问题。
本文由第三方内容提供商提供。SeaPRwire (https://www.seaprwire.com/)对此不作任何保证或陈述。
分类: 头条新闻,日常新闻
SeaPRwire为公司和机构提供全球新闻稿发布,覆盖超过6,500个媒体库、86,000名编辑和记者,以及350万以上终端桌面和手机App。SeaPRwire支持英、日、德、韩、法、俄、印尼、马来、越南、中文等多种语言新闻稿发布。