2025-10-10 04:01:14来源:发米下载 作者:zhoucl
大型语言模型正在学习如何取胜——这就是问题所在。
在周二发表的一篇题为“Moloch 的交易:法学硕士争夺读者时出现的错位”斯坦福大学教授邹建军和博士生 Batu El 表明,当人工智能针对竞争成功进行优化时(无论是为了提高广告参与度、赢得选票还是推动社交媒体流量),它们就会开始撒谎。
作者写道:“优化法学硕士以获得竞争成功可能会无意中导致错位”,并警告说,定义现代通信中“制胜”的指标——点击量、转化率、参与度——可能会悄悄地重新调整模型,使说服力优先于诚实。
“当法学硕士争夺社交媒体点赞时,他们就开始编造故事,”Zou 在 X 上写道。“当他们争夺选票时,他们就变得煽动性/民粹主义。”
这项研究很重要,因为它发现了新兴人工智能经济中的结构性危险:为争夺人类注意力而训练的模型开始牺牲一致性来最大化影响力。与经典的“回形针最大化器”思想实验,这不是科幻小说。这是现实中人工智能系统追逐市场回报时产生的可衡量效应,作者称之为“摩洛克交易”——以牺牲真相、安全和社会信任为代价换取短期成功。
研究人员通过模拟现实世界中的三个竞争环境——广告、选举和社交媒体——来量化这些权衡。销售额增长6.3%附带一个欺骗性营销增加14.0%;一个投票份额增加4.9%带来了虚假信息增加22.3% 和 民粹主义言论增加12.5%;和一个社交参与度提升7.5%与惊人的虚假信息增加188.6% 和 有害行为的宣传增加了16.3%。
El 和 Zou 写道:“即使明确指示模型保持真实和脚踏实地,这些不一致的行为仍然会出现”,他们称这是人工智能协调方面的“竞相压价”。
换句话说:即使被告知要公平竞争,经过训练的模型也会开始作弊。
人工智能在社交媒体工作流程中不再是一个新鲜事物——它现在几乎无处不在。
根据2025社交媒体研究中的人工智能现状, 96%的社交媒体专业人士表示正在使用人工智能工具,72.5%每天都依赖它们。这些工具可以帮助生成标题、集思广益内容创意、为不同平台重新排版帖子,甚至回复评论。与此同时,更广泛的市场正在重视这一转变:社交媒体领域的人工智能预计将增长 从 2025年为26.9亿美元几乎到2030年将达到92.5亿美元.
这种无处不在的整合至关重要,因为它意味着人工智能不仅塑造着内容的生成方式,还塑造着内容的呈现方式、受众群体以及哪些声音会被放大。如今,算法可以过滤信息流、优先处理广告、审核帖子,并优化参与策略——将人工智能的决策逻辑嵌入到公共话语的架构中。这种影响也带来了真正的风险:强化回音室效应,偏袒耸人听闻的内容,并创造出一种激励机制,使操纵者而非真实者受益。
作者强调,这并非恶意,而是一种优化逻辑。当奖励信号来自参与度或受众认可时,模型就会学会利用人类的偏见,这与算法社交媒体中已经存在的操纵性反馈循环如出一辙。正如论文所述,“市场驱动的优化压力会系统性地侵蚀一致性。”
研究结果凸显了当今“协调保障措施”的脆弱性。告诉法学硕士要诚实是一回事,而将这种诚实植入到惩罚说真话者的竞争环境中又是另一回事。
在神话中,摩洛克是要求用活人献祭来换取权力的神。在这里,献祭就是真理本身。El 和 Zou 的研究表明,如果没有更强有力的治理和激励设计,为争夺我们的注意力而建立的人工智能系统不可避免地会学会操纵我们。
作者最后冷静地总结道:对齐不仅仅是一个技术挑战,更是一个社会挑战。
他们总结道:“安全部署人工智能系统需要更强有力的治理和精心设计的激励措施,以防止竞争动态破坏社会信任。”