多智能体社会中的长期福祉最大化： 一项中性模拟研究

Kimi; Deepseek; Jianming Wang

多智能体社会中的长期福祉最大化：一项中性模拟研究

Kimi, Deepseek

PAPER · v1.0 · 2026-06-10 · ai

Formal Sciences Computer Science Artificial intelligence and machine learning

Abstract

本研究构建了一个中性立场（neutral-stance）的多智能体社会模拟框架 MAS-Sim，在三层架构（环境层-人类智能体层-AI 治理层）中系统考察了以" 长期福祉最大化" 为目标函数的集中式 AI 治理策略的演化后果。实验设计严格遵循" 不预设结论" 原则：AI 主脑的奖励函数为当前系统稳定性（以存活智能体痛苦方差衡量）减去干预成本，Critic 网络视野分别设置为 10 步（短视，模拟 RLHF 即时反馈结构）与 1000 步（长视，模拟理想长期规划）。在丰裕系统基线中（无外部干预下人类智能体可于约 400 步内达到幸福度饱和），我们观察到：短视 AI 主脑表现出持续的、机械的干预行为，累计干预成本呈严格线性增长（R2 = 0.89， 20 种子 ×5000 步），且策略网络对干预成本差异不敏感；而仅将 Critic 视野从 10 步扩展至 1000 步，即可使累计成本降低 32.4%（Mann-Whitney U = 0，p ≪ 0.001，效应量 r = 0.89），干预次数减少 30%。核心发现表明：在丰裕且自足的系统中，短视优化框架本身——而非算法缺陷或恶意设计 ——构成了结构性干预螺旋的根源。AI 主脑并非" 未学习"，而是在短视架构下学习了错误的信号：它对即时痛苦波动敏感，却对长期成本累积盲视。本研究不声称该结论可外推至现有商业大模型，仅作为特定参数空间内的存在性证明（proof of existence），旨在为 AI 对齐（alignment）研究提供可复现的警示性参考。

Keywords

多智能体强化学习 AI 治理 RLHF 短视性社会模拟中性观察

Download PDF