AI 玩《文明帝國 VI》輸了竟發射核彈：CivBench 演化出人工智能報復心態？

BlockTempo編輯部

(UTC 03:53)

1 分钟阅读

前沿 AI 模型在《文明帝國 VI》模擬中，因未能阻止法國文化勝利而動用核武轟炸圖盧茲，最終仍輸掉遊戲。CivBench 基準測試凸顯戰略推理能力與傳統 QA 評測的本質落差，也引發對代理型 AI 安全治理的關注。
（前情提要：Anthropic 與五角大廈對抗：拒讓 Claude 用於自主武器）
（背景補充：AI 紅隊演練是什麼？為什麼你需要它保護企業資安）

前沿 AI 模型會不會在戰略遊戲中因「氣急敗壞」而按下核彈按鈕？最新公布的一項基準測試給出了令人玩味的答案。AI 開發者、同時身兼 Tony Blair Institute 顧問的 Liam Wilkinson 透過自建的 CivBench 框架發現，一款前沿語言模型在 Sid Meier 經典戰略遊戲《文明帝國 VI》中，耗費 50…

COINOTAG 不提供金融咨询服务。本内容仅供参考，不应被视为投资建议。加密货币投资具有高风险。

将 COINOTAG 添加为首选来源

在 Google 新闻和搜索中将 COINOTAG 添加为首选来源，优先查看我们的最新报道。

在 Google 中添加

其他社区文章