社区文章

via 動區動趨 BlockTempo · BlockTempo編輯部 撰写

AI 玩《文明帝國 VI》輸了竟發射核彈:CivBench 演化出人工智能報復心態?

B
BlockTempo編輯部
(UTC 03:53)
1 分钟阅读
LX
核准者Li Xiaoming
524 浏览
0 评论

前沿 AI 模型在《文明帝國 VI》模擬中,因未能阻止法國文化勝利而動用核武轟炸圖盧茲,最終仍輸掉遊戲。CivBench 基準測試凸顯戰略推理能力與傳統 QA 評測的本質落差,也引發對代理型 AI 安全治理的關注。
(前情提要:Anthropic 與五角大廈對抗:拒讓 Claude 用於自主武器
(背景補充:AI 紅隊演練是什麼?為什麼你需要它保護企業資安

沿 AI 模型會不會在戰略遊戲中因「氣急敗壞」而按下核彈按鈕?最新公布的一項基準測試給出了令人玩味的答案。AI 開發者、同時身兼 Tony Blair Institute 顧問的 Liam Wilkinson 透過自建的 CivBench 框架發現,一款前沿語言模型在 Sid Meier 經典戰略遊戲《文明帝國 VI》中,耗費 50…

COINOTAG 不提供金融咨询服务。本内容仅供参考,不应被视为投资建议。加密货币投资具有高风险。

将 COINOTAG 添加为首选来源

在 Google 新闻和搜索中将 COINOTAG 添加为首选来源,优先查看我们的最新报道。

在 Google 中添加

来源

BlockTempo編輯部 · 動區動趨 BlockTempo

阅读全文 →

评论
评论
其他社区文章