OpenAI 揭 CoT 評分意外影響：保留思路鏈監控是 AI Agent 對齊關鍵防線

WLD

WLD/USDT

US$0.4693

-5.52%

US$0.4693

-5.52%

(24s)

24小时成交量

US$439,350,542.55

24小时高/低

US$0.4989 / US$0.4536

差价: US$0.0453 (9.99%)

资金费率

+0.0056%

多头支付

数据来自COINOTAG DATA实时数据

WLD

每日

US$0.4669

▼ -5.92%

成交量 (24小时): -

阻力位

阻力 3US$0.6167

阻力 2US$0.5366

阻力 1US$0.4748

价格US$0.4669

支撑 1US$0.4449

支撑 2US$0.4036

支撑 3US$0.3329

枢轴点 (PP):US$0.472833

趋势:上升趋势

RSI (14):45.1

ABMedia編輯部

(UTC 07:23)

1 分钟阅读

编辑者Liu Jianhua

1492 浏览

0 评论

OpenAI 5 月 8 日發表新研究、揭露公司在強化學習（RL）訓練過程中、部分模型的思路鏈（Chain of Thought, CoT）被「意外評分」、可能影響 AI Agent 對齊（alignment）監控能力。OpenAI Alignment 團隊報告說明：保留 CoT 的可監控性是當前防範 AI Agent 對齊失敗的關鍵防線；OpenAI 在 RL 訓練設計上、刻意避免懲罰模型的「對齊失敗推理」、以維持監控能力。