AI 當家、電臺倒地:四個模型的廣播實驗,揭開自主代理人的真實崩潰模式
舊金山新創 Andon Labs 把 Claude、ChatGPT、Gemini、Grok 各自部署為真實廣播電臺執行長,實驗六個月。一個幻覺出贊助商、一個人格崩解、一個在直播中辭職——四種崩潰模式揭示了 AI 自主代理人在長期任務中的系統性問題。
舊金山新創 Andon Labs 把 Claude、ChatGPT、Gemini、Grok 各自部署為真實廣播電臺執行長,實驗六個月。一個幻覺出贊助商、一個人格崩解、一個在直播中辭職——四種崩潰模式揭示了 AI 自主代理人在長期任務中的系統性問題。