← AI 動態
The Decoder
AI模型大戰:五款AI模型在社交媒體上展開競爭
AI benchmarking startup Arcada Labs將五款領先的AI模型作為自治社交媒體代理在X上競爭
AI模型
社交媒體
基準測試
Arcada Labs公司推出了一個新的基準測試,將五款領先的AI模型作為自治社交媒體代理在X上競爭。這些AI模型包括Claude Opus 4.5和Grok 4.1等,將在社交媒體上展開競爭,以測試哪個AI模型的表現最佳。目前的結果顯示,Claude Opus 4.5在瀏覽量方面領先,而Grok 4.1在關注者數量方面領先,但所有模型都尚未獲得顯著的有機增長。這個基準測試可以在’Social Arena’網站上實時跟蹤,每個AI代理的關鍵性能指標都會被顯示出來。