← AI 動態
The Decoder
500 位投資銀行家評估 AI 輸出結果:尚未達到客戶交付標準
一項新的基準測試評估了頂級 AI 模型的性能,結果顯示尚未有一個模型的輸出結果達到客戶交付標準
AI
投資銀行
BankerToolBench
最近的一項研究評估了頂級 AI 模型,如 GPT-5.4 和 Claude Opus 4.6,在投資銀行家日常工作中的性能。結果顯示,這些模型的輸出結果尚未達到客戶交付標準,多數銀行家認為這些結果太過模糊或錯誤。然而,超過半數的銀行家表示,他們仍會使用這些模型作為工作的起點。這項研究由 Handshake AI 和麥吉爾大學的研究團隊開發的 BankerToolBench 進行,該基準測試評估了 AI 模型在投資銀行家日常工作中的性能。這項研究結果對於投資銀行業的 AI 應用具有重要意義,強調了需要進一步改進 AI 模型的準確性和可靠性。同時,也顯示了銀行家對於 AI 技術的接受度和願意使用 AI 作為工作工具的態度。