← AI 動態 2026-04-26 The Decoder

500 位投資銀行家評估 AI 輸出結果：尚未達到客戶交付標準

一項新的基準測試評估了頂級 AI 模型的性能，結果顯示尚未有一個模型的輸出結果達到客戶交付標準

最近的一項研究評估了頂級 AI 模型，如 GPT-5.4 和 Claude Opus 4.6，在投資銀行家日常工作中的性能。結果顯示，這些模型的輸出結果尚未達到客戶交付標準，多數銀行家認為這些結果太過模糊或錯誤。然而，超過半數的銀行家表示，他們仍會使用這些模型作為工作的起點。這項研究由 Handshake AI 和麥吉爾大學的研究團隊開發的 BankerToolBench 進行，該基準測試評估了 AI 模型在投資銀行家日常工作中的性能。這項研究結果對於投資銀行業的 AI 應用具有重要意義，強調了需要進一步改進 AI 模型的準確性和可靠性。同時，也顯示了銀行家對於 AI 技術的接受度和願意使用 AI 作為工作工具的態度。

500 位投資銀行家評估 AI 輸出結果：尚未達到客戶交付標準

相關講座