← AI 動態 2026-05-01 The Decoder

Anthropic 推出 BioMysteryBench 量表，Claude 能夠匹配人類生物資訊學專家

Anthropic 的新量表 BioMysteryBench 顯示，Claude 能夠解決真實的生物資訊學問題，達到專家級別

Anthropic 的 BioMysteryBench 量表旨在評估 AI 模型在生物資訊學領域的實際表現。現有的量表存在盲點，例如知識測試只能評估事實知識，而不是實際研究技能。BioMysteryBench 使用真實數據集評估模型，結果顯示 Claude 能夠匹配人類生物資訊學專家。然而，結果也存在重要的限制。這項技術的進步對生物資訊學領域具有重要意義，可能帶來新的研究方法和突破。然而，需要進一步評估和驗證以確保其可靠性和有效性。

Anthropic 推出 BioMysteryBench 量表，Claude 能夠匹配人類生物資訊學專家

相關講座