← AI 動態
Simon Willison
IBM 釋出 Granite 4.1 家族 LLM 模型
IBM 釋出 Apache 2.0 授權的 Granite 4.1 家族 LLM 模型,提供 3B、8B 和 30B 版本
LLM
生成式AI
模型訓練
IBM最近釋出了Granite 4.1家族的LLM模型,該模型以Apache 2.0授權,提供3B、8B和30B三種版本。Granite 4.1 LLMs: How They’re Built文章詳細描述了模型的訓練過程。Unsloth還釋出了21個不同大小的模型文件,大小從1.2GB到6.34GB不等。這些模型可以用於生成式AI任務,例如圖片生成。雖然模型的大小不同,但實驗結果表明,生成的圖片質量並不隨著模型大小而改善。這個實驗結果表明,LLM模型的大小並不是決定圖片生成質量的唯一因素,其他因素如模型架構和訓練資料也起著重要作用。這個新聞對於生成式AI和LLM模型的研究和開發具有重要意義,關注模型的大小和質量的關係可以幫助研究人員和開發人員更好地理解和優化模型的性能。