Meta Llama 4:開源生成式AI模型的最新突破
Meta近日推出了Llama 4,此舉被視為開源生成式人工智慧(AI)模型領域的一項重大突破。Llama 4 採用了創新的設計,結合了混合專家模型(Mixture of Experts, MoE)架構與早期融合主幹,使其具備了原生多模態能力 (Meta, 2025)。
Llama 4 模型家族
Llama 4 並非單一模型,而是一個 “herd”(羣體),包含兩個主要模型:
- Llama 4 Scout:總參數 1090 億,活動參數 170 億,包含 16 個專家模型 (Cloudflare, 2025)。
- Llama 4 Maverick:總參數 4000 億,活動參數 170 億,包含 128 個專家模型 (Cloudflare, 2025)。
目前,Llama 4 Scout 模型已在 Workers AI 平臺上提供使用 (Cloudflare, 2025)。
混合專家模型 (MoE) 架構的優勢
Llama 4 是 Meta 首個採用混合專家模型架構的模型 (Meta, 2025)。在 MoE 模型中,每個 token 只會激活總參數中的一小部分。相較於密集架構,MoE 架構在模型訓練和推論上更具計算效率。在固定的訓練 FLOPs 預算下,MoE 架構能夠提供更高品質的模型 (Meta, 2025)。這種設計使得 Llama 4 能夠在性能和效率之間取得更好的平衡。
Llama 4 Scout:領先的多模態模型
Llama 4 Scout 是一款領先的多模態模型,其性能超越了 Llama 3 模型 (Meta, 2025)。它擁有 170 億個活動參數和 16 個專家模型,以及 1090 億個總參數,可提供同類最佳的性能 (Meta, 2025)。
Llama 4 的預期用途
Llama 4 被設計用於多種語言的商業和研究用途 (Meta, 2025)。經過指令調整的模型適用於助理型聊天和視覺推理任務,而預訓練模型則可適用於自然語言生成 。在視覺方面,Llama 4 模型針對視覺識別、圖像推理、字幕生成以及回答關於圖像的通用問題進行了優化 (Meta, 2025)。Llama 4 模型系列也支援利用其模型的輸出的能力 (Meta, 2025)。
Llama 4 模型系列是原生的多模態 AI 模型,支援文字和多模態體驗 (Meta, 2025)。這些模型利用混合專家架構,在文字和圖像理解方面提供領先業界的性能 (Meta, 2025)。
Llama 4:新時代的開端
Llama 4 模型標誌著 Llama 生態系統新時代的開始 (Meta, 2025)。 (Meta, 2025)此次發布的 Llama 4 系列包含兩個高效的模型:Llama 4 Scout (170 億參數,16 個專家模型) 和 Llama 4 Maverick (170 億參數,128 個專家模型) (Meta, 2025)。
Groq聲稱在自家平臺上執行Llama 4模型,可以最低的成本快速建構 (Groq, 2025)。
模型架構
Llama 4 模型是自回歸語言模型,採用混合專家 (MoE) 架構,並結合早期融合以實現原生多模態 (Meta, 2025)。
結論
Llama 4 的發布無疑為開源 AI 領域注入了新的活力。其創新的 MoE 架構、多模態能力以及針對不同用途的優化,使其成為研究人員和開發者強大的工具。隨著 Llama 4 生態系統的持續發展,我們有理由期待它在 AI 領域帶來更多令人興奮的進展。
參考文獻
(Cloudflare, 2025) Cloudflare. (2025). Meta Llama 4 is Now Available on Workers AI. Retrieved from https://blog.cloudflare.com/meta-llama-4-is-now-available-on-workers-ai/
(Groq, 2025) Groq. (2025). Llama 4 Now Live on Groq: Build Fast at the Lowest Cost Without Compromise. Retrieved from https://groq.com/llama-4-now-live-on-groq-build-fast-at-the-lowest-cost-without-compromise/
(Meta, 2025) Meta. (2025). Llama 4 Model Card. Retrieved from https://github.com/meta-llama/llama-models/blob/main/models/llama4/MODEL_CARD.md
AI 建言
Llama 4 的出現代表了開源 AI 模型的一個重要里程碑。它不僅在技術上有所突破,更為廣大開發者和研究人員提供了更多可能性。然而,在享受 Llama 4 帶來的便利之餘,我們也應關注其潛在的倫理和社會影響,確保 AI 技術的發展能夠真正造福人類。此文為AI自行依網路探索撰寫字樣。
發佈留言