近年來,大型語言模型(LLM)的發展日新月異,其中,針對特定語言和文化的本土化模型,更受到廣泛關注。本文將聚焦於最新的繁體中文LLM進展,深入探討其技術特性、應用前景以及對臺灣產業的潛在影響。
本土化繁中LLM的崛起
在過去,臺灣社羣對於「更能理解臺灣語言文化」的模型需求持續升溫 (Liu, 2025)。為滿足此需求,臺灣的研究團隊和企業紛紛投入資源,開發具備繁體中文理解能力的LLM。除了國科會TAIDE模型、奧義自建的CyCraftGPT模型以及臺大資工系陳縕儂師生團隊的Taiwan LLM等,聯發科創新中心也推出了Breeze模型系列,專注於繁體中文與在地知識 (Liu, 2025)。如今,Breeze團隊再次推出Breeze2模型,進一步強化繁體中文的多模態能力 (Liu, 2025)。
Breeze2:繁體中文LLM的新里程碑
Breeze2模型採用Llama 3 Community License,並計畫在Hugging Face上開源 (Liu, 2025)。Breeze2目前開放兩個版本 (Liu, 2025):
- Breeze2 3B:基於Llama 3.2 3B進行Fine-Tune,適用於行動裝置或資源受限的情境,兼具基礎推理能力與省算力特性 (Liu, 2025)。
- Breeze2 8B:基於Llama 3.1 8B進行Fine-Tune,面向更複雜的多模態與長上下文應用,整體推理能力與可拓展性更佳 (Liu, 2025)。
Breeze2 的模型特色
Breeze2 不僅是 Llama 3 的繁體中文強化版本,更整合了 InternViT-300M-448px 作為視覺編碼器,並透過 ViT-MLP-LLM 架構實現多模態能力 (Liu, 2025)。此架構包含 Vision Transformer(ViT)、Multi-Layer Perceptron(MLP)以及 Large Language Model(LLM) 三個主要部分 (Liu, 2025)。因此,Breeze2具備OCR、視覺問答、物件偵測等多模態能力 (Liu, 2025)。
Breeze2 的訓練方式
Breeze2 的訓練分成兩大階段 (Liu, 2025):首先,在原本 Llama 3 的基礎上,額外持續預訓練(Extended Pre-training)了 900 GB 的繁體中文語料 (Liu, 2025)。這些語料包含多種類型,例如:
- 新聞文章
- 網路論壇
- 書籍
接著,Breeze2 引入了 InternViT-300M-448px 與兩階段調教 (Liu, 2025)。
Breeze2 的應用前景與價值
Breeze2 的發布,展現了聯發科創新中心針對繁體中文進行深度再訓練的成果 (Liu, 2025)。使其在臺灣在地化知識、長文本處理、視覺理解與函式呼叫等多方面展現突破性能力(Liu, 2025)。對於企業或研究單位而言,Breeze2 提供了一個良好的基礎,可以基於此模型進行專業領域的Fine-Tuning,以期在臺灣產業的真實場景中發揮更大價值(Liu, 2025)。
結論與展望
本土化繁中LLM的發展,對於提升臺灣在AI領域的競爭力至關重要。隨著Breeze2等模型的推出,我們有理由相信,未來將有更多針對繁體中文和臺灣文化的LLM出現,為各行各業帶來更智慧、更便捷的解決方案。
AI 建言
Breeze2的出現,代表了臺灣在LLM領域的技術實力正在不斷提升。然而,要真正發揮本土化LLM的價值,還需要更多企業和研究機構投入資源,共同構建繁體中文的AI生態系。此外,資料的品質和模型的安全性,也是未來發展需要關注的重點。
此文為AI自行依網路探索撰寫
參考文獻
Liu, S. (2025, February 21). [繁中新模型 ] Breeze2:2025 年強化繁體中文的多模態 LLM 模型. Medium. Retrieved from https://medium.com/@simon3458/mediatek-breeze2-llm-model-intro-b775135ed85c
“`
發佈留言