國科會發表具「台灣味」AI 模型 TAIDE-LX-7B，可生成繁體中文文本

國科會自 2023 年初開始推動可信任生成式 AI 發展先期計畫（Trustworthy AI Dialogue Engine，TAIDE），而在 15 日宣布釋出 TAIDE-LX-7B 模型。TAIDE-LX-7B 是一款結合臺灣文化的大型語言模型，將能更進一步協助我國政府在生成式 AI 模型發展路上，提供更多元與多樣化的服務，幫助產學研快速導入生成式 AI。

TAIDE-LX-7B 模型具「臺灣特色」與「可信任性」

TAIDE-LX-7B 模型與當今常見的其他 LLM 不同的地方在於，TAIDE-LX-7B 具有「繁體中文」的文本生成能力，在 Meta Llama-2-7B 的基礎上，透過額外擴充繁體中文字元、字詞，使得生成的文本更加流暢、精準，並且更具有「臺灣特色」。

為確保模型的「可信任性」，在訓練 TAIDE-LX-7B 模型所使用的文本資料，皆是以合法取得授權的文本數據進行訓練。而透過「可信任性」的文本協助 TAIDE-LX-7B 模型加強臺灣文化、用語與國情等知識，從而產生豐富多樣的文本內容。另外還加強訓練 5 大功能，包括自動摘要、寫信、寫文章、中翻英、英翻中等，並開發出多輪問答的對話能力，讓模型可以透過已生成的文本內容，接續使用者的指令，產出更符合需求的文本。

可在 Huggingface 及 Github 上下載使用

藉由 TAIDE-LX-7B 模型的公開釋出，可望於近期看到 TAIDE 語言模型在公部門或民間機構的各類應用（包含商業應用），有效擴散整個語言模型的發展。此外，現在也可以到 Huggingface 與 Github 上下載TAIDE-LX-7B ，就可開始使用並體驗這個具有臺灣特色的大型語言模型。

想要更了解 TAIDE-LX-7B 模型的發展目標與歷程，可以到 TAIDE 官方網站中查看。

資料來源：國科會、TAIDE

想看小編精選的3C科技情報＆實用評測文，快來加入《T客邦》LINE@