2024.04.16 08:30

國科會發表具「台灣味」AI 模型 TAIDE-LX-7B,可生成繁體中文文本

ADVERTISEMENT

國科會自 2023 年初開始推動可信任生成式 AI 發展先期計畫(Trustworthy AI Dialogue Engine,TAIDE),而在 15 日宣布釋出 TAIDE-LX-7B 模型。TAIDE-LX-7B 是一款結合臺灣文化的大型語言模型,將能更進一步協助我國政府在生成式 AI 模型發展路上,提供更多元與多樣化的服務,幫助產學研快速導入生成式 AI。

TAIDE-LX-7B 模型具「臺灣特色」與「可信任性」

TAIDE-LX-7B 模型與當今常見的其他 LLM 不同的地方在於,TAIDE-LX-7B 具有「繁體中文」的文本生成能力,在 Meta Llama-2-7B 的基礎上,透過額外擴充繁體中文字元、字詞,使得生成的文本更加流暢、精準,並且更具有「臺灣特色」。

為確保模型的「可信任性」,在訓練 TAIDE-LX-7B 模型所使用的文本資料,皆是以合法取得授權的文本數據進行訓練。而透過「可信任性」的文本協助 TAIDE-LX-7B 模型加強臺灣文化、用語與國情等知識,從而產生豐富多樣的文本內容。另外還加強訓練 5 大功能,包括自動摘要、寫信、寫文章、中翻英、英翻中等,並開發出多輪問答的對話能力,讓模型可以透過已生成的文本內容,接續使用者的指令,產出更符合需求的文本。

ADVERTISEMENT

可在 Huggingface 及 Github 上下載使用

藉由 TAIDE-LX-7B 模型的公開釋出,可望於近期看到 TAIDE 語言模型在公部門或民間機構的各類應用(包含商業應用),有效擴散整個語言模型的發展。此外,現在也可以到 HuggingfaceGithub 上下載TAIDE-LX-7B ,就可開始使用並體驗這個具有臺灣特色的大型語言模型。

想要更了解 TAIDE-LX-7B 模型的發展目標與歷程,可以到 TAIDE 官方網站中查看。

資料來源:國科會TAIDE

ADVERTISEMENT

ADVERTISEMENT