多模態的最新熱門文章

新聞

Google 推出首款 Gemini Embedding 2 多模態嵌入模型，AI 理解力再進化

ycr 發表於 2026年3月13日 13:30

Google 發布首款「原生多模態」嵌入模型 Gemini Embedding 2，旨在將不同類型的資料轉化為 AI 能理解的數值表示，讓電腦在處理文字、圖片、影音與文件時，具備更深層的關聯理解能力。

新聞

janus 發表於 2026年2月17日 13:30

中國新創 Z.ai 推出 GLM-OCR，這款多模態 OCR 模型以其驚人的輕量化設計，僅 0.9B 參數卻能精準解析複雜文件。

新聞

cnBeta 發表於 2025年11月24日 16:30

Google的 Gemini 3.0 Pro 強勢回歸，展現驚人實力，不僅在多項測試中領先，更預示著 Google 在 AI 領域的重大突破。Google 的 AI 技術發展令人期待。

新聞

janus 發表於 2025年9月10日 10:30

字節跳動推出 Seedream 4.0 多模態圖像創作模型，生成速度飆升十倍、支援4K畫質

新聞

cnBeta 發表於 2025年8月27日 14:30

想輕鬆體驗本地大型語言模型？Ollama 推出圖形介面，讓你像聊天一樣與 Llama 3 等模型互動。Ollama 讓複雜的 AI 模型操作變得簡單好用。

新聞

cnBeta 發表於 2025年8月18日 14:00

OpenAI的ChatGPT語音功能大升級！新增語音速度調整，讓使用者能自訂語速。全新語音模式更自然，根據使用者情緒調整語氣，享受更直覺的語音互動體驗。

新聞

KKJ 發表於 2025年7月10日 15:45

馬斯克發表 Grok 4，號稱全球最強 AI 模型、推理能力達博士等級

新聞

KKJ 發表於 2025年7月09日 09:30

OpenAI 確認今夏推出 GPT-5：「史上最強 AI 模型」將整合文字、語音、影像

新聞

KKJ 發表於 2025年5月25日 08:30

探索Google Gemma系列模型：離線AI、MedGemma健康應用、SignGemma手語翻譯，AI開發者新趨勢與挑戰。

新聞

janus 發表於 2025年3月26日 08:00

4o Image Generation 的多種應用情境，從模擬白板會議記錄、生成富含意義的文字圖像、創作趣味漫畫，乃至複雜的科學實驗圖解，GPT-4o 皆能輕鬆應對，展現其強大的多模態能力。

新聞

洪詩詩發表於 2025年3月11日 16:00

Google 近期推送 Pixel 更新，主要更新包含 Gemini Live 互動方式、Pixel Watch 也加入更多健康相關功能。

新聞

netizen 發表於 2024年10月03日 09:00

Nvidia 丟下震撼彈：全新 AI 模型開源、規模龐大，準備好與 GPT-4 匹敵