首頁 多模態 多模態 的最新熱門文章 新聞 字節跳動推出 Seedream 4.0 多模態圖像創作模型:對決Nano Banana、生成速度飆升十倍、支援4K畫質 janus 發表於 2025年9月10日 10:30 Plurk 字節跳動推出 Seedream 4.0 多模態圖像創作模型,生成速度飆升十倍、支援4K畫質 新聞 Ollama 推出桌機版應用程式:離線跑 AI 更簡單,Windows、macOS 用戶直接圖形介面操作 LLM cnBeta 發表於 2025年8月27日 14:30 Plurk 想輕鬆體驗本地大型語言模型?Ollama 推出圖形介面,讓你像聊天一樣與 Llama 3 等模型互動。Ollama 讓複雜的 AI 模型操作變得簡單好用。 新聞 ChatGPT 語音模式功能大進化!語速 0.5–2.0 倍任你調、還能記住指定語氣 cnBeta 發表於 2025年8月18日 14:00 Plurk OpenAI的ChatGPT語音功能大升級!新增語音速度調整,讓使用者能自訂語速。全新語音模式更自然,根據使用者情緒調整語氣,享受更直覺的語音互動體驗。 新聞 馬斯克發表 Grok 4,號稱全球最強 AI 模型、推理能力達博士等級 KKJ 發表於 2025年7月10日 15:45 Plurk 馬斯克發表 Grok 4,號稱全球最強 AI 模型、推理能力達博士等級 新聞 OpenAI 確認今夏推出 GPT-5:「史上最強多模態 AI 模型」將整合文字、語音、影像 KKJ 發表於 2025年7月09日 09:30 Plurk OpenAI 確認今夏推出 GPT-5:「史上最強 AI 模型」將整合文字、語音、影像 新聞 Google 的全新 Gemma 3n AI 模型,讓手機端就能執行多模態任務 KKJ 發表於 2025年5月25日 08:30 Plurk 探索Google Gemma系列模型:離線AI、MedGemma健康應用、SignGemma手語翻譯,AI開發者新趨勢與挑戰。 新聞 OpenAI 推出 4o Image Generation 圖像生成功能,AI 繪圖更精準、擬真、未來免費用戶也能用 janus 發表於 2025年3月26日 08:00 Plurk 4o Image Generation 的多種應用情境,從模擬白板會議記錄、生成富含意義的文字圖像、創作趣味漫畫,乃至複雜的科學實驗圖解,GPT-4o 皆能輕鬆應對,展現其強大的多模態能力。 新聞 Pixel 三月功能更新:Gemini Live 操作更容易、Pixel Watch 加入更多健康功能 洪詩詩 發表於 2025年3月11日 16:00 Plurk Google 近期推送 Pixel 更新,主要更新包含 Gemini Live 互動方式、Pixel Watch 也加入更多健康相關功能。 新聞 超越 GPT-4?Nvidia 開源 720 億參數 AI 模型 NVLM-D-72B,圖像理解、文字能力全面升級! netizen 發表於 2024年10月03日 09:00 Plurk Nvidia 丟下震撼彈:全新 AI 模型開源、規模龐大,準備好與 GPT-4 匹敵 新聞 Meta發佈最強開源AI模型 Llama 3.2:視覺模型趕超GPT-4o mini,還有可單獨安裝在手機上的版本 cnBeta 發表於 2024年9月26日 11:12 Plurk Llama 3.2:視覺模型趕超GPT-4o mini,1B端側模型媲美Gemma 新聞 「大型語言模型」名不符實?專家籲正名,馬斯克也參戰! bigdatadigest 發表於 2024年9月17日 13:00 Plurk AI 專家卡帕斯認為「大型語言模型」(LLM)名稱不準確,應改為更通用的「自回歸序列轉換模型」。此觀點引發廣泛討論。 新聞 阿里雲推出全新視覺語言模型Qwen2-VL,可分析超過 20 分鐘長的影片,實現AI「類人視覺感知」 netizen 發表於 2024年9月01日 09:00 Plurk 中國電子商務巨頭阿里巴巴的雲端服務和儲存部門阿里雲宣布推出其最新先進的視覺語言模型 Qwen2-VL,旨在增強視覺理解、影片理解和多語言文本圖像處理。 上一頁1下一頁
新聞 字節跳動推出 Seedream 4.0 多模態圖像創作模型:對決Nano Banana、生成速度飆升十倍、支援4K畫質 janus 發表於 2025年9月10日 10:30 Plurk 字節跳動推出 Seedream 4.0 多模態圖像創作模型,生成速度飆升十倍、支援4K畫質
新聞 Ollama 推出桌機版應用程式:離線跑 AI 更簡單,Windows、macOS 用戶直接圖形介面操作 LLM cnBeta 發表於 2025年8月27日 14:30 Plurk 想輕鬆體驗本地大型語言模型?Ollama 推出圖形介面,讓你像聊天一樣與 Llama 3 等模型互動。Ollama 讓複雜的 AI 模型操作變得簡單好用。
新聞 ChatGPT 語音模式功能大進化!語速 0.5–2.0 倍任你調、還能記住指定語氣 cnBeta 發表於 2025年8月18日 14:00 Plurk OpenAI的ChatGPT語音功能大升級!新增語音速度調整,讓使用者能自訂語速。全新語音模式更自然,根據使用者情緒調整語氣,享受更直覺的語音互動體驗。
新聞 馬斯克發表 Grok 4,號稱全球最強 AI 模型、推理能力達博士等級 KKJ 發表於 2025年7月10日 15:45 Plurk 馬斯克發表 Grok 4,號稱全球最強 AI 模型、推理能力達博士等級
新聞 OpenAI 確認今夏推出 GPT-5:「史上最強多模態 AI 模型」將整合文字、語音、影像 KKJ 發表於 2025年7月09日 09:30 Plurk OpenAI 確認今夏推出 GPT-5:「史上最強 AI 模型」將整合文字、語音、影像
新聞 Google 的全新 Gemma 3n AI 模型,讓手機端就能執行多模態任務 KKJ 發表於 2025年5月25日 08:30 Plurk 探索Google Gemma系列模型:離線AI、MedGemma健康應用、SignGemma手語翻譯,AI開發者新趨勢與挑戰。
新聞 OpenAI 推出 4o Image Generation 圖像生成功能,AI 繪圖更精準、擬真、未來免費用戶也能用 janus 發表於 2025年3月26日 08:00 Plurk 4o Image Generation 的多種應用情境,從模擬白板會議記錄、生成富含意義的文字圖像、創作趣味漫畫,乃至複雜的科學實驗圖解,GPT-4o 皆能輕鬆應對,展現其強大的多模態能力。
新聞 Pixel 三月功能更新:Gemini Live 操作更容易、Pixel Watch 加入更多健康功能 洪詩詩 發表於 2025年3月11日 16:00 Plurk Google 近期推送 Pixel 更新,主要更新包含 Gemini Live 互動方式、Pixel Watch 也加入更多健康相關功能。
新聞 超越 GPT-4?Nvidia 開源 720 億參數 AI 模型 NVLM-D-72B,圖像理解、文字能力全面升級! netizen 發表於 2024年10月03日 09:00 Plurk Nvidia 丟下震撼彈:全新 AI 模型開源、規模龐大,準備好與 GPT-4 匹敵
新聞 Meta發佈最強開源AI模型 Llama 3.2:視覺模型趕超GPT-4o mini,還有可單獨安裝在手機上的版本 cnBeta 發表於 2024年9月26日 11:12 Plurk Llama 3.2:視覺模型趕超GPT-4o mini,1B端側模型媲美Gemma
新聞 「大型語言模型」名不符實?專家籲正名,馬斯克也參戰! bigdatadigest 發表於 2024年9月17日 13:00 Plurk AI 專家卡帕斯認為「大型語言模型」(LLM)名稱不準確,應改為更通用的「自回歸序列轉換模型」。此觀點引發廣泛討論。
新聞 阿里雲推出全新視覺語言模型Qwen2-VL,可分析超過 20 分鐘長的影片,實現AI「類人視覺感知」 netizen 發表於 2024年9月01日 09:00 Plurk 中國電子商務巨頭阿里巴巴的雲端服務和儲存部門阿里雲宣布推出其最新先進的視覺語言模型 Qwen2-VL,旨在增強視覺理解、影片理解和多語言文本圖像處理。