本文重點:
- 百度推出新一代 AI 基礎模型 ERNIE 4.5 與深度推理模型 ERNIE X1,直接挑戰 GPT-4.5 與 DeepSeek R1。
- ERNIE 4.5 強調多模態理解能力,聲稱在多項基準測試中超越 GPT-4.5,且價格僅為其 1%。
- ERNIE X1 專注於深度推理與工具使用,性能直逼 DeepSeek R1,價格卻更具競爭力。
- 百度更宣布將開源 ERNIE 4.5 系列模型,展現其以技術實力與開放策略搶佔市場的企圖心。
- 低價策略與開源計畫能否成為百度 ERNIE 模型在 AI 市場突圍的關鍵?值得深入探討。
近年來,人工智慧 (AI) 領域發展日新月異,各家科技巨頭紛紛投入大量資源,力求在 AI 模型研發上取得領先。其中,中國科技巨擘百度 (Baidu) 近期推出最新 AI 基礎模型 ERNIE 4.5 與 ERNIE X1,再次引發業界高度關注。這兩款新模型不僅在技術性能上有所突破,更以極具競爭力的價格策略和開源計畫,向市場投下震撼彈。本文將深入剖析百度 ERNIE 4.5 與 X1 模型的技術特點、應用潛力,並對比其與 GPT-4.5、DeepSeek R1 等領先模型的差異,同時探討百度在 AI 市場的戰略佈局,及其低價與開源策略可能對產業帶來的影響。
ERNIE 4.5:多模態能力再進化,劍指 GPT-4.5
ERNIE 4.5 被百度定位為「新一代原生多模態基礎模型」,其最大亮點在於多模態協同優化能力。這意味著 ERNIE 4.5 不僅能理解文字,更能有效整合圖像、音訊、影片等多種不同形式的內容。相較於前代模型,ERNIE 4.5 在語言理解、生成、推理和記憶能力上均有顯著提升,同時也強化了「抗拒模型幻覺」、邏輯推理和程式碼編寫能力1。
更令人矚目的是,ERNIE 4.5 展現了對複雜內容的理解力,甚至能掌握網路迷因和諷刺漫畫等更具情境脈絡的內容。百度更宣稱,ERNIE 4.5 在多項基準測試中超越了 GPT-4.5,並具備更親民的價格,僅為 GPT-4.5 的 1%2。
ERNIE 4.5 的技術突破,歸功於多項創新技術:
- FlashMask 動態注意力遮罩 (Dynamic Attention Masking): 提升模型處理多模態資訊的效率與準確性。
- 異構多模態混合專家模型 (Heterogeneous Multimodal Mixture-of-Experts): 強化模型在不同模態間的協同運作能力。
- 時空表徵壓縮 (Spatiotemporal Representation Compression): 優化模型對時序和空間資訊的處理。
- 知識中心訓練數據構建 (Knowledge-Centric Training Data Construction): 提升模型的知識理解與應用能力。
- 自我回饋增強後訓練 (Self-Feedback Enhanced Post-Training): 強化模型的自我修正與優化能力。
ERNIE X1:深度推理與工具使用,對標 DeepSeek R1
ERNIE X1 則是百度推出的全新深度思考推理模型,專注於強化模型的理解、規劃、反思和進化能力。百度將 ERNIE X1 定位為「首個具備工具使用的多模態深度思考推理模型」,使其在中文知識問答、文學創作和複雜計算等領域表現出色3。
ERNIE X1 的「工具使用」能力,使其能進一步拓展應用場景,例如:
- 進階搜尋 (Advanced Search): 更精準地檢索網路資訊,獲取更全面的知識。
- 文件問答 (Document Q&A): 快速理解文件內容,並解答相關問題。
- 圖像理解 (Image Understanding): 深入分析圖像內容,提取有價值的資訊。
- AI 圖像生成 (AI Image Generation): 根據使用者需求,生成高品質的圖像。
- 網頁閱讀 (Webpage Reading): 自動解析網頁內容,提取關鍵資訊。
百度聲稱,ERNIE X1 的性能與 DeepSeek R1 相當,但在價格上更具優勢,僅為 DeepSeek R1 的一半4。
ERNIE X1 的強大能力,得益於以下技術支援:
- 漸進式強化學習方法 (Progressive Reinforcement Learning Method): 提升模型在複雜任務中的決策能力。
- 端到端訓練方法 (End-to-End Training Approach): 整合思考鏈和行動鏈,提升模型的推理效率。
- 統一多面向獎勵系統 (Unified Multi-Faceted Reward System): 更全面地評估模型表現,引導模型優化。
極具競爭力的價格策略:搶佔市場的關鍵?
除了技術性能提升,百度 ERNIE 4.5 和 X1 模型最引人注目的,莫過於其極具侵略性的定價策略。相較於 GPT-4.5 和 DeepSeek R1,百度在價格上提供了顯著優勢。ERNIE 4.5 的價格僅為 GPT-4.5 的 1%,而 ERNIE X1 的價格也僅為 DeepSeek R1 的一半5。
此低價策略顯示,百度正試圖通過成本效益來快速擴大市場份額,尤其是在價格敏感的企業用戶和開發者社群中。對於企業用戶和開發者而言,ERNIE 4.5 可通過百度 AI 雲的千帆平台 API 進行訪問,而 ERNIE X1 也將很快在同一平台上线。
開源 ERNIE 4.5:加速普及與生態建立
更值得關注的是,百度宣布將於 6 月 30 日開源 ERNIE 4.5 系列模型。此舉顯示百度有意藉由社群力量,加速模型普及和生態系統的建立6。開源策略不僅能降低開發者使用 AI 模型的門檻,更能吸引更多開發者參與模型的優化與應用創新,進一步擴大 ERNIE 模型的影響力。
CoLai觀點:
百度 ERNIE 4.5 和 X1 模型的核心競爭力,不僅僅在於技術性能的提升,更在於其「低價」與「開源」的組合策略。這個定價策略不僅直接挑戰了市場領先者,更可能對整個 AI 模型市場的競爭格局帶來深遠影響,正如先前的DeepSeek一樣。
然而,AI 模型的競爭不僅僅是技術和價格的比拚,更涉及生態系統、應用場景和使用者體驗等多個面向。百度 ERNIE 模型能否在市場上取得成功,仍有待時間驗證。但可以肯定的是,百度此次的積極佈局,將為 AI 市場帶來更多可能性,也為使用者提供更多元的選擇。