摘要:中國新推出的人工智能應用程序DeepSeek以驚人的速度震撼了科技行業、市場以及美國在人工智能領域的優越感。
最近DeepSeek橫空出世,給了全球科技界“億點點”震撼。短短幾日,DeepSeek應用就超越ChatGPT,登頂蘋果美國地區應用商店免費APP下載排行榜。應用上線20天,日活已迅速突破2000萬。
DeepSeek出自深度求索公司。其成立于2023年,由知名量化資管巨頭幻方量化創立,專注研究世界領先的通用人工智能底層模型與技術。
2024年1月5日,DeepSeek LLM發布,這是深度求索的第一個大模型。2024年12月26日,DeepSeek正式上線全新系列模型DeepSeek-V3首個版本并同步開源。
擁有驚人的6710億參數、14.8萬億高質量token的DeepSeek-V3,不僅在推理速度上大幅提升,更以557.6萬美元的訓練成本和280萬個GPU小時的計算需求,成功實現了與現有頂尖模型的競爭。在目前大模型主流榜單中,DeepSeek-V3 在開源模型中位列榜首,與世界上最先進的閉源模型不分伯仲。
而真正讓 DeepSeek在全球嶄露頭角的是,今年1月20日發布的開源大模型DeepSeek-R1。R1在數學、代碼、自然語言推理等任務上,比肩OpenAI o1正式版,并采用MIT許可協議,支持免費商用、任意修改和衍生開發等。這不僅降低了企業和開發者的使用成本,還大大提高了AI技術的普及度。
此外,在商業化落地方面,DeepSeek-R1展現出極具競爭力的成本優勢。其API服務采用差異化定價策略:輸入tokens每百萬收費1元(緩存命中)或4元(緩存未命中),輸出tokens每百萬僅需16元,顯著低于OpenAI o1每百萬輸入tokens 15美元及輸出tokens 60美元的水平,極大降低了AI技術的使用門檻。
憑借高性能、低成本、開放性三大優勢,國產開源大模型DeepSeek迅速破圈,吸引了海內外巨頭紛紛接入。
1月31日,英偉達、亞馬遜和微軟三家美國科技巨頭在同一天宣布接入先進大語言模型DeepSeek-R1。
2月,華為云、京東云、聯通云、天翼云等國內主流云平臺也爭先上線R1大模型。目前京東云已正式上線DeepSeek-R1和DeepSeek-V3模型,支持公有云在線部署、專混私有化實例部署兩種模式,供用戶按需部署,快速調用。
在芯片領域,國內GPU廠商加速與DeepSeek模型對接并完成適配。2月5日,華為官方表示,DeepSeek系列新模型正式上線昇騰社區。
DeepSeek選擇開源,為全球人工智能領域提供了高性能、低成本的模型范例。隨著越來越多的廠商接入,圍繞DeepSeek的產業生態正在形成,云平臺提供計算資源和模型部署服務,芯片廠商提供算力支持,應用廠商拓展應用場景,實現相互協作相互促進。
英國《衛報》網站日前刊文指出,中國人工智能(AI)企業深度求索(DeepSeek)打破了美國對AI的話語權壟斷。BBC則報道稱,中國新推出的人工智能應用程序DeepSeek以驚人的速度震撼了科技行業、市場以及美國在人工智能領域的優越感。
目前DeepSeek正在全力加快AI智能生態的發展和豐富,加快從工具到生態的躍進。未來,隨著技術的不斷迭代和產業生態的日益完善,DeepSeek有望在全球AI領域發揮更加重要的作用,引領人工智能技術的創新與應用。
編輯/劉曉茹