幻方量化旗下模型DeepSeek上線V3版本
2024-12-27 08:48
12月26日,幻方量化全新系列模型DeepSeek-V3首個版本上線并同步開源,API服務已同步更新,接口配置無需改動。當前版本的DeepSeek-V3暫不支持多模態輸入輸出。據介紹,DeepSeek-V3為自研MoE模型,671B參數,激活37B,在14.8Ttoken上進行了預訓練,其多項評測成績超越了Qwen2.5-72B和Llama-3.1-405B等其他開源模型,并在性能上和世界頂尖的閉源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲。
編輯/李雅本平臺發布/轉載的內容僅用于信息分享,不代表我司對外的任何意見、建議或保證,我們倡導尊重與保護知識產權,如發現本站文章存在版權問題,煩請將版權疑問、授權證明、版權證明、聯系方式等,發郵件至info@tonews.cn,我們將第一時間核實、處理。同時,歡迎各方媒體、機構轉載和引用,但要嚴格注明來源:今日商訊。