首頁  資訊  商機   下載  拆解   高校  招聘   雜志  會展  EETV  百科   問答  電路圖  工程師手冊   Datasheet  100例   活動中心  E周刊閱讀   樣片申請
EEPW首頁 >> 主題列表 >> deepseek-v3

國產(chǎn)大模型 DeepSeek-V3 開源:6710 億參數(shù)自研 MoE,性能和 GPT-4o 不分伯仲

  • 12 月 27 日消息,“深度求索”官方公眾號昨日(12 月 26 日)發(fā)布博文,宣布上線并同步開源 DeepSeek-V3 模型,用戶可以登錄官網(wǎng) chat.deepseek.com,與最新版 V3 模型對話。援引博文介紹,DeepSeek-V3 是一個 6710 億參數(shù)的專家混合(MoE,使用多個專家網(wǎng)絡將問題空間劃分為同質(zhì)區(qū)域)模型,激活參數(shù) 370 億,在 14.8 萬億 token 上進行了預訓練。多項評測成績超越 Qwen2.5-72B 和 Llama-3.1-405B 等開源模型,
  • 關鍵字: DeepSeek-V3  AI  大語言模型  人工智能  
共1條 1/1 1

deepseek-v3介紹

您好,目前還沒有人創(chuàng)建詞條deepseek-v3!
歡迎您創(chuàng)建該詞條,闡述對deepseek-v3的理解,并與今后在此搜索deepseek-v3的朋友們分享。    創(chuàng)建詞條

熱門主題

樹莓派    linux   
關于我們 - 廣告服務 - 企業(yè)會員服務 - 網(wǎng)站地圖 - 聯(lián)系我們 - 征稿 - 友情鏈接 - 手機EEPW
Copyright ?2000-2015 ELECTRONIC ENGINEERING & PRODUCT WORLD. All rights reserved.
《電子產(chǎn)品世界》雜志社 版權(quán)所有 北京東曉國際技術(shù)信息咨詢有限公司
備案 京ICP備12027778號-2 北京市公安局備案:1101082052    京公網(wǎng)安備11010802012473