華夏經(jīng)緯網(wǎng)8月23日訊:據(jù)香港“中通社”報(bào)道:中國(guó)人工智能(AI)公司深度求索(DeepSeek)21日宣布,其最新大語(yǔ)言模型DeepSeek-V3.1正式發(fā)布。
據(jù)DeepSeek介紹,新升級(jí)版本變化體現(xiàn)在三方面:混合推理架構(gòu)、更高的思考效率、更強(qiáng)的Agent(智能體)能力。通過(guò)“深度思考”按鈕切換,DeepSeek-V3.1實(shí)現(xiàn)一個(gè)模型同時(shí)支持兩種模式:面對(duì)簡(jiǎn)單問(wèn)題時(shí),能以“非思考模式”快速回答。處理復(fù)雜問(wèn)題時(shí),可切換到“思考模式”,給出更具深度和邏輯的解答。此外,DeepSeek-V3.1使用了UE8M0 FP8 Scale的參數(shù)精度。DeepSeek官方公眾號(hào)在其文章置頂留言里說(shuō),UE8M0 FP8是針對(duì)即將發(fā)布的下一代中國(guó)產(chǎn)芯片設(shè)計(jì)。
官方數(shù)據(jù)顯示,與今年5月發(fā)布的旗艦推理模型DeepSeek R1升級(jí)版本“R1-0528”相比,DeepSeek-V3.1在思考模式下效率大幅提升,能在更短時(shí)間給出答案,token(大模型文本處理的最小單位)消耗量可減少20%至50%,各項(xiàng)任務(wù)平均表現(xiàn)與R1-0528持平。
京公網(wǎng)安備 11010502045281號(hào)網(wǎng)站簡(jiǎn)介 / 廣告服務(wù) / 聯(lián)系我們
主辦:華夏經(jīng)緯信息科技有限公司 版權(quán)所有 華夏經(jīng)緯網(wǎng)
Copyright 2001-2024 By www.wxhzjy.cn