青青草在在观免费1_草草在线视频_国产女人高潮毛片_国产麻豆剧果冻传媒仙踪林老_又爽又色又舒服A片免费_福利导航大全_日韩亚洲欧美中文高清在线_红果免费剧场短剧大全剧名_刺激一区仑乱_免费黄色视屏网站_夫妻之间在线观看_毛片无码一区二区三区A片视频_麻豆免费观看高清完整视频在线_开心五月四房播播_少妇荡乳情欲办公室A片视频网站_麻豆精产国品一二三产区_无码一卡二卡三卡四卡视频版_搞逼综合网_好男人好社区好资源在线_在线观看快乐大本营

  • 虎科技 - 領(lǐng)先的互聯(lián)網(wǎng)科技媒體

阿里Qwen團(tuán)隊(duì)發(fā)布QwQ-32B:少量參數(shù)實(shí)現(xiàn)高性能,媲美DeepSeek R1

   時(shí)間:2025-03-06 07:55 來源:ITBEAR作者:沈如風(fēng)

阿里巴巴的Qwen團(tuán)隊(duì)近日震撼發(fā)布了其最新的科研成果——QwQ-32B大型語言模型,這一創(chuàng)新成果迅速引起了業(yè)界的廣泛關(guān)注。

QwQ-32B模型擁有驚人的320億參數(shù),但其性能卻足以與擁有6710億參數(shù)(激活部分為370億)的DeepSeek-R1模型相媲美。這一成就的實(shí)現(xiàn),得益于Qwen團(tuán)隊(duì)在強(qiáng)化學(xué)習(xí)領(lǐng)域的突破,使得QwQ-32B在參數(shù)數(shù)量僅為DeepSeek-R1約1/21的情況下,實(shí)現(xiàn)了性能的飛躍。

不僅如此,阿里巴巴還在QwQ-32B的推理模型中融入了與Agent相關(guān)的能力,這一創(chuàng)新使得該模型能夠在使用工具的同時(shí),進(jìn)行批判性思考,并根據(jù)環(huán)境的反饋靈活調(diào)整其推理過程。這一特性無疑大大增強(qiáng)了模型的實(shí)用性和智能化水平。

為了全面評(píng)估QwQ-32B的性能,阿里巴巴團(tuán)隊(duì)在一系列基準(zhǔn)測(cè)試中對(duì)其進(jìn)行了嚴(yán)格的測(cè)試,包括數(shù)學(xué)推理、編程能力以及通用能力等多個(gè)方面。結(jié)果顯示,在數(shù)學(xué)能力的AIME24評(píng)測(cè)集上,以及評(píng)估代碼能力的LiveCodeBench中,QwQ-32B的表現(xiàn)與DeepSeek-R1相當(dāng),遠(yuǎn)遠(yuǎn)超過了o1-mini以及相同尺寸的R1蒸餾模型。

在由meta首席科學(xué)家楊立昆領(lǐng)銜的“最難LLMs評(píng)測(cè)榜”LiveBench、谷歌提出的指令遵循能力IFeval評(píng)測(cè)集,以及加州大學(xué)伯克利分校等提出的評(píng)估準(zhǔn)確調(diào)用函數(shù)或工具的BFCL測(cè)試中,QwQ-32B均取得了超越DeepSeek-R1的優(yōu)異成績。這些測(cè)試結(jié)果無疑進(jìn)一步證明了QwQ-32B的強(qiáng)大性能和廣泛適用性。

QwQ-32B模型已經(jīng)在Hugging Face和ModelScope平臺(tái)上開源,廣大開發(fā)者可以通過這些平臺(tái)直接獲取并使用該模型。同時(shí),用戶還可以通過Qwen Chat直接體驗(yàn)QwQ-32B的強(qiáng)大功能,感受其帶來的智能化變革。

 
 
更多>同類內(nèi)容
推薦圖文
推薦內(nèi)容
點(diǎn)擊排行
 
智快科技微信賬號(hào)
ITBear微信賬號(hào)

微信掃一掃
加微信拉群
電動(dòng)汽車群
科技數(shù)碼群

主站蜘蛛池模板: 赤城县| 勐海县| 中卫市| 九寨沟县| 昌图县| 雷波县| 广平县| 宜黄县| 兴仁县| 海原县| 武安市| 拜泉县| 垦利县| 巫山县| 临夏县| 琼中| 辽阳县| 定远县| 十堰市| 龙川县| 弥勒县| 大理市| 疏勒县| 育儿| 张家川| 长子县| 清苑县| 娄烦县| 循化| 霍城县| 吉木萨尔县| 衢州市| 嘉荫县| 江源县| 秀山| 两当县| 海南省| 耒阳市| 井冈山市| 铜山县| 财经|