青青草在在观免费1_草草在线视频_国产女人高潮毛片_国产麻豆剧果冻传媒仙踪林老_又爽又色又舒服A片免费_福利导航大全_日韩亚洲欧美中文高清在线_红果免费剧场短剧大全剧名_刺激一区仑乱_免费黄色视屏网站_夫妻之间在线观看_毛片无码一区二区三区A片视频_麻豆免费观看高清完整视频在线_开心五月四房播播_少妇荡乳情欲办公室A片视频网站_麻豆精产国品一二三产区_无码一卡二卡三卡四卡视频版_搞逼综合网_好男人好社区好资源在线_在线观看快乐大本营

  • 虎科技 - 領先的互聯網科技媒體

阿里通義千問Qwen2.5-1M模型開源,長上下文處理能力大幅提升!

   時間:2025-01-27 07:52 來源:ITBEAR作者:趙云飛

阿里通義千問于近日正式宣布,開源了其最新的Qwen2.5-1M模型及其配套的推理框架。這一舉措標志著通義千問在人工智能領域邁出了重要一步。

據悉,通義千問此次發布的開源模型包括Qwen2.5-7B-Instruct-1M和Qwen2.5-14B-Instruct-1M兩個版本。尤為引人注目的是,這兩個版本首次將Qwen模型的上下文長度擴展到了1M(即100萬標記),這在業界尚屬首次。

為了幫助開發者更好地部署和應用這些模型,Qwen團隊還開源了基于vLLM的推理框架。該框架集成了稀疏注意力方法,使得在處理長達1M標記的輸入時,推理速度有了顯著提升,達到了3倍至7倍的增長。

在長上下文任務方面,Qwen2.5-1M系列模型展現出了強大的能力。在一項名為“大海撈針”的任務中,這些模型能夠準確地從1M長度的文檔中檢索出隱藏信息。盡管7B版本的模型在極少數情況下出現了錯誤,但整體上,其表現仍然令人矚目。

為了全面評估Qwen2.5-1M系列模型在長上下文任務中的表現,研究團隊還選擇了RULER、LV-eval和LongbenchChat等多個測試集進行測試。測試結果顯示,這些模型在大多數任務中都顯著優于之前的128K版本,特別是在處理超過64K長度的任務時,其優勢更加明顯。

Qwen2.5-14B-Instruct-1M模型不僅在性能上擊敗了Qwen2.5-Turbo,還在多個數據集上穩定超越了GPT-4o-mini。這一結果無疑為長上下文任務提供了更多開源模型的選擇。

除了長上下文任務外,Qwen2.5-1M系列模型在短序列任務上的表現同樣出色。測試結果顯示,Qwen2.5-7B-Instruct-1M和Qwen2.5-14B-Instruct-1M在短文本任務上的表現與其128K版本相當,這意味著增加長序列處理能力并沒有犧牲其基本能力。

與GPT-4o-mini相比,Qwen2.5-14B-Instruct-1M和Qwen2.5-Turbo在短文本任務上實現了相近的性能,但它們的上下文長度卻是GPT-4o-mini的八倍。這一結果進一步證明了Qwen2.5-1M系列模型在短序列任務上的強大實力。

 
 
更多>同類內容
推薦圖文
推薦內容
點擊排行
 
智快科技微信賬號
ITBear微信賬號

微信掃一掃
加微信拉群
電動汽車群
科技數碼群

主站蜘蛛池模板: 文化| 通渭县| 犍为县| 南平市| 基隆市| 怀宁县| 贵州省| 黎城县| 瑞昌市| 青川县| 轮台县| 黎城县| 绥化市| 汝州市| 崇左市| 乌鲁木齐县| 崇义县| 县级市| 彰化县| 武清区| 晋城| 北宁市| 徐州市| 兖州市| 宜城市| 简阳市| 永川市| 蓬安县| 都匀市| 九龙坡区| 从江县| 阆中市| 隆安县| 随州市| 商城县| 闽侯县| 南通市| 望都县| 洛浦县| 合川市| 上蔡县|