青青草在在观免费1_草草在线视频_国产女人高潮毛片_国产麻豆剧果冻传媒仙踪林老_又爽又色又舒服A片免费_福利导航大全_日韩亚洲欧美中文高清在线_红果免费剧场短剧大全剧名_刺激一区仑乱_免费黄色视屏网站_夫妻之间在线观看_毛片无码一区二区三区A片视频_麻豆免费观看高清完整视频在线_开心五月四房播播_少妇荡乳情欲办公室A片视频网站_麻豆精产国品一二三产区_无码一卡二卡三卡四卡视频版_搞逼综合网_好男人好社区好资源在线_在线观看快乐大本营

  • 虎科技 - 領先的互聯(lián)網(wǎng)科技媒體

小米開源MiMo大模型,7B參數(shù)挑戰(zhàn)AI推理極限,能否再創(chuàng)佳績?

   時間:2025-04-30 21:35 來源:ITBEAR作者:沈如風

小米大模型團隊在“Xiaomi MiMo”公眾號上宣布了一項重大進展:4月30日,他們正式開源了首個專為推理設計的大模型——Xiaomi MiMo。這一舉措標志著小米在AI領域邁出了堅實的一步,旨在通過聯(lián)動預訓練與后訓練,全面提升模型的推理能力。

MiMo是小米大模型Core團隊這一新興力量的初步探索成果。該團隊致力于推動AI技術的創(chuàng)新與應用,而MiMo正是他們交出的第一份答卷。

在公開測評中,MiMo的表現(xiàn)令人矚目。在數(shù)學推理(AIME 24-25)和代碼競賽(LiveCodeBench v5)兩大領域,MiMo僅憑7B的參數(shù)規(guī)模,便超越了OpenAI的閉源推理模型o1-mini以及阿里更大規(guī)模的開源推理模型QwQ-32B-Preview。這一成績無疑是對小米大模型團隊實力的有力證明。

小米官方透露,MiMo推理能力的提升得益于預訓練和后訓練階段中數(shù)據(jù)與算法等多層面的創(chuàng)新。在預訓練階段,團隊注重讓模型接觸更多推理模式,以拓寬其視野。在數(shù)據(jù)層面,他們深入挖掘富含推理元素的語料,并合成了約200B tokens的推理數(shù)據(jù),為模型提供了豐富的訓練素材。訓練過程則分為三個階段,逐步提升難度,總共訓練了25T tokens,確保了模型的扎實基礎。

在后訓練階段,小米團隊引入了高效穩(wěn)定的強化學習算法和框架。他們提出了Test Difficulty Driven Reward策略,以緩解困難算法問題中的獎勵稀疏問題,并引入了Easy Data Re-Sampling策略,以穩(wěn)定強化學習訓練過程。他們還設計了Seamless Rollout系統(tǒng),使得強化學習訓練加速2.29倍,驗證加速1.96倍,大大提高了訓練效率。

對于廣大開發(fā)者和技術愛好者而言,這無疑是一個振奮人心的消息。小米開源MiMo大模型,不僅為他們提供了一個強大的推理工具,更為他們探索AI技術的無限可能提供了寶貴的資源。目前,MiMo大模型已可在Hugging Face平臺上獲取,技術報告也已在GitHub上公開,供感興趣的人士深入研究和應用。

在小米大模型團隊的持續(xù)努力下,我們有理由相信,未來將有更多創(chuàng)新性的AI技術和產品涌現(xiàn),為人們的生活和工作帶來更多便利和驚喜。讓我們共同期待小米在AI領域的更多精彩表現(xiàn)吧!

 
 
更多>同類內容
推薦圖文
推薦內容
點擊排行
 
智快科技微信賬號
ITBear微信賬號

微信掃一掃
加微信拉群
電動汽車群
科技數(shù)碼群

主站蜘蛛池模板: 卢氏县| 郑州市| 长春市| 河津市| 化州市| 镇原县| 鄂伦春自治旗| 陇川县| 丹江口市| 斗六市| 南京市| 虞城县| 昌都县| 石嘴山市| 和龙市| 三明市| 邹平县| 清镇市| 呼伦贝尔市| 墨脱县| 玛沁县| 新营市| 永宁县| 阿合奇县| 科技| 搜索| 正蓝旗| 铁岭县| 哈尔滨市| 陈巴尔虎旗| 扶余县| 北辰区| 伊通| 永登县| 马龙县| 南宁市| 浠水县| 南靖县| 吕梁市| 静宁县| 思南县|