在近日的一次技術創(chuàng)新中,夸克公司推出了專為高考志愿填報設計的高考志愿大模型,并配套上線了三大核心功能:“高考深度搜索”、“志愿報告”以及“智能選志愿”。這款大模型具備專家級的決策能力,旨在為每位考生提供既精準又個性化的志愿填報服務。
夸克此次推出的“志愿報告”功能,運行方式獨特,它以Agent形式運作,目前已經(jīng)開放試用。這一功能仿佛為每位考生配備了一位經(jīng)驗豐富的志愿填報專家,能夠基于考生的成績、興趣、家庭背景和地域偏好等因素,提供量身定制的規(guī)劃建議。通過一套“任務規(guī)劃—執(zhí)行—檢查—反思”的鏈式推理流程,夸克志愿報告會自動生成包含沖穩(wěn)保策略、志愿表以及院校專業(yè)推薦等內(nèi)容的全面報告。
夸克的“志愿報告”Agent首先會根據(jù)考生的具體情況制定個性化的任務規(guī)劃,如定位成績段、篩選專業(yè)方向、制定填報策略等。隨后,它會將這些任務轉化為指令,并基于高質(zhì)量的數(shù)據(jù)完成任務執(zhí)行。每輪執(zhí)行結果都會經(jīng)過模型的自動檢查,以確保不存在邏輯沖突、數(shù)據(jù)缺漏或排序異常等問題。通過不斷評估結果與需求的差異,模型能夠優(yōu)化后續(xù)策略,實現(xiàn)動態(tài)修正與智能迭代。
例如,當考生傾向于選擇省內(nèi)的985院校時,面對省內(nèi)985院校數(shù)量有限的情況,夸克高考志愿大模型會像專家一樣,嘗試推薦適合的外省985高校,以滿足考生的需求。
另一個備受矚目的功能是“高考深度搜索”。當用戶輸入如“江蘇物理組考生584分,性格內(nèi)向,想找穩(wěn)定工作”這類復雜查詢時,該功能便會被觸發(fā)。為了提升回答的準確性和專業(yè)性,夸克高考志愿大模型會將考生的真實需求進行精細化拆解,并為每一類需求定制對應的回答范式和要點,確保回復既具有針對性又足夠深入。
夸克高考志愿大模型的訓練機制同樣值得稱道。它以通義千問為基座,通過多階段、高復雜度的訓練范式,融合了自監(jiān)督語義建模、監(jiān)督式對齊調(diào)優(yōu)以及由專家判別價值引導的策略精化機制。在指令微調(diào)階段,夸克將數(shù)百名資深高考志愿規(guī)劃師的溝通、決策過程進行結構化處理,提取出完整分析路徑與語言風格,并將上萬條真實專家的“推理鏈”轉化為高質(zhì)量監(jiān)督數(shù)據(jù),供模型深度學習。
夸克高考志愿大模型還具備強大的復雜推理能力。它在處理復雜推理任務時,能夠生成中間可驗證結構,從而顯著降低幻覺率、增強跨模態(tài)演繹能力,并實現(xiàn)分布外泛化魯棒性,有效解決各種需要專業(yè)知識的復雜問題。為了進一步提升模型的決策能力,夸克還引入了一個基于人類偏好強化學習(RLHF)的精化策略層,構建了一個閉環(huán)優(yōu)化機制。該機制將“模擬填報→專家反饋→策略評分”引入到模型迭代過程中,通過不斷模擬和優(yōu)化,使模型的輸出更加接近專家的真實判斷標準。
夸克高考志愿大模型還搭載了一套國內(nèi)最大的實時更新、結構嚴謹?shù)母呖贾R庫。該知識庫對高考相關權威站點實現(xiàn)了近100%覆蓋,涵蓋了全國2900多所高校和近1600個本科專業(yè),系統(tǒng)整合了院校分數(shù)線、專業(yè)設置、課程體系等核心教學信息。夸克還投入大量資源對每個省份的高考政策及權威解讀進行梳理和實時更新,確保數(shù)據(jù)的權威性和可驗證性。
考慮到志愿填報與未來就業(yè)的緊密關聯(lián),夸克高考知識庫還進一步納入了高校畢業(yè)生就業(yè)相關信息、產(chǎn)業(yè)趨勢規(guī)劃以及就業(yè)報告等。這些豐富、準確的數(shù)據(jù)為模型在“沖—穩(wěn)—保”排序、就業(yè)前景評估等環(huán)節(jié)提供了有力支持。
夸克算法負責人蔣冠軍表示:“高考志愿填報是一個信息密集、決策復雜的場景。我們希望通過高考志愿大模型的專業(yè)優(yōu)勢,幫助每一個考生和家庭都能獲得全面、準確的參考信息,助力他們做出更加明智的選擇。”