夸克AI志願報告火了!上線近1月生成1000萬份,揭秘背後深度研究能力

揭秘夸克“志願報告”Agent背後技術棧。
作者 |  陳駿達
編輯 |  漠影
2025年高考成績已陸續出爐,全國各地的考生都面臨一個同樣的問題——填志願。除了自行查閱相關資訊,或是諮詢專家之外,還有數千萬考生和家長,選擇了向AI求助。
長期提供高考資訊服務的夸克今年有一個新能力爆了。截至6月30日,夸克已累計生成超過1000萬份AI志願報告,為考生和家長提供考生情況分析、填報策略設計、志願表解讀、風險提示等覆蓋全面的資訊,輔助志願填報。
該報告由夸克今年新推出的“志願報告”Agent打造,底層由夸克高考志願大模型與高考知識庫提供支援,並採用了“任務規劃—執行—檢查—反思”的深度研究邏輯。
這一Agent能根據使用者提供的基本資訊,規劃思考路徑,調用搜索工具進行資訊收集,並在執行過程中動態最佳化志願方案,甚至會主動反思擴充套件推薦範圍。
“志願報告”Agent展現出接近人類專家的決策思維和動態策略調整能力,這是傳統工具難以實現的。作為夸克深度研究技術在垂類場景中的代表應用,“志願報告”Agent在經歷超過1000萬份報告的驗證之後,成為國內最大規模的深度研究應用
夸克的通用深度研究功能,實際已於5月在夸克首頁正式上線。透過拆解志願報告的打造過程,我們能夠窺得夸克深度研究的整體技術思路與發展方向。
01.
5分鐘生成完整報告
AI也能真正像專家一樣思考
“志願報告”是今年夸克針對志願填報推出的核心功能之一,也是國內唯一可以生成完整志願報告的Agent。在考生提交省份、成績、興趣偏好等資訊後,“志願報告”Agent能在5-10分鐘內交付一份詳實的報告。
這份報告能根據考生的資訊,整理出清晰的填報策略,既能考慮到分段、選科組合等硬性指標,也能理解考生的專業傾向、職業規劃、地域偏好等主觀因素。
“志願報告”Agent不僅會考慮錄取率,還會綜合考量地域佈局、城市發展機會、考生職業發展路徑等因素,給出的方案全面,且具有側重點,能對重點志願進行詳盡的分析。
在執行過程中,Agent透過多輪“工具呼叫+反思調整”的機制,動態最佳化志願方案。例如,當考生表達“傾向留在省內(廣州、深圳優先)、不考慮偏遠地區”時,模型會自動生成搜尋指令:優先推薦廣州、深圳的高校,其次考慮廣東省內其他城市院校,排除偏遠地區選項。
若優質選項受限,Agent還能主動反思擴充套件搜尋範圍,如增加廣東周邊發達城市,或在高層次高校(如985)上適度放開地域限制,為考生爭取衝一衝的機會。
針對一些較為複雜、甚至自相矛盾的需求,“志願報告”Agent會幫助使用者進一步澄清需求。例如,面對“數學成績差,但想報考計算機”這類常見衝突,系統會提示使用者這一選擇可能存在的能力匹配問題。
在高考志願填報這個高決策風險、強個性化、資訊複雜且動態變化的特殊場景中,AI系統需要實現真正可靠的決策支援。下面,我們就將深入解析夸克“志願報告”Agent背後技術棧的核心架構與創新。
02.
海量可信資料+人工挑刺
揭秘“志願報告”Agent背後技術棧
在志願填報這一垂直場景,準確的資料是Agent做出正確決策的重要前提。
夸克高考志願大模型的知識庫對高考相關權威站點實現近100%覆蓋,共收集了8000多個站點的幾十億個網頁,涵蓋全國2900多所高校、近1600個本科專業,系統整合了院校分數線、專業設定、課程體系等核心教學資訊。
這一知識庫不僅收集H5網頁資料,還投入大量人力收集非H5網頁資料(如學校官網的招生資訊和機構資料),以及線下專業資料,確保小眾或非知名站點的權威資訊也能被收錄,從而保證了資料的全面性和權威性。
夸克高考知識庫還投入海量資源對每個省份的高考政策及權威解讀進行梳理、即時更新。透過OCR提取、多源交叉比對與人工抽檢等多重機制,實現高可信度的資料引入與結構化治理,確保模型所依賴的資料具備權威性和可驗證性。
此外考慮到志願填報與未來就業強相關,夸克高考知識庫還進一步將高校近三年的就業資料、考研資料、招錄體檢要求以及行業研究分析報告等延展資訊納入。
夸克的高考志願大模型則是“志願報告”Agent的大腦。
這一模型以通義千問為基座,充分利用了夸克過去7年來在高考資料方面的積累。夸克高考知識庫的資料一方面會應用到夸克高考志願大模型訓練的訓練過程中,作為訓練語料,由模型打磨、精煉相關知識;另一方面也可作為模型推理時的RAG內容供給。
這一模型還透過多階段的專項訓練,獲得了對複雜規則與使用者需求的理解與推理能力。在內部測評中,高考志願大模型的幻覺率相比通用模型大幅降低。
在指令微調階段,夸克高考志願大模型將數百名資深高考志願規劃師的溝通、決策過程進行結構化。圍繞他們與考生或家長的多輪真實對話,提取出完整分析路徑與語言風格。透過將上萬條真實專家“推理鏈”轉化為高質量監督資料,夸克高考志願大模型得以深度學習人類專家的分析過程。
後訓練階段,夸克高考志願大模型結合使用了RLVR(可驗證獎勵強化學習)和RLHF(人類反饋強化學習)。RLVR透過明確的事實(如院校程式碼、選科要求等)進行自動化檢驗,RLHF則透過人工反饋來進行評估。這兩種機制靈活地混合協同工作,以最佳化模型最終輸出的效果。
在RLHF階段,人工專家的評判尤為關鍵。模型生成的志願填報方案將被提交給多位高考志願專家進行評估。評估標準包括:專業建議是否準確易懂、排序邏輯是否貼合考生特徵、是否兼顧分數與興趣、是否充分提示風險並給出可行應對策略等。
透過“人類挑刺 + 模型修正”的方式,夸克高考志願大模型的輸出在專業度與匹配度上持續逼近專家的真實判斷標準。在交付報告後,模型還能根據使用者的後續指令進行迭代調整。
最終,夸克“志願報告”Agent透過構建全面、權威的高考知識庫,結合多階段專項訓練與強化學習機制,顯著提升了報告內容的精準度和個性化水平,為考生和家長提供了專業、可靠的智慧決策支援。
03.
真實世界千萬使用者驗證
夸克深度研究潛力盡顯
在夸克演算法負責人蔣冠軍看來,志願報告是夸克對深度研究技術的一次重要實踐。他觀察到,在很多專業領域,使用者的需求是高度複雜的,已經無法透過常規搜尋或簡單總結來滿足,從這次志願報告的應用情況來看,深度研究已經讓AI真正成為使用者身邊的“專家型助手”。
夸克的“志願報告”Agent能夠在志願填報領域真正做到專家級的表現,這與夸克整體的“深度研究”技術特點是緊密相關的。
其實,業內已有不少提供“深度研究”類功能的AI產品,雖然這些產品都能快速生成報告,但當細究具體內容時,精準性、專業度仍有待提高,尤其是在志願填報這樣的垂直領域。
由於行業、領域知識的匱乏,“深度研究”功能很可能會誤讀專業術語或遺漏關鍵細節。在知識快速更新的前沿領域,還可能因為使用過時資料導致分析偏差。
大部分深度研究產品的專業度也無法匹敵行業專家。AI雖然能整合、統計大量資料,但在分析上仍存在明顯短板,也缺乏經驗與思辨能力。
今年5月,夸克的深度研究功能正式上線,對於通用深度研究需求,夸克已面向全量使用者開啟邀測,使用者可在夸克首頁輸入端找到入口。
夸克深度研究可以實現結構化大綱生成、問題澄清路徑、AI工具協同和多模態結果輸出。資料顯示,在首批受邀使用者中,研究報告的下載和主動分享率超過40%,這也從側面反映出使用者的滿意度。
而今年高考季的“志願報告”Agent,則集中展現了上述深度研究能力在垂直場景的可擴充套件性。針對深度研究的潛在問題,夸克已經在“志願報告”Agent的打造過程中打磨出一套可行的方法論。
04.
結語:人人可用的夸克深度研究
用AI打破資訊壁壘
夸克此次將深度研究能力應用於志願填報場景,也具有深遠的社會意義。長期以來,優質高考志願填報服務作為一種付費產品,其覆蓋範圍始終侷限於部分考生群體。而夸克的介入,正在改變這一局面。
在日前舉辦的溝通會上,蔣冠軍分享了一組有趣的資料,截至目前,在夸克“志願報告”Agent生成的1000萬份志願報告中,有超過5成是三線及以下城市使用者。這也意味著,在傳統付費服務難以觸達或使用者無力承擔的地區,夸克有效滿足了這一剛性需求,為推動教育資訊公平提供了一種可行的解決方案。
回望夸克過去數年來的發展歷程,它一直在面向使用者獲取高質量資訊服務的需求,不斷擴充套件自己的能力。隨著“志願報告”Agent和其背後的“深度研究”能力廣泛可及,夸克再一次豐富了其資訊獲取、處理和生成方面的核心能力,讓人人都能享受到“深度研究”所帶來的技術紅利。
(本文系網易新聞•網易號特色內容激勵計劃簽約賬號【智東西】原創內容,未經賬號授權,禁止隨意轉載。)


相關文章