夸克生成千萬份志願報告背後:一個Agent應用“深度落地”的真實樣本

作者辛峰郵箱[email protected]
這個夏天,一個數據不僅在AI圈內引起了關注,更牽動了千萬中國家庭的心:不到一個月,超過1000萬份詳盡的高考志願報告,由一個具備深度研究能力的Agent免費生成。
這不是一次技術演示,而是一項直接關係到未來的高風險服務。提供這項服務的,是阿里的夸克。在一次內部技術溝通會上,夸克演算法負責人蔣冠軍將志願報告定義為“是夸克深度研究技術的一次重要實踐” 。
這引出了一個值得探討的問題,當許多AI應用還停留在看似萬能但可能不可靠的階段時,夸克是如何在一個零容錯的場景裡,實現大規模深度落地的?它的實踐,為我們提供了一個觀察AI如何從玩具走向工具再進化為智慧助手的真實樣本。
使用者具體是如何與這個Agent互動的呢?過程十分簡單,使用者輸入分數等基本資訊後,用日常說話的方式告訴Agent自己的想法,比如想去哪個城市、對什麼專業感興趣。Agent隨後會生成一份包含完整志願表的深度報告。使用者可以反覆修改想法,多次生成報告,夸克方面提到,有使用者甚至生成了一百多份報告來輔助決策。

1
Agent如何成為一個“靠譜”的決策顧問?
每年高考後,志願填報的複雜性都會被重新討論。近3000所高校、超過2000個專業,構成了一個巨大的資訊迷宮 。近幾年,隨著“張雪峰”等志願填報專家的走紅,也反映了市場的核心痛點,考生和家長缺的不僅是資訊,更是一個能幫忙做複雜決策的可信顧問,這也催生了一個魚龍混雜的志願填報服務行業。
AI能成為這個顧問嗎?蔣冠軍的看法很坦誠,“當前這個階段,AI肯定是替代不了考生自己的決策” 。那麼,夸克要做的,或者說AI現階段能做到的是什麼?
答案或許不是替代,而是成為一個靠譜的輔助決策系統。所謂的靠譜,體現在它如何處理現實世界中那些模糊、甚至矛盾的複雜需求上。
比如,當用戶的理想與現實衝突時。一個常見的需求是“想留在本省的好城市,但分數只夠得上外省的985院校” 。一個簡單的工具可能會陷入邏輯死迴圈,但夸克的Agent會嘗試像真人顧問一樣權衡,它可能會主動拓寬選項,為你展示“省外985”和“省內頂尖211”各自的利弊,將決策權交還給你 。
更有挑戰性的是當用戶的需求本身就自相矛盾。夸克高考演算法負責人唐亮提到了一個典型場景,“數學成績差,但想報考計算機” 。這背後是學生對專業要求的不瞭解。此時,一個負責任的Agent不應盲目執行指令,而是會觸發一個需求澄清流程,溫和地提示其中的風險,並引導使用者探索更適合的選項 。
處理複雜場景的能力讓AI從一個冰冷的執行機器,向一個能與人商量、值得參考的顧問角色邁進了一步。而要實現這一切,靠的不是單一的模型技巧,而是在後臺,一套笨重但紮實的系統工程。
1
“笨功夫”與“精細活”
“信任”是Agent在嚴肅場景落地的基石。夸克構建信任的方式,可以歸結為兩種,一種是下笨功夫,另一種是做精細活。
笨功夫下在了資料上。夸克做了幾件髒活累活,他們蒐集了8657個權威站點進行分級,將超過10萬份PDF、Word等非標內容數字化,並組織上百人團隊對關鍵資料進行人工校驗,以確保準確率達到“4個9”(99.99%)的水平。
這些工作聽起來沒有演算法那麼炫酷,但它們共同構成了一個高可信度的知識庫,是模型能做出正確判斷的前提。
而精細活則體現在模型的調校上,必須為其注入垂直場景的靈魂 。夸克為此設計的訓練正規化,層層遞進:整個過程始於SFT(監督微調),讓模型學習上萬條真實專家的推理邏輯,學會像專家那樣去分析問題、組織語言 。
在此基礎上,利用RLVR(可驗證獎勵強化學習),針對有標準答案的事實性問題進行自動化校驗,這就像給模型配備了一個24小時的事實核查員,大幅降低“幻覺” 。
而對於沒有標準答案的開放性問題(如專業前景),則透過RLHF(基於人類反饋的強化學習),引入大量真實專家對Agent生成的方案進行打分,讓模型的“品味”和“策略觀”向人類專家看齊。
正是這套笨功夫加精細活的組合,讓Agent的決策不僅基於機率,更基於經過治理的、可信的知識與經驗。

1
一次成功的Agent實踐,與它背後的七年
夸克志願報告的成功,是在一個垂直應用場景的勝利。但在更深的層面,它更像一次路演,展示了深度研究技術落地的一種可能性。
今天的AI行業,並不缺少聰明的產品。許多大模型應用能寫詩、繪畫、寫程式碼、做複雜的邏輯推理,但在單個具體任務上,卻往往缺乏穩定和可信賴的表現。使用者很難將一項嚴肅、高風險的決策工作完全託付給它們。
夸克的選擇似乎有些逆流而動。它沒有去盲目追求一個無所不能的通用助手,而是像一位手藝人,選中了高考志願這塊硬骨頭,並投入了長達七年的時間去打磨。其核心,是一種被夸克稱為“深度研究”的方法論。
所謂的深度並非僅指技術,更指一種能力。它體現在對場景的深刻理解上,團隊沒有把志願填報看作一個簡單的機率預測問題,而是將其視為一個資訊蒐集、自我認知、未來規劃高度交織的複雜決策系統。
它也意味著對資料的極致治理,團隊選擇了一條更艱難的路——投入上百人力去做資料的線下蒐集和人工校驗,以此來構建Agent可信度的地基。此種深度最終落實在對模型的精細對齊上,基於海量專家資料和使用者真實反饋,夸克團隊不斷對模型進行強化學習,讓它從一個機率機器逐漸成長為一個懂得權衡、善於溝通的決策夥伴。
“志願報告是我們對深度研究技術的一次重要實踐,”蔣冠軍的這句話很關鍵。高考場景,以其極高的複雜度和零容錯的要求,成為了這套深度研究方法論的最佳試煉場。
如今,這場高難度的路演結束了,夸克也已經推出了面向所有人的通用深度研究功能。這並非簡單的功能上新,而是將那套經過千萬次高壓測試後被驗證有效的方法論,開放給了更廣泛的使用者。它讓普通人處理複雜資訊、進行深度分析時,也能擁有一個專家級的Agent助手。

1
從解決一個真問題開始
在關於AI的討論中,我們聽過太多關於顛覆和革命的宏大敘事。但夸克的故事提供了一個更樸素的視角,AI的價值,或許始於腳踏實地地解決一個真實的、具體的問題。
它不追求成為無所不知的神,而是努力成為一個在特定領域靠譜的專家。它沒有因為技術的複雜而忽視最根本的使用者需求,也沒有因為商業回報的不確定性而放棄對資訊普惠的堅持。事實上,夸克已經連續7年為高考生和家長提供全免費、無廣告的高考資訊搜尋和志願填報服務。
這意味著夸克並非AI浪潮下的投機者,而是將技術落地為社會價值的長期主義者,也讓今年的Agent應用更像是一場厚積薄發。超過50%的使用者來自三線及以下城市 ,以及深入鄉村的公益行動,都讓這項技術多了一份溫度。
或許,未來真正能改變我們生活的AI,不是那個在雲端不斷重新整理效能分數的龐然大物,而是一系列像夸克志願報告這樣,專注、深入、並真正融入我們工作與生活場景的Agent助手。
夸克的高考故事,可能只是這個新篇章的開始。

點個愛心,再走


相關文章