嘉賓|平野 天弘基金人工智慧部負責人
編輯|黃雯希
近年來,隨著國家對“科技金融”領域關注的不斷加深,天弘基金以其多年積累的技術開發能力和豐富的行業經驗,在大模型方面持續進行自主研發和創新。根據最新的行業資料分析,天弘基金的金融大資料模型在行業分析、問題解決深度以及金融資料時效性等關鍵指標上取得了顯著進展,已成功應用於投資研究和銷售策略中,展現出卓越的效果和領先的技術實力。
AI Agent 是人工智慧領域的一項重要技術,它能夠模擬人類的智慧行為,執行各種任務。然而,在實踐中,AI Agent 面臨著諸多挑戰。如何在複雜環境下進行決策,高效地處理資料,深入探索 AI Agent 的發展與實踐,成為了當前人工智慧領域的重要議題之一。
在日前舉辦的 ArchSummit 全球架構師峰會深圳站上,天弘基金演算法團隊負責人平野分享了其團隊在金融行業內開發的基於大模型的 AI Agent, 以及 AI Agent 的核心技術和在金融領域的實際應用案例。AI Agent 透過深度學習和自然語言處理技術,能夠理解和生成人類語言,進而實現與客戶的自然對話、提供金融諮詢、進行投資決策輔助等,為金融行業的創新發展注入新的動力。
8 月 16-17 日,FCon 全球金融科技大會將在上海舉辦。本屆大會由中國信通院鑄基計劃作為官方合作機構,將邀請國內外金融機構及金融科技公司專家分享其實踐經驗與深入洞察。AI Agent 智慧體作為焦點話題,屆時也將有多個議題分享,螞蟻集團投研支小助技術負責人紀韓將帶來《多智慧體協同正規化在金融產業中的應用實踐》,文因互聯董事長 / 創始人鮑捷博士將分享企業如何《精益地打造金融專家智慧體》……
大會更多演講議題火熱招募中,點選連結可檢視目前的專題安排並提交議題:
https://fcon.infoq.cn/2024/shanghai/
以下是平野老師分享全文(經 InfoQ 進行不改變原意的編輯整理)
大模型的出現經歷了從興奮,到質疑,再到理智對待的發展階段。
提到 AI Agent ,實際上它是基於大模型的 Agent 技術。大模型從 2022 年底開始備受關注,到現在越來越流行,競爭也越來越激烈。

在第一個階段,大模型的出現是非常令人興奮的, ChatGPT 在推出後的五天內就積累了 100 萬用戶,兩個月內達到 2 億使用者,打破了史上所有 APP 使用者增長速度。隨後,國內各大廠也開始進入這個領域,全力投入 AI,很多從事大模型的公司如雨後春筍一樣冒出來,全部捲入這個行業中來,那個時候經常聽到“all in AI”。
接著是質疑階段。媒體報道充斥著各種訊息,有的說在 AIGC 時代需要龐大的算力,有的說斯坦福推出的 Alpaca 模型只需 100 美金就能訓練出我們自己的大模型。這件事情也引發了大眾的爭議,質疑大模型經常會一本正經地胡說八道,也就是所謂的“幻覺”。另外,很多公司和研究機構投入大量的算力資源和人才資源,但真正落地的場景還在探索中,沒有找到非常好的新技術的應用場景。這時候也有人質疑,大模型的成本是否太高?相關人才是否難找?
而且隨著監管制度的不斷完善,對大模型的倫理和相關的安全性、合規性要求也越來越高。現在大模型的發展已經進入了一個理智的階段。根據天弘基金在全體員工的抽樣調查中,發現約 25.7% 的使用者已經基本上離不開大模型,這個資料還在不斷增長。未來大模型在各行各業的應用會越來越多,越來越普及。
要想在金融行業應用 AI Agent 首先要考慮三個問題:
第一個問題是資源和人才。作為一家金融公司,在開始做大模型時,沒有像一些科技大廠一樣擁有大量資源和人才。人才和資源的密度、總量都是有限的,需要選擇性地進行投入,要決定哪些專案要堅持做,哪些專案要放棄。例如,數字人在很多銷售領域的公司裡可能很有用,但對金融的業務幫助不大,所以我們捨棄了這類看似高大上的技術。
第二個問題是研發方式。金融公司要不要直接購買第三方廠商的模型進行使用?但很多金融領域的使用場景中運用第三方的大模型是行不通的。因此,天弘更多地是採用自主研發。
第三個問題是算力。金融行業是否要應用 AI Agent?金融公司往往擔心算力投入過大,像 ChatGPT 每個月的在算力上的開銷至少是千萬美金以上。金融公司是否需要上千張 GPU 卡才能將自己的 AI Agent 研發成功?但經過探索發現,可以用較小的成本做出有用且效果不差的模型。
此外,還要明確大模型並不能解決所有問題,大模型只是提升生產力的一種工具。它可以只是一把槍,但如果能在特定的場景下理解業務然後訓練和最佳化大模型,那麼它就能成為精準把握市場機會的狙擊槍,這樣的效果會比普通的大模型要好得多。

舉例來說,在金融行業,不同角色會遇到很多問題。作為基金經理,每天早上要看大量資訊,看不完怎麼辦?作為交易員,突然發現光伏板塊上漲,想知道原因或相關新聞怎麼辦?作為運營經理,發現有個熱點,想快速抓住市場機會,領先發布相關營銷物料,怎麼辦?這些問題看似簡單,但並不是大模型就能完全解決的。
這時候,Al Agent 就能發揮作用。它可以在各種場景中提供即時性的資料,解決傳統方法中訓練時缺乏時效性的問題。那麼,什麼是 Al Agent 呢?
Agent 是一種能夠自主決策、採取行動以達到某種目標的實體,Al Agent 主要依託 LLM 模型和具體的業務場景來呼叫相應的工具來完成任務目標,簡單來說大模型 + 外掛 + 執行流程 = Agent。如果延伸到智慧體,那就還需要反思、環境感知等等多模組。透過應用 AI Agent,我們就能解決特定場景中的問題。
接下來簡單介紹一下 AI Agent 的組成部分。AI Agent 主要有四個分支:Memory、Tools、Planning 和 Action。
Memory 分為長期記憶和短期記憶。短期記憶用來感知當前發生的狀態,以即時決策。長期記憶則會把一些資料和內容儲存在資料庫或記憶系統中,供以後查詢使用。查詢後,可以透過預先調整來做相應的行動(Action)。
Tools 模組是 Agent 用來處理和分析資料、進行推理和決策的演算法和方法。Tools 讓模型和外部世界進行互聯互通,既能讓模型感知世界,也能讓模型透過利用工具來改變外部狀態。在金融領域使用工具,我們主要可以賦予模型感知金融市場即時變化的能力。例如,如果要查一個基金的資料,或在營銷中查某個使用者相關的購買資料,就需要呼叫相應的查詢 API,我們稱之為 Chat BI。Tools 決定了你需要使用什麼 API。工具部分提供了 Agent 處理資訊和執行任務的核心能力。
Planning 模組負責根據當前的目標和環境條件制定長期和短期的行動計劃。這包括考慮到不確定性和可能性的計劃制定,以及如何有效地達成設定的目標。規劃使得 Agent 能夠在複雜和動態的環境中進行有條理的行動。例如,如果我要寫一個大綱,Planning 會告訴我第一步做什麼,第二步做什麼等等。或者,在寫營銷文案時,它會規劃出邏輯順序,確保步驟有條不紊地進行。此外,還有思維鏈(Chain of Thought,COT),這也是 Planning 的一部分。
Action 模組涉及 Agent 基於規劃和當前環境狀態選擇和執行具體的行動或操作。這是 Agent 與外部世界互動的方式,透過執行行動來實現其目標和任務。則透過執行 Planning 規劃的步驟,結合感知資訊,呼叫合適的 Tools 來實現最終的行動目標。
那麼,Al Agent 在金融領域能解決什麼問題呢?它在金融領域最重要的應用場景是統一資料互動形式和多樣化資料型別的互動。
Al Agent 的應用的核心是資料和互動。將不同模態和結構的資料進行互動,並透過簡單直觀的工具呼叫,以對話式的方式(例如 ChatGPT)呈現給使用者,這是 Al Agent 的目標。
所以在金融領域的應用場景中,有幾個重要的板塊:
首先是搜尋 API。像大家可能熟悉的 new Bing ,這些平臺現在都採用即時檢索結合大模型的方式。在金融領域,經常需要查詢各種基金資料、交易資料或者即時市場行情資料等。
其次是多模態互動。在很多領域,多模態互動是很重要的。比如在影片創作、營銷文案、財務報表等場景中,多模態互動可以更直觀地呈現複雜資料,提升使用者體驗。
另外,還有 ChatBI 和工具互動,這取決於在每個業務場景中我們需要執行的具體操作以及呼叫的工具,然後將結果透過使用者介面展示出來,進行一個使用者介面的互動。
這裡簡單介紹一下我們團隊基於改良 Retrieval-Augmented-Generation 為基礎的 Agent 框架的金融分析大模型。

首先是我們稱之為改良 RAG 的一個框架,即即時檢索與大模型結合的框架。這個框架在 2024 年越來越火,許多大模型公司都會選擇在這個框架上做延展。其實我們在 2023 年初就開始嘗試這個框架,因為它對計算的資源要求不高,而且具有即時性的效果。所以我們在 RAG 的基礎上進行了改良,分為幾個模組:
-
改寫(Rewrite):在檢索之後拿到的知識板塊是在召回的這一塊,我們把傳統的 RAG 改寫,按 Agent 的思路進行改良,先進行多角度的分析思考,再在每個分析視角下進行問題拆解,問題改寫,和工具呼叫。我們會對問題進行改寫,以讓大模型能更好地理解和回答問題。比如,我們會將複雜的問題拆解變成多個子任務,在這些子任務上進行規劃,即 planning。在 planning 之後,如果有必要會進行二次改寫,再透過規劃後的內容進行檢索 + 金融工具呼叫。在金融領域裡面會有很多複雜的問題。比如,哪些國家是因為經濟下行不得不下調利率,而使得整個國家的經濟健康發展?這樣一個問題,在百度或者谷歌 Google 直接搜尋都是搜不出來答案的。所以在這種情況下,需要把這個內容進行改寫,把它變成子模組,進行每個子模組的搜尋,再用大模型進行歸納。
-
檢索(Retrieve):多路召回 + 多觸發條件 + 多索引打分。比如,提出一個問題,先進行搜尋,而不是直接用大模型回答。搜尋包括搜尋網際網路內容和天弘基金自己的內容庫,這樣不僅可以獲取網上公開的即時資料、天弘基金內部的資料、專業研究員的市場觀點以及所自己積累的這種內部語料等。
-
推理(Read):即歸納和總結。我們透過改寫完的問題檢索,會得到很多資訊,把得到的資訊進行排序和推理,最後得到一個總結性答案,就是我所說的推理。天弘基金使用的是多槽位推理,在多個子任務中同時進行大模型推理,最後給出總結。
在這個設計大模型的過程中我們也做了一些創新。比如大家常說的 COT,也就是思維鏈(Chain of Thought),我們在此基礎上做了改進,稱之為 COM,就是把 Thought 變成了 Mind。COM 的意思是將一個關於金融的複雜問題拆解成多個子問題再進行操作。透過很多嘗試,我們發現,一些基礎的大模型,對於你提出的金融問題,回答的結果雖然正確,卻並不是我們所想要的。作為一個專業的金融研究員,希望得到的答案也是專業的。在這種情況下,所需要的不是一個普通的、正確的答案,而是一個可以幫助做出正確決策的答案。
所以我們創新了 COM,幫助我們在構建這個大模型中融入了研究員和基金經理的這種思維模式,讓大模型也有這種研究的思維。
接下來,我要介紹的是在檢索以後,我們做的一些召回策略。在檢索完成後,我們會進行召回策略的制定。例如,我們使用多路召回和多條件觸發。理解使用者意圖不僅限於關鍵詞匹配,還涉及時效性和語義理解等。我們採用多種索引方式,包括向量索引、關鍵詞匹配(如 BERTSpan)、實體識別(NER)等。
另外,我們在粗排階段,我們進行了相關性的過濾模型最佳化。在召回模組中,除了即時檢索的資料,我們還整合了內部資料。這些內部資料透過知識圖譜(KB)系統進行連線,讓 Al Agent 的回答更偏向於研究員的研究。我們結合了產業鏈系統,確保對行業上下游關係的全面理解。比如說,當我們要分析光伏行業時,需要了解其上下游的供應商、完整的供應鏈和產品承接方。這些資料怎麼能結合在一起準確地出現在金融從業者的答案中呢?我們進行了 KB 內容建設。首先是打通了產業鏈的上下游資料。我們會自動化地處理一部分不變的市場資料,如公司行業指標等,把它們客觀地呈現出來。另外,我們還針對一部分變化的資料,如一些分析師的觀點和各個業的異動,把每一個子模組都納入異動監測的模型中,確保這些動態資料也能及時反映在大模型的回答中。
透過這些改進,我們發現效果得到了顯著提升。進行對比,會發現在金融領域,我們團隊在金融行業內開發的基於大模型的 AI Agent 與 ChatGPT 幾乎不相上下,甚至在某些場景下我們會回答得更出色,因為我們針對金融領域進行了專門的訓練。
關於 reference,我們實際上也做了好幾個版本。現在我們的 reference 主要有幾個關鍵點。一個是確保輸出的內容都是都是有源可溯的,也是真正所需要的。我們會在答案中加入 reference,標明每一句話的來源,無論是來自我們的知識庫還是網上公開的內容,都會有明確的標註,並且可以檢視最終的資料來源。
最後介紹一下天弘基金的產品。剛才提到的可能是一些技術細節,在產品方面,天弘基金內部已經發布了大約七到八款大模型相關的產品,這些產品還沒有對外發布。總結一下,大模型可以在一天之內做些什麼?用一個時間線來串起整個大模型的產品,比如說,早上研究基金經理來到我們公司,可能需要瀏覽各種研報。這時候,我們有一個產品叫智匯,可以讓研究員快速瀏覽市場上最新的研報,並且篩選出他們感興趣的內容。天弘大模型的優勢在於總結研報或 PDF 時,如果涉及投資領域,天弘基金訓練後大模型可以識別文章中提到的投資標的,如最近的 AI 醫療、AI 辦公和 AI 法律等領域。這是研究員非常關注的內容。

我們還按照不同的研報型別,例如行業分析,市場策略,宏觀解讀這些研報分類訓練了不同的研報摘要模版。其次,作為研究員,在早間瀏覽黃金新聞時,我們根據研報進行進一步解讀,我們釋出了智讀產品,專門針對特定的研報進行解讀和提問。也就是當你看到一篇特別感興趣的文章時,你想要深入研讀它,這時候開啟我們的系統,你可以提出問題,還可以對比多篇文章進行閱讀。

接下來是“弘小助”板塊,這是我們的核心之一,涵蓋行業研究、市場分析和金融知識問答等多個方面的專項訓練,在市場表現、行業分析、熱點解讀等幾個方面做得相當出色。我們內部推出的產品,可以整合市場上公開的各種研報和公開的第三方資料來源,以及包括內部基金經理的觀點。比如,如果向這個大模型產品提問“光伏行業能否現在買入?”隨後利用我們自己獨創的 COM,將研究員的思維模式融入其中,透過意圖分析後,為投資研究角色提供了答案,給出的回答會讓提問者至少了解了最近光伏行業的市場表現。不僅限於這些問答,“弘小助”還會提供類似光伏指數這樣的行業指標,同時將產業鏈中的資訊整合進來,解釋每一個異動點背後的原因,並深入分析這些異動點。接下來是“reference”,也就是我們提到的,你可以看到每一個內容的來源。另外,我們還將大模型整合到產業鏈系統中,使用弘小助來進行產業鏈異動解讀、熱點挖掘等,使得產業鏈更智慧化,特別是在發現異動方面的效果明顯優於以往小模型的應用。
除以上應用的落地,我們還進行了一些探索性工作,包括利用大模型挖掘金融中的量化因子。我們一直在思考大模型是否能幫助我們解決投資中的因子挖掘問題。之前國外有幾個大的基金公司,專門從私募基金中挖掘出一批非常厲害的“大牛”,用於進行大模型挖因子的工作。天弘基金當時也在進行類似的嘗試,這件事是否可行,是否能實現。我們進行了一系列的實驗,其中有幾個是我們自己創新的方法。在滬深 300 的股票池中進行了測試後,我們發現,與我們常規的 word count 101 演算法或者最近流行的強化學習挖因子相比,大模型的效果非常顯著,我們的資訊係數(IC)達到了 0.0326,這比目前我們嘗試的強化學習的效果還要好。從理論上講,如果有很多個因子,需要進行組合,這其實是一個計算機難以完成的暴力求解過程。但是如果能夠藉助大模型的思維方式,透過某種邏輯形式將一些不必要的組合排除在外,就能夠顯著地縮小最終的搜尋範圍。
關於金融大模型,天弘基金會始終堅持業務導向,務實創新。始終堅持技術引領,前瞻探索。始終堅持創新合作,共創價值。始終堅持合規運營,敬畏風險。始終堅持成本效益,精準投入。

