推薦3個yyds的開源專案!

大家好,今天咱們繼續聊聊科技圈發生的那些事兒。
一、GS Quant
GS Quant是一個用於量化金融的 Python 工具包,GS 其實就是 Goldman Sachs 高盛集團的縮寫。
GS Quant 的功能主要涵蓋了以下幾個方面:
  • 內建很多金融衍生品定價模型,涵蓋多個資產類別
  • 提供了公司內部及市場的資料介面,便於監測
  • 提供風險管理、風險評估工具
  • 構造交易邏輯
所以,無論是在量化交易的策略定製,企業內部管理投資風險,又或者是專業教學任務,GS Quant都可以有很不錯的表現。畢竟,這麼大的公司自己做的,能拿出來開源的,質量應該還是不錯的。
專案可以,以Python包的形式直接使用,直接使用以下命令安裝後匯入即可。

pip install gs-quant

這裡我們可以看看官方的使用示例,使用GS Quant生成一個隨機時間序列並計算 1 個月(22 天)滾動已實現波動率:

import gs_quant.timeseries as ts

from gs_quant.timeseries import Window
x = ts.generate_series(1000)           

# Generate random timeseries with 1000 observations

vol = ts.volatility(x, Window(22, 0))  

# Compute realized volatility using a window of 22 and a ramp up value of 0

vol.tail()                             

# Show last few values

這是執行這段程式碼之後的結果:

Out[1]:

2021-12-20 12.898025

2021-12-21 12.927230

2021-12-22 12.929520

2021-12-23 13.987033

2021-12-24 14.048165

dtype: float64

更多的API和使用方法可以檢視官方文件。對量化金融感興趣的小夥伴可以自行體驗一下這個工具。
專案地址:
https://github.com/goldmansachs/gs-quant

二、GraphRAG

最近幾天,微軟團隊開源了GraphRAG,這是一種基於圖(Graph)的檢索增強生成方法。
先說說RAG吧,檢索增強生成,相當於是從一個給定好的知識庫中進行檢索,接入LLM模型,讓模型生成準確且符合上下文的答案,減少幻覺,根據特定的知識庫進行符合知識庫內容的回答。如果和模型微調進行比較,通俗點來說,RAG是給模型一本《答案全解》讓它自己查,微調是給模型開輔導班補習。不過,傳統RAG有一些待解決的問題,比如推理能力不足,答案不完整,準確性不足等。
知識圖譜視覺化示例
而 GraphRAG 的實現流程大致如下,首先將輸入文字轉化為文字塊,讓 LLM 提取知識圖譜,將知識圖譜聚類,基於關鍵詞實現子圖遍歷。
我們直接來看看 GraphRAG 的實戰測試吧。測試基於俄烏雙方關於暴力事件的上千份新聞報道,檔案內容比較多,而且內容之間關係複雜,無法直接放入LLM的上下文中,RAG方法是此時的最優解。團隊首先測試了第一個問題:Novorossiya 是什麼?
可以看到無論是 Baseline RAG 還是 GraphRAG 表現都很好,因為這種查詢確實是基線RAG擅長的部分,查就完了。
但如果把問題換成:Novorossiya 做了什麼?
Baseline RAG 根本沒法給出答案,它的原始檔中沒有任何東西提到這個關鍵詞。而 GraphRAG 讓 LLM 建立了知識圖譜,分析實體之間的關係,生成了很不錯的答案。GraphRAG 極大的提升了 RAG 的檢索能力,在捕獲上下文的這個過程中可以填充更多具有相關性的內容,從而讓生成的答案更具準確性。
不過有一個無法避免的問題:所有的效能改進技術,都會導致 token 的使用和推理的時間增加。但這並不影響 GraphRAG 的優秀,讓我們一起期待一下GraphRAG的進一步發展吧!
專案地址:
https://github.com/microsoft/graphrag

三、FunAudioLLM

在 B 站的新影片中,我們介紹了阿里新開源的 FunAudioLLM 專案。
之前很多讀者留言說到,如果只有短短幾秒的微信語音,如何才能模仿他們的聲音?在當時,各種專案不是效果不好,就是無法根據這麼短的輸入音訊進行聲音模仿。不過現在,依靠 FunAudioLLM,我們終於可以實現了!
只需三秒的輸入音訊,提供輸入文字,FunAudioLLM 可以生成具有相同音色的音訊。更讓人驚喜的是,專案支援跨語言語音翻譯!比如你只給出了一段中文的語音,專案可以幫你生成相同音色下,粵語、日語、英語等不同語種的聲音,想象一下,哪怕自己日語的五十音圖都還沒有認全,藉助 FunAudioLLM 的 CosyVoice,你甚至可以聽到自己的聲音說著流利的日語!
而 FunAudioLLM 的功能遠不止如此。如果我們將一本書輸入給大模型,讓大模型嘗試理解書中各個人物的性格、情感,模擬出他們的情緒特點和音色,透過 CosyVoice 的語音合成功能,你可以得到一段旁白,其中不同的人物有不同的音色與情緒。
專案的高階功能還有很多。不知道大家有沒有看過一本網路小說《十日終焉》,小說裡的角色“青龍”具有分辨不出是男是女的神奇音色,我根本無法想象這個聲音到底是什麼樣的。透過 FunAudioLLM,你可以輸入兩個不同音色的輸入音訊,專案可以合成兩個音色,創造出一個可能真的從未存在的聲音!甚至,你可以調整偏好,讓生成出的音色更貼近某一個音源。
此外,先前介紹過的 ChatTTS 可以透過打標籤的形式讓生成出帶情緒起伏的音訊,比如大笑、悲傷、強調,FunAudioLLM同樣能做到。還有給識別到的語音加標點符號,透過識別語音中的音樂查詢到音樂的名字,都是非常實用的功能。
這個專案中所有給出的例子,都可以在新影片中感受效果,聽聽音訊具體的質量怎麼樣。如果想要即刻上手體驗,影片的簡介區我們也已經做好了一鍵部署啟動的懶人包,玩得開心的話,給個免費的贊就行。
影片地址:
https://www.bilibili.com/video/BV18T421Y7FG
專案地址:
https://github.com/FunAudioLLM/CosyVoice
https://github.com/FunAudioLLM/SenseVoice
·················END·················

相關文章