被低估的ChatGPT新功能,10分鐘搞定DeepSeek程式碼庫深度研究


新智元報道  

編輯:定慧
【新智元導讀】ChatGPT悄悄上線的直連Github新功能太強大!一旦連上Github,立馬化身「研究怪獸」:不管是DeepSeek這樣的明星開源專案,還是自己DIY的文件資料,只要放進倉庫,就能交給深度研究,一鍵生成專業到飛起的報告。
大概5天前,ChatGPT「悄悄」上線了一個新功能,就是Deep Research功能可以直連Github倉庫。
這個功能剛推出時,第一反應是給程式設計師用的,但是最近使用後才發現這個功能非常強大——應用場景遠比想象的更加廣闊。
不僅僅是審查程式碼,或者生成報告,能夠連線Github的ChatGPT在重度使用後,效果還是超乎想象的——幾乎可以進行任何方向的深度研究。
只要是Github開源的公開倉庫,都可以透過:「專案官方倉庫——Fork倉庫到個人賬號——ChatGPT——Github聯結器——深度研究——選擇個人倉庫——完成報告」的鏈條來快速輸出專業級別的研究報告!
先簡單介紹下,這次連線Github後,ChatGPT具備了自動讀取、解析並總結整個GitHub倉庫的能力。
過去想要發掘和研究一個開源專案,通常需要好幾天的時間來閱讀原始碼,但是現在有了ChatGPT+Github這個聯結器,效率得到了指數級的提升。
如果說過去在Github挖寶是拿著鐵鍬,這下直接開上挖掘機了!
比如我讓ChatGPT來分析我倉庫中的一個,第一步還是常規的Deep Research步驟,先確定研究內容,然後任務啟動。
ChatGPT會對整個倉庫程式碼的功能架構、核心模組、技術棧以及維護狀態等進行全面分析。
在進行了一段時間的研究後,就可以輸出一份非常專業,並且幾乎沒有幻覺的研究報告。
這份報告,幾乎已經完成了對一個專案能做所有的研究和分析。
這份報告主要包含六個主要部分:1.技術架構 2.核心模組分析 3.程式碼質量評估 4.文件情況 5.倉庫活躍度與維護狀態 6.專案的適用性
那既然能研究一個倉庫,那是不是能研究其他倉庫?而Github的倉庫不一定非得是程式碼,是可以上傳任何的檔案的。
等會,既然ChatGPT可以提供強大的深度研究能力,而Github聯結器又限定了研究的範圍,這兩個能力加起來不就是相當於一個面向特定領域的非常專業的研究員嗎!
以前沒有這個功能的時候,ChatGPT主要依靠聯網來進行深度研究,雖然能夠獲取的資訊多了,但是「幻覺」的機率也會同步增大。
但是如果透過在Github來限定「研究範圍」,那ChatGPT給出的「深度研究」報告是不是會更專業?
而限定範圍很容易做到,只要將倉庫內容換成你想要的資料就好了,這也相當於是一個專門的RAG+MCP功能啊。
說幹就幹,下面就用Github上開源倉庫程式碼來試試效果。

整個活:套娃式研究DeepSeek
這次想讓ChatGPT出一份關於DeepSeek-R1的專業分析報告,正好DeepSeek-V3就在Github已經開源了。
只需要在深度研究下面選擇連線Github,並選擇對應的倉庫即可。
這裡為了方便操作,我是先把DeepSeek-R1 fork到了我自己的倉庫中,因為ChatGPT和Github的聯結器需要索引找到倉庫,所以重新複製一份到個人倉庫會加快索引的速度。
所以流程就是:
DeepSeek-R1官方倉庫——DeepSeek-R1 Fork倉庫——ChatGPT——Github聯結器——選擇深度研究——選擇Github倉庫為DeepSeek-R1 Fork倉庫。
然後就可以倒杯咖啡,看著ChatGPT工作了,只需10分鐘!
當ChatGPT開始深度研究後,他的介面如下圖所示,右側標識了活動過程和呼叫的研究資訊資源。
可以看到在這個任務中,ChatGPT只使用了Github倉庫限定的檔案內容。
等待十幾分鍾到二十分鐘左右,ChatGPT就在幕後認真的處理和思考這些資訊。
你可以看到這個報告真的非常的長,非常的詳細,每個部分都能溯源到原始檔案的位置。
感興趣的可以透過這個連結來檢視:https://chatgpt.com/share/682571fe-52c8-8013-a8f1-c85562ec1850
簡單介紹下生成報告的質量,報告一開始講的是R1的模型架構,然後是R1的資料訓練流程,接著講了訓練機制和推理和部署,最後還對模型的創新點做了闡述。
可以說是一份非常完善的模型研究報告,並且使用的DeepSeek-R1的官方倉庫,甚至結尾還有DeepSeek-R1的模組原始碼解釋。
可以說是非常的詳細了。
使用ChatGPT+Github這種深度研究的另一種好處就是,出了研究報告後,可以直接在ChatGPT中直接提問來進行進一步的研究。
整個流程順滑無比。

使用「索引技巧」來加快倉庫被發現的進度
需要注意的一點是,目前ChatGPT+Github聯結器在索引倉庫時,並沒有那麼快。
比如這裡剛開始我就一直搜尋不到,不斷重啟聯結器也無法找到倉庫,不論是自己的還是其他Public公開的倉庫。
後來在OpenAI的官方文件中才找到說明。OpenAI提到了Github的倉庫需要手動啟用後才能加到索引列表,才能被聯結器找到。
ChatGPT也針對這個問題給出瞭解決方案,那就是將倉庫在Github的搜尋框中搜一下,或者上傳一個新的更新。

不一定是程式碼

實際上,ChatGPT的這個功能其實非常強大,上面主要使用的是訪問Github倉庫來進行深度研究的功能。

那麼引申一下,就可以將一些特定的內容,比如PDF、Word等上傳到新建的倉庫中,然後使用這個流程來進行研究。
這樣就把研究資料限定在固定的範圍內,同時還能利用Github聯結器本身對各種檔案的編排能力,畢竟在分析一個專案倉庫時,Github本身也是會區分不同的檔案型別。
這就是一個相當完美的RAG+MCP組合,不僅能使用ChatGPT強大的模型能力,還可以使用Github構建倉庫的能力,簡直完美。
最關鍵的是,這個功能只要是開通了Plus的使用者即可使用,從這一點上來說,ChatGPT Plus這次終於值回了20美元的票價。
這種將ChatGPT和GitHub深度連線、相互強化的新玩法,其實就是開啟了一種全新的研究模式。
不管你是想要快速上手一個陌生的開源專案,還是精準分析特定領域的內容,都能用上這個組合。
更關鍵的是,這種玩法甚至能夠擴充套件到各種型別的研究資料中去,實現了真正的RAG+MCP組合——專業又高效。
如果你還有更好玩,更有趣的玩法,歡迎在評論區交流。
參考資料:
https://help.openai.com/en/articles/11145903-connecting-github-to-chatgpt-deep-research
https://x.com/OpenAIDevs/status/1920556386083102844


相關文章