
Jan.
27
灼見(ID:penetratingview)
中國AI,這一次真的震撼了世界。

這些天,矽谷徹底處於中國公司帶來的大地震餘波中。全美都在恐慌:是否全球人工智慧的中心已經轉移到了中國?

01



02

(專案地址:https://github.com/hkust-nlp/simpleRL-reason)


第一部分:SimpleRL-Zero(從頭開始的強化學習)
1. 訓練過程動態分析


2. 自我反思機制的湧現

第二部分:SimpleRL(基於模仿預熱的強化學習)
1. 訓練過程分析



03


04

— THE END —