
最近讀AI論文有個很強的感受:表面上說的是A,其實應用落地完全可以是B。
乍一看,論文的研究物件離商業化異常遙遠,但其實,已經為具體的產品提供了非常可觀的未來藍圖。
比如最近,看到一篇斯坦福等高校釋出的AI和心理學、語言學交叉的研究論文,直譯過來叫《利用大型語言模型生成多層次反饋,為新手同伴諮詢師提供支援》。
論文核心在講LLM對於心理諮詢的輔助,但是非常非常建議所有做「AI虛擬陪伴」的產品經理,甚至是所有做「AI對話」相關的從業者,都來仔細讀一讀。
“生成多層次反饋”、“最佳化專業問答效果”、“克服幻覺問題”……
一系列涉及到的常見問題,本篇作者的分析方式、思考角度,都讓我非常受啟發!
資料採集和分析的方法,更有種旁逸斜出的創新感,極有想象力。
每每看到優秀的論文、產品,其背後的巧思、天才的創造,總是讓人拍案叫絕,甚至時常會帶來一種心流般的沉浸式享受。
https://ar5iv.labs.arxiv.org/html/2403.15482 話不多說了,原論文連結我直接放在這裡。以下是基於論文和相關背景的介紹和分析👇
斯坦福最新的「心理模型」
在美國,精神疾病和心理問題的流行,影響著近五分之一的成年人,而正規的心理諮詢師的供給卻是遠遠不夠。
同伴支援,即志願者透過富有同情心的傾聽,以此提供即時幫助,已成為專業治療的一個有效的補充。
雖然這種非正式方法可以提供即時且易於獲得的支援,但它也為支持者做好角色準備帶來了獨特的挑戰。
與心理治療或醫學等專業中的結構化培訓計劃不同,同伴諮詢師通常從一開始就沒有太多準備。
為了充分利用同伴支援的潛力,為志願者配備強大的資源,匹配AI技術以提高效率至關重要。
在 2024 年“計算語言學協會會議”上的一篇新的論文中,來自斯坦福大學、卡內基梅隆大學和佐治亞理工學院的研究人員,提出了一種基於人工智慧的新的「心理模型」——
該模型為新手同伴諮詢師提供反饋,以提高他們幫助有需要的人的能力。

該專案植根於斯坦福大學計算機科學家楊迪一,和斯坦福大學心理學家布魯斯·阿諾之間的獨特合作關係。他們都是這篇論文的作者,該論文得到了斯坦福「以人為本」的人工智慧研究所的支援。
“跨學科合作對於開展這個專案至關重要,”Arnow 表示。“人工智慧在幫助提高心理治療培訓的質量和效率方面具有巨大潛力,但心理健康界還沒有足夠的能力開發人工智慧輔助培訓模式,而計算機科學界也沒有諮詢干預技能的基礎。”
組建一個由兩個交叉學科組成的團隊,使我們能夠在這個令人興奮的新研究領域取得更多進展。

定義好的反饋
該專案的第一步是規劃出哪些反饋是有用的以及如何將其提供給新的同伴諮詢師。研究人員與斯坦福大學的三位心理治療師合作,制定了一份切實可行的良好反饋藍圖。
“目標是思考新手同伴諮詢師經常犯什麼樣的錯誤,以及什麼樣的建議可以幫助他們學習,”斯坦福大學計算機科學博士生、論文合著者 Alicja Chaszczewicz 說。
透過與諮詢主管合作,研究團隊開發了一個框架,為任何特定的交流提供三條資訊:明確定義諮詢師應該從對話中瞭解什麼;改進諮詢師回應的建議(更多同理心、更專業、更好的問題等)。
以及最符合所表達的擔憂和對話目標的具體建議回應。如果諮詢師給出良好的回應,該模型還可以給予積極的強化。

考慮到這一反饋框架,研究人員隨後收集了 400 次不同的情感支援對話中給出的反饋資料集。資料集中的每句話都收到了共同註釋的反饋:GPT-4 撰寫了初稿,兩位領域專家決定最終編輯。
該資料集提供了高質量的基本事實,可以在此基礎上微調模型,以自動生成與諮詢主管將為其受訓者提供的反饋相符的反饋。
“主要目標是確保我們儘量減少模型中的不良反饋,”斯坦福大學博士後研究員、論文合著者 Ryan Louie 表示。
為了確保這一點,他們建立了一個創新的自檢流程,其中模型將其提出的反饋輸入到自己的框架中,以確認建議是否符合對話目標。
“它基本上是在反覆檢查自己,以降低給出糟糕建議的可能性。”據審查其輸出結果的人類專家稱,最終的模型對於指導那些沒有接受過太多正規培訓的同伴諮詢師來說是一個有價值的工具。
使用反饋模型培訓諮詢師
當團隊探索這種反饋模型如何為受訓助手賦能時,他們的目標是針對直接、個性化監督可能有限的環境。
一個有希望的初始應用可能是在教育環境中,在這種環境中,教師在每次諮詢對話中提供詳細監督方面面臨挑戰。
反饋模型可以顯著增強這種體驗,透過提醒對話特定部分的目標以及輔導員的回答如何更好地與目標保持一致。
這種詳細的反饋可以提供額外的視角,補充同學和教師之間的定期討論。

然而,理想情況下,反饋模型將在沒有太多直接支援的環境中發揮作用。研究人員提到的一種可能性是,在訓練環境中,新手同伴諮詢師可以與 AI 患者進行練習對話,然後模型會審查這些對話。
用 Louie 的話來說,這將是一個“安全沙箱”,新手諮詢師可以自己練習,並獲得有關其諮詢技能的反饋,同時避免隱私問題——
“你可能不想或無法分析真實患者的資料,”Louie 說。它還允許諮詢師進行實驗、犯錯,並最終在負責幫助真正需要幫助的人之前做好更充分的準備。
但更廣泛的目標是讓這個工具能夠大規模使用併為受訓人員提供另一種學習資源。“我們絕不會試圖取代臨床監督流程,因為臨床監督流程非常複雜,”Chaszczewicz 說道。
最後我拿自己的話稍總結一下。
斯坦福等高校的研究人員,與資深心理治療專家,共同設計了一套用於培訓諮詢技能的多層次反饋框架。他們構建了帶有反饋註釋的諮詢對話公開資料集,並提出了一種簡單但有效的反饋生成自我改進方法。
並且根據論文對比資料,這套模型的效果顯著優於GPT4和其他模型的組合,並且輸出的結果得到了心理學教授的認可。
在幻覺、錯誤等問題上的控制也達到了極高水平。
有興趣的朋友,強烈建議閱讀一下論文原文!
表面上是一篇AI在心理諮詢的應用,其實對於所有的虛擬陪伴、AI對話都很有借鑑意義!
資訊參考:
https://aiindex.stanford.edu/report/https://arxiv.org/abs/2211.06318https://arxiv.org/abs/2304.03442
https://hai.stanford.edu/research/ai-index-report https://ar5iv.labs.arxiv.org/html/2403.15482
https://hai.stanford.edu/research/ai-index-report https://ar5iv.labs.arxiv.org/html/2403.15482

參考閱讀:
新鮮真話,關注一下👆
朋友圈會發一些具體的案例和商業化日常~
AI交流,歡迎加我本人微信:FrankGPTs
