
MLNLP
(
機器學習演算法與自然語言處理
)社群是國內外知名自然語言處理社群,受眾覆蓋國內外NLP碩博生、高校老師以及企業研究人員。
社群的願景 是促進國內外自然語言處理,機器學習學術界、產業界和廣大愛好者之間的交流,特別是初學者同學們的進步。
(
機器學習演算法與自然語言處理
)社群是國內外知名自然語言處理社群,受眾覆蓋國內外NLP碩博生、高校老師以及企業研究人員。
轉載自 | 機器之心
作者 | Marco Tulio Ribeiro



1
『前提:擴充套件你的相鄰可能』
2
『提出想法的啟發式方法』
他們通常有 10 到 20 個想要解決的重要問題。當他們看到一個新想法出現時,人們會聽到他們說「這個想法與這些問題中的某一個相關。」

論文地址: https://arxiv.org/pdf/1602.04938.pdf
3
『idea真的很“廉價”嗎?』
4
『構建潛在專案』
CheckList :我們想知道我們的模型是否符合業務規則、先驗知識和常識。現在,即使是專家也很難寫出這些是什麼。大多數人甚至沒有想過他們為什麼需要這樣做。 為什麼困擾:總結一下為什麼這個問題很重要,或者我們為什麼關心它的解決。
CheckList :訓練 / 評估資料是靜態的,通常導致模型的偏差。準確性通常不是我們關心的全部,而且測試集幾乎從來沒有足夠大或變化到足以測試某些行為(例如,模型在存在拼寫錯誤時的行為方式,模型對於某些異常值的行為方式等)。 當前的解決方案及其失敗的原因:一個可能適用於「問題」的方法列表,即使它們不是專門為它設計的。請注意,「它們失敗了」並不是說這些方法不好,只是它們不能解決我們的問題,即使它們在其他方面非常出色。
CheckList 示例:我列出了一堆方法(與這篇博文無關),並說「這些方法並不能真正測試人類期望的模型行為,只有少數例外。此外,有些需要訪問模型內部。」 如果我有一個解決方案,它會是什麼樣子?這樣做的重點不是實際提出解決方案,而是「對映」我們期望什麼樣的解決方案,如下面的示例所示。如果你能想出多種可能的解決方案,那就更好了。
CheckList 示例:一個測試框架,包括不同測試型別的分類 – 一種從使用者那裡獲取測試的方法 – 使整個過程變得簡單的軟體 我怎麼知道我是否解決了它?同樣,這主要是評估的草圖(不需要詳細資訊)
CheckList 示例: – 許多令人信服的 SOTA 模型未能透過測試的示例,並收集到見解 – 與微軟工程師進行的「使用者研究」,我們(希望)表明他們在編寫測試後在自己的模型中發現了一堆(可修復的)問題. 什麼是不確定性?這必須是真的嗎?這個解決方案不能正常工作是什麼?這是關於繪製出高度不確定性的區域,並確保我們儘可能快地排除會使專案或解決方案草圖無效的事情。
CheckList 示例: – 如果我是唯一能夠進行測試的使用者,那麼這將是失敗的。 – 如果 SOTA 模型僅在特殊測試中失敗,則可能準確性已經足夠好,我們不需要這個專案了 計劃草圖是這裡的關鍵詞。我們只需要前幾個步驟的合理細節,而第一步通常是某種形式的初步文獻綜述。
總結下來就是:
-
點亮評論 -
為 SOTA 情緒分析模型寫測試 – 為其他幾個模型(釋義,SQuAD)編寫測試 -
嘗試將這些組織成一般原則 -
開發所需的任何工具 -
與微軟人員進行案例研究;與研究人員的案例研究 -
使用者研究 -
撰寫論文
5
『評論模板』
6
『評估潛在專案的啟發式方法』
-
與人交談
-
駭客會議
7
『寫在最後』
部落格連結
第二篇:

掃描二維碼新增小助手微信
關於我們
