AI決策浪潮背後

撰 文  |黑爪
人類自古就在夢想,要製造出會思考的機器。這個願望至少可以追溯到古希臘時代,傳說中的皮格馬利翁、代達洛斯、赫菲斯托斯都被賦予了傳奇發明家的形象,經他們之手而誕生的葛拉蒂雅、塔羅斯、潘多拉,也許便是出現在人類敘述中最早的人工智慧。
今天,人工智慧已經真實地活躍在眾多的應用和研究領域。但它不是魔術,也不創造奇蹟。讓我們透過喧囂,回顧一下人工智慧的前世今生,藉此看清它究竟是什麼,現在能作什麼,未來能作什麼。
早期的人工智慧,迅捷地攻佔了一些對人類大腦而言相對困難,而對計算機來說則顯得直截了當的問題,換句話說,那些可以用一系列數學規則所描述的問題。
但人工智慧所面臨的真正挑戰卻恰恰相反。我們希望它能替代我們的,有更多的是人類很容易執行,卻非常難以用規則來描述的任務,那些我們透過直覺來解決的問題。例如,聽懂別人說話,或者在一幅圖片裡找到人臉。
第一波浪潮:
難以理解現實的專家系統
人工智慧的第一次技術發展,是基於人類專家知識的人工智慧。人工智慧專家提取特定領域的知識,將其轉換成可輸入計算機的規則,以及遵循不同規則帶來的不同後果。計算機繼而運用邏輯推理來“懂得”這些採用正規語言所描述的說明。
這個技術可以用於日程安排,棋類遊戲(例如IBM戰勝國際象棋大師卡斯帕羅夫的超級計算機深藍),或者替人報稅等,有非常明確而具體的條件,執行明確的任務。對現實世界進行認知,則是第一波人工智慧的短板。此外,它不具備自我訓練和提高的能力,這恰恰又是作為智慧體的一個要素。那期間有個著名的專案叫作Cyc,由推理引擎加資料庫組成。人們希望這樣的一套系統,可以利用足夠的複雜度,來精確地描述現實世界。然而Cyc讓人失望了。例如,它試圖去讀一個故事,故事裡有個人叫弗雷德,每天早上會刮鬍子。然而它的推理引擎檢測到了故事中有一處前後矛盾:它知道人的身上沒有電動部件,可是每當弗雷德剃鬚時手裡拿著電動剃鬚刀,於是它相信這個“剃鬚時的弗雷德”身上包含了電動部件,因此它問,弗雷德剃鬚時還是不是人。
這是仰仗硬編碼知識的智慧系統,也就是第一波人工智慧所面臨的一個經典困難。它說明人工智慧系統需要具備透過從元資料中提取規律來自主獲取知識的能力,這就是我們今天說的機器學習。 
但這並不意味著第一波技術對於今天毫無意義,去年美國國防高研署(DARPA)成功完成了一項數字安全測試,便是基於第一波人工智慧技術的應用。孤立的技術,在外部環境(硬體、資料量、配套技術)不成熟的情況下,可以作的另一件事,就是等待。
第二波浪潮:
個體精度欠缺的機器學習系統 
第二波人工智慧出現的最好例子,也出自美國國防高研署。他們在2004到2005年兩年間鼓勵並組織業界進行了大量的自駕車研究,並推出一個挑戰賽,看誰的自駕車能在加利福尼亞和內華達的沙漠裡跑150英里。結果,2004年那一屆,沒有一輛車跑完,事實上沒有一輛車跑過了8英里。原因是這些自駕車的視覺系統分辨不出遠處的黑色物體,究竟是陰影還是石塊,“我”是應該避開呢,還是應該碾過去。因此它們大多在這個問題上翻了船。到了2005年這一屆,情況一下子大不一樣,有5輛車跑完了全程。
造成這個差別的原因,正是他們大多開始使用機器學習的技術,運用機率方法來處理資訊。這就是人工智慧技術的第二波。
這一波的特點是統計學習。它在語音識別,人臉識別等應用領域作得非常成功。人們常常會說,計算機“就是”會學習啊。但事實真的不是你以為的那樣“就是”,若沒有背後強大的,將現實問題用統計數學模型來描述的支撐,它便“就是”不會學習。
我們現在看見的、談論的,並且真正應用到商業領域的,大多是此處描述的第二波人工智慧技術。撇開它鋪天蓋地的輿論影響,真正被有效利用的型別極其有限。近來幾乎所有的人工智慧進展都只是一種,那就是輸入資料(A),迅速產生簡單響應(B),如表 1所示。
就這麼簡單地輸入A,輸出B,已經足夠改變許多行業了。然而“A→B”與科幻小說向我們許諾的有感知的機器人,畢竟相去甚遠,人類的智力更是遠非“A→B ”所能相比。為什麼這麼說?例如有一張拿著牙刷的小男孩圖片,被人工智慧識別為,一個拿著棒球棍的小男孩。
這讓我們發笑,因為我們人類絕不會這樣說。從這個例子可以看出,第二波技術在大量的工作中一次又一次地讓我們歎服,但也會忽然間爆出這種笑料來。它所反映出來的一個結論則是,第二波人工智慧在統計學範疇表現出色,但個體樣例不可靠。而這種個案的不可靠,若是發生在金融領域,就是災難性的。
將“A→B”放到具體的商業環境下意味著什麼?前百度首席科學家吳恩達教授用這樣一句話來解釋:一個正常普通人能夠用少於一秒鐘的思考所完成的任務,都可以透過人工智慧來實現。
第三波浪潮:
初現成效的語境適應系統
借用美國國防高研署對第三波的定義,那就是“語境適應”。第三波的系統,會逐漸建造出“有意義”的模型用以描繪現實世界的現象。
舉個例子,讓第二波系統來甄別一張貓的圖片不是問題,但如果你問它,為什麼你認為它是一隻貓呢?它的答案肯定是:“經過大量的計算,結果顯示貓位居榜首。”這個答案顯然並不能令人滿意,我們希望它說,當然是貓了,你看它有耳朵,有爪子,有毛,以及各種把貓與其他東西區分開來的特徵呢。具備了這種知道“為什麼”的能力的第三波系統,便絕不會在把前面提到的圖片標註為“拿棒球棍的小男孩”。
第二波系統對資料的依賴,幾乎達到“喪心病狂”的地步,這也是吳恩達為什麼說,當今的人工智慧企業要成功,最重要的一是資料,二是人才。比如你要教會一個系統識別一個手寫的數字,大概需要交給它5萬甚至10萬個例子,才能保證基本不出錯,設想如果你教一個小孩識字,每一個字要教5萬到10萬次是什麼情景。
因此,第三波基於“語境”模型系統的到來便成為一件自然而然的事。
IBM的辯論機器人從海量的辯論文字中學習提取有說服力的論點,谷歌剛剛推出的“觀點介面”用以在社交媒體上辨別惡意評論,都是較為成功的應用嘗試。從前面的分析可以看出,第一波人工智慧,基於嚴格的問題定義(硬編碼)而獲得了較強的推理能力,略有認知,卻完全欠缺學習和抽象能力。第二波人工智慧建立在統計模型基礎上,能夠進行精準分類和預測,其認知和學習能力有了長足進步,卻喪失了第一波技術的推理能力,同時抽象能力依然十分不足。第三波人工智慧,理論上可以粗略理解為前兩波的取長補短,然而並非把二者相加那樣簡單。基於統計模型的學習和基於嚴格問題定義的專家系統,同時存在於同一個智慧系統這個目標,還有大量需要克服的技術實現以及成本問題。越仰仗人類直覺、感知的問題,對機器的挑戰越大。去年聖誕期間,一輛優步無人車在舊金山當代藝術博物館門前闖紅燈的事故,就是一例。
是不是泡沫?
答案很堅決,不是。那怎樣解釋反覆出現的漲潮退潮呢?又得回頭看歷史,這一次我們單獨回顧一下目前最主流的“深度學習”技術的歷史。
深度學習的變遷  深度學習經歷了漫長而豐富的歷史,跌宕起伏的熱度,也被叫過不同的名字,每一個名字都反映了特定年代下的視角和觀點。
今天深度學習在很多人眼裡是一個令人振奮的新技術,而事實上,它的歷史可以回溯到20世紀40年代。它之所以看上去新,僅僅是因為它在近幾年的這股熱潮之前不被人看好,也因為它經歷了許多不同的名字,直到最近,才定下來被叫作“深度學習”。
最早的學習演算法很多是生物學習的計算模型,所以它曾經叫作人工神經網路(Artificial Neural Networks,ANNs),是實實在在基於生物大腦的啟發為基礎的學習系統。所以那個階段的“學習”概念比今天的更寬泛。
對今天的深度學習而言,神經科學僅僅被當作啟發和參照,已經不再是這個領域的主導指南。因為如今的科學對大腦的認識依然非常有限,遠不能給人工智慧提供足夠的資訊來進行模擬。而媒體對輿論的誤導往往正源於此,它們通常會將深度學習與生物大腦聯絡在一起。理解了現代深度學習技術除了從大腦獲得靈感外,它的技術體系還架構在大量對線性代數、機率、博弈理論、以及數字最佳化的基礎之上這一點,也許將不再會被輿論所帶來的威脅論嚇倒。當然,也不會對人工智慧正在帶來的顛覆視而不見。
到了80年代,伴隨著認知科學的興起,神經網路又熱過一次,被稱作符號推理。這期間值得一提的是一種叫聯結主義的觀點——大量可以進行簡單計算的單元聯結在一起,能夠執行智慧任務。這個潮流持續到90年代中期而終止,它的“遺產”到了今天,在包括谷歌在內的很多專案中仍然得到廣泛的應用。
這一波原本非常有價值的研究之所以戛然而止,很大程度上是因為那些開展這項研究的公司在尋求投資時誇大其詞,而結果並未能達到浮誇的預期,導致了投資者失望。
人工智慧行業有一個眾所周知的事實,許多自20世紀80年代起就存在的演算法如今表現優秀,但它們的優秀在大約2006年之前並不明顯,原因恐怕只能用硬體開銷來解釋。當今強大而廉價的計算能力、儲存能力彌補了超前優秀演算法的時代鴻溝。
大資料讓人工智慧從“藝術”變為“技術”  深度學習早在50年代就出現了,為什麼到了最近才忽然重要起來?這是一種隨機出現的狂熱和泡沫嗎?
其實從90年代起,它就有過不少成功的商業應用,但人們更多地視之為“藝術”而不是“技術”。不可否認,提升深度學習演算法的效能需要一些技巧,但幸運的是,技巧的需求與訓練資料的尺寸之間是反比關係,隨著資料量的猛增,對技巧的需求也隨之降低。
今天的學習演算法在一些複雜任務的執行能力上達到人類的水平,但這些演算法本身與80年代用來解決一些小兒科問題都十分掙扎的演算法幾乎一模一樣。帶來鉅變的無疑是今天的海量資料。這些海量的資料來自高度聯網的計算機,來自全社會生活的數字化,人們的每一個行為,甚至每一個步驟都被數字化後記錄了下來,這是“大資料”年代給機器學習領域的大禮。
人工智慧商業時代需要什麼
理解了眼下的人工智慧所能做和不能做的,下一步便需要企業家們將這一理解貫徹到企業的策略之中,這意味著,理解價值在哪個環節產生,什麼是難以複製的。人工智慧行業是一個非常開放的領域,幾乎所有的頂級研究人員都沒有保留地在發表最新成果,分享經驗、想法以至開放原始碼。在這個開源的世界裡,如下資源因而變得極其寶貴:
資料  頂尖的人工智慧團隊要複製別人的軟體,大多數不會超過一到兩年就能做到。但是要獲得別人的資料卻難於上青天。因此,資料而不是軟體,是許多企業的防禦堡壘。
人才  簡單的下載,再把開原始碼應用到你的資料上,通常很難奏效。人工智慧要求對你的商業環境和資料進行量身定製,這正是眼下硝煙瀰漫的人工智慧人才戰的起因。
至於人工智慧模仿人性善惡兩極的潛能,已經有許多的討論。然而它對於每一個個體,在未來可見時間裡的最大威脅,可能還是對一部分人力工種的取代。致力於建造一個讓每一個個體都有繁榮機會的世界,是作為企業領袖的責任。理解人工智慧可以做什麼,並將它運用到企業策略中只是一個開始,而不是結束。


相關文章