海歸學者發起的公益學術平臺
交流學術,偶爾風月
AI技術無疑是2024年最炙手可熱的科技詞彙,其內涵和外延都在隨著人們越來越廣泛的認可和應用變得無比豐富,複雜且充滿了爭議,但是毫無爭議的是,這項或者叫這類新技術正在像歷史上的蒸汽機、內燃機、電動機或者網際網路一樣緩慢但是無可阻擋的向人類社會的方方面面進行滲透。有關AI的新聞就像天氣預報一樣每天都在更新,知社選取了一些我們認為具有重要影響的AI大事件進行了盤點,也希望親愛的讀者提出您的看法與我們探討。
2024年10月8日17時45分,2024年諾貝爾物理學獎揭曉,獲獎者是約翰·霍普菲爾德 (John J. Hopfield) 和傑弗裡·辛頓 (Geoffrey E. Hinton),表彰他們利用人工神經網路在機器學習方面取得的開創性發現和系列發明。這個獎項的頒發意味著主流科學界已經充分認識到了AI技術的無窮潛力,那麼為這項技術進行開拓和奠基的科學家受到表彰就是順理成章的事了。
從本質上說,AI技術是一種仿生技術,與其他仿生產品的區別在於它模仿的物件是人類本身。諾獎頒獎詞中提到:“現在,當人們談論人工智慧時,他們通常指的是使用人工神經網路的機器學習技術。這項技術最初受到了人體大腦結構的啟發。在人工神經網路用具有不同值的節點來模仿大腦的神經元。這些節點以類比突觸的連線方式相互影響,從而產生更強或更弱的連線。這為訓練AI模型提供了最基本的理論之一。”
將科學界對人類大腦思維方式的理解與現代計算機技術相結合,就成為了AI技術的奠基石。而其最成功的應用之一就是Deepmind開發的蛋白質結構預測工具AlphaFold2。自1970年代以來,研究人員一直在嘗試從氨基酸序列預測蛋白質結構,但這非常困難。過去半個多世紀以來,科學家一共解析了5萬多個人源蛋白質的結構,這花費了幾萬名科學家幾十年的辛勤勞動和數百億美元的經費,而AlphaFold2在兩年內給出了2億個蛋白質的預測結果,這個效率是人類科學家的幾萬倍,與太多帶有娛樂性質的AI工具相比,這個專案是實實在在的超級生產力工具,堪稱科學界的殺手級AI應用,獲得諾獎實至名歸。
強力的AI功能的實現離不開強力的AI算力支援,作為AI晶片領域毫無爭議的王者,英偉達公司一直在推陳出新,不斷髮布的新品讓各大科技巨頭眼紅心熱,紛紛揮舞著鉅額支票要求預定產品,甚至想要吞下未來幾年的所有產能。新技術帶來的市場壟斷地位讓英偉達擁有了前所未有的定價權,其主力產品的毛利率經常在90%以上甚至超過95%,即便如此也擋不住客戶的搶購衝動。這也助推了英偉達公司的市值一飛沖天。從2023年4月的不到1萬億美元,到2024年6月19日,當日收盤時市值達到了3.33萬億美元,超越微軟成為全球市值最高的公司。
得益於臺積電的全力支援,英偉達的換代新品Blackwell GPU 架構和系統正在迅速出貨,這款受到客戶追捧的新品預示著英偉達的市場表現依然值得期待。與此相對的是,各大買家微軟、OepnAI、蘋果、谷歌、亞馬遜和臉書等公司都在大量燒錢,晶片只是其中一部分開支,其他成本也無比龐大。但是相比於英偉達已經兌現的業績,這些軟體巨頭們離賺到錢還遙遙無期。這讓英偉達獲得了“AI賣鏟人”的稱號,認為它就像淘金時代不挖金礦而服務於淘金者的那些公司,賺到的錢遠比碰運氣的挖礦人更穩定可靠。英偉達依靠業界最強的技術實力,已經成為了AI時代的基礎性公司之一,就像上一個時代的英特爾一樣。
雖然像ChatGpt等大語言模型確實實現了功能上的飛躍,但是還沒有出現受到消費級市場認可的殺手級應用,普通消費者更多的把AI當作新型科技玩具而非不可或缺的工具,無論是生產還是娛樂。為了能夠出現“殺手級”應用讓鉅額投入能夠產生回報,微軟和蘋果兩家居於生態位中心的科技巨頭全面引入了AI技術來重構其產品線。微軟將其生成式AI技術(如GPT-4/5)深度整合到Office套件(Word、Excel、PowerPoint等),推出了名為“Copilot”的智慧助手,功能包括自動撰寫文件、生成分析報告、建立簡報等,顯著提升辦公效率;微軟的Bing搜尋和Edge瀏覽器整合了生成式AI,使搜尋結果更精準,並支援即時生成文章總結、內容提煉等功能。而蘋果公司將AI技術融入其硬體生態,如iPhone、iPad、Apple Watch等裝置,主要表現在Siri的升級,透過生成式AI提供更流暢、更智慧的語音互動功能;同時升級裝置端AI,透過先進的神經引擎(Neural Engine)實現即時的語音處理、影像識別和個性化建議。
不光是軟體,全面定製化的AI PC也成為了押注的方向:Apple Intelligence 將在所有搭載Apple M 系列處理器的 Mac 上推出,而 Copilot+ 功能僅在越來越多片上系統內配備神經處理單元 (NPU) 的 PC 上提供。研究公司 IDC 預測,到 2027 年,人工智慧 PC 將佔全球 PC 出貨量的60%。儘管人工智慧 PC 在 2024 年成為熱門詞,但尚未吸引太多使用者。
網路巨頭思科將 AI 作為 2024 年的首要任務之一,斥資 280 億美元收購了 Splunk,旨在打造一個專為人工智慧時代打造的完整安全運營中心。還與 Nvidia 合作推出了一系列新的 AI 基礎設施,即 Nexus HyperFabric AI Cluster。亞馬遜雲計算公司 AWS則向人工智慧初創公司 Anthropic 追加投資了40億美元,後者在新型生成式模型和定製AI晶片領域都很有希望。
多模態大模型的崛起:
OpenAI 推出ChatGPT-4o
ChatGPT-4o中的 "o" 代表 "omni"(全能),標誌著 OpenAI 在人工智慧技術上的又一次重大飛躍。其關鍵特點在於多模態處理能力。ChatGPT-4o 能夠即時處理和生成文字、音訊以及影像等多種模態的資料,提供更全面的解決方案。另一方面,透過多模態學習,AI模型可以將一個模態學到的知識遷移到另一個模態上,從而提高模型的泛化能力。
而在多模態資料的基礎之上,ChatGPT-4o提供了更為自然的人機互動體驗,在GPT-4o之前,使用者使用語音模式與ChatGPT對話時,GPT-3.5的平均延遲為2.8秒,GPT-4為5.4秒,音訊在輸入時還會由於處理方式丟失大量資訊,讓GPT-4無法直接觀察音調、說話的人和背景噪音,也無法輸出笑聲、歌唱聲和表達情感。但GPT-4o可以在232毫秒內對音訊輸入做出反應,與人類在對話中的反應時間相近。在釋出會上,OpenAI的兩位高管做出了演示:GPT-4o能夠因測試人員急促的喘氣聲中聽出“緊張”,並且建議他進行深呼吸。此外,GPT-4o還可以根據使用者要求變換語調。這一交流體驗的提升意義非凡,可以說人們對於通用AI又邁進了可觀的一步。
2024年9月25日,數學家陶哲軒啟動了一項雄心勃勃的專案——等式理論計劃。該計劃旨在探索按蘊含關係排序的原群等式理論空間,經過57天的緊張合作,成功完成了4694個等式之間22028942個蘊含關係的分析。根據 GitHub 顯示,等式理論計劃專案有 45 位貢獻者。而在計劃過程中,陶哲軒使用 GitHub Copilot 來處理日常任務,加快程式碼編寫,Claude 則被用來協助建立視覺化工具,而 ChatGPT 更多時候在扮演一個激發數學家們靈感的小助手角色。不過陶哲軒也表示,大模型們在專案中的表現“低於預期”,數學家們更多的時候用到的還是“經典AI”
無論如何,這次專案的成功為人們展示了一幅驚人的未來願景──人類直覺和機器學習能力在純粹思維領域的有機結合,足以解決這些領域中的一些最具挑戰的問題。這一成就不僅標誌著等式理論領域的重要突破,也為未來AI數學工具的基準測試提供了參考。
AI巨頭的壟斷:
OpenAI與伊隆·馬斯克的訴訟糾紛
自2024年3月起,馬斯克多次對OpenAI 及其執行長塞繆爾·奧特曼 (Samuel Altman) 提起訴訟,指控其違反了OpenAI成立時簽訂的捐贈條款,轉而追求商業利益,尤其是讓公司服務於微軟的商業目的。起訴書稱,OpenAI “在推動人工智慧發展的過程中將利潤置於公共利益之上”。
圖片來源:Allison Robbert – Pool via CNP/Zuma Press
馬斯克是OpenAI的初始投資人之一。2015年,馬斯克為OpenAI投資了近5000萬美元。但2019年,OpenAI逐漸從從非營利組織轉型為“有限盈利”組織,成立了營利性子公司的管理實體。在這一過程中,馬斯克多次指出OpenAI背離使命,並在2018年正式宣佈退出OpenAI董事會。但今年3月,OpenAI公開了一組郵件截圖,這些郵件資料顯示,馬斯克曾對OpenAI建立營利性實體的決定表示認同。OpenAI聲稱,馬斯克希望獲得營利性實體的多數股權、初始董事會控制權並擔任執行長。而OpenAI對此拒絕接受。
截至11月末,馬斯克已經三次加碼訴訟力度,指控OpenAI和微軟涉嫌不正當競爭行為,違反了美國的反壟斷法律。
2024年12月,英國推出提案,擬設定版權法的豁免政策,根據這種“版權豁免政策”,科技公司將被允許自由使用受版權保護的材料來訓練人工智慧模型,除非作者和版權公司特別聲明瞭不允許AI使用其內容。此提案一齣,激起了英國出版界和創作者群體的激烈反彈。政府方面表示,該提案是為了給人工智慧開發提供一個獲取訓練材料的透明化渠道。
出版商協會執行長丹·康威對此提出反對,他說:“目前還沒有任何客觀案例支援設立新的版權豁免政策。重要的是,確保包括出版商在內的內容生態系統獲得適當的商業激勵來投資高價值內容,並確保版權持有者能夠保留對作品使用方式和時間的基本控制權”。
隨後,一個由英國作家、出版商、音樂家、攝影師、電影製片人和報刊從業者組成的抗議組織提出了一份聯合宣告,專門駁斥版權豁免的提議。披頭士前成員保羅·麥卡特尼和歌手凱特·布什成為抗議組織中的主力軍,他們與演員朱麗安·摩爾、斯蒂芬·弗萊和休·博內威利一起簽署了一份請願書,目前已有得到37500 餘人的支援。該請願書稱,“未經許可使用創意作品來訓練生成式人工智慧,是對創作者生計的嚴重威脅。這絕不能被允許”。
圖片來源:Raphael Pour-Hashemi
通用人工智慧的先聲:
特斯拉人形機器人‘擎天柱’明年上線
2024年7月,特斯拉執行長埃隆·馬斯克聲稱,特斯拉生產的人形機器人“擎天柱”(Optimus )將在2025年上線。據悉,擎天柱是一個協助汽車生產的人形機器人。它身高約 1.7米,體重56公斤,可以幫助完成汽車製造過程中的“枯燥、重複和危險”工作。
馬斯克於 2022 年展示了人形機器人擎天柱的原型機
圖片來源:Photograph: Tesla/AFP/Getty Images
通用人工智慧(AGI)是許多人工智慧研究人員夢寐以求的、足以與人類相當的人工智慧。專家認為,機器人技術對於實現AGI至關重要。只有人工智慧具有物理形態,它才能真正理解我們的世界。
馬斯克曾表示,他的目標是實現機器人的大規模生產,並且將每個機器人的成本控制在20000 美元以內。他還在社交媒體宣佈稱,特斯拉將在2026年製造出可以出售給其他公司的人形機器人。
對此您怎麼看呢?對於2024年的AI發展,您認為的最值得關注的事件有哪些呢?不妨留言與大家分享。