封面來源|WAIC
大模型的廝殺日趨白熱化,而世界人工智慧大會(WAIC)就是AI界的狂歡,AI界的春晚。
7月4日,WAIC在上海世博展館開幕。在主論壇上,姚期智、李彥宏等AI大咖齊聚一堂;在展館中,AI戰場從模型一步步捲到了應用,又從軟體捲到了硬體——2024年的展館新設機器人專區,有25款人形機器人亮相。
今年的WAIC也比往年更卷:500餘家企業,參展企業數量歷史最多。
上海的酷日與冰雹來得猛烈,AI之火來得更猛烈:大會的幾十場論壇早早就被約滿,媒體們帶上直播的長槍短炮,AI博主們紛紛在展館閃現並與網友見面,也有求職者直接到大會現場找工作、應聘企業。
在展會上,你可以跟AI一起玩狼人殺,跟著數字人一起同臺跳舞健身,還可以讓AI老羅幫你直播帶貨。大量的AI應用,悄然躍過了純展示和Demo階段,從手機App延伸到到詞典筆、電視等等硬體中,進入到生活的方方面面。
你還能看到特斯拉的賽博皮卡Cybertruck,和特斯拉的人形機器人Optimus合影……
特斯拉電動皮卡Cybertruck 圖源:作者拍攝
數不清的具身機器人中,有會寫書法的、會做穴位按摩的、會疊衣服做家務的,甚至還有會跳女團舞的……
與AI共存,不是未來某刻,而是此時此刻。
特斯拉Optimus:很牛,但只能看不能摸
時隔7個月,特斯拉Optimus第二代產品終於亮相,這次自然也吸引了不少目光。這次,Optimus毫無疑問變得更強了。
據特斯拉工作人員介紹,Optimus如今在直立行走的基礎上,行走速度提升了30%,而且,它的十個手指還“進化”出了感知和觸覺。這意味著,它不僅僅能輕握脆弱的雞蛋,還可以搬運沉重的箱子。
特斯拉還在嘗試把Optimus用到他們的汽車工廠中,替代人類。比如,藉助和特斯拉汽車上類似的視覺神經網路和FSD晶片,Optimus已經能夠模仿人類的操作進行電池的分揀訓練。特斯拉方面稱,明年將會有超過1000個Optimus要進廠工作。
遺憾的是,這次其他家的機器人都在現場整花活,唯獨Optimus被關在了一個玻璃櫃子裡面,只可遠觀,不可褻玩。
原地後空翻吧!機器人!
這次,“宇樹科技”則展出了他們的Unitree H1人形機器人。據說,這款機器人是全球首款能在原地後空翻的人形機器人,而且還是純電驅動。
在現場,宇樹可以還展示了他們的一系列機器狗產品。這些機器狗能自如做站立的動作,並且還能連續原地側空翻,每翻一次,現場都驚起“哇”聲一片。
咋踹都不倒的機器人
通用足式機器人公司“逐際動力”的標杆產品,是一款用腳踹都踢不倒的雙足機器人。
運動的穩定性,對機器人執行任務、打工幹活兒是關鍵。要走得穩,才能代替人類上刀山下火海。
在地形複雜、坑坑窪窪的山路上,而且是在完全陌生的野外環境,這款機器人可以走石子路、過溝渠、爬草坡,甚至人怎麼用棍子打它,都不會倒。
在大會現場,這款產品幾乎贏得了機器人區最多的目光。觀眾用各種方式欺負這款雙足機器人:拉、拽、踢、踹……
可憐的機器人哪怕被人踢得快跪下了,甚至都被地上的坎兒絆了一下,都沒倒,繼續還能雙腳交替調整,站起來。
機器人這種怎麼踢也踢不倒的能力,得益於強大的運動控制。
在軟體方面,需要結合更即時、更精準的地形感知資訊,同時需要迭代全身的運動控制演算法。透過對全身動作的即時規劃,機器人的手臂與腿部的動作更加協調,身體在運動過程中的晃動顯著減小。
會疊衣服的賢惠機器手
靈活的手,造就了人類使用複雜工具的能力。而對機器人來說,靈活的手決定它是否能代替人類做各種操作。
在人類的日常家務中,疊衣服其實難度很高:對手指關節的靈活性、對柔性變形衣物的感知能力、操作的力道和角度要求,都很高。
“穹徹智慧”的機器手,就是代替人類疊衣服的一雙靈巧手:
穹徹智慧公司成立於2023年11月,該公司由非夕科技拆分而來,初創團隊主要由非夕科技CEO王世全和上海交大教授盧策吾等人組成。盧策吾曾是著名AI學者、斯坦福教授李飛飛教授團隊成員。
不過,據《智慧湧現》觀察,穹徹智慧的這雙靈巧手疊衣服比較費時,三分鐘才剛能把衣服拉起來。機器人幫你做疊衣服這種高難度家務,在效率暫時還比不上人類,但是曙光應該就在眼前。
機器人為你做一次馬殺雞
當你腰痠背痛,又不想出門去按摩店,如果有一臺機器人在家為你做按摩,豈不是爽呆了?
“睿爾曼智慧”的這款康養機器人,採用仿人機械臂,能對人體上不同的穴位進行按摩。跟傳統的按摩器大不相同。
傳統的按摩器,按摩的動作是固定的,只可以調檔位。在同一個檔位和模式下,按摩的手法、動作與力道是一樣的。
AI時代的機器人,可以根據不同人體的形狀與身材,調整按摩手法和力道。
據現場工作人員介紹,這款機器人錄入了400多種不同的人體身體的資料,可以自動判斷當前床位上人的穴位位置進行按摩。此外,機器人還能調整按摩的力度、溫度和時間。
使用者還可以有個性化定製按摩,比如當你近期感覺腎臟欠佳,就可以設定讓機器人重點給你敲打腎經。
價格也幫大家問過了,標價每臺12萬元,在場的《智慧湧現》小夥伴們人人都心動。
Soul:和AI一起玩狼人殺
在興趣社交社群平臺Soul的“狼人覺醒”遊戲中,真人與AI同上牌桌,一起爾虞我詐。
“但凡你要為狼人做事情的話,你都會說兩句話對不對?結果你直接划水。”在一次遊戲場景裡,一個AI角色信誓旦旦地分析道。
有使用者在旁邊感嘆道:“AI把我整得一愣一愣的。”
Soul社群在今年釋出了“狼人覺醒”的站內遊戲,AI扮演角色,和人類玩家一樣,在狼人和村民的角色中互相博弈。
據瞭解,該遊戲基於Soul自研的語言大模型Soul X,採用強化學習技術,在遊戲各個階段讓AI角色作出包括偽裝、信任、領導與對抗等精準擬人決策,還能支援多角色扮演,也能選擇不同的音色。
B站:一鍵讓漫畫會動+有聲音
喜愛的漫畫成功TV化,或者被搬上熒幕,其中的幸福滋味,二次元們肯定懂。
這次,“二次元老家”B站,親自用AI生成動漫的影片版,暫解動漫迷的苦守TV化之苦。
在嗶哩嗶哩漫畫上,B站上線了“動態漫”模式。所有的漫畫都可以絲滑地切換成TV模式,漫畫分鏡連成了影片,角色擁有了肢體動作,臺詞也轉換成了字幕。
沒想到吧,B站也悄咪咪地自研了大模型——B站小夥伴向《智慧湧現》介紹,無論是“動態漫”還是數字人,都是基於B站自研的大模型能力。在展會現場,B站也開放了自研大模型的對話能力,使用者掃碼即可進入大模型的直播間聊天。
在家跟數字人鬥舞
不想去健身房、在家又怕學不會動作的社恐們,現在可以在家跟著數字人同臺健身了。
騰訊就推出了體感健身應用“舞動極光”。使用者不需要額外購置裝置,只需要要把手機連上一臺電視/電腦,就可以跟著虛擬角色一起健身。
舞動極光使用了AI動作捕捉技術,依靠機器學習來推斷出身體結構運動。在真人模式下,你自己的影像,會與虛擬角色的影像一起,同時出現在臺上。
比如,虛擬角色是喜羊羊,喜羊羊怎麼抬手、踢腿,你就跟著抬手、踢腿,你的動作會顯示在螢幕上的真人影像上,即時反饋,動作正確就會獎勵得分,像遊戲闖關一樣。
AI閨蜜“關小芳”,有了眼睛和耳朵
如今的AI智慧體,已經不僅僅是二維螢幕上跟你對話的軟體,而是有著三維體積感的數字人——能站在你面前,看到你的相貌,像活人一樣跟你聊天,誇你今天的穿搭,為你唱歌。
你面前的關小芳,是快手的虛擬數字人,站在如同透明液體一般的VR顯示裝置裡,隔著一道玻璃,但你彷彿能觸碰到她。
展會上的關小芳數字人,當你跟她聊天、希望她給你唱首歌,她會用知性的聲音唱道:“擁抱的溫度,只有你清楚。”這個有著3D體積感的數字人,彷彿伸手就能擁抱你。
快手開發關小芳智慧體之初,是用來當帶貨主播。藉助虛擬演播助手,使用者只需要站在攝像頭前,面部表情和肢體姿態就可以被快速捕捉與識別,並即時呈現在直播間的虛擬角色上,能夠和直播間的觀眾進行即時互動。
2022年,快手還與AI賣鏟人英偉達合作,用數字人在聖誕節開直播。
在AI的加持下,VR/AR、元宇宙重新煥發活力。元宇宙不僅能讓數字人帶貨,還讓《頭號玩家》里人類與虛擬人共同生活成為可能。
AI老羅,24小時幫你直播帶貨
真實世界裡的羅永浩,已經今年慢慢從直播界淡出、降低了直播頻率。沒關係,AI羅永浩可以替他幹活兒——大模型獨角獸公司“智譜AI”釋出的數字版老羅,就是用羅永浩真人語料庫訓練出來的AI智慧體。
只要有電,AI老羅可以24小時無間歇和你聊天,還可以24小時幹活兒做直播——這可比真人老羅有價效比多了。
羅永浩的幽默詼諧,已經成為他直播帶貨的風格護城河。那麼AI羅永浩能模模擬人羅永浩的風格精髓嗎?
不能說完全一樣,但AI老羅也繼承了真實羅永浩的語言風格。
AI老羅也用羅永浩標誌性的雙手撐桌姿勢,用帶點調侃的語氣回應:
“AI領域火得一塌糊塗,機會多如牛毛,比如AI在醫療健康、金融、零售、製造業等行業的應用,都是創業熱點……但別忘了,創業不是光靠點子就能成功的,執行力、團隊、資金、市場定位,一個都不能少。有興趣的話,可以深入瞭解一下,也許下一個改變世界的就是你了。”
AI改作業,十國語言不在話下
什麼應用能在海外的下載量超過TikTok?答案是會即時批改作業的AI。
這款能解放教師雙手的智慧批改系統,來自猿力科技自研的AI大模型多語言智慧批改技術。
批改作業和試卷,最怕的就是因為錯批、漏批而影響到學生對錯題的覆盤。猿力科技的智慧批改系統,已經學習了海量青少年的書寫筆跡,進而能夠更準確地讀懂學生的答題字跡。
僅僅是批改還不夠,這套系統還擔當了錯題講解員的角色。根據上傳的作業,系統介面能夠即時出現批改結果,並提供智慧解析和影片講解。
在海外受歡迎,也是因為這款懂十幾種語言的系統,能解放多國教師的雙手。除了中文,英語、日語、葡萄牙語、西班牙語、法語、德語、俄語、越南語、印尼語、西班牙語等多種語言的作業,AI也果斷拿捏!
“文科教師”有道詞典筆,終於會講理綜題了
去年,網易有道就開始用自研教育大模型“子曰”,給詞典筆“換腦”。這次新推出的詞典筆X7,就注入了會做、且能分佈講解所有科目的能力。
相當於,曾經偏科語文和英語的有道詞典筆,終於換上了一顆全科教師的AI大腦。
使用方法也很簡單,只需要用機身掃過題目,詞典筆內建的AI攝像頭就能識別、讀取題目資訊。
相較於搜尋引擎或市面上其他直接給出答案的教育產品,X7的特點在於,內建了有道AI教學應用“小P”老師,強調了給孩子“講題”的能力。
比如,下圖中有關浮力的物理題,X7就分了兩步來講解。孩子如果有不懂的地方,還能用語音輸入相關疑問,如“為什麼排出水的重量就等於浮力?”
X7上也搭載了有道的AI虛擬人口語教練“Hi Echo”,孩子可以與虛擬人老師Echo進行英語口語的即時聯絡。釋出了一年的Hi Echo,也推出了語氣更可愛、更會誇誇的兒童版模式。
不過,2023年8月9日,有道才剛釋出搭載基礎AI學習功能的有道詞典筆X6 Pro。時隔不到一年,即便功能升級,X7還賣得動嗎?
網易有道工作人員告訴《智慧湧現》,消費電子市場正處於緩慢的恢復期,AI在商業化佈局上承擔的最重要角色,是拉新,而非帶動老使用者的換機。而且,家長們不希望孩子們天天玩手機,這也是購買新硬體的重要動力。
當然,產品的吸引力最終不僅在功能,還在價格——升級功能的X7定價為999元,和X6 Pro(售價1199)相比,加了量還減了價。
中科曙光:打造國產算力底座
中科曙光作為國產智算的領軍企業之一,打造了堅實的AI算力基礎設施,具備從底座、平臺、服務、生態到應用的全棧能力,致力打造新“智”生產力引擎。
其中的一大亮點是曙光人工智慧基礎軟體系統DAS,它由基礎運算元、框架工具和擴充套件元件三部分構成,同時下層依託基礎硬體系統及開發工具棧,上層支援廣泛AI應用,為使用者提供包括模型訓練、推理落地等全領域智慧計算服務,為大模型遷移和最佳化提供了新捷徑,幫助客戶更高效快速地實現AI技術的落地應用。
國產GPU:從千卡躍進萬卡大關
在通用顯示卡這一領域,國內少數或可從功能上對標英偉達的GPU晶片——摩爾線程,現已從千卡叢集,升級到萬卡叢集了。
摩爾線程釋出的萬卡叢集,叫誇娥(KUAE),能夠承載萬卡規模,具備萬P級浮點運算能力,能用來訓練萬億引數級別的複雜大模型。
對於顯示卡來說,多卡互聯可以拓展算力,那麼從千卡規模拓展到萬卡規模,算力便更上一個臺階。據介紹,構建萬卡叢集並非一萬張GPU卡的簡單堆疊,而是一項複雜的系統工程。
GPU數量越多,叢集算力越高。圖源:摩爾線程B站賬號
誇娥萬卡叢集很注重生態相容性,支援多種大模型架構,基於MUSA程式語言和完整相容CUDA能力,提供了生態適配工具。
而且,這個萬卡叢集還很穩定,平均無故障執行時間超過15天,最長可實現大模型穩定訓練30天以上,周均訓練有效率在99%以上。
AI+辦公:WPS AI伴寫
WPS Al是金山辦公旗下一款具備大語言模型能力的人工智慧應用,2023年11月開啟公測,錨定AIGC(內容創作)、Copilot(智慧助理)、Insight(知識洞察)三個戰略方向發展,支援文字、表格、PPT、PDF等主流辦公元件,提供快速起草文件、處理複雜函式公式、輔助閱讀長文字等AI功能。
WAIC展廳上,WPS AI又帶來了新的功能體驗——WPS AI伴寫。
在使用者寫作過程中,AI陪伴即時為使用者提供後文寫作建議,有效幫助使用者提升文稿質量,快速完稿。AI伴寫打破了常規大模型寫作中對話方塊的限制,且無需跳轉查詢,不會打斷使用者寫作思路,模仿使用者的文風,以AI寫作助手的身份猜測你想要表達的內容,從而寫出專屬於你的文案。
展臺工作人員介紹,本次WAIC展會WPS AI經過一年的摸索,將會全新發布4個AI辦公助手能力。
AI+播客:在喜馬拉雅聽見“AI”
喜馬拉雅並沒有親自下場做AI大模型,但成為了AI的內容平臺與流量池。
播客正逐步成為許多人獲知科技資訊、促進自我提升的重要渠道。根據最新發布的《2023喜馬拉雅中文播客生態報告》顯示,“前沿科技”類的播客內容佔據80後人群收聽榜的TOP1。
喜馬拉雅上,有各種圍繞AI的話題活動,如“2024年AI新趨勢”、“誰是AI時代的新霸主”、“個人如何把握AI新機遇”等,邀請經濟學家管清友、經濟學家向松祚、科普作家嚴伯鈞、科技作家塗子沛等知名主播發聲,與人民公園說AI、新商業相對論、科技行者等科技領域主播一起探討。
此外,喜馬拉雅上還有各種AI相關的專輯:《AI實踐真知課》、《山姆·奧特曼傳》、《晶片的未來》、《數字文明系列》、《“AI教母”李飛飛自傳》等。
獨家、深度、前瞻,為1%的人捕捉商業先機
36氪旗下精選公眾號