“蘿蔔快跑”被曝是真人在螢幕前操作；阿里雲宣佈與月之暗面“聯姻”；去哪兒宣佈每週兩天自選辦公地｜AI週報

整理 | 褚杏娟、趙明華

網友稱蘿蔔快跑其實有駕駛員人為干預；去哪兒員工每週兩天可自主選擇辦公地點；阿里雲宣佈與月之暗面“聯姻”；OpenAI 絕密專案「草莓」首次曝光；AMD 收購歐洲最大私人 AI 實驗室 Silo AI。

行業熱點

蘿蔔快跑訂單瘋漲，無人駕駛時代真的來了？

7 月 10 日，百度旗下自動駕駛出行服務平臺“蘿蔔快跑”登上微博熱搜榜首。據瞭解，蘿蔔快跑已在全國 11 個城市開放載人測試運營服務，在武漢、重慶、深圳、上海、北京等城市開展全無人自動駕駛出行服務與測試。

媒體報道稱，隨著百臺無人車的投入運營，“蘿蔔快跑”在武漢市全無人訂單量也迎來了爆發式增長，單日單車峰值超 20 單。資料顯示，蘿蔔快跑 APP 使用者滿意度評價達 4.9 分，其中 5 分滿分好評佔比高達 94.19%。此外，網路傳言稱，蘿蔔快跑已在武漢投放 1000 輛無人車，進而引發對網約車司機、計程車司機就業市場的深刻擔憂。

目前，蘿蔔快跑還面臨著安全與技術等方面的問題。有武漢網友 7 月 7 日下午在短影片平臺釋出影片，稱百度旗下的自動駕駛出行服務平臺“蘿蔔快跑”無人駕駛出租車在武漢街頭與行人相撞，影片中可以看到一個行人躺在出租車前，交警正在現場，事故造成了部分車輛擁堵。這件事故引出了一個亟待解決的問題：無人駕駛車應該如何定責。目前，我國還沒有建立一套完善的全國性法規，只有地方規定。此外，在長江網武漢市民留言板上，有關於“蘿蔔快跑”的留言，目前已累計達到 324 條。留言板多個內容顯示，蘿蔔快跑 Robotaxi 在道路上運營期間，出現車輛在綠燈狀態下停滯不前、紅燈時衝入路口中央、轉彎時卡頓不動等情況，並引發交通擁堵現象，對市民出行造成了一定影響。

針對此類現象，武漢經開區管委會回應稱：“確認涉訴車輛為自動駕駛測試車，正在除錯中。開發區交通大隊將定期與公司負責人溝通和反映問題，確保道路安全。”另外，近日還有網友在社交平臺稱，無人駕駛的蘿蔔快跑其實有駕駛員人為干預。網傳圖片顯示，在蘿蔔快跑汽車機器人智控中心，有真人坐在帶方向盤的螢幕前操作。百度方面截至發稿沒有回應。

據網信永川公眾號 2023 年 7 月釋出的內容，位於永川區大資料產業園的百度無人駕駛實驗基地內，有云代駕安全員在 5G 雲代駕艙進行遠端即時控制，透過高頻寬、低時延的 5G 網路，從螢幕組上觀察汽車周圍 360°狀況，並利用方向盤、檔把、腳踏板等控制器駕駛無人車輛。5G 雲代駕的意義在於，在無人車沒有安全員的情況下，當無人車出現解決不了的問題時，雲端安全員可以幫助其遠端脫困。

三星爆發大規模罷工，韓媒：半導體部門員工是罷工主力

據報道，韓國三星電子旗下最大工會“全國三星電子工會”於 8 日上午開始在京畿道華城市三星電子華城工廠正門前舉行罷工，計劃持續 3 天。該工會會員總數為 3 萬人，約佔三星電子員工總數（12.5 萬人）的 24%。據悉，在 8 日的罷工中，工會推算有 4000 至 5000 人參與，三星公司和警方則估計有 3000 人參加。

韓媒稱，這是三星電子成立 55 年來首次爆發大規模罷工。此前在 6 月初，工會部分成員曾利用休年假的形式罷工 1 天。工會此次提出的主要訴求有：全體工會成員薪酬上調、改變獎金標準、公司履行帶薪休假承諾，以及對因罷工導致的工資損失進行補償等。工會主席在接受採訪時還表示，公司不透明的獎金計算方式，導致員工對自身利益的不確定性增加；若公司在 10 日前未拿出解決方案，工會將於 15 日起進行第二階段的罷工。

韓國 SBS 電視臺稱，半導體部門的員工是此次罷工的主力。三星公司稱半導體生產線的執行沒有受到重大影響，但《東亞日報》報道稱，即使許多生產線實現了自動化，操作這些生產線的重要人員也很難替換。半導體生產線一旦停止運轉，恢復生產需要耗費大量時間和成本。

騰訊全員郵件宣佈調薪：員工月工資增加 3200 元等

7 月 10 日，騰訊內部向全員釋出郵件稱，將調整內部的薪酬福利政策，對薪酬結構做出調整。

校招生的房補從每月 4000 元調整為按 15 個月發放，並將其納入月薪基數中。調整後，員工每月基本工資增加 3200 元，多出來的三個月將在年終獎一起發放。根據資料，騰訊公司給校招生提供的房補標準為每月 4000 元（北上廣深地區為 2000 元），三年共計 14.4 萬元。
員工服務獎（13 薪）從年底發放調整為平攤到 12 個月，並加入月薪基數中。騰訊郵件中稱，這兩個舉措旨在幫助大家在更高、更穩定的月收入基礎上更安心地安排工作與生活。相關調整於 2024 年 7 月 1 日起生效，8 月 5 日的發薪中開始體現。

大模型人才緊缺，字節跳動加速爭奪全球高校頂尖技術人才

近日，字節跳動“筋斗雲人才計劃”啟動。該計劃是字節跳動面向優秀校園技術人才推出的專項招聘，意圖在全球範圍內，吸引和招募有志於用技術創造突破性價值的頂尖學生。

據悉，本次招聘涵蓋 AI 應用、搜尋、推薦、廣告、AI for Science、AI Safety、機器人、隱私與安全、硬體、影片架構、工程架構等技術領域。招聘的目標群體是 2024 年 9 月 -2025 年 8 月畢業的博士群體，重點針對有亮眼學術成果、擁有頂會頂刊論文或專利的學術達人；有豐富的大賽經歷，在國際知名競賽中取得優異成績的競賽達人；或有極強的實踐能力，參與過重大專案，擅長解決難題的實戰達人。

在大模型相關技術人才招聘上，字節跳動是國內網際網路大廠最積極的公司。據一位大模型行業人士透露，今年字節跳動的 AI 人才招聘規模最大。脈脈高聘人才智庫資料印證了這一資訊：今年上半年，字節跳動位列新發人工智慧崗位最多的企業。從招聘指數上看，字節跳動以 9.53 位居第一，大幅領先於小紅書（7.96）、螞蟻集團（5.84）、美團（4.86）、騰訊（2.48）等網際網路大廠。

去哪兒員工每週三、週五可自主選擇辦公地點

7 月 9 日，去哪兒 CEO 陳剛發全員信宣佈，從 7 月 15 日起，每週三、週五，員工可以靈活選擇辦公地點。陳剛在信中強調，員工按規定混合辦公，“無需任何申請審批”。

據瞭解，混合辦公的適用人員範圍以入職 6 個月以上的標準工時正式員工為主。

去年 10 月，去哪兒開始了為期 9 個月的混合辦公試驗。回收資料顯示，員工對混合辦公的各個維度反饋正面 —— 超過九成的員工認為混合辦公後幸福感有明顯提升，員工主動離職率在混合辦公後下降了三成。

去哪兒 COO（營運長）劉連春表示，“混合辦公沒有讓公司業績變壞，並且顯著提升了員工的幸福度。那這件事情公司何樂而不為呢？”

微軟要求中國區員工必須使用 iPhone？微軟回應

7 月 9 日訊息，據媒體報道，微軟中國員工已被告知，登入公司系統時必須使用 iPhone 進行身份驗證。從 9 月起，將禁止使用 Android 智慧手機作為多因素身份驗證裝置。

據介紹，此舉屬於微軟全球安全未來計劃的一部分，將影響中國大陸的數百名員工，旨在確保所有員工都使用微軟 Authenticator 密碼管理器和 Identity Pass 身份驗證應用。另有訊息顯示，由於部分中國安卓裝置不支援谷歌服務，微軟將為受影響員工提供 iPhone15 作為工作手機。

一位微軟發言人回應表示：「Microsoft Authenticator 和 Identity Pass 應用程式已正式在 Apple Store 和 Google Play Store 上架。我們希望為員工提供訪問這些必要應用程式的途徑，由於本地區無法使用 Google 移動服務，我們即向員工提供了例如 iOS 裝置的選擇。」

對此，不少網友稱，若是能配發工作機就沒問題。但若強制要求員工自行購買，則“不能接受”。

阿里雲宣佈與月之暗面“聯姻”：幫 Kimi 技術突破

7 月 8 日，阿里雲官宣兩位新“代言人”——月之暗面科技有限公司創始人楊植麟和智聯招聘集團總裁張月佳。

這是月之暗面首次公開與阿里雲的合作情況。資訊顯示，阿里雲的算力和大模型服務平臺，助力月之暗面提升模型推理效率，加速 Kimi 智慧助手實現技術突破。此外，智聯招聘集團的大模型應用，也基於阿里雲實現快速部署和上線支援。

AMD 重砸 6.65 億美元收購歐洲最大私人 AI 實驗室 Silo AI

AMD 宣佈以價值約 6.65 億美元的全先進交易價值收購歐洲最大的私人 AI 實驗室 Silo AI。該收購案預計在 2024 年下半年完成。

收購完成後，Silo AI 執行長兼聯合創始人 Peter Sarlin 將繼續領導 Silo AI 團隊，向 AMD 高階副總裁 Vamsi Boppana 彙報工作。

據瞭解，Silo AI 總部位於芬蘭赫爾辛基，業務遍及歐洲和北美，專注於端到端 AI 驅動解決方案，幫助客戶快速輕鬆地將 AI 整合到其產品、服務和運營中。他們的工作涉及不同的市場，客戶包括安聯、飛利浦、勞斯萊斯和聯合利華。除了 SiloGen 模型平臺外，Silo AI 還在 AMD 平臺上建立了最先進的開源多語言 LLM，例如 Poro 和 Viking。

AMD 在新聞稿中表示，此次收購代表該公司基於開放標準並與全球 AI 生態系統建立強有力的合作伙伴關係，並提供端到端 AI 解決方案的戰略又邁出了重要一步。Silo AI 團隊由世界一流的 AI 科學家和工程師組成，他們擁有豐富的經驗，為雲、嵌入式和終端計算市場的領先企業開發量身定製的 AI 模型、平臺和解決方案。

多方監管增壓，微軟放棄參與 OpenAI 董事會

7 月 10 日，據媒體報道，隨著歐美監管機構加強對人工智慧市場的反壟斷審查，微軟公司決定放棄在美國開放人工智慧研究中心 (OpenAI) 董事會中的觀察員席位。

微軟 9 日致函 OpenAI 說明上述決定，並解釋稱，OpenAI 自去年發生董事會人事震盪以來，經營管理已有改善，因此不再需要微軟參與。微軟選擇放棄觀察員席位，決定“立即生效”。

據報道，去年 OpenAI 執行長薩姆·奧爾特曼“離職又復職”風波過後，微軟在 OpenAI 董事會獲任無投票權觀察員。據此前報道，微軟支援並短暫聘用過奧爾特曼。

小紅書被曝獲 DST 投資，估值 170 億美元

7 月 11 日訊息，小紅書獲得了風險投資公司 DST Global 的支援。三位知情人士透露，小紅書在最近幾周進行了股份出售，公司估值達到 170 億美元。

DST Global 曾投資過 Facebook，並與紅杉中國一起參與了小紅書這一輪投資，紅杉中國增加了其現有股份。此外高瓴資本、博裕資本和中信資本也進行了跟投。

此前有訊息稱，小紅書在 2023 年首次實現盈利。據四位知情人士透露，小紅書去年淨利潤達 5 億美元，營收達 37 億美元。

大模型一週大事

大模型釋出

OpenAI 絕密專案「草莓」首次曝光，內部人士曾稱其可能威脅人類

7 月 13 日，據外媒報道，OpenAI 內部正在一個代號為「草莓（Strawberry）」的專案中開發一種新的人工智慧模型。該專案的細節此前從未被報道過，而 OpenAI 正努力證明其提供的各類模型能夠提供高階推理能力。

當被問及上述所說的草莓技術時，OpenAI 的發言人在一份宣告中表示：“我們希望自身 AI 模型能夠像我們（人類）一樣看待和理解世界。持續研究新的 AI 能力是業界的常見做法，大家都相信這些系統的推理能力會隨著時間的推移而提高。”

儘管發言人並未直接回應有關“草莓”專案的問題，但媒體報道指出，該專案之前被稱為 Q*，而 Q*正是去年導致 OpenAI CEO 被意外解僱的重要導火索。

OpenAI 的內部人士曾向董事會發出警告，稱 Q* 的重大發現可能對全人類構成威脅。

媒體推測，Q* 可能具備 GPT-4 所缺乏的基礎數學能力，這可能意味著它具有與人類智慧相媲美的推理能力。而這可能標誌著 OpenAI 在實現其 AGI 目標方面邁出了重要一步。

螞蟻集團開源 EchoMimic：支援為人像照片對口型、生成肖像動畫影片

近日，螞蟻集團推出了一項開源專案——EchoMimic，這款 AI 工具能夠根據聲音內容，為照片中的人物建立逼真的口型同步動畫。

EchoMimic 具備較高的穩定性和自然度，透過融合音訊和麵部標誌點（面部關鍵特徵和結構，通常位於眼、鼻、嘴等位置）的特徵，可生成更符合真實面部運動和表情變化的影片。

EchoMimic 的技術核心在於其能夠精確捕捉音訊訊號和麵部特徵之間的關聯，並以此為基礎生成動畫。在訓練過程中，EchoMimic 採用了先進的資料融合技術，確保了音訊和麵部特徵的有效整合，從而提高了動畫的穩定性和自然度。

經過與多個公共資料集和自收集資料集中的替代演算法進行的全面比較，EchoMimic 在定量和定性評估方面均展現出卓越的效能。這一點在 EchoMimic 專案頁面上的視覺化效果中得到了充分體現。

騰訊開源 web 端地圖元件庫 tlbs-map

7 月 11 日，騰訊開源了其基於騰訊位置服務 JavaScript API 封裝的地圖元件庫 —— tlbs-map，用於在網頁上繪製地圖，並在地圖上繪製點、線、面、熱力圖等效果。它支援 Vue2、Vue3、React 等主流技術棧，可以幫助開發者降低地圖開發的成本。

據官方介紹，tlbs-map 封裝騰訊地圖 API 為響應式元件，無需關心複雜的地圖 API，只需要操作資料即可；同時，元件提供地圖和圖層例項，使用者可編寫自定義元件或直接呼叫地圖 API 滿足定製化需求。

為了方便開發者使用，tlbs-map 還提供了詳盡的元件使用文件和示例程式碼，可以幫助開發者輕鬆上手，快速開發。

智譜 AI 開源推出影片理解模型 CogVLM2-Video

7 月 12 日，智譜 AI 提出了一種基於視覺模型的自動時間定位資料構建方法，生成了 3 萬條與時間相關的影片問答資料。基於這個新資料集和現有的開放領域問答資料，引入了多幀影片影像和時間戳作為編碼器輸入，訓練了一種新的影片理解模型—CogVLM2-Video。

智譜 AI 表示，目前影片理解的主流方法使模型失去了時間感知能力，無法準確地將影片幀與精確的時間戳關聯起來。因此，模型缺乏時間定位、時間戳檢測和總結關鍵時刻的能力。為了解決這些問題，團隊提出了 CogVLM2-Video，這是基於 CogVLM2 影像理解模型的擴充套件影片模型。

該模型不僅在開放域問答中實現了先進的效能，還能感知影片中的時間戳資訊，從而實現時間定位和相關問答。

具體來說，這種方法就是從輸入影片片段中提取幀，併為其註釋時間戳資訊，使後續的語言模型能夠準確知道每一幀在原影片中對應的確切時間。

幾分鐘生成四維內容，還能控制運動效果：北大、密歇根提出 DG4D

近期，商湯科技 – 南洋理工大學聯合 AI 研究中心 S-Lab ，上海人工智慧實驗室，北京大學與密歇根大學聯合提出 DreamGaussian4D（DG4D），透過結合空間變換的顯式建模與靜態 3D Gaussian Splatting（GS）技術實現高效四維內容生成。

據悉，四維內容生成近來取得了顯著進展，但是現有方法存在最佳化時間長、運動控制能力差、細節質量低等問題。DG4D 提出了一個包含兩個主要模組的整體框架：1）影像到 4D GS ；團隊使用 DreamGaussianHD 生成靜態 3D GS，接著基於 HexPlane 生成基於高斯形變的動態生成；2）影片到影片紋理細化；團隊透過細化生成 UV 空間紋理對映，並透過使用預訓練的影像到影片擴散模型增強其時間一致性。

值得注意的是，DG4D 將四維內容生成的最佳化時間從幾小時縮短到幾分鐘，允許視覺上控制生成的三維運動，並支援生成可以在三維引擎中真實渲染的動畫網格模型。

企業應用

7 月 10 日，谷歌宣佈將於本月底向所有谷歌賬號使用者開放「暗網報告」功能，旨在幫助使用者快速瞭解網路上發生的個人資料洩露事件，並提供相關漏洞資訊的搜尋服務。
7 月 10 日，阿里推出專為科研人員、高校教師和學生、職場人士研發的大模型應用產品心流，其產品定位為使用者的 AI 搜尋助手，提供智慧搜尋、知識問答、智慧閱讀、輔助創作等能力。
7 月 10 日，夸克宣佈升級“超級搜尋框”，推出以 AI 搜尋為中心的一站式 AI 服務，為使用者提供從檢索、創作、總結，到編輯、儲存、分享的一體化資訊服務價值。
7 月 11 日，三星表示將在今年推出基於自己人工智慧（AI）模型的升級版語音助手 Bixby，據悉，這次 Bixby 的升級是三星在其裝置套件上推廣人工智慧功能的一部分。
7 月 12 日，粉筆釋出了基於首個專注於職教行業的垂域大模型 AI 產品——粉筆 AI 老師 “粉筆頭”，旨在讓 AI 幫助老師化身“高效能人士”，向學員提供更有針對性的服務。

內容推薦

AIGC技術正以驚人的速度重塑著創新的邊界，InfoQ 首期《大模型領航者AIGC實踐案例集錦》電子書，深度對話30位國內頂尖大模型專家，洞悉大模型技術前沿與未來趨勢，精選10餘個行業一線實踐案例，全面展示大模型在多個垂直行業的應用成果，同時，揭秘全球熱門大模型效果，為創業者、開發者提供決策支援和選型參考。關注「AI前線」，回覆「領航者」免費獲取電子書。