
要聞提示


1.臺積電被曝將應美國要求,從 11 月 11 日起停止向中國大陸供貨先進 AI 晶片
2.月之暗面創始人被前公司投資人提起仲裁,受理律師回應將提出抗辯
3.位元組豆包通用影像編輯模型 SeedEdit 開啟測試,使用者可一句話輕鬆改圖
4.OpenAI 帶飛兩家 AI 創企,先後拿下 20 億估值
5.OpenAI 下一代大模型 Orion 被曝效能提升有限
今日頭條


據外媒報道稱,美國已要求臺積電從 11 月 11 日開始,停止向中國大陸客戶運送常用於人工智慧(AI)應用領域的先進晶片。知情人士稱,美國商務部致函臺積電,對出口到中國大陸的某些 7 奈米或更先進設計的精密晶片實施出口限制,這些晶片用於驅動 AI 加速器和圖形處理器(GPU)。
英國《金融時報》近日也援引三名知情人士報道了類似訊息,其中兩名知情人士甚至還稱,臺積電未來向中國大陸客戶供應任何此類半導體都將由華盛頓方面批准。
對此訊息,美國商務部拒絕置評。而臺積電方面的一名發言人也拒絕置評,並聲稱“臺積電是一家守法的公司,我們承諾遵守所有適用規章制度,包括適用的出口管控”。
2022 年 10 月,美國政府就已實施了一系列 AI 晶片出口限制措施,向英偉達和 AMD 發出了所謂“知會函”。後來,英偉達由於無法向中國市場提供 A100 和 H100 人工智慧處理器,專門為中國市場特供 A800 和 H800 晶片,以繞開美國政府的管制並符合規定。此外,美國政府還向科林研發(Lam Research)、應用材料(Applied Materials)和科磊(KLA)等晶片裝置製造商發出信函,限制其向中國出口製造先進晶片的工具。這些信件中的限制措施,後來變成了適用於其他公司的種種規定。
《金融時報》則提到,此番報道中的“臺積電收緊規定”,可能會影響中國科技巨頭們施展其抱負雄心,這些中企已經在為其 AI 雲服務設計半導體方面投入巨資,而越來越多的 AI 晶片設計初創公司也已轉向臺積電尋求製造支援。(觀察者網)
國內資訊


11 月 11 日訊息,月之暗面創始人楊植麟、聯合創始人兼 CTO 張宇韜被前公司迴圈智慧時期的投資人在中國香港提起仲裁,相關電子仲裁申請書也已遞交 HKIAC(香港國際仲裁中心)。對此,銘德律師事務所資深合夥人 David Morrison 律師回應稱:“我們認為該事項既缺乏法律依據,也不具備事實基礎,本所將依法提出抗辯。”
另據援引知情人士稱,本次仲裁的申請方,來自迴圈智慧以及迴圈智慧 7 家投資方中的 5 家:金沙江創投、靖亞資本、博裕資本、華山資本和萬物資本。上述知情人士表示,此次仲裁申請可能緣起於,在尚未拿到來自迴圈智慧的幾個投資方(金沙江創投、萬物資本、靖亞資本、華山資本和博裕資本)的同意豁免書之前,楊植麟和張宇韜等人就已啟動融資並創立月之暗面。
月之暗面是國內大模型獨角獸、Kimi 智慧助手開發公司,已獲得阿里巴巴等巨頭投資。該公司於 2023 年 3 月創立,2023 年 10 月推出全球首個支援輸入 20 萬漢字的智慧助手產品 Kimi。創始團隊核心成員參與了 Google Gemini、Google Bard、盤古 NLP、悟道等多個大模型的研發。(IT之家)
11月12日訊息,據報道,力帆科技(集團)股份有限公司(力帆科技)11日下午釋出公告稱:選舉曠視科技聯合創始人、CEO印奇為公司第六屆董事會董事長,任期自本次董事會審議透過之日起至第六屆董事會屆滿之日止。
隨著印奇成為力帆科技董事長,AI獨角獸公司曠視科技科創板IPO之路或將中止。曠視科技自2019年謀求赴港上市未果;其後轉戰科創板IPO,迄今已有1340天。而北京曠視科技有限公司(曠視科技)法定代表人已從印奇更換為唐文斌,因此這意味著唐文斌或將成為曠視科技董事長、法定代表人。
印奇於1988年1月出生。清華大學計算機科學實驗班(“姚班”)計算機科學學士學位,哥倫比亞大學計算機科學(智慧感測)碩士學位。2011年,印奇與唐文斌、楊沐三位清華大學計算機科學實驗班人才,創立了中國AI公司曠視科技。
其中,印奇擔任公司執行董事、董事長、執行長。他還曾擔任第28屆中國青年五四獎章獲得者,曾連續三年入選《財富》“中國40位40歲以下的商界精英”,福布斯亞洲30U30青年領袖。
成立至今,曠視共完成9輪融資,從資本市場上拿到了近100億元人民幣,估值超過300億元。其中,螞蟻集團為曠視大股東(15.08%),與淘寶共同持有29.41%的股份。(鈦媒體)
11 月 11 日,位元組在豆包大模型團隊官網上公佈最新通用影像編輯模型 SeedEdit。SeedEdit 支援一句話輕鬆改圖,包括修圖、換裝、美化、轉化風格、在指定區域新增刪除元素等各類編輯操作,透過簡單的自然語言即可驅動模型編輯任意影像。
目前,該模型已經在豆包 PC 端及即夢網頁端開啟測試。使用者可以在豆包生成圖片後,點選繼續編輯按鈕,輸入簡單的文字指令對圖片背景或主體進行輕鬆調整,實現一句話改圖。此外,使用者也可以嘗試在豆包 PC 或即夢的影像生成功能中自行上傳參考圖並進行二次加工。
據介紹,在模型資料生產中, SeedEdit 針對資料稀缺問題, 重新設計模型架構,並且採用多模型,多尺度,和多標準的資料製造方案很大程度上解決了資料量,資料多樣性和資料質量的問題。作為一款專為影像編輯任務設計的模型,SeedEdit 在通用性、可控性、高質量等方面取得了一定突破。(品玩快訊)

據斯坦福官方訊息,李飛飛與吳佳俊團隊聯手,推出一個用於一小時影片語言理解的基準資料集,名為 HourVideo。
據悉該資料集由一個新穎的任務套件組成,包括總結、感知(回憶、跟蹤)、視覺推理(空間、時間、預測、因果、反事實)和導航(房間到房間、物件檢索)任務。HourVideo 包含來自 Ego4D 資料集的 500 個人工策劃的自我中心影片,時間跨度從 20 分鐘到 120 分鐘不等,包含 12,976 道高質量的五向選擇題。
基準測試結果表明,包括 GPT-4 和 LLaVA-NeXT 在內的多模態模型與隨機機率相比取得了微弱的進步。與此形成鮮明對比的是,人類專家的表現明顯優於最先進的長語境多模態模型 Gemini Pro 1.5(85.0% vs. 37.3%),凸顯了多模態能力的巨大差距。(品玩快訊)
百度 AI 旗下的文心一言 AI 繪畫技術迎來了重大升級,這項技術現在支援一鍵生成多比例圖片,極大地簡化了新媒體配圖的流程。
文心一言 AI 繪畫技術的專業版允許使用者輸入所需的圖片比例,系統便能自動生成多尺寸圖片,覆蓋橫寬比 2 倍以內的各種需求。例如,只需在提示詞中加入“3:4”的比例詞,系統就能生成相應尺寸的圖片。文心一言智慧生圖現在能夠繪製任意風格,包括國潮精緻風、商務精英局以及寫實人像照等多種風格。使用者只需輸入具體的描述,系統便能生成具有高階質感、細節豐富的圖片。這一技術的進步,使得文心一言 AI 繪畫技術在語義理解、視覺效果和細節刻畫上都有了顯著提升。
此外,文心一言 AI 繪畫技術還支援參考圖生成圖片,使得人物生成更美觀,畫面生成更精準。使用者可以根據自己的需求,新增模特或者調整風格,以滿足不同的內容創作需求。(AIBase基地)

11 月 11 日訊息,AI 醫療和腦科學公司杭州虛之實科技有限公司(簡稱“虛之實科技”)宣佈完成 A 輪融資。據悉,本輪融資由星陀資本領投,AIalpha Ventures 等參與跟投,融資規模數千萬元。虛之實科技稱,公司本輪融資將主要用於加速國內及海外醫療產品研發、C端及專家市場團隊的建設。
虛之實科技是一家 AI 醫療和腦科學公司,其率先將數字技術用於各類腦疾病治療,目前已經獲評專精特新和高新技術企業。公司擁有包括腦科學、人工智慧、醫學、生物工程學、虛擬現實等多個前沿領域的海內外頂尖人才。透過多年努力,虛之實科技已經構建起覆蓋精神科、神經內科、兒科、康復科、心理科等多個領域的產品體系,並在國內二十餘個省市實現近 500 家醫院落地,服務患者超過百萬人次。(投資界)
AI 口語學習軟體“可栗口語”近日宣佈完成數百萬元天使輪融資,投資方為嘉程資本和源合資本,本輪及後續融資由源合資本擔任獨家財務顧問。此次融資資金,將主要用於團隊擴充套件、核心技術研發和市場推廣。
可栗口語成立於 2023 年,致力於透過個性化 AI 學習方案,為使用者提供高效的英語口語提升體驗。其 CEO 兼創始人周樹帆曾在微軟網際網路工程院擔任演算法工程師,在深度學習、自然語言處理、多語言模型等領域具備豐富經驗。
周樹帆表示,透過與 AI 對話,使用者可以降低語言學習過程中的心理負擔。同時,AI 還能根據使用者的發音、語法、詞彙量和表達習慣等方面提供精準的個性化反饋,提升學習的實用性與效率。周樹帆還表示,可栗口語將持續迭代升級其 AI 能力,為使用者提供更精準和個性化的學習內容。使用者群體也將逐步擴充套件,滿足更廣泛的學習需求。(36氪)

11 月 11 日訊息,閃極科技宣佈潘欣正式加入閃極,出任閃極科技合夥人,領導 AI 相關技術研發。據瞭解,2015 年,潘欣作為 Google Brain 的首位研究軟體工程師加入該團隊。回國後,他先後在百度、騰訊與字節跳動擔任要職,分別構建了無量深度學習框架和推動 AIGC 與視覺大模型平臺的開發。
公開資訊顯示,消費類充電和儲能產品公司閃極科技成立於 2020 年,旗下核心產品為氮化鎵潮玩快充充電器、隨行充電寶、固態硬碟等。2021 年閃極科技完成數千萬人民幣天使輪融資,投資方為光速光合。(鈦媒體APP)
上海人工智慧實驗室等聯合提出了一種即插即用的框架——SearchLVLMs。該框架可以在推理階段對大模型進行網際網路檢索增強,使其無需微調就能對即時資訊做出準確反饋。
SearchLVLMs 框架主要由三部分組成:查詢生成、搜尋引擎呼叫和分層過濾。以視覺問答為例,框架會基於問題和圖片生成查詢關鍵詞,調用搜索引擎查詢相關資訊,再透過多層過濾得到有用的資訊,最終以提示的形式提供給大模型。
實驗結果顯示,配備 SearchLVLMs 的模型在 UDK-VQA 資料集上的回答準確率比自帶網際網路檢索增強的 GPT-4o 模型高出 35% 。此外,SearchLVLMs 在多種模型上均能帶來顯著的效能提升。(新智訊)
11 月 11 日訊息,柯南(廣東橫琴)智慧科技有限公司(以下簡稱“柯南 AI ”)近日完成數百萬元天使+輪融資,投資方為太和資本,華峰資本擔任長期戰略財務顧問,本輪融資資金將用於產品生產製造、供應鏈最佳化、市場推廣以及加強 AI 產品演算法、算力的建設。
“柯南 AI ”成立於 2024 年,專注研發 AI+兒童教育產品,定位 AI 賦能方案商。有別於傳統 AI+ 教育產品的“機械教育”,“柯南 AI ”聚焦於讓孩子瞭解和使用 AI,培養孩子的想象力,以適應時代的變革。(投資界)

近日,天億馬在互動平臺表示,目前人工智慧技術已廣泛應用於公司提供的智慧政務等多個領域的綜合解決方案或產品中,包括 NLP 自然語言處理、影像識別、語音識別,人臉識別等;在大語言模型方面,公司接入百度,阿里,chatgpt 等通用大模型進行測試與研發,後續將為政務方向等垂直領域大模型做充分的準備。未來,隨著公司業務的發展,搭載人工智慧的公司產品或系統解決方案將在智慧交通、智慧企業等其他業務領域廣泛使用。(財聯社)

國際資訊


近期,OpenAI 投資的兩家 AI 創業 Anysphere 和 Mercor 均在推進超過 20 億美元估值的新一輪融資。
Anysphere 主要研發了 AI 編碼助手 Cursor,可以將開發人員的整個程式碼庫知識融入其建議,OpenAI 曾為 Cursor 提供部分技術支援。目前,該公司已收到投資邀約,估值約為 25 億美元。OpenAI 以及其投資方 Andreessen Horowitz 和 Thrive Capital Anysphere 同樣為 Anysphere 參與過該公司的融資。並且,OpenAI 聯合創始人、剛加入 Anthropic 公司的 John Schulman 同樣也是該公司的投資者。
而另一家創企,AI 人力資源管理公司 Mercor 也正和投資者談論了以高達 20 億美元的估值,籌集至少 1 億美元融資。Mercor 成立於兩年前,主要透過人工智慧來面試和篩選候選人。據 Mercor 網站稱,該公司的市場註冊員工超過 30 萬,其中包括谷歌和亞馬遜的前工程師。同時,Mercor 還是 OpenAI、Meta 的承包商,幫助其尋找 AI 開發人員,以評估其 AI 模型。(矽兔君)
據傳,iPhone 使用者有望以全新的方式與谷歌 AI 助手 Gemini 互動。此前,iPhone 使用者只能透過谷歌應用中的特定標籤訪問 Gemini。而現在,谷歌正在蘋果 App Store 上測試一款獨立的“ Google Gemini ”應用程式,該應用將提供更多 AI 功能。
這款獨立的 Google Gemini 應用包含了一個名為 Gemini Live 的功能,該功能允許使用者透過語音命令與 AI 進行對話,也是目前 iOS 上無法使用的功能之一 ,該功能自 2024 年 9 月起可供 Android 使用者使用。
由於谷歌尚未正式宣佈 iOS 版 Google Gemini 應用,因此尚不清楚應用何時正式上線。(IT之家)

11 月 11 日訊息,據外媒報道,OpenAI 即將推出的下一代大語言模型 Orion 的效能提升有限,不如前幾代產品進步巨大。
據報道,OpenAI 目前已經完成了 Orion 的20%訓練工作,其表現接近GPT-4。雖然 Orion 在語言任務中表現出色,但在編碼方面表現平平且存在執行成本過高的問題。
但也有 OpenAI 的員工指出,Orion 部分接受了 AI 生成的資料訓練,這可能導致其效能與舊模型相似。(品玩快訊)
NVIDIA 近日對外發布全新的 AI 影片搜尋與摘要藍圖( AI Blueprint for Video Search and Summarization ),這一技術方案將徹底改變傳統影片分析的侷限性。不同於過去僅能識別預設物件的固定模型,新方案透過結合生成式 AI 、視覺語言模型( VLM )和大語言模型( LLM ),實現了對影片內容的深度理解和自然互動。
這套系統建立在 NVIDIA NIM 微服務架構之上,核心優勢在於其強大的影片理解能力。透過將影片分段處理、密集描述生成和知識圖譜構建等技術有機結合,系統可以準確理解和分析超長影片內容。使用者可以透過簡單的 REST API 介面,實現影片摘要生成、互動問答,以及對即時影片流進行自定義事件監控。
目前,NVIDIA 已開放該技術方案的早期訪問申請。開發者可以透過 NVIDIA 提供的 API 目錄選擇合適的模型,既可以使用 NVIDIA 託管的服務,也可以選擇本地部署方案。(AIBase基地)
近期,Anthropic 推出了全新的 token 計數 API,旨在提供更深入的令牌使用洞察,從而提升與語言模型的互動效率和控制能力。
Anthropic 的 token 計數 API 使得開發者能夠在不直接呼叫 Claude 模型的情況下進行令牌計數。該 API 可以測量提示和響應的 token 數,且在計算資源的消耗上更加高效。這種預先的估算功能使得開發者能夠在發起實際的 API 呼叫之前,對提示內容進行調整,從而最佳化開發過程。
目前,該 token 計數 API 支援多種 Claude 模型,包括 Claude3.5Sonnet、Claude3.5Haiku、Claude3Haiku 和 Claude3Opus。開發者可以透過簡潔的程式碼呼叫 API 來獲取 token 的數量,無論是使用 Python 還是 Typescript,都可以輕鬆實現。(AIBase基地)

Salesforce 近日宣佈,計劃在未來招聘超過 1000 名員工,以支援其新推出的生成性 AI 代理產品“ Agentforce ”的銷售。這款產品能夠在無人監督的情況下完成客戶支援和銷售開發任務,初步定價為每次對話 2 美元。
執行長馬克·貝尼奧夫表示,此次招聘是為了充分利用“ Agentforce ”帶來的“巨大動力”。這款產品自兩週前釋出以來,已經收到了客戶的熱烈反饋。作為全球最大的客戶關係管理軟體供應商,Salesforce 在今年對其 AI 戰略進行了重大調整,專注於開發能夠獨立完成任務的智慧代理。(新智訊)

近日,Suno 公司釋出了其最新的 v4 音樂生成模型的音訊樣本。這些演示音訊展現了與之前版本相比,音質、音色多樣性和一致性都有了顯著提升。
Suno 的 v4 模型透過深度學習技術對大量音樂資料進行訓練,旨在生成更自然、更豐富的音樂作品。與以往版本相比,v4 模型在音訊合成方面的表現更為出色,能產生更具表現力的樂曲,增強了音樂的情感表達。聽眾在試聽樣本時,能夠明顯感受到音質的細膩程度和旋律的流暢性,給人以耳目一新的體驗。
透過對不同風格和流派的音樂資料進行學習,v4 模型能夠生成多種風格的音樂,滿足不同聽眾的需求。此外,模型在保持音樂一致性方面也有所改進,無論是在旋律、節奏還是和聲方面,v4 都能夠保持高度的協調性。(站長之家)
11 月 11 日訊息,美國公司正大手筆投資資料中心,力圖在人工智慧領域中搶佔先機。根據最新的美國人口普查局資料,美國私人資料中心的建設開支已激增至每年近 300 億美元(當前約 2153.32 億元人民幣),是 2022 年底 OpenAI 推出 ChatGPT 時支出的兩倍以上。
金管理公司 KKR 的資料稱,美國“引領著資料中心投資的浪潮”,全球相關支出預計將達到每年 2500 億美元(當前約 1.79 萬億元人民幣)。目前,資料中心行業受益於 AI 的發展,對更強大計算能力的需求正在持續增長。
此外,資料中心還需要大量電力,這引發了人們對科技巨頭或將要求更多發電份額的擔憂,且可能推高家庭及其他企業的用電成本。上週,美國主要能源監管機構否決了一項特別協議,該協議原本允許亞馬遜公司的一個數據中心從鄰近的核電站獲取更多電力。(IT之家)

麻省理工學院的最新研究揭示,儘管生成式 AI 模型(如 transformer 模型)在導航等特定任務中表現出色,但它們並未真正形成對城市結構的連貫理解。研究發現,生成式 AI 能夠提供近乎完美的逐步導航,但一旦地圖發生細微變化,如關閉某些街道,模型準確率會大幅下降。
這表明,AI 模型生成的城市地圖其實是“虛構的”,並未真正掌握現實中的地理結構。研究顯示,當前生成式 AI 對世界的“理解”並不連貫,這在實際應用中可能引發問題。(大G.AI商業)
11 月 11 日訊息,Near Protocol 推出了一款新的 alpha 級跨鏈 AI 代理,可以在幾秒鐘內啟動 Meme 幣,並透過網路搜尋以法定貨幣購買產品。即將推出的附加功能預計將使使用者能夠在 Web2 網站上預訂航班或訂購外賣。
Near 的 AI 助手在當前 AI 代理中的獨特之處在於鏈式抽象技術,該技術使使用者只需簽署交易即可將任何資產交換為任何其他資產。這款名為 Near Intents 的產品目前處於測試階段,且有交易限制,目前支援比特幣、以太坊、Arbitrum、Base 和 Near Protocol 之間的原生資產交換。(PANews)

今日熱門影片


更多內容,點選下方關注:
