三位哈佛00後聯手創業，7個月拿下億元估值

👆關注的人，領先不止一步👆

作者 | Xuushan，編輯｜Evan

“

成立不到7月，估值已過億。

”

前有三位90後創辦的Cohere估值衝向360億美元，後有95後郭文景創辦的Pika拿到55億美元估值。很顯然，矽谷裡的AI創業潮正在影響所有人，00後Leonard Tang也是被裹挾進去的萬分之一。

Leonard Tang是AI安全創企 Haize Labs的創始人兼CEO，也是今年哈佛大學本科畢業生。

他創辦的Haize Labs透過一段影片展示了AI大模型安全防線的“脆弱”。只需短短幾行提示，就能繞過大模型的安全限制，從而讓AI大模型生成大量的色情文字、血腥圖片等，甚至可以自動攻擊其他網路。

目前，Haize Labs主要透過其打造的首款AI產品——自動化套件Haizing。該套件主要透過攻擊AI大模型進行壓力測試，以發現AI大模型的安全漏洞。據外媒winbuzzer報道，明星AI創企Anthropic、Scale AI均是其客戶。

Haize Labs成立於2023年12月，在成立不到7個月的時間裡，Haize Labs就收到至少四份投資意向書，知名基金Coatue也參與其中。知情人士透露，Haize Labs已經獲得了General Catalyst領投的最新投資，估值達到1億美元。

在短短1-2輪融資中就獲得高額估值，這般融資速度和規模業內都少見。一方面可以看出，投資者對Haize Labs信心十足，另一方面也顯示了AI安全賽道的潛力。

國際調研機構CB Insight報告顯示，機器學習安全市場（MLSec）正快速增長。2023年AI安全創企投融資總額高達2.13億美元，遠超於2022年的7000萬美元。

據矽兔賽跑不完全統計，2024年，北美已經出現了至少5家AI安全獨角獸，至少39家AI安全創企獲得新融資，累計融資達8億美元。

“目前AI大模型安全領域還是空白的創業藍海市場。”一位投資人士說。

隨著AI攻擊、AI大模型越獄事件不斷發生，人們對AI失控的風險擔憂日益增加。Haize Labs以AI越獄為切入口，以AI大模型安全為抓手，投身入局。

三位哈佛應屆生

瞄準AI“越獄”

“每個人都對大模型越獄行為視而不見。”

Leonard Tang在接受媒體採訪時提到，這也成為了他和兩位朋友Richard Liu、Steve Li一起創辦Haize Labs契機。

據VentureBeat報道，Leonard Tang如今暫停了斯坦福大學博士課程的第一年學業，專注於Haize的發展。Richard Liu、Steve Li則兼顧學業，成為了伯克利人工智慧研究實驗室的本科研究員。

Haize Labs的創始人、CEO Leonard Tang告訴VentureBeat，Haize Labs其實是自己本科階段有關對抗性攻擊和大模型穩健性研究的商業化成果。大學期間，他主修了數學和計算機科學兩大專業課程。

AI直譯，圖源官網

Leonard Tang第一次對LLM（大語言模型）模型越獄產生興趣大約是在兩年前，當時他嘗試透過對影像分類器進行對抗性攻擊，繞過Twitter的NSFW（Not Safe For Work）過濾器，該工具專門過濾一些不適宜在工作場合檢視的內容。

隨後，他發現AI浪潮中似乎每個人都對大模型越獄行為視而不見，於是受到啟發著手專注AI可靠性和安全性的研究。

今年4月，他在Github上發表了一篇有關《如何輕鬆越獄Llama3》的論文。論文指出，Llama 3這類大語言模型缺乏自我反省的能力，一旦被誘導，大模型也不知道自己輸出的文字是什麼意思。

從其哈佛網站的個人主頁來看，Leonard Tang在大學期間的經歷豐富多彩。除了學業上對LLM模型廣泛研究，他還擁有在多家AI大廠實習的經驗，比如說在英偉達MagLev的ML基礎工程實習生，參與到自動駕駛汽車研究。再比如說，作為亞馬遜SDE實習生，從事大資料供應鏈物流工作。

另外兩位聯合創始人Richard Liu和Steve Li同樣是AI領域的研究員。Steve Li是哈佛大學計算機科學專業的大四學生，主要專注人工智慧安全、語音處理、作業系統和機器學習系統的研究。他曾在Roblox的使用者安全團隊實習，參與到報告功能和 ML分類管道的工作中。

AI直譯，圖源官網

背靠哈佛，衝向矽谷。他們還獲得了一些顧問和天使投資者的支援，建立自己的人脈圈。這其中包括卡內基梅隆大學和哈佛大學的教授、Okta、HuggingFace、Weights and Biases、Replit 的創始人，以及谷歌、Netflix、Stripe、Anduril 等公司的人工智慧和安全高管。Graham Neubig等顧問為Haize Labs 提供 LLM 評估方面的專業知識

業內的AI越獄大神@Pliny the Prompter也是Hazie的朋友和合作方。@Pliny the Prompter以可以迅速攻破Llama 3.1、GPT-4o的安全防線而聞名，他曾表示只需要30分鐘左右的時間，就能破解世界上最強大的人工智慧模型。

可以看出，Haize Labs已經在AI大模型安全領域建立了一定初步影響力，並且有了自己的關係網路，推動相關合作。

傳統審查機制不適用AI大模型

最開始，Haize Labs測試了當下許多知名的生成式AI程式、像是AI影片Pika、ChatGPT、影像生成器DALL-E等等。他們發現許多知名工具都會產生暴力或色情內容，甚至會指導使用者生產生化武器，並允許自動進行網路攻擊。

這是因為傳統審查如基於人工審查、關鍵詞過濾等方法去檢驗大模型輸出內容不精確。

因為AI大模型通常基於深度學習和大量資料訓練，其決策過程可能不透明，這種“黑箱”特性使得傳統審查難以控制潛在的風險。

同時，AI大模型能夠不斷學習和適應新的資料，其輸出可能隨著時間和輸入的變化而變化。傳統審查機制往往靜態和滯後，難以跟上AI大模型的動態變化。

此外，AI大模型可以處理和分析大量資料，生成內容的速度、新的表達方式和內容，都有可能會遠超於傳統審查機制的預期。

這也導致了無論是OpenAI審查工具Moderation API、谷歌的過濾模型Perspective API，還是Meta的保護模型Llama Guard，效能表現效果都很差。

AI直譯，圖源官網

Hazie對各大AI模型進行越獄測試時，發現Anthropic旗下Claude模型的安全性表現較好，而像Vicuna和Mistral這類沒有明確執行安全微調的模型很容易進行越獄操作。

面對越獄合法性的質疑，Haize Labs表示他們更希望主動出擊，才能提供防禦性解決方案，預防此類事件發生。

拿下Anthropic、Scale AI 訂單

Haize商業化程序迅速

俗語道，不打不相識。

有意思的是，不少曾被攻擊過的機構、模型公司並沒有起訴Haize，反而還成為了合作伙伴。

如今，Haize Labs的客戶有AI愛好者、政府的附屬機構、模型供應商等。

Haize Labs和AI大模型創企Anthropic達成了3萬美元試點合作、與AI創企AI21簽約了五位數的協議，並且還與AI模型平臺Hugging Face、英國人工智慧安全研究所（AISI）和 AI工程聯盟MLCommons達成合作。

不僅如此，Haize Labs與Scale AI簽署了50萬美元意向書，目標是對醫療保健和金融領域的LLM進行特定領域的壓力測試，每次更新時都會重新評估模型以保持穩健性。

Haize Labs打造的Haizing套件是一套搜尋和最佳化演算法，結合了模糊測試和紅隊測試技術，可以較為全面的檢查AI系統。該產品主要在開發階段誘導大模型出現幻覺，進行壓力測試，從而更好提醒開發者安全漏洞的問題。

“只有透過嚴格、可擴充套件且自動地測試您的模型以瞭解其所有極端情況和弱點，客戶才能開始修復這些弱點。”Leonard Tang說。

Haizing Suite升級了多種演算法，使用強化學習等技術檢測有害內容輸入。它利用各種測試場景來發現潛在的問題點，並且透過反向定義不良行為為行動指導。

該套件擁有免費版和商業版，其中免費版需要申請，商業版則是Hazie的主要盈利來源。Haizing套件商業版，將為基礎模型服務商和應用程式層的客戶提供CI/CD haizing和執行時防禦解決方案。

AI大模型的巨頭們也注意到AI大模型越獄安全性問題，並先後提醒人們注意。

OpenAI也曾邀請各領域專家透過對抗性方式幫助提高模型的安全性和可靠性，也就是招募“紅隊隊員”

微軟詳細介紹了一種名為“Skeleton Key”的越獄技術，使用者透過誘導的方式，繞過大模型的安全機制並讓模型認為，自己輸出的內容是在“合法範圍”之內。

Anthropic則發現隨著視窗長度的不斷增加，大模型的“越獄”現象開始死灰復燃。“現在是時候努力減小大模型越獄的潛在風險了，否則它們可能造成嚴重危害。”Anthropic在公告中說道。

在大模型快速發展的今天，安全一直成為人們繞不開的話題。

現階段，AI激進派與AI保守派各執一詞，以自己的準繩預測著AI大模型安全的風險值。前不久，馬斯克的AI大模型 Grok 2.0正在以無所限制地生成AI內容，挑戰著使用者的敏感神經。AI激進派認為如果對AI越獄行為進行全面封鎖，或許會阻礙AI大模型的靈活性和響應能力。

Haize則是透過自動化各種不同型別的攻擊，測試各個AI大模型的安全漏洞，試圖為AI大模型建立更穩固的防線。

但同時，我們也能看到各大AI大模型廠商已經開始對AI越獄行為進一步防守。若是Haize的成長僅侷限於AI越獄方向，業務方向似乎較為單一，也難以支撐後續發展。

文末互動：

你看好Haize Labs嗎？

評論區告訴我們你的看法哦～

別忘了點關注，不迷路啊。

👇👇👇

20個月燒掉100億，OpenAI正在找「續命錢」

Get Rich

點贊+在看，搞錢穩賺！

關鍵詞

大模型

安全性

資料

內容

dignews.cc

三位哈佛00後聯手創業，7個月拿下億元估值

相關文章

速遞｜李飛飛WorldLabs推出首個AI系統——生成從圖片到可互動的3D場景

英偉達、英特爾和AMD，聯手投出一家「晶片獨角獸」

TwelveLabs：多模態重塑影片內容檢索

英偉達AMD英特爾聯手，投出一家AI晶片獨角獸

AI眼鏡黑馬海外爆紅，聚齊蘋果谷歌大牛，公開“節制創新”方法論

速遞｜Flux獲a16z新一輪2億美元領投！成立不到五個月，估值超10億美元

深圳90後斯坦福博士，24小時狂攬百萬刀，殺出AI眼鏡全球黑馬

比傳統語言模型快10倍，首個商業規模的擴散語言模型，究竟是什麼來頭？

英偉達、AMD、英特爾，晶片三巨頭為何押注同一家AI獨角獸？

3個月估值10億，李飛飛用一張圖讓3D影片變天？|【經緯低調分享】