大咖雲集!首屆大模型安全研討會開啟註冊,共同探索大模型的安全邊界

2024
大模型安全研討會
LARGE MODEL SAFETY WORKSHOP 2024
簡介
Introduction
在人工智慧迅猛發展的今日,大模型的開發與部署標誌著技術進步的前沿,並開啟了一個充滿創新與無限可能性的新時代。這些高度複雜的模型正在革新醫療健康、金融服務、交通物流和智慧製造等眾多行業。然而,隨著這些強大技術的普及,我們逐漸認識到伴隨而來的巨大責任。
在資料安全方面,大模型常處理涉及敏感資訊的資料,如個人身份、健康記錄或金融交易資料,這不僅提出了資料保護的挑戰,還可能加劇資料洩露的風險。在內容安全方面,由於大模型輸出的內容可能影響公眾意見和行為,確保內容的真實性和適當性極為重要。不當的內容過濾機制可能導致誤導資訊的傳播,甚至被用於資訊操控或假新聞的傳播。
此外,大模型的倫理風險也不容忽視。模型的決策可能反映出資料集的偏見,進一步放大社會不平等。因此,開發過程中必須考慮演算法的公平性、透明性及其可解釋性,採取措施如進行倫理審查和提高演算法透明度,以緩解這些技術可能帶來的負面影響。
為了全面探討和應對這些挑戰,首屆大模型安全研討會(LARGE MODEL SAFETY WORKSHOP 2024)將於 2024 年 7 月 2 日在新加坡卡爾頓酒店(Carlton Hotel Singapore)舉行,由新加坡管理大學(Singapore Management University, SMU)的孫軍教授主辦。
本次研討會深受新奧爾良對齊研討會(The New Orleans Alignment Workshop)的啟發,致力於深入探索與大模型安全相關的關鍵議題。本會議旨在全面剖析大模型所帶來的廣泛挑戰與獨特機遇,並將探討一系列確保這些先進技術在多個領域中安全且有效應用的策略。
我們非常榮幸邀請到了來自北美普林斯頓大學、加州大學伯克利分校、杜克大學與芝加哥大學等頂尖學府的多位傑出學者,包括 Prateek Mittal 教授、Neil Gong 教授和 Bo Li 教授等。他們將針對大模型所面臨的新型攻擊、內容安全、資料安全、風險緩解策略以及道德準則等主題進行深入交流。此外,本次會議還將迎來新加坡政府部門的高層領導及全球領先認證企業的技術專家,共同深度探討人工智慧的治理和合規認證問題。
透過十場富有洞察力的演講,我們期待為參與者提供一個具有前瞻性和廣闊視野的討論平臺。無論你是經驗豐富的人工智慧從業者還是領域新手,本次研討會都將提供寶貴的洞見,幫助你在這一變革性技術時代中,優先考慮到安全、倫理與責任問題,從而推動真正的創新。本次研討會不僅是亞太地區難得一見的大模型安全峰會,也將為推動全球大模型技術的安全發展做出重要貢獻。
研討會主頁:
https://llmworkshop.github.io
媒體支援:
PaperWeekly
日程
Schedule
主席
Chairman
Jun Sun 現任新加坡管理大學計算機與資訊系統學院的終身教授。他分別於 2002 年和 2006 年在新加坡國立大學獲得計算科學學士和博士學位。2011 年至 2012 年期間,他作為訪問學者在麻省理工學院開展研究工作。他的主要研究領域涵蓋軟體工程、形式化方法、計算機安全和人工智慧,當前研究工作集中在人工智慧的測試與驗證技術、自動駕駛系統和資訊物理融合系統等方面。他的創新性研究成果已在多個相關領域的頂級期刊與會議上發表,包括 CAV、S&P、USENIX Security、TOSEM、TSE、ICSE、FSE、FM 等。他曾榮獲 2020 年ACM SIGSOFT Research Highlight,以及三次 ACM SIGSOFT Distinguished Paper Award(ISSTA 2021、ICSE 2020、ICSE 2018)和 2018 年 TSEBest Paper Award。此外,他還是模型檢測器 PAT 的聯合創始人。
Gerry Kian Woon Chng 現任德勤網路風險諮詢部門的執行董事,專注於網路安全和風險管理。他在網路安全領域擁有超過25年的經驗,為客戶提供如何在安全和可控環境中採用技術創新的諮詢服務。他負責管理網路新興技術專案,包括解決由技術帶來的風險,如演算法決策(人工智慧/機器學習)。他的其他專業領域包括在資訊科技和運營技術領域構建治理、風險和合規專案,以應對私營和公共部門面臨的威脅和監管環境。他還負責管理檢測與響應服務,幫助客戶主動評估其技術環境,並在必要時進行事件響應。此外,他還擔任新加坡人工智慧技術委員會(AITC)的聯合主席。該委員會的成立旨在為新加坡推薦採用相關的國際人工智慧標準,支援在必要時開發新的人工智慧標準,並提升對人工智慧標準的認知。同時,他也是新加坡計算機學會(SCS)認證的人工智慧倫理與治理(專家級)專業人士。
嘉賓
Contributor
Prateek Mittal 現任普林斯頓大學電氣與計算機工程系教授,於 2012 年在伊利諾伊大學厄巴納-香檳分校獲得博士學位。他廣泛研究隱私保護和安全系統,目前主要關注領域包括隱私增強技術(例如匿名通訊和統計資料隱私)、對抗性機器學習以及網際網路/網路安全。他的研究融合了資料科學、網路科學/複雜網路、分散式系統和應用密碼學等多領域技術。其研究成果廣泛發表在 USENIX Security、S&P、NDSS、CCS、ICML、ICLR、NeurIPS 等頂級國際會議上。他連續三年獲得 Caspar Bowden 隱私增強技術傑出研究獎,並曾獲得 ARO 和 ONR 青年研究者計劃獎以及 Facebook 機器學習研究獎、IBM 全球傑出學者獎、谷歌教授科研獎、英特爾教授科研獎、思科教授科研獎等殊榮。
Bo Li 現任芝加哥大學計算機科學系副教授。她曾獲得 IJCAI 計算機與思想獎、Alfred P.Sloan 研究獎學金、美國國家科學基金會傑出青年獎、AI's 10 to Watch、麻省理工學院科技評論 35 歲以下科技創新獎、院長卓越研究獎、C.W. Gear 傑出學者獎、英特爾新星獎、賽門鐵克研究實驗室獎學金、EECS 新星獎,以及來自亞馬遜、Meta、谷歌、英特爾、微軟研究院、eBay 和 IBM 等科技公司的研究獎項。此外,她還在多個頂尖的機器學習和安全領域會議上獲得了最佳論文獎。她的研究專注於可信機器學習的理論與應用,涉及機器學習、安全、隱私和博弈論的交叉領域。她已開發多個針對魯棒學習和隱私保護資料釋出系統的可擴充套件框架。她的工作還曾被《自然》、《連線》、《財富》和《紐約時報》等主流媒體廣泛報道。
Pang Wei Koh 現任華盛頓大學艾倫計算機科學與工程學院助理教授,並在艾倫人工智慧研究所(AI2)擔任客座研究科學家。他致力於研究構建可靠機器學習系統的理論與實踐,已在《自然》和《細胞》等頂級學術期刊上發表研究成果,並得到了《紐約時報》和《華盛頓郵報》等主流媒體的關注與報道。他曾獲得麻省理工學院科技評論亞太區 35 歲以下科技創新獎,並在 ICML 和 KDD 上榮獲最佳論文獎。他從斯坦福大學獲得計算機科學學士和博士學位,在攻讀博士學位之前,他是線上教育平臺 Coursera 的第三位員工及合作伙伴關係總監。
Neil Gong 現任杜克大學電氣與計算機工程系助理教授,併兼任計算機科學系。他的研究興趣包括網路安全和可信人工智慧。他曾獲得美國國家科學基金會傑出青年獎、ARO 青年研究者計劃獎、北美計算機華人學者協會新星獎、IBM 全球傑出學者獎、Facebook 研究獎,以及多個最佳論文獎和最佳論文榮譽獎。他是 ACM CCS 2022 機器學習與安全賽道的程式委員會主席。他於 2010 年從中國科學技術大學獲得榮譽學士學位,並於 2015 年從加州大學伯克利分校獲得計算機科學博士學位。
Mohan Kankanhalli 現任新加坡國立大學計算機學院教務長講座教授(Provost’s Chair Professor),並擔任新加坡國立大學人工智慧研究所所長。此外,他還是 AI Singapore(新加坡國家人工智慧研發計劃)的副執行主席。該計劃由新加坡國家研究基金會資助,整合了新加坡所有本地研究機構、人工智慧公司和初創企業,旨在共同推進研究並提升研究實力。該計劃囊括了人工智慧基礎研究、關鍵技術挑戰和行業應用研究等多個領域。Mohan 在印度理工學院克勒格布林分校獲得了學士學位,並在美國紐約倫斯勒理工學院獲得碩士和博士學位。他的研究興趣包括多模態計算、計算機視覺和可信人工智慧。作為新加坡國立大學人工智慧研究所所長,他領導了關於多模態模型和可信機器學習的研究。他還在多媒體計算領域承擔領導角色,如擔任《ACM Transactions on Multimedia Computing》期刊的資深編輯和《IEEE Multimedia》雜誌的副主編。他是世界經濟論壇全球未來理事會人工智慧委員會成員,也是 IEEE 會士。
Ting Wang 現任紐約州立大學石溪分校計算機科學系副教授兼 Empire Innovation 學者。他此前曾在賓夕法尼亞州立大學資訊科學與技術學院擔任副教授。他的研究主要集中在機器學習、隱私和安全的交叉領域,致力於開發安全可信的人工智慧技術。他的近期工作側重於從三個關鍵方面改進人工智慧方法和系統:安全保障(抵禦惡意操縱)、隱私保護和決策透明度。他的研究成果已在計算機安全和機器學習領域眾多頂級國際會議和期刊上發表,並獲得多項最佳論文獎以及媒體報道。他於浙江大學獲得學士學位,後在喬治亞理工學院完成博士學位。
Sewon Min 即將擔任加州大學伯克利分校電氣工程與計算機科學系的助理教授。她最近從華盛頓大學獲得計算機科學與工程博士學位。她的研究專注於語言模型,包括深入研究語言模型的科學基礎,以及設計新的模型型別和學習方法,旨在提升語言模型的效能和靈活性。她還在研究資訊檢索、法律和隱私環境中的語言模型。她在 ACL 2023 上獲得論文獎,曾獲摩根大通獎學金,並在 2022 年被評為電氣工程與計算機科學專業的新星。此前,她曾在 Meta AI 擔任兼職客座研究員,並曾在谷歌和 Salesforce 實習。她從首爾國立大學獲得計算機科學與工程學士學位。
Martin Saerbeck 目前擔任 TÜV 南德意志集團數字服務首席技術官,負責領導人工智慧、機器人技術和物聯網技術領域新型數字測試和認證解決方案的戰略研發。TÜV 南德意志集團是一家國際領先的測試、認證、檢驗和培訓服務供應商,致力於確保技術、系統和過程的安全性和可靠性。Martin 擁有計算機科學碩士學位及工業設計博士學位,在航空、醫療、製造業和零售業領域應用人工智慧方面積累了超過 20 年的經驗。作為 ISO/IEC SC42、IEEE SA 和 CEN/CENELEC JTC 21 等多個(新加坡)國內外標準化委員會的編輯和專家貢獻者,他在推動人工智慧標準化方面發揮了重要作用。他熱衷於應用研究,致力於將學術成果轉化為實際應用,以增強當今聯網智慧系統的安全性和可靠性。
Seok Min Lim 於 2014 年在新加坡國立大學獲得計算機科學學士學位。自 2021 年 4 月起,她在新加坡資訊通訊媒體發展局(IMDA)擔任技術研究主管,負責人工治理和信任技術的研發。IMDA 是新加坡政府機構,負責制定和執行國家的資訊通訊和媒體政策,致力於推動電信和媒體行業的發展,並促進資訊科技和媒體之間的整合與創新。IMDA 旗下的 AI Verify 基金會致力於利用全球開源社群的集體智慧和資源,開發人工智慧測試工具,以實現負責任的人工智慧,同時推動人工智慧領域的最佳實踐和標準的建立。Lim 領導了首個人工智慧驗證工具包原型 Spearheaded 的開發,為測試人工智慧模型的設計和工作流程奠定了基礎。此外,她還推動了針對傳統人工智慧模型的魯棒性、公平性和可解釋性等的評估和測試的技術研究和原型開發工作。自 2023 年 9 月至今,她繼續推動生成式人工智慧模型評估和測試的相關技術研究和原型開發(Moonshot 專案),包括基準測試、越獄技術以及提示注入等領域的工作。
Wan Ding Yao 是新加坡政府技術局(GovTech)的網路安全工程師。他擁有新加坡管理大學的法學(商業科技)學士和計算機科學(資料科學與工程)碩士學位。他在新加坡政府技術局網路安全組擔任人工智慧安全團隊負責人,主導人工智慧與網路安全交叉領域的工作,包括為網路安全運營開發人工智慧應用原型以及構建人工智慧紅隊(攻擊模擬團隊)。他已獲得新加坡律師協會授予的律師執業資格,並持有 OffSec、CREST、(ISC)²、Practical DevSecOps、MAD20、AWS、Microsoft 和 Google 等機構與企業頒發的多項專業網路安全認證。
🔍
現在,在「知乎」也能找到我們了
進入知乎首頁搜尋「PaperWeekly」
點選「關注」訂閱我們的專欄吧
·
·
·

相關文章