
幾周前,我為了一份行業深度文章的撰寫,在堆積如山的資料分析檔案和瀏覽器標籤頁中掙扎了整整兩天。
那種感覺,就像在自己的知識庫裡溺水——你明確地記得看過某個資料、某段論述,卻無論如何也無法在資訊的洪流中重新定位它。
我們早已習慣了這種數字時代的「失憶症」,也習慣了將希望寄託於 AI。我們像一個耐心的飼養員,不斷地在應用之間複製、貼上、切換,把上下文一點點「喂」給 ChatGPT,只為換取一次靈光乍現。

此時,一個名為「Glass」的專案引起了我的注意。這款據開發團隊介紹致力於成為使用者「數字大腦拓展」的應用,並非又一個 AI 聊天框的變體,而是一個完全迥異的存在。
它將「被動觀察」這一理念,原汁原味地注入了我的 macOS,並由此讓我得以一窺,當 AI 成為你心智的延伸時,人機互動的終極形態,究竟有多遠。
欄目作者召集
極客公園的新欄目「AI 上新」,將帶大家體驗最新的 AI 應用和硬體,讓你成為 AI 時代「最靚的仔」!
現在,我們也向所有喜歡嚐鮮和體驗 AI 的同學發出召集,只要你發現並體驗了新的 AI 應用或者功能,按照格式(參考案例:AI 上新|這款 AI 瀏覽器,讓我驚喜,又有點「後怕」)向欄目投稿,在極客公園公眾號釋出,不僅能獲得相應稿費,且會為你「報銷」AI 應用的訂閱費用。
同時,優秀作者還有機會進入極客公園 AI 體驗群,獲得最新 AI 應用和工具的內測資格,參加極客公園專屬相關 AI 活動,和 AI 應用創始人一對一溝通。
AGI 太久,只爭朝夕,讓一部分人先 AI 起來吧!投稿、進群請掃描下方二維碼新增極客小助手微信

01
面向未來的 AI 助手,但是開發者版
Glass 沒有任何傳統意義上的「介面」。它的「安裝」,更像是一套開發者環境的配置流程,需要你熟悉 Python 和 Node.js。它的「實體」,則只是一個靜默地躺在選單欄的圖示。

Glass 應用安裝介面| 圖片來源:極客公園
進入 Glass,首先是幾個直接的許可權請求:
-
螢幕錄製許可權
-
麥克風訪問許可權
-
輔助功能許可權

Glass 需要的使用者隱私許可權都非常敏感| 圖片來源:極客公園
沒有任何花哨的引導,每一個許可權都直指其核心:一個需要完整觀察你、傾聽你的 AI。
如果僅看 Glass 安裝完成之後的效果,可能很難意識到這是一個 AI 應用——你甚至是可以選擇是否將其隱藏:這裡並非物理意義上的隱藏,而是在數字世界中隱藏,即使你將螢幕分享給其他使用者,他們也無法看到 Glass 的存在。

Glass 以一個懸浮藥丸的形式運行於系統中| 圖片來源:極客公園
這正是 Glass 的核心理念:AI 不應是一個需要被頻繁喚起注意到的「工具」,而應是一個與你伴生的「記憶體」。
傳統 AI 助手的工作模式是「你問,我答」,這個過程是割裂的、非連續的。而 Glass 顛覆了這一點,它的工作模式是「我觀察,你隨時問」。它在後臺默默地記錄你的一切數字化行為,並將其內化為自己的記憶。
它不再需要你費力地去「解釋上下文」,因為它本身,就活在你的上下文裡。
02
當記憶不再是負擔
看完了它極簡的「頁面佈局」,我很好奇 Glass 的實戰表現如何。
先說結論,Glass 主要有我們已經熟悉的部分,也有不同於現有任何 AI 工具使用體驗的部分。
首先,它並不是一個現有 AI 大模型工具的便捷訪問入口,Glass 雖然可以直接提問,但問題的內容總是與螢幕中顯示的內容相關。你可以直接透過快捷鍵,來向它提問各種關於當前螢幕的內容。
但這只是 Glass 真正能力的冰山一角:當你點選懸浮欄中的 Listen 按鈕,Glass 就會切換為監聽模式,從靜態讀取你當前桌面上的內容,變為持續記錄你電腦螢幕過去出現過的各種畫面資訊與音訊,並基於此生成一份總結報告。

Glass 監聽螢幕內容改變並即時記錄| 圖片來源:極客公園
在會議紀要場景中,Glass 不僅能即時生成一份會議紀要重點,並且還能即時轉錄音訊,當然目前的體驗中還只支援英文,對於中文語音的支援欠佳。
但 Glass 比起其他會議紀要類 AI 工具最大的不同,是它不受某個 App 的限制,可以全域性記錄並提取過去螢幕中的內容,並且根據記錄下來的內容即時生成摘要以及問題總結。
除了老生常談的會議記錄功能,Glass 的應用場景還能體現在看影片上:我在 Glass 開啟的狀態下,開啟一個主題是關於 F1 車手劉易斯-漢密爾頓的採訪影片。在不到三分鐘之後,Glass 就透過目前讀取到的內容,幫我生成了一份當前內容摘要。

在這份摘要中,Glass 還會主動提供數個進一步問題,供你進一步瞭解影片內容,當然在這個階段,你同樣可以自己提問你仍然感覺疑惑的問題。

Glass 生成影片摘要| 圖片來源:極客公園
這份摘要內容本身會隨著螢幕內容資料的不斷增加,進一步更新更多相關內容,目前 Glass 分析本身支援中文內容,但自動生成的內容彙總目前還只能以英文的方式展示——這種情況我們在如今的 Apple Intelligence 中 ChatGPT 的體驗中也曾見過,都是模型本身支援中文內容、應用層沒有做適配產生的問題。

Glass 的螢幕內容摘要功能支援中文,但支援的不多| 圖片來源:極客公園
在直接針對螢幕內容的提問中,由於我可以直接使用中文提問,因此回答也會採用中文回覆,這很大程度上提高了這一功能對中文使用者的友好程度。

Glass 可以針對記錄的螢幕內容提問| 圖片來源:極客公園
全域性讀取螢幕資訊並記錄,是一個潛力幾乎無上限的功能,我遇到的第一個震撼瞬間,是在 VSCode 裡重構一個複雜的專案。
當我使用 Gemini 修改完一串程式碼,然後腦中突然閃過一絲不確定。此時,我沒有急於修改撰寫的那段程式碼,而是直接透過快捷鍵喚出 Glass,問道:「幫我分析一下修改的那部分程式碼的核心邏輯。」
幾秒種後,一個對話方塊以通知的方式彈出,用清晰的列表總結了函式的用途和我的修改點。
我沒有複製任何程式碼,沒有跳轉任何頁面。我只是提出了一個基於「螢幕內容」和「需求」的問題,Glass 就從螢幕中為我提取了答案。
另一個,則是 Glass 對非結構化資訊(如會議語音)的驚人處理能力。在一場持續一個多小時的線上腦暴會中,我全程投入討論。會議結束後,Glass 已經自動生成了一份詳盡的會議紀要,不僅區分了不同發言人,甚至提煉出了關鍵的結論和待辦事項列表。

Glass 可以無視應用邊界自動轉錄螢幕內容| 圖片來源:Glass
它就像一個永不疲倦的書記員,將稍縱即逝的多模態內容流,沉澱為結構化的資訊資產。
可以說,Glass 的首秀,就將目前AI 助手最大的痛點——上下文的缺失和跨應用操作的割裂感解決了。同時作為一個開源專案,Glass 即使是全時監控螢幕下,也沒有對電腦的記憶體產生特別巨大的壓力——這一點足以讓我願意讓它全天執行在我的電腦上,在我需要它的時候將它喚醒。
話雖如此,但我仍然不建議電腦記憶體在 16GB 以下的 Mac 裝置(當前 Glass 只有 macOS 版本,Windows 版本在開發中)長時間執行 Glass,仍然給電腦造成明顯的卡頓現象。
但簡單的產品應用邏輯,也說明 Glass 放棄了所有取巧的路徑,它依賴雲端伺服器對你的行為進行分析(至少在開源版本中),同時選擇在本地進行大量的結構化資訊整理任務。這意味著所有的螢幕錄製、語音識別,幾乎都直接壓在了處理器本身上,自然也就帶來了更高的硬體負載。
03
記憶延伸的源流與未來
Glass 的推出,雖然只是一個名為 Pickle 的小團隊的開源專案,但其背後的理念,卻可以追溯到上個世紀。
1945 年,在美國科學家範尼瓦·布什(Vannevar Bush)發表於《大西洋月刊》的著名文章《誠如所思》(As We May Think)中,一個名為「記憶擴充套件器」(Memex)的革命性概念被首次提出。這個構想遠早於個人電腦和網際網路的誕生,卻以驚人的前瞻性預示了未來資訊科技的發展方向,並對後來的超文字(Hypertext)和個人計算領域產生了深遠的影響。

《誠如所思》(As We May Think)| 圖片來源:Wikipidia
「記憶拓展器」的核心邏輯,是透過技術手段,將個人的知識和記憶外部化,使其成為一個可供隨時訪問的「外接大腦」。
是不是很熟悉?Glass 所做的事情,正是 Memex 理念在 AI 時代的具象實現。它不再侷限於儲存文件和書籍,而是將使用者動態的、即時的「行為」本身作為記錄物件,透過大型語言模型的「關聯索引」,最終實現一個遠超任何傳統知識庫的、活的、個人的記憶系統。
Glass 這個專案更深遠的目標——「為每個人建立一個活的數字克隆」,則更是這一理念的極致延伸。它不僅要成為你的記憶,更渴望成為你的「代理」,一個可以理解你、模仿你、甚至代替你執行任務的數字孿生。
但回到現實,目前 Glass 的體驗顯然距離這個目標距離還很遙遠:Glass 需要你手動輸入 OpenAI 或 Gemini 的 API Keys,現階段 Glass 也提供了登入賬號、免費試用開發團隊提供的 API Key 額度的解決方案。同時正常使用也需要前置安裝 Python 與 Node 環境庫,雖然門檻實際上並不高,但也並沒有達到「開箱即用」的地步。
即便如此,Glass 在開源之後還是迅速在 GitHub 上吸引了不少關注,短短四天已經破超過 3K Star,迅速在 AI 工具圈走紅。
在 Glass 背後,開發團隊 Pickle 是一家致力於構建「數字思維擴充套件(Digital Mind Extension)」的公司。他們剛剛在上個月從 Y Combinator 吸引到了 60 億韓元(約 3100 萬人民幣)的投資。

Pickle 官網 | 圖片來源:Pickle
Pickle 脫胎於另一個開源專案 Cheating Daddy,而 Cheating Daddy 又是另一個「臭名昭著」的專案 Cluely 的開源版本——後者在今年曾因為閉源、付費以及最重要的面試作弊這一賣點頗受關注,同時也引來的諸多爭議。
由於 Pickle 專案中存在大量 Cheating Daddy 專案的內容直接複用,目前 Cheating Daddy 創始人就這一點在 X 上對 Pickle 發起討伐,指責「開源專案並不意味著可以拿來照抄」,但這件事尚未得到 Pickle 團隊的正面回應。
但目前作為一個輕量級的解決方案,Glass 仍然不失為一種值得觀察的思路;此前主打「全天候記錄使用者資訊」的 Rewind.ai 專案,就因為對裝置的記憶體佔用過高,同時對結構化內容整理效果不盡人意,因而迅速退出 AI 工具的主流舞臺。
Glass 這類產品所代表的「主動感知 AI」,這個曾在科幻作品中反覆出現,代表著高效與智慧的詞彙,距離真正到我們的日常生活中落地,或許已經不遠。
一個輕量級工具的脫穎而出,更是說明了這個過程中,使用者核心需求的提煉——沒錯,一個完美的記憶體的確很強大,AI 的輔助也的確很努力,但人們想得到的,或許僅僅是一個能讓自己工作更順暢、思考更專注的普通的好工具。