AI上新｜我讓AI「偷窺」了我的螢幕，它有機會變成我第二個大腦

AI 助手，向著「低調實用」方向發展。

作者｜張勇毅

編輯｜靖宇

幾周前，我為了一份行業深度文章的撰寫，在堆積如山的資料分析檔案和瀏覽器標籤頁中掙扎了整整兩天。

那種感覺，就像在自己的知識庫裡溺水——你明確地記得看過某個資料、某段論述，卻無論如何也無法在資訊的洪流中重新定位它。

我們早已習慣了這種數字時代的「失憶症」，也習慣了將希望寄託於 AI。我們像一個耐心的飼養員，不斷地在應用之間複製、貼上、切換，把上下文一點點「喂」給 ChatGPT，只為換取一次靈光乍現。

此時，一個名為「Glass」的專案引起了我的注意。這款據開發團隊介紹致力於成為使用者「數字大腦拓展」的應用，並非又一個 AI 聊天框的變體，而是一個完全迥異的存在。

它將「被動觀察」這一理念，原汁原味地注入了我的 macOS，並由此讓我得以一窺，當 AI 成為你心智的延伸時，人機互動的終極形態，究竟有多遠。

欄目作者召集

極客公園的新欄目「AI 上新」，將帶大家體驗最新的 AI 應用和硬體，讓你成為 AI 時代「最靚的仔」！

現在，我們也向所有喜歡嚐鮮和體驗 AI 的同學發出召集，只要你發現並體驗了新的 AI 應用或者功能，按照格式（參考案例：AI 上新｜這款 AI 瀏覽器，讓我驚喜，又有點「後怕」）向欄目投稿，在極客公園公眾號釋出，不僅能獲得相應稿費，且會為你「報銷」AI 應用的訂閱費用。

同時，優秀作者還有機會進入極客公園 AI 體驗群，獲得最新 AI 應用和工具的內測資格，參加極客公園專屬相關 AI 活動，和 AI 應用創始人一對一溝通。

AGI 太久，只爭朝夕，讓一部分人先 AI 起來吧！投稿、進群請掃描下方二維碼新增極客小助手微信

面向未來的 AI 助手，但是開發者版

Glass 沒有任何傳統意義上的「介面」。它的「安裝」，更像是一套開發者環境的配置流程，需要你熟悉 Python 和 Node.js。它的「實體」，則只是一個靜默地躺在選單欄的圖示。

Glass 應用安裝介面｜圖片來源：極客公園

進入 Glass，首先是幾個直接的許可權請求：

螢幕錄製許可權
麥克風訪問許可權
輔助功能許可權

Glass 需要的使用者隱私許可權都非常敏感｜圖片來源：極客公園

沒有任何花哨的引導，每一個許可權都直指其核心：一個需要完整觀察你、傾聽你的 AI。

如果僅看 Glass 安裝完成之後的效果，可能很難意識到這是一個 AI 應用——你甚至是可以選擇是否將其隱藏：這裡並非物理意義上的隱藏，而是在數字世界中隱藏，即使你將螢幕分享給其他使用者，他們也無法看到 Glass 的存在。

Glass 以一個懸浮藥丸的形式運行於系統中｜圖片來源：極客公園

這正是 Glass 的核心理念：AI 不應是一個需要被頻繁喚起注意到的「工具」，而應是一個與你伴生的「記憶體」。

傳統 AI 助手的工作模式是「你問，我答」，這個過程是割裂的、非連續的。而 Glass 顛覆了這一點，它的工作模式是「我觀察，你隨時問」。它在後臺默默地記錄你的一切數字化行為，並將其內化為自己的記憶。

它不再需要你費力地去「解釋上下文」，因為它本身，就活在你的上下文裡。

當記憶不再是負擔

看完了它極簡的「頁面佈局」，我很好奇 Glass 的實戰表現如何。

先說結論，Glass 主要有我們已經熟悉的部分，也有不同於現有任何 AI 工具使用體驗的部分。

首先，它並不是一個現有 AI 大模型工具的便捷訪問入口，Glass 雖然可以直接提問，但問題的內容總是與螢幕中顯示的內容相關。你可以直接透過快捷鍵，來向它提問各種關於當前螢幕的內容。

但這只是 Glass 真正能力的冰山一角：當你點選懸浮欄中的 Listen 按鈕，Glass 就會切換為監聽模式，從靜態讀取你當前桌面上的內容，變為持續記錄你電腦螢幕過去出現過的各種畫面資訊與音訊，並基於此生成一份總結報告。

Glass 監聽螢幕內容改變並即時記錄｜圖片來源：極客公園

在會議紀要場景中，Glass 不僅能即時生成一份會議紀要重點，並且還能即時轉錄音訊，當然目前的體驗中還只支援英文，對於中文語音的支援欠佳。

但 Glass 比起其他會議紀要類 AI 工具最大的不同，是它不受某個 App 的限制，可以全域性記錄並提取過去螢幕中的內容，並且根據記錄下來的內容即時生成摘要以及問題總結。

除了老生常談的會議記錄功能，Glass 的應用場景還能體現在看影片上：我在 Glass 開啟的狀態下，開啟一個主題是關於 F1 車手劉易斯-漢密爾頓的採訪影片。在不到三分鐘之後，Glass 就透過目前讀取到的內容，幫我生成了一份當前內容摘要。

在這份摘要中，Glass 還會主動提供數個進一步問題，供你進一步瞭解影片內容，當然在這個階段，你同樣可以自己提問你仍然感覺疑惑的問題。

Glass 生成影片摘要｜圖片來源：極客公園

這份摘要內容本身會隨著螢幕內容資料的不斷增加，進一步更新更多相關內容，目前 Glass 分析本身支援中文內容，但自動生成的內容彙總目前還只能以英文的方式展示——這種情況我們在如今的 Apple Intelligence 中 ChatGPT 的體驗中也曾見過，都是模型本身支援中文內容、應用層沒有做適配產生的問題。

Glass 的螢幕內容摘要功能支援中文，但支援的不多｜圖片來源：極客公園

在直接針對螢幕內容的提問中，由於我可以直接使用中文提問，因此回答也會採用中文回覆，這很大程度上提高了這一功能對中文使用者的友好程度。

Glass 可以針對記錄的螢幕內容提問｜圖片來源：極客公園

全域性讀取螢幕資訊並記錄，是一個潛力幾乎無上限的功能，我遇到的第一個震撼瞬間，是在 VSCode 裡重構一個複雜的專案。

當我使用 Gemini 修改完一串程式碼，然後腦中突然閃過一絲不確定。此時，我沒有急於修改撰寫的那段程式碼，而是直接透過快捷鍵喚出 Glass，問道：「幫我分析一下修改的那部分程式碼的核心邏輯。」

幾秒種後，一個對話方塊以通知的方式彈出，用清晰的列表總結了函式的用途和我的修改點。

我沒有複製任何程式碼，沒有跳轉任何頁面。我只是提出了一個基於「螢幕內容」和「需求」的問題，Glass 就從螢幕中為我提取了答案。

另一個，則是 Glass 對非結構化資訊（如會議語音）的驚人處理能力。在一場持續一個多小時的線上腦暴會中，我全程投入討論。會議結束後，Glass 已經自動生成了一份詳盡的會議紀要，不僅區分了不同發言人，甚至提煉出了關鍵的結論和待辦事項列表。

Glass 可以無視應用邊界自動轉錄螢幕內容｜圖片來源：Glass

它就像一個永不疲倦的書記員，將稍縱即逝的多模態內容流，沉澱為結構化的資訊資產。

可以說，Glass 的首秀，就將目前AI 助手最大的痛點——上下文的缺失和跨應用操作的割裂感解決了。同時作為一個開源專案，Glass 即使是全時監控螢幕下，也沒有對電腦的記憶體產生特別巨大的壓力——這一點足以讓我願意讓它全天執行在我的電腦上，在我需要它的時候將它喚醒。

話雖如此，但我仍然不建議電腦記憶體在 16GB 以下的 Mac 裝置（當前 Glass 只有 macOS 版本，Windows 版本在開發中）長時間執行 Glass，仍然給電腦造成明顯的卡頓現象。

但簡單的產品應用邏輯，也說明 Glass 放棄了所有取巧的路徑，它依賴雲端伺服器對你的行為進行分析（至少在開源版本中），同時選擇在本地進行大量的結構化資訊整理任務。這意味著所有的螢幕錄製、語音識別，幾乎都直接壓在了處理器本身上，自然也就帶來了更高的硬體負載。

記憶延伸的源流與未來

Glass 的推出，雖然只是一個名為 Pickle 的小團隊的開源專案，但其背後的理念，卻可以追溯到上個世紀。

1945 年，在美國科學家範尼瓦·布什（Vannevar Bush）發表於《大西洋月刊》的著名文章《誠如所思》（As We May Think）中，一個名為「記憶擴充套件器」（Memex）的革命性概念被首次提出。這個構想遠早於個人電腦和網際網路的誕生，卻以驚人的前瞻性預示了未來資訊科技的發展方向，並對後來的超文字（Hypertext）和個人計算領域產生了深遠的影響。

《誠如所思》（As We May Think）｜圖片來源：Wikipidia

「記憶拓展器」的核心邏輯，是透過技術手段，將個人的知識和記憶外部化，使其成為一個可供隨時訪問的「外接大腦」。

是不是很熟悉？Glass 所做的事情，正是 Memex 理念在 AI 時代的具象實現。它不再侷限於儲存文件和書籍，而是將使用者動態的、即時的「行為」本身作為記錄物件，透過大型語言模型的「關聯索引」，最終實現一個遠超任何傳統知識庫的、活的、個人的記憶系統。

Glass 這個專案更深遠的目標——「為每個人建立一個活的數字克隆」，則更是這一理念的極致延伸。它不僅要成為你的記憶，更渴望成為你的「代理」，一個可以理解你、模仿你、甚至代替你執行任務的數字孿生。

但回到現實，目前 Glass 的體驗顯然距離這個目標距離還很遙遠：Glass 需要你手動輸入 OpenAI 或 Gemini 的 API Keys，現階段 Glass 也提供了登入賬號、免費試用開發團隊提供的 API Key 額度的解決方案。同時正常使用也需要前置安裝 Python 與 Node 環境庫，雖然門檻實際上並不高，但也並沒有達到「開箱即用」的地步。

即便如此，Glass 在開源之後還是迅速在 GitHub 上吸引了不少關注，短短四天已經破超過 3K Star，迅速在 AI 工具圈走紅。

在 Glass 背後，開發團隊 Pickle 是一家致力於構建「數字思維擴充套件（Digital Mind Extension）」的公司。他們剛剛在上個月從 Y Combinator 吸引到了 60 億韓元（約 3100 萬人民幣）的投資。