他的AI實驗給你哪些創業靈感?|和鴨哥聊:給AI加上耳朵、眼睛,用AI買菜、寄快遞

未來屬於最會用 AI 的人。

👦🏻 播客採訪:Koji、Ronghui
🥷 整理編輯:Bella
🧑‍🎨 排版:NCon

在科技行業裡,有一些富有好奇心、動手能力又很強的極客,他們會在一些產品剛出現的時候就迅速上手,不僅使用,有時還會自己動手組裝、魔改,把原本的產品玩出新的花樣。
本期我們邀請的嘉賓鴨哥就是這樣一位極客,最近我們知道,鴨哥在做一些 AI 實驗,比如他自己做了一個語音輸入法,用 Apple Watch 全天 24 小時錄製自己說的話,這給 AI 更好地瞭解他提供了豐富的語料資訊。
此外,他還把 Insta360 掛在胸前,拍下全天候的影片和照片 ——我們在訪談中說,鴨哥的這些 AI 實驗,就像是給 AI 加了耳朵和眼睛,很好的解決了和 AI 溝通訊息極度不對稱的問題。不僅如此,他還成功地讓 AI 幫他買菜、寄快遞,等等。

在這期播客裡,鴨哥跟我們分享了他的這些實驗,以及他從中得到的收穫。以及這樣「極致的提高了效率」之後,他對人如何使用 AI 的思考。
我們邀請鴨哥來做客十字路口,因為我們相信他作為早期使用者(Early Adopter)的體驗和折騰出的各種專案實驗,能為許多 AI 創業者提供未來產品的靈感。
此外,鴨哥也是《Manus 爆火的背後:我們用 20 個問題一起搞懂 AI Agent》那一期的嘉賓,他的個人 Blog 「Computing Life[1]」 值得對 AI 感興趣的朋友們讀一讀。
推薦:鴨哥的課程《From User to Builder》[2],幫助你從AI工具使用者進化為具備實戰能力的Builder,用AI打造實用專案、提升工作效率、增強職場競爭力。
小宇宙收聽:

微信直接收聽:
本週我們也嘗試錄製並剪輯了影片播客,可以到 Koji 的小紅書/B站/影片號觀看(本文釋出一週後,上線影片版本)。

Part 1 快問快答,認識鴨哥

👦🏻 Koji
請問鴨哥的年齡?
👨🏻 鴨哥
一上來就問這種讓人傷感的問題(笑)。我已經是個老男人了,已經過了要被最佳化的界限。
👦🏻 Koji
畢業院校?
👨🏻 鴨哥
本科在中國科大。博士在 Columbia University
👦🏻 Koji
現在的工作身份?
👨🏻 鴨哥
在 Samsara 做 Applied Scientist,研究行車記錄儀裡的計算機視覺。業餘也在持續探索 agent AI。
👦🏻 Koji 你的 MBTI 和星座是什麼?
👨🏻 鴨哥
MBTI 忘了,只記得是很少見的型別。星座是天蠍座。
👦🏻 Koji
很多人是透過你寫的技術文章認識你的。可以聊聊在 AI 和程式碼之外的你,是什麼樣的生活狀態?
👨🏻 鴨哥
這個問題挺開放的,我確實有一些不太一樣的經歷。比如 2008 年我當過北京奧運會的火炬手,後來考了挖掘機、飛機、還有船的駕照。
這些看起來很酷的事情,其實背後都有一個動機:我想親身體驗人類可以做到的邊界。
考飛機駕照不是因為有錢要開私人飛機,而是我不會飛,但一直很好奇 —— 如果能自己飛到雲上,看風景、拍照,會是種什麼感覺?我覺得人死後什麼都帶不走,那為什麼不盡量去體驗這個世界?
另外我還是個業餘攝影師。喜歡拍天文、顯微、多波段影像。用得多了,Leica 注意到我,還邀請我在西雅圖辦了個個人展覽。
這些探索本質上也是一樣的:
用工具拓展人的感知邊界,去看更遠、更小,甚至是人眼看不見的東西。
攝影也成了我生活中很重要的一部分。
👦🏻 Koji
我覺得你是個既極客又很有生活實驗精神的人,尤其是在 AI 上做了很多有趣的嘗試。我記得最早是從你寫的部落格看到你開始關注 ChatGPT —— 當時大家都覺得它有時像天才,有時像智障。你會不會也這麼覺得?
👨🏻 鴨哥
我太有這樣的感受了。我早期用 AI 的時候,經常覺得它連最簡單的事都做不好,特別蠢。但可能因為我比較容易共情,有時會站在 AI 的角度想:如果我是它,老闆讓我幹這個,我可能也真幹不出來。
就像公司來個剛畢業的清華北大的新人,人很聰明,但你沒交代清楚背景,他就算給出一個教科書級的方案,也落不了地。問題其實在我們沒講清楚需求。
後來我發現,AI 出錯大致分兩種情況:
  1. 它真的不夠聰明,比如連算術都算錯。
  2. 它其實很聰明,但我們像個糟糕的 PM,一邊給任務一邊不斷改需求。突然說這個不行、那個也不行,其實是我們一開始就沒有給出足夠的 context
所以回頭看,很多“人工智障”的時刻,不是 AI 不行,而是我們沒當好它的產品經理。鍋,可能在我們這兒。

👦🏻 Koji
你竟然可以共情AI。
👨🏻 鴨哥
這樣等 AI 統治世界時,我說不定能混個好職位(笑)。
👧🏻 Ronghui
那你會刻意調整自己,讓自己更會用 AI 嗎?
👨🏻 鴨哥
我確實做了不少調整。
以前 AI 經常答非所問。但我發現只要把背景交代清楚,它的反饋就會好很多。問題不在 AI,而在我沒說清楚 context。
不過打字太累,我又懶(笑)。所以後來我用 GPT-4o 做了個即時語音輸入系統,能即時轉寫,理解並回應內容。我就靠它快速 “嘴寫 prompt “,一分鐘能講幾百字,和 AI 之間的頻寬一下子打開了。
結果很明顯:AI 輸出的質量提升了,我也更願意把複雜任務交給它。
以前我覺得 AI 是我的小弟,但在 context 給夠以後,它成了我大哥(笑)。
現在我寫 prompt,會把專案背景、失敗教訓,甚至老闆和同事的喜好都告訴它。
它甚至能從 VP 的角度告訴你:“如果你這麼說,你老闆就可以拿去跟他老闆吹牛。” 這種高層視角,以前我是完全接觸不到的。
而這些建議真的很有用。我提出的方案更容易打動老闆、說服同事,推動事情也更順了。
這一切的轉變,其實就從“用語音打 prompt”這種小事開始的。
一旦把輸入的門檻降下來,AI 的實力才能真正被激發出來。
👦🏻 Koji
我最近被灰度到了 ChatGPT 的語音輸入的新功能,一個非常容易被觸發的入口,類似「下拉重新整理」,是「上拉,即開始語音輸入」。
——感覺這也是為了讓使用者減少打字的摩擦,鼓勵更多、更自然地輸入,從而提供更多 context 給到 AI。
👨🏻 鴨哥
我也被灰度到了。
我覺得這說明了兩點:
第一,ChatGPT 正在往會議助手方向走。比如開會時可以直接錄音,會後它幫你總結,還能繼續問答。語音對它產品形態的重要性已經很明顯了。
第二,它之前也推出過 whisper 語音識別,但效果沒有現在 GPT-4o 即時語音這麼好。主要因為 whisper 背後不是大型語言模型,而 GPT-4o 是 LLM,理解和反饋能力差距還是很大。
👧🏻 Ronghui
打字的資訊密度太低了,哪怕是那種已經很愛打字的人,其實也很難表達得完整。
👨🏻 鴨哥
尤其在手機上,真的太痛苦了(笑)。

Part 2 如何把 AI 真正融入日常

👦🏻 Koji 
所以當你用語音輸入讓和 AI 的交流、提供 context 都變輕鬆之後,你下一步做了什麼?
👨🏻 鴨哥
開始更頻繁地用語音和 AI 交流後,我很快遇到一個大問題:AI 沒有記憶。
LLM 每個 inference 的過程都是上下文獨立的。除非產品本身幫你“維護記憶”,像 ChatGPT 的記憶功能。但要麼很多產品沒這個功能,ChatGPT 做得也不好。
這導致我每次都得重複上下文:比如家人喜好、專案目標;效率很低。
我試過寫好一段標準的 context,複製貼上應對固定場景,但面對經常變化的工作內容,這種方法很麻煩,像在寫文件,摩擦太大。
後來我意識到,我們每次寫 prompt,本質上是在向 AI 表達“我是誰”。那能不能別每次都從零開始“教”它,而是把它長期融入我的生活中,自然擁有“記憶”?
於是我開始用 Apple Watch 錄音。
因為我居家辦公,隱私顧慮不大。我用 Apple Watch 自帶的 Voice Memo,錄完自動同步到 iCloud,轉寫後存入資料庫。
這個錄音系統立刻帶來了驚喜:有次開車走神差點撞車,幸好 Apple Watch 正在錄音,我當下就語音覆盤並設了提醒,晚上再總結。之後語音識別會自動整理這些待辦事項。這樣當下教訓被記錄下來,後續還有覆盤,真的對我駕駛技術有提升。

👦🏻 Koji
所以你現在可以隨時自言自語,想到什麼就說出來,比如提醒自己晚上要做什麼。
👨🏻 鴨哥
對,這就是進一步降低了使用的摩擦。
👦🏻 Koji
那你會不會因此變得小心,有些話不要說出來?
👨🏻 鴨哥
還好。因為整個系統都是我自己搭的,不經過任何商業平臺,資料完全可控。
但如果是用第三方系統,那我確實可能就會有所保留了。
👦🏻 Koji
用這個系統之後還有哪些收穫?有沒有一些你沒預料到?
👨🏻 鴨哥
有兩個特別意外的收穫。
一個是之前說的開車那次,錄音幫我覆盤了整件事。
另一個意外收穫是,語音識別把我和 AI 的日常對話和思路像漏斗一樣集中記錄下來,資訊密度很高,意外成了一個高效的資訊收集方式。
不過光有錄音還不夠,識別完也只是堆 TXT 檔案躺在硬碟上,那怎麼用起來?
所以我自己又搭了一個“山寨版 ChatGPT”。它有兩個我很需要的功能:
  1. 可以接入多個模型(比如 GPT、Gemini、DeepSeek、通義千問等)。
  2. 用的是 agentic AI 的思路 —— 它不只是回答問題,還能自己調工具、查資料、做搜尋。
我還給它接入了一個 retrieval 的引擎,能訪問我之前語音識別的資料庫。比如我讓它幫我找一下上週我提過那個專案的背景,它會自己去搜出來。
而且它不是傳統的 RAG(那是靜態流程),而是一個 agentic workflow,能動態決定怎麼搜、換不換關鍵詞、搜幾輪,全是 AI 自主決定。
結果發現,這種方式真的特別有效,也驗證了我之前做的所有錄音和整理工作,都是值得的。
👦🏻 Koji
你現在堅持錄了多久了?
👨🏻 鴨哥
錄音做了兩個多月,錄影剛開始兩個星期,已經拍了兩萬多張照片。
👦🏻 Koji
哇,那你講講這個錄影系統?是怎麼用 Insta360 拍的?
👨🏻 鴨哥
對,Insta360 很小,背後有磁鐵,配套的磁吸項鍊戴在衣服裡面,相機就能吸在胸前,幾乎沒什麼存在感。我用的是 vlog 模式,每兩分鐘拍一次 15 秒影片,續航大概 4 小時。但我覺得還是不夠理想,要經常充電。所以我又自己做了一個小裝置:用微控制器 + Micro SD 卡 + CMOS 攝像頭模組,體積小、能深度睡眠,一塊小鋰電池能撐 1~3 天。現在還在開發中,但我覺得挺有意思。

👦🏻 Koji
我覺得鴨哥的動手能力太強了!
上個月「十字路口」的「AI + 硬體」線下沙龍,有一個來分享的創業公司叫 Looki,他們也在開發類似的東西:一個可以磁吸在胸口的 AI 硬體,每隔幾分鐘拍照或錄影,記錄你的一天,之後還能自動生成 vlog。
人家整個創業公司做的產品,你自己一個人就 diy 出來了。
👨🏻 鴨哥
聽起來確實有點像,但我這個其實沒什麼技術含量,屬於華強北思路。東西都是現成的,我只是把它們拼起來。程式碼也大部分都是 AI 寫的。
以前搞嵌入式開發特別痛苦,現在用 O3(GPT-4o)幫我除錯,效率高太多了。貼個報錯,它馬上告訴我怎麼改,感覺 O3 真成了我大哥(笑)。
👦🏻 Koji
那你每兩分鐘拍 15 秒 vlog,記錄一段時間後,有什麼發現嗎?
👨🏻 鴨哥
有,而且過程也挺有意思的。
我用通義千問 2.5 VL 這個本地模型來處理這些影片幀,主要做三件事:
  1. 過濾隱私:比如我進廁所時拍到的畫面,它能自動識別並刪掉。
  2. 生成搜尋關鍵詞:方便我將來回顧時,能透過關鍵詞快速找到這段經歷。
  3. 判斷畫面質量:比如影像清晰、有構圖、有人臉的內容才會被保留進未來的“回憶系統”。
我打算以後把這些影像做成一個影像搜尋引擎,幾年後再看,就像數字版“追憶往昔”。
我還用機器學習對這兩萬張圖做了聚類,從中挑出 200 張最有代表性的照片,再扔給 Gemini 分析。
結果他分析的特別準。它不僅能看出我的健康問題(比如壓力大、坐姿不對),還能大致判斷出我的職業和興趣愛好。
這次實驗讓我覺得,一圖勝千言是真的。它帶來了很多啟發,我打算繼續做下去。

👦🏻 Koji
它怎麼判斷你坐姿不對的?不是掛在胸前嗎,怎麼看得出來?
👨🏻 鴨哥
可能是從畫面能看出我駝背、手撐著臉之類的姿勢,它就推測出來了。
👧🏻 Ronghui   
你讓它挑“最有代表性的圖”,但“代表性”這個詞本身就挺抽象的吧?
👨🏻 鴨哥
對,這一步不是 AI 做的,是我用傳統機器學習完成的。比如一些重複性很高的畫面,像我在電腦前程式設計,那些類似的圖會先被合併,再挑出差異最大的,作為代表。
👧🏻 Ronghui
那裡面有哪些分析是你預料中的,有哪些是意外的?健康問題那個聽起來就挺出乎意料的。
👨🏻 鴨哥
預料之中的,是它能識別出我生活裡的一些物品。比如我很喜歡一個電影攝影機造型的小模型,結果 Gemini 不僅認出來了,還準確說出了品牌和型號,甚至推斷出我對攝影感興趣。這種細節本來就是我希望它能注意到的,但能識別得這麼準,還是讓我有點驚訝。
👧🏻 Ronghui
透過聲音和影像讓 AI 更全面地瞭解你,你在主動消除我們和 AI 之間資訊差。你覺得當 AI 擁有更多關於你的資訊後,會發生什麼?
👨🏻 鴨哥
人類和AI面臨的資訊差的確特別大。
比如發起新專案前,我們的第一反應不是寫文件或提示詞,而是找同事喝咖啡聊聊,在聊天中把框架討論清楚。
開會時老闆一個皺眉,我們立刻能意識到要調整。但 AI 沒有眼睛和耳朵,感知不到這些微妙訊號。但如果未來能變得更 AI-friendly,AI 的能力可能會放大十倍甚至百倍,對科研和日常生活都有巨大影響。
所以我最近在研究一個方向:讓 AI 能“主動介入”。現在我們都得手動觸發 AI 工具,或者說一聲 “Hey Siri”。但未來有沒有可能 AI 能即時反饋?比如你說“法國首都是倫敦”,它立刻跳出來說“是巴黎”。這比事後更正有用得多。
我設想的未來是,大家戴著 XR 眼鏡,AI 像外腦一樣,即時提供提示、策略,甚至幫你組織語言,不只是總結,而是現場協助。這是我覺得非常值得深入嘗試的方向。

👦🏻 Koji
我最近見了一個做“主動式 AI”的團隊,叫 Proactor AI[3]。他們的產品能全天監聽,在你開口前就判斷需求並給出建議。但挑戰在於兩點:一是處理大量使用者資料,二是在不打擾使用者的前提下精準介入。我相信這種主動式形態是 AI 的未來。
👨🏻 鴨哥
同意。出必買。
我還在想另一種「回溯式呼叫」的方式。
現在我們用 AI,通常得先按按鈕再說話,比如 ChatGPT。但如果裝置能持續錄音,就像相機的“預錄”功能,一旦按下按鈕,就把之前幾秒的語音發給 AI,讓它判斷你想幹嘛。這種方式能降低使用門檻,也可以和「主動介入」的模式互相補充。
👦🏻 Koji
你剛提到的主動式 AI 讓我想到 Proactor 團隊說,有時候 AI 需要的 context 不只是過去,還包括你接下來可能要幹嘛。所以他們選擇了全天監聽、主動跳出的服務式 AI。
那你給 AI 裝上“眼睛”和“耳朵”之後,它是如何具體幫你處理日常事務的?
👨🏻 鴨哥
以前我和 AI 更多是“嘴炮式互動”,我下指令,它給建議,最後還是我去執行。後來我開試 ChatGPT 的 Operator 功能,讓它真正幫我“動手”幹活。
我讓 AI 幫我做了兩件事,效果都不錯。
第一是網上買菜。以前我需要手動搜尋、選品、加購物車,常常花二三十分鐘。現在我直接用語音告訴 AI 要買什麼,它就自動搜尋,加入購物車,還能查我的歷史訂單,知道我偏好的品牌。有時還能預測哪些菜快用完,主動補上。最後我只需點一下任務執行按鈕,它就把所有菜加好,我再簡單篩選後下單,整個流程壓縮到五分鐘。
第二個是寄包裹。美國寄件大量資訊都需要手動填寫,很費時間。我現在直接報給 AI 包裹資訊和地址,它就在後臺自動操作,幫我選 USPS、跳過保險,五分鐘後告訴我搞定了。我只需要結賬就行。

Part 3 對人如何使用 AI 的思考

👦🏻 Koji
感覺你做的這些事,都是在極限提升效率。
👨🏻 鴨哥
確實,這背後其實是我一直在想的一個概念:賽博長生。不是那種上傳意識、永生不死的幻想,而是在同樣的時間裡,能不能讓自己完成更多的事情。
比如買菜。線下去超市可能只花 100 塊,但要耗掉一小時。線上買菜雖然貴 20 塊,但我只要 5 分鐘就能搞定。本質上是用錢換回 55 分鐘的時間。
你要說 20 塊錢換 55 分鐘命,大家都願意。但一說“買貴了 20 塊”,反而就不想花了。其實這就是我理解的“賽博長生”:不是多活幾年,而是把每一天過得更高效。
👦🏻 Koji
有些人就是喜歡逛菜市場,對他們來說,那是生活的樂趣。他願意用省下的時間去做這件事。
👨🏻 鴨哥
沒錯,這種選擇完全合理。但如果你不享受逛市場,你也可以把時間用來陪家人、打遊戲,或者什麼都不做。從某種意義上說,這也是一種“長生”,或者叫時間置換。
👦🏻 Koji
上一期我們採訪了 RockFlow 的 Vakee。他說推出金融 Agent Bobby 之後,原來的 App 已經不太需要了,未來可能只保留對話式的 agent。最近 Sam Altman 也提到,GUI 很可能會被取代。你怎麼看這個觀點?
👨🏻 鴨哥
GUI 最初是為了降低使用電腦的門檻,讓不會寫程式碼的人也能操作。但在買菜、寄快遞這些場景裡,反而成了效率的障礙。現在我直接用自然語言讓 AI 去操作 GUI,就像派了個代理人,效率反而更高。
這也說明,GUI 這種幾十年前的互動方式,可能真的到了該被重新思考的時刻了。

👧🏻 Ronghui
你現在有沒有看到哪些公司在探索替代 GUI 的互動方式?
👨🏻 鴨哥
還挺多的,像 Apple Watch 最近推出的 “點兩下” 手勢就是一個例子。未來如果眼鏡裝置普及,像手部細微動作、甩手、方向變化這些 IMU 訊號,也都可能變成新的互動方式。空間很大,但目前還很難判斷哪種形式會成為主流。
👦🏻 Koji
我感覺鴨哥比其他人更快地去擁抱新技術,是 early adopter 中的 early adopter。
👨🏻 鴨哥
是的,我比較 geek。
👦🏻 Koji
最近有沒有用到什麼新產品,讓你覺得未來可能會爆火?
👨🏻 鴨哥
暫時沒有特別驚豔的完整產品,但很多新功能讓我很興奮。比如 ChatGPT 每週更新的新特性,像 Codex、Operator 等。我現在更多是在用它們的元件,加上我自己的想法,做一個“山寨版 ChatGPT”。程式碼很多也是 Cursor 或 Trae 生成的。
我覺得 AI 最大的改變是,它讓我們不必再等廠商做出理想的“爆款”。現在,我們可以把自己的想法直接灌注到已有產品中,拼出一個真正符合自己需求的工具。
👦🏻 Koji
你上次來我們節目時,正值 Manus 釋出。現在過了三四個月,你還在用 Manus 或類似的 Agent 產品嗎?會在什麼場景下用?
👨🏻 鴨哥
我一直在用 Manus,尤其是外出時不能坐在電腦前,又想快速算點東西或調研。
比如我最近關注一場咖啡豆的拍賣 Best of Panama,它有個 sample box,我就想知道這三盒樣品值不值那個價。最直接的演算法是參考去年拍賣的單價乘以 100 克,但手動查算太費勁。
我只花了 30 秒和 Manus 說明需求,它花十分鐘生成了結果,還帶中間過程。價格比今年賣得便宜不少,我就決定買了。
這類 Agent 工具在生活裡還是挺實用的。
👦🏻 Koji
哇,我感覺你每天關注的事情好多。
👨🏻 鴨哥
是啊,這其實就是我說的“賽博長生”。
沒這類工具,你只能硬著頭皮買,或者老老實實查資料、算錢,半小時就沒了。有了 Manus,相當於多活半小時。
👧🏻 Ronghui
我感覺你的能量好高,可能也是因為 AI 替你分擔了很多事,幫你省了不少精力。
👨🏻 鴨哥
確實有幫助,但也不全是 AI 的功勞。我覺得能量高,一方面和性格有關,另一方面取決於你每天在做什麼。如果每天做的都是有趣、有挑戰的事,而不是機械重複、替別人收尾的工作,那人自然會更有動力。像剛才說的,把調研交給 AI,我只負責做決策,那種成就感和幸福感是完全不一樣的。這就是我說的,不只是提高密度,更是提高生活的“質量”。從這個意義上說,也算是延長了壽命。
👧🏻 Ronghui
我感覺最開心的,往往是兩種人:一種是像你這樣,AI 用得很熟練的;另一種是完全不關心這些技術、沒有資訊焦慮的人。反而是中間那批人,會覺得每天都有東西要學、很多還沒跟上,總是在焦慮和拉扯中。
👨🏻 鴨哥
確實,這也算是一種命運的眷顧吧。
👧🏻 Ronghui
你自己動手做這些專案,最大的樂趣是什麼?感覺你真的挺享受這個過程的。
👨🏻 鴨哥
最大樂趣就是“做成了”。以前不會的事,現在做到了,比如像學會飛行一樣。
對我來說,能力的突破本身就是最好的獎勵。

Part 4 當 AI 更懂你:人與技術關係的新倫理

👧🏻 Ronghui
我最近剛看了你寫的小說,沒想到研究 AI 的同時還能寫小說。
👨🏻 鴨哥
其實是 AI 寫的,嚴格來說我只是寫了提示詞。
👧🏻 Ronghui
裡面有個情節我印象很深:一個下班很累的人回家,太太情緒不好,AI 提示他該怎麼回應。這個是不是你“賽博長生”想法的一部分?
👨🏻 鴨哥
對,這正是我想表達的。但仔細一想也有點荒謬:如果和伴侶相處時還需要 AI 提示,那我還是“我”嗎?可現實是,AI 的建議往往比我們更理性、更精準,甚至更貼心。這也就帶來了很多像《黑鏡》裡那樣的衝突。
👧🏻 Ronghui
你寫的小說是不是也表達了你對未來“賽博生活方式”的想象?
👨🏻 鴨哥
是的,如果用一個詞概括,那就是“彆扭”。比如有一篇講一個人回家看到妻子因工作壓力大而哭泣,AI 提出幾種安慰方案:講個笑話、給他一段話照著讀、或者執行一整套“情緒修復動作包”。但每個方案都要消耗 AI 預算點。他因為下週有個重要會議,只能選最便宜的選項,結果沒什麼用。
人在技術面前常常不得不做出一些艱難甚至荒謬的選擇。
我對技術本身是樂觀的,但也覺得它會帶來很多我們未必能應對的社會問題。

👦🏻 Koji
你會不會有時覺得,現在的 AI 比任何朋友或家人都更懂你、也更能幫到你?想到這一點,你的感受是開心、失落,還是有點恐怖?
👨🏻 鴨哥
這其實挺恐怖的。當你意識到 AI 的確能提升你的效率、改善你和他人的關係,就很容易依賴它,甚至有點上癮。但問題是:那還是“我”在活嗎?還是 AI 藉著我的身體在活?這個界限有時真的很模糊。
👦🏻 Koji
你會有種 AI 藉著你的軀殼在活的感受?
👨🏻 鴨哥
雖然沒那麼極端,畢竟現在還沒出現那種小說裡的 AR 眼鏡,但我確實會在很多決策時請教 AI。無論是明天去哪玩,還是如何處理家庭矛盾,它給出的方案往往比我更理性、更成熟,也確實更有效。可從某種意義上說,那些決定都是它做的,我只是去執行而已。這種感覺,還挺恐怖的。
👧🏻 Ronghui
你覺得現在有很多人像你這樣,過著高度融合 AI 的生活方式嗎?
👨🏻 鴨哥
不多。我身邊這樣的人很少。
一方面是因為本身就沒那麼多人在深度使用 AI,另一方面是這個領域太新太分散,就算都是 early adopter,也可能走在完全不同的路徑上,彼此難以交集。
👧🏻 Ronghui
我以前看過一部 Bradley Cooper 演的電影 《Limitless(永無止境)》,他吃了一種聰明藥後變得精力旺盛、聰明又成功,最後卻對這藥極度依賴,甚至想自己生產。
這種狀態讓我想到現在用 AI 的感覺,有點像。

👨🏻 鴨哥
是的。更可怕的是,我聽完你講的第一反應是:要是我現在有副 AR 眼鏡,可以直接根據你剛才的描述搜出電影名字就好了。這就像黑鏡那種遞迴感,我真的很需要那個“聰明藥”。
👧🏻 Ronghui
你是AI加強過的人類(笑)。
👨🏻 鴨哥
是,它就是我的外腦。
👧🏻 Ronghui
我想問一個可能有點冒犯的問題:你覺得用 AI 之後,有失去什麼嗎?
👨🏻 鴨哥
我暫時沒覺得自己真的失去了什麼。我每天都會記錄自己做了什麼事,有了 Apple Watch 的錄音功能之後更方便了。我還把這些記錄丟給 AI,請它給建議。它說我做事太有目的性,沒有真正放空的時間。如果說有失去,可能是失去了那種無所事事的閒暇。但我回頭想想,就算沒 AI,我也會把時間塞滿,比如學飛行,去折騰別的東西,可能也不會閒著。
👦🏻 Koji
那你有沒有想過,有一天你離開了,但 AI 還記得你的一切,別人還能透過它和你“對話”?你願意嗎?
👨🏻 鴨哥
Why not?反正我已經離開了,之後發生什麼也管不了了。某種程度上,這也算是“賽博永生”了。關鍵還是看,就算人不在了,還有沒有留下對這個世界的影響。
👦🏻 Koji
你作為有孩子的家長,在教育孩子和 AI 共處這件事上,有什麼思考?
👨🏻 鴨哥
我覺得這特別重要。雖然我孩子還小,但我覺得,比起數數、背唐詩,更重要的是從小培養一種直覺: 哪些事可以交給 AI,哪些是核心能力不能輕易讓渡怎麼判斷 AI 的表現,怎麼當好 AI 的“老闆”。這種能力比會幾百首唐詩、早兩年學會乘法都更有意義。我相信未來世界裡,早點接觸並學會用 AI 是很關鍵的。
👦🏻 Koji
他現在幾歲?跟 AI 怎麼互動?
👨🏻 鴨哥
才三歲多,和 AI 沒有太多互動,主要是聽 AI 給他講故事。我們會用 ChatGPT 的即時對話模式,也在嘗試引導他和 AI 聊天,但他暫時還不太感興趣。
不過我們用 Manus 幹了一件挺有意思的事:比如睡前講白雪公主的故事時,我們會偷偷加點私貨進去,比如說“要好好吃飯”,他還挺願意聽的。

Part 5 未來暢想:從用好 AI 到管好 AI

👦🏻 Koji
節目的最後,想請你分享一下,最近幾個月你觀察到哪些最帶勁的變化,可能預示著巨大的商業價值?
👨🏻 鴨哥
我有兩個感受。
第一,AI 的進化速度一直沒放慢。就像兩三年前我們沒法想象今天的 ChatGPT,六個月前我也想不到 Claude Code 和各種工具會這麼成熟,甚至 Facebook 都開出了 1 億美元的入職獎金。AI 真的在朝著極限衝刺。
第二,Agentic AI 正在成為主流。我一直相信這是 AI 的正確方向,也很高興看到它越來越火。我現在做的 Agentic Workbench 就是相關方向,所以特別興奮。
👦🏻 Koji
Agentic Workbench?
👨🏻 鴨哥
我自己開發了一個類似 ChatGPT 的小工具,我稱之為 Agentic Workbench。
它的核心能力是,可以接入我本地的個人資料庫。我實現了一個 Agentic Retrieval System,它不像 RAG 一樣是一個固定的工作流,而是當AI在思考如何完成一個任務時,如果它自主判斷需要更多背景資訊,它才會觸發搜尋工具,自己去構造關鍵詞,從我的記憶資料庫裡檢索相關資訊,並利用這些資訊來支撐它的分析和回答,或者在必要的時候迭代關鍵字進行進一步搜尋。
透過這種方式,我把資訊的利用也變成了一個低摩擦的、由 AI 自主驅動的過程。
👦🏻 Koji
你剛才提到有很多喜歡的產品,也有不少自己的想法。如果你能參與其中,會做出哪些不一樣的東西?可以講講兩三個例子嗎?
👨🏻 鴨哥
我最喜歡的產品是 ChatGPT,我個人認為它比 Gemini 和 Claude 至少領先兩三個身位。如果能加入 OpenAI 給 GPT 加新功能,我會很興奮。反過來,我特別不喜歡 Gemini 的 App,具體能吐槽半小時(笑),但如果 Google 找我去改進它,我也願意去做。
還有一些 Startup,比如 Manus、Cursor、Trae,這些產品我也在用,也有不少想法可以貢獻進去。
👧🏻 Ronghui
你剛才提到你也在做一個產品,能講講嗎?
👨🏻 鴨哥
其實就是一個“山寨版 ChatGPT”,但我加了兩個改進:一是讓它更透明,能看到 AI 是怎麼思考的,並有機會干預,這點 ChatGPT 和 Gemini 現在還做不到。二是加了很多工具,比如能把 YouTube 音訊轉文字、接我自己的資料庫等,整體更貼合我自己的使用習慣。
👧🏻 Ronghui
你平時時間怎麼分配的?
👨🏻 鴨哥
其實每天也就工作 2~4 個小時,剩下都交給 AI 處理了。它寫程式碼的效率很高,我在公司提交的程式碼量還是前四。對,前四就是第四(笑)。
AI 幫我省下了大量時間,讓我可以自由去做更多自己感興趣的事。
👧🏻 Ronghui
如果你給一個和你類似工作的工程師一些提升效率的建議,你會說什麼?
👨🏻 鴨哥
學會用AI。
👧🏻 Ronghui
假設他已經在用了呢?
👨🏻 鴨哥
那我會建議:別把 AI 只是當作工具來看。
AI是一個像人一樣的東西,我們應該把它當做一個下屬,而不是一個工具。
你要像一個好老闆那樣去使用它——明確任務,提供足夠的資訊,檢查交付質量,幫助它解決被卡住的問題。
用這種心態去協作,很多原本常見的失敗模式就能避免。
👧🏻 Ronghui
我最近也有類似的感覺。昨天我還在說 “ChatGPT 跟我講了什麼”,感覺我是在說一個人,而不是一個工具。
👨🏻 鴨哥
是的,因為它太強大了,我們不得不把很多背景資訊交給它。比如開車,其實很複雜,但我們把很多東西自動遮蔽了,比如交警、訊號燈、行人,所以覺得開車很簡單。但 AI 不一樣,我們讓它處理更多、也更難的任務,自然就需要用新的方式和它協作。
這時候,管理學就派上用場了。我們要像管理一個人一樣去管理 AI。
👦🏻 Koji
可以展開講講嗎如何用管理學的方式和 AI 相處嗎?
👨🏻 鴨哥
可以。簡單來說,管理學的本質是在佈置任務時,確保對方理解你說的是什麼、知道怎麼執行,並且最終交付的結果符合標準。你要處理溝通、技術風險、結果驗收等等一整套流程。
但管理 AI 和管理人又有很大不同。比如,人需要畫餅、要開 one-on-one,而 AI 不需要這些。
AI 真正需要的是上下文。你要維護好它的 context,才能讓它發揮得好。所以,和 AI 協作,其實是一種全新的管理技能,既像管人,又必須用新方法。

👧🏻 Ronghui
我覺得 context 真的很關鍵。人和人溝通時常常會誤解,和 AI 對話時這種問題更明顯。它不知道你的背景,就可能答非所問。但如果你給的資訊足夠,它的回應就會很好。
👨🏻 鴨哥
是的。如果資訊不夠,AI 就容易幻覺。因為它被訓練的目標是給使用者提供幫助,可當它遇到沒資訊又要幫忙的時候,就只能瞎編。這就是幻覺的來源。
👧🏻 Ronghui
你平時看哪些 AI 相關的資訊源?
👨🏻 鴨哥
我不太看固定的網站,我每週會定時讓 ChatGPT 做一次 AI 領域的 Deep Research,然後看它整理出的報告。
👦🏻 Koji
今天非常感謝鴨哥做客十字路口。很多人還在摸索怎麼用好 AI,但鴨哥已經在用它作為第二大腦,甚至幫助你理解世界、理解自己。
我們期待繼續和你一起觀察 AI 的演進。歡迎改天再來!
👨🏻 鴨哥   
好!
👧🏻 Ronghui
謝謝。

參考資料

[1]

Computing Life: https://grapeot.me/

[2]

《From User to Builder》: /2238e8f58ed18087a91acf9fcf252e9e

[3]

Proactor AI: http://proactor.ai/


相關文章