
嘉賓 | 姚旭晨
編輯 | 李忠良
在現代旅遊時代,傳統導遊面臨著 Pokémon Go 和 Google Gemini 等創新技術的競爭。這些數字伴侶提供 7×24 全天候的可訪問性、豐富的知識和個性化體驗,改變了我們探索世界的方式。雖然傳統指南可能會受到世界知識和可用性的限制,但 Pokémon Go 和 Google Gemini 可以根據個人興趣無縫訪問資訊和建議。從發現隱藏的瑰寶到解開文化奧秘,這些技術豐富了旅行體驗,為每一次旅程提供見解和陪伴。展望未來,大語言模型和增強現實的整合為沉浸式探索帶來了更大的可能性,在不斷發展的旅行領域彌合好奇心和理解之間的差距。在旅遊大模型這個賽道有可能誕生出千億美金的 AI 原生公司出來。
我是一個喜歡追求不同體驗的網際網路產品人,經歷了 2G 時代的窮遊,3G 時代的微博搭夥遊,4G 時代的短影片推薦遊。我在中國長大,隨後在歐洲生活了兩年,北美生活了 14 年,大部分旅遊都是在國外。這篇帖子也主要探索科技產品加持下的國外旅遊新方式。
隨著技術的演進,我手上的旅遊工具也慢慢有了變化:
-
2G 時代:《孤獨星球》紙質書,諾基亞 Here Maps 離線地圖,Wikitravel 離線版。
-
3G 時代:窮遊網、馬蜂窩看帖子做攻略
-
4G 時代:小紅書、TikTok/ 抖音推薦
最近幾年我對使用科技的感受是:推薦引擎太成熟,旅遊博主太能吆喝,旅遊馬太效應越來越明顯啦。不知不覺間,旅遊開始“隨大流”,無數的“打卡”點,“網紅”地,“必去”清單把控著我。天哪,說走就走的衝動,隨處漫步的愜意,我對旅遊的初心逃不出推薦引擎的手掌心。
於是在最近一趟去越南河內和中國臺北的旅行中,我嘗試著摒棄推薦引擎,轉而用了一些很特殊的科技與狠貨:
-
用 Pokémon Go(精靈寶可夢 移動版)這款遊戲帶我探索世界
-
用 Google Gemini 大語言模型幫我介紹歷史,解釋旅遊所見
這兩款工具能代替專業的人工導遊嗎?這是我最想回答的問題。
《喬布斯傳》裡寫到喬布斯夫婦去土耳其旅行,特地僱了當地大學的歷史學教授當導遊 — 這樣的旅行一定收穫滿滿。可咱們普通人呢?是否也可以有類似的專人專業 1 對 1 的貼心服務呢?而且不花錢!
跟團遊雖然有導遊,但畢竟不是 1 對 1 服務,有時還會有暗示或者強制購物的不舒服。或許科技可以取人類導遊之長,無不良導遊之短呢?這篇文章帶您揭曉我的體驗和思考。
在越南河內的旅行中,我特意採用了兩種旅遊方式:
A. 僱傭了三位人類導遊,每位導遊都提供了獨特的視角:
-
個人行:一位知識淵博的學生帶我遊覽河內四小時。
-
跟團遊:一位專業接待外國遊客的導遊,持有藍色導遊證。
-
商務行:一名專業的翻譯帶我瞭解河內的商業習俗和文化歷史。
B. 用獨特的科技工具自助遊,同時不依賴小紅書等推薦演算法:
-
Pokémon Go – 利用遊戲裡的一個“靠近我的遊戲”的功能幫助導航和發現附近有趣的地方。
-
Google Gemini – 藉助生成式人工智(GenAI)來解釋文化敘述歷史。
最終我發現,大多數時候我更喜歡以 Pokémon Go、Google Gemini 為代表的數字伴侶。但是!它們也有侷限性,少了一些人類導遊的有趣和情感,同時如果沒有網路那就巴比 Q 了。
在下面的文章中,我將分享我的反思和經歷,並輔以旅行期間拍攝的圖片。為了讓文章更加完整,我首先將介紹生成式人工智慧在旅行前規劃的應用,但全文重點將主要放在旅行中導遊。
隨著數字時代繼續徹底改變我們探索世界的方式,由大型語言模型 (LLM) 提供支援的生成式 AI 技術已成為旅行規劃中的強大盟友。大語言模型提供的旅行前協助通常分為兩大類:行程規劃和計劃執行。
在行程規劃領域,大語言模型擅長制定全面的旅行計劃,其中包括文化體驗、美食、住宿選擇和必去的旅遊景點。例如,Google Gemini 的旅行行程推薦功能利用其先進的演算法來根據個人喜好制定個性化旅行計劃。

Google Gemini 的旅遊行程推薦: 針對一家四口的家庭遊,同時也提供了越南在四月份的天氣概況幫助準備行前裝備
微軟家的 Microsoft Copilot 還提供專門的假期規劃器叫做 Vacation Planner,進一步簡化行程規劃流程。這些工具分析大量資料,以建議最佳路線、活動和時間表,確保從始至終提供無縫且愉快的旅行體驗。

Microsoft Copilot 甚至還有專門的假期規劃程式。只是隱藏在 Copilot 中比較深,一般很難發現。
除了行程規劃之外,大語言模型還能充當虛擬旅行社,協助旅行者進行各種選購活動,例如機票預訂、酒店預訂、汽車租賃和旅遊安排。透過與第三方系統的 API 整合,這些由大語言模型支援的助手可以在網路上搜索相關資訊並給旅行者建議。
例如,Google Gemini 與 Google Flights 和 Google Hotels 整合,為使用者提供直接訪問航班和住宿選擇的機會。同樣,ChatGPT 提供與 Expedia 和 Kayak 等平臺的整合,使旅行者能夠輕鬆搜尋和預訂旅行相關服務。

Google Gemini 透過其擴程式展(Extensions)提供旅行計劃

OpenAI 的 ChatGPT 使用外掛(Plugin)支援旅行前計劃
值得說明的是,這些旅遊規劃助手有如下限制:
-
在規劃上一般就是“第一下好使”,後面再繼續深度詢問就很難與前面計劃的行程保持一致了。說實話我的感覺是不如看小紅書馬蜂窩等遊記攻略自己總結。
-
在動作執行階段,並沒有真正做到“機票預訂、酒店下單”。也就是最後一公里的執行問題還只能旅行者解決。
旅行前的周密計劃無疑至關重要,但旅程本身也帶來了一系列挑戰和機遇。在接下來的部分中,我們將探討 Pokémon Go 和大語言模型如何在旅行過程中繼續支援遊客,提供指導和見解,讓大家自信而輕鬆地探索世界。
在旅行中我發現很多時候傳統的語音導覽裝置和真人導遊是可以被替代或增強的:
-
博物館和美術館常用的語音導覽裝置
-
有些場所為了創收會收取額外租賃費用。
-
語言選擇也有限,一般是本地語言和英語。中文只有在非常大的地方或者中國遊客非常多的地方才會提供,比如盧浮宮。
-
真人導遊
-
真人導遊通常知識面深而窄:對少數景點了解很多,對大部分景點了解有限。
-
真人導遊有固定的行程,需要你遵循,不是“自由行”。
-
真人導遊通常是單語或者雙語,往往外國遊客只能透過英文交流。
所以我用了兩個很流行的手機 APP 幫我遊覽:
Pokémon Go:用來探索各種“打卡”點
Pokémon Go 是一層疊加在物理世界上的虛擬層,也是一款非常棒的增強現實遊戲。它的遊戲世界是整個地球,然後在各個風景名勝處放置了小怪物或者寵物小精靈讓遊戲玩家去探索。Pokémon Go 的創作者是 Google Maps 的創始人,因為苦於他兒子老是窩在家打遊戲,而開發了一款鼓勵青少年在戶外活動的遊戲。對技術範的讀者插句題外話:Pokémon Go 的釋出是當時世界上最大的 Kubernetes 叢集應用(再跑題更遠一些,對更老的技術範讀者提問:世界上第一個成功的 Java 企業級應用是什麼?)。
Google Gemini:利用大語言模型的多模態(文字、語音和視覺)充當遊客的眼耳腦
Google Gemini 不光是一個大語言模型,同時也支援圖片輸入。它有一個很好用的手機 APP,接受三種輸入方式:文字、語音、和圖片。這樣遊客可以隨時提問,一邊遊覽一邊與 Gemini 互動獲取更多的旅遊知識。
在接下來的部分中,我將說明這一創新系統如何增強旅行體驗。在旅行過程中,傳統的語音導覽裝置和真人導遊可以被 Pokémon Go 和 Google Gemini 取代或增強。
作為世界上玩家最多的增強現實遊戲,Pokémon Go 已經超越了其遊戲娛樂的本體,而成為了一個強大的世界探索工具。這個有點像 Google Earth(谷歌地球)和 Google Street View(谷歌街景),使用者可以足不出戶“瀏覽”整個世界。當然,Pokémon Go 的核心是讓遊戲玩家走出家門,真正探索物理世界。
Pokémon Go 也開始說是一個“眾包“平臺,或者 UGC(User Generated Content)平臺。其吸引力的核心是 PokéStops 和 Wayspots,也就是大家經常說的“打卡點”(POI: Point of Interest)。它們是通往現實世界興趣點的門戶,吸引旅行者踏上人跡罕至的發現之旅。
Wayspots:遊戲玩家和社群驅動的興趣點
Wayspots 是玩家在 Niantic 遊戲(例如 Pokémon Go 和 Ingress)中提交的真實世界位置。它涵蓋了各種各樣的景點,包括歷史地標、雕塑、公園和建築奇觀。玩家只要拍照,然後提交到遊戲平臺,待平臺批准後就可以變成遊戲中人人可以獲取的遊戲景點。
PokéStops:官方釋出的遊戲地標
PokéStops 源自已獲批准的 Wayspots,是 Pokémon Go 中的遊戲內建地點,也是互動和探索的中心。一般 PokéStops 是比較大的興趣點,會有各種小寵物,玩家會在這些經典打卡地進行各種 battle。
這兩款程式在國外的 Google Play Store 和 Apple AppSotre 都可以免費下載和使用。介紹完這兩款程式,我們一起開始旅程探索世界吧~
探索越南河內地標:還劍湖

河內還劍湖周圍的 Pokéstops 和 Wayspots 路徑點(左),以及湖中央著名的龜塔(右)– 真的有烏龜哦!
往往大景點都是 Pokéstops,附近也有很多 Wayspots 路徑點。還劍湖 (Hoàn Kiếm Lake) 是河內必去的旅行景點和經典,而且一到週末,周圍一圈的街道就禁止機動車上路了,專門留給行人、遊客和鍛鍊的人。大多數遊客都被湖中心標誌性的 龜塔(Tháp Rùa)吸引,然後徑直走過去。但其實呢,好的風景在途中,而不止在終點。途中有很多鮮為人知的景點往往被心急的遊客或者傳統導遊忽視 – 可 Pokémon Go 一點都不會落下!

前往還劍湖 (Hoàn Kiếm Lake) 途中的三個 Pokéstops,每一個都有一段歷史和故事
Pokémon Go 使用名為 Wayfarer 的系統來管理 Wayspots 和 Pokéstop 的提交和編輯。該系統允許玩家透過提名新的 Wayspots 並審查其他人提交的內容來做出貢獻。PokéStops 和 Wayspots 的壯大歸功於遊戲社群的積極參與。透過玩家的共同努力,從 2019 年 11 月到 2020 年 6 月短短七八個月時間,遊戲裡就新增了 190 萬個 Wayspot 。
所以,當你在國外一個陌生的城市 city walk 時,下載開啟 Pokémon Go,一邊玩遊戲收集寵物小精靈,一邊遊覽遊戲景點吧!
我在用 Pokémon Go 的過程中,心裡四個字一直在吶喊:什麼是“寓教於樂”?這不就是嘛!
Pokémon Go 帶我們去了旅遊景點,可誰為我們講解呢?在下一節中,我們深入探討如何用 Google Gemini 做導遊。
PokéStops 和 Wayspots 是探索“我附近”(Near Me) 的興趣點的最佳方式,這些興趣點通常是導遊不知道的或 Google 地圖不顯示的。
Gemini (“雙子座”)是 Google 為了對抗 OpenAI 推出的多模態大語言模型。其實作為人工智慧的先行者,Google 早就有嘗試各種 AI 助理。在 Gemini 之前還有最早先的 Google Assistant(主要用在智慧家居 Google Home,安卓手機,和車載系統 Android Auto),屌炸天但沒有大規模應用的 Google Duplex(釋出的時候絕對是一枝獨秀,那時候大家還認為 Google 是 AI 領頭羊),一脈相承但是曇花一現的 Duet AI(對標微軟的 Copilot 全家桶),以及命苦且短命的 Bard:匆匆上馬然後直接被 Gemini 完全取代。Google 從領先者變成了追隨者。
可 Gemini 還是很好用,尤其是對多模態和中文支援也不錯。當然,重點來了 – Gemini 是唯一支援圖片輸入的免費大語言模型 APP。
大家有沒有注意到前圖右三中巨大的鐘表?我在 Pokémon Go 中看到它的時候還非常納悶:怎麼一個巨大的石頭做的鐘表反而成了地標了?Pokémon Go 只是帶我去了那裡,但是沒有解釋為什麼要去那裡。然後我就打開了 Google Gemini 開始詢問了。

Google Gemini 對鮮為人知的瑞士鐘錶娓娓道來,同時中文也支援。注意右上角的語音按鈕,可以用來聽的。
上圖所示的還劍湖附近瑞士鐘的故事正好回答了我的問題:
-
瑞士鍾是瑞士城市 Bern 在 2010 年 1000 年生日的時候贈送給河內的,直徑足足有 13 米,高 1.8 米,其實是挺大一個東西,但是沒人知道!
-
這個瑞士鍾鮮有人知,很多河內本地人也不太知道,這可怎麼辦?Gemini 解釋說有很多人一直在抱怨政府沒有做好宣傳(壓力瞬間給到河內文旅局)。即使是專業導遊或當地人也可能不知道其歷史。因此越南當地人一直在討論將時鐘重新安置到更顯眼的位置。
-
瑞士鍾其實在谷歌地圖上根本找不到!但《Pokémon Go》顯示了它的位置!
瑞士鍾其實只是去往還劍湖的一個途中小插曲,最終目的地還劍湖也有一個美麗的傳說,Gemini 用其獨特的女聲(也可以選男聲,誰叫咱叫“雙子座”呢)娓娓道來。
還劍湖的傳說
一邊走,一邊聽,Google Gemini 揭示了還劍湖的有趣起源,還生動地描繪了一把傳奇寶劍和發生關鍵作用的神龜的歷史:一位越南古時候的國王得到了神龜親賜的寶劍,擊敗了外來入侵者(你們猜是誰?),最後又把寶劍歸還給了居住在湖中的神龜,“還劍湖”之名由此得來。

Google Gemini 講述還劍湖和神龜的故事——這個河內的淡水湖就是過往歸還寶劍的地方。
作為旅行伴侶,Google Gemini 的與眾不同之處在於它能夠提供超越傳統導遊侷限的見解。能夠做到胸中有物,知無不盡。有了 Gemini,我能夠更深入地瞭解周圍的歷史和文化,發掘隱藏的瑰寶和不為人知的故事,豐富旅行體驗。
Google Gemini 比專業導遊更能講解世界。
此外,Google Gemini 的手機 APP 有對使用者很友好的介面設計和直觀的功能(例如文字轉語音),為移動探索提供了無與倫比的便利。
我一般是用無線耳機跟它配合使用,邊走邊問,邊問邊聽。這個時候 Gemini 就變身為一個移動中的動態音訊指南,不讓我做低頭族而耽誤了旅途中的美景和風土人情。
具有 Google Gemini 文字轉語音功能的真無線耳機是最好的移動旅行指南,也是增強現實在旅遊業中的絕佳應用。
彩虹屁一把:在不斷發展的旅遊技術領域,Google Gemini 猶如啟蒙燈塔,以其無盡的知識和深刻的評論照亮世界。從揭開鮮為人知的地標之謎到探究塑造文化遺產的傳說,Gemini 已不再只是單純的嚮導,而是成為深入瞭解我們周圍世界的門戶。隨著我們繼續探索增強現實的邊界,Gemini 成為一股變革力量,透過一次次的旅行和一筆筆的講解,精雕細琢逐步塑造旅遊探索的未來科技形態。
上面一整段話,除了前 5 個字,都是 ChatGPT 潤色的。大語言模型如 ChatGPT 和 Google Gemini,一點都沒有人類的嫉妒之心,雖然貴為勢不兩立的競爭對手,但相互吹捧起來其實是一點都不含糊的,而且它們說話的時候也是真心實意的 — 因為機器不會撒謊,只會幻覺(hallucination ),也就是一本正經地胡說八道。但是重點來了:再胡說八道,也是真心實意的 ——已婚男人們都學起來吧。
當初為了抗衡只有文字能力的 ChatGPT,Google Gemini 一定要有創新,於是成為了首個支援多模態的大語言模型。所謂“模態”,其實就是溝通交流的媒介,如文字、聲音、影像、影片,還有前衛玄乎的腦波。“多模態”就是一個模型同時支援多種溝通媒介。例如正常人就是多模態的,耳朵眼睛觸覺分別代表不同模態。聾啞人是雙模態,主要是看和摸。盲人也是雙模態,主要是聽和摸。
在我參觀河內最古老的佛教寺廟鎮國寺時,我看到了一個有趣的場景:好多遊客肩搭著肩圍繞著一棵參天大樹繞圈圈。他們在幹嘛?沒人可以問,於是我求助於 Google Gemini:為什麼這些人要繞著這座佛教寺廟裡的樹轉圈?見下圖:

Google Gemini 解釋寺廟裡繞樹的儀式
首先,Gemini 僅憑一張照片(上圖左)就成功識別出這座寺廟是越南河內的鎮國寺!是不是很棒?我看到答案時直接驚呆了 — 這得要多上通天文下曉地理才能有如此廣泛的知識面!然後它繼續解釋了繞圈圈的幾種原因。還讓我很驚歎的是,把樹圍起來的罈子上其實是有一些被遊客遮擋的文字的,可 Gemini 仍然成功辨認或者推理出全部文字:“DUONG LICH”、“CHÍNH NGHIỆP”和“CHÍNH”。
在整個行程中,我的兩個經常性動作是:
-
走路的時候就用無線耳機跟 Gemini 對話,讓它講解整個越南的歷史,從發源講到成為中國的藩屬國,然後經歷了法國和日本的殖民統治,再到胡志明領導的獨立運動,然後越南戰爭和有越南特色的社會主義。還解釋了河內為什麼叫“河內”,真的就是城市被河包裹,所以叫河內。
-
遇到語言無法形容的,就掏出手機照一張相,然後找 Gemini 解釋。一來一去一問一答倒也有趣,雖然一個人旅行,但總感覺有專人陪伴,而且 Gemini 還可以設定自己喜歡的聲音哦。
我發現 Google Gemini 非常擅長翻譯和識別照片中的物體,但有時它拒絕識別或評論照片中的人。唉,谷歌那水漫金山的政治正確,跟微軟的”Responsible AI”一樣氾濫而且副作用明顯。Google 曾經犯過一些很“致命”的錯誤,比如把黑人識別成大猩猩,結果一朝被蛇咬十年怕井繩,產品經理或者決策者們乾脆採取了“寧可錯殺一千也不放過一個”的“寧濫毋缺”策略,嚴重影響了絕大多數人的產品體驗。
隨著 Google Gemini 的不斷發展,它逐漸成為我進行基於影像的查詢的首選工具,並逐漸取代了 Google Lens 作為我圖片識別的首選。
有一天我和導遊去了河內的一家咖啡館(Gemini 也可以解釋為什麼以茶為主導的亞洲,咖啡在越南如此流行)。來了這裡總要體驗一下世界聞名的越南雞蛋咖啡吧!然後我就開始一邊跟導遊對話,一邊從 Gemini 上求證。我發現在短短 10 分鐘的對話裡,導遊傳遞了一些錯誤的資訊,也有一些不太清楚的問題,而 Gemini 正好是一個很好的輔助。
雞蛋咖啡的準備其實是很漫長的,因為要把淡黃打發到起泡,才能有綿密細滑的口感。有點像做蛋糕的時候手打蛋黃,兩根筷子是很難搞定的。於是咖啡廳裡一般用電動打蛋器。但即使這樣,也需要打發至少 5 分鐘才能有非常綿密的泡沫。這也解釋了為什麼雞蛋咖啡在世界範圍內不如奶泡咖啡流行 – 製作工藝有點複雜。
然後我的小小好奇心就起來了,我問導遊:在電動打蛋器發明之前,越南人是如何打發蛋黃的呢?這一下子就把他給問住了。我的導遊不到 30 歲,而雞蛋咖啡的歷史已經有七八十年了,好像從他小時候的記憶裡雞蛋咖啡就是用電動打蛋器做出來的。
要回答這個問題,必須要有 3 個推理過程:1)雞蛋咖啡杯發明的時候,電動打蛋器被髮明瞭嗎?2) 如果是,那電動打蛋器在越南有引入並廣泛使用嗎?3) 如果否,那越南人用什麼呢?我的當地導遊沒有把這個思考過程聯絡起來。但 Google Gemini 卻給出了直接的答案:

Google Gemini 解釋了越南雞蛋咖啡中蛋黃的加工過程
1)雞蛋咖啡杯發明的時候,電動打蛋器已經被髮明瞭。
2)但是早期的電動打蛋器並不好用,也沒有引入到越南。
3)所以越南人早期一直用手動打蛋製作雞蛋咖啡。
越南導遊還告訴我,雞蛋咖啡很衛生,因為在打蛋的過程會把蛋黃做熟起到殺菌作用。而 Gemini 則指出,其實這有一定的健康風險,因為攪拌產生的熱量不足以完全煮熟蛋黃,也不一定殺菌。嗯,我的下一個問題很自然的變成了:使用無菌蛋呢?真的無菌嗎?Gemini 不光能從科學角度給出合理解釋,還會考慮經濟和社會因素。比如無菌蛋的成本是否會成為阻止雞蛋咖啡流行的障礙。
在咖啡館裡,我不斷地追問導遊為什麼雞蛋咖啡沒有牛奶咖啡那麼受歡迎。Gemini 滿足了我有點變態的求知慾。我相信大多數導遊不會有如此廣泛的知識或極大的耐心來回答我這些古怪的問題。
大語言模型既有知識,又有耐心,可以提供對旅遊中問題的全方位解讀和回答。
Pokémon Go 和 Google Gemini 的侷限性
與任何技術一樣,Pokémon Go 和 Google Gemini 都有自己的一系列限制,可能會影響它們在某些情況下的有效性。
對網際網路接入的依賴
Pokémon Go 和 Google Gemini 的主要限制是它們對網際網路連線的依賴。在沒有網際網路接入的地區,例如偏遠的荒野或地下,這些技術可能會變得無效,從而限制了在人跡罕至區域的探索應用。
室內限制
尤其是 Pokémon Go 主要針對戶外探險而設計,在室內環境中基本無法發揮作用。因此,在博物館、美術館或其他室內景點尋求指導或資訊的遊客可能會發現 Pokémon Go 作為旅行伴侶的實用性有限。
在移動網際網路普及之前,我會把整個 Wikitravel 網站下載到手機上離線閱讀遊覽城市的 HTML 頁面。從這個意義上說,我手中的《孤獨星球》(Lonely Planet)或 Wikitravel 的離線副本就是我的本地導遊,只是它們只能瀏覽,不能對話,產品體驗比大語言模型差很多。
雖然現在已經有了 0.5B 到 2B 離線手機版本的大語言模型,但他們也有非常多的侷限。比如說這些離線模型缺乏世界知識。因為引數太少了,也不能上網尋求知識補全。同時大語言模型對手機硬體的資源要求也讓中低端手機捉襟見肘。本地算力跟不上還是隻能依賴聯網體驗。
在博物館等環境中,文物識別也有侷限性。因為大語言模型引數再多也不能具體到每一個很小的展覽品,所以傳統的博物館導遊和導覽裝置會提供更卓越的講解知識。
最終,雖然 Pokémon Go 和 Google Gemini 等技術提供了前所未有的便利性和可訪問性,但它們少了人與人近距離互動的人情味。它們更多的是一個專業知識的講解員,開個玩笑,來個段子,即興表演一個,這些都是人類導遊做的好而科技無法追上的地方。
總結一下,在旅行陪伴領域,Pokémon Go 和 Google Gemini 是革命性的工具,為全球旅行者提供無與倫比的可訪問性、知識和便利性。透過利用增強現實和高階語言處理的力量,這些技術重新定義了傳統的導遊體驗,根據每位旅行者的獨特興趣和偏好提供個性化的旅程。它們的優點主要體現在:
拓展知識視野
傳統導遊最顯著的缺點之一在於他們的世界知識有限。然而,有了觸手可及的 Google Gemini,旅行者就可以訪問海量資訊庫,並透過從廣闊的網際網路收集的即時更新和見解來豐富資訊。無論是尋找歷史軼事還是文化細微差別,Google Gemini 都是無所不知的嚮導,隨時準備用其無限的知識照亮道路。
不間斷的可用性
與傳統導遊的可用性和能力可能受到時間和資源的限制不同,Pokémon Go 和 Google Gemini 提供全天候幫助,確保旅行者可以隨時獲得答案和建議,而無需等待或安排預約。這種無縫的可達性增強了旅行體驗的靈活性和自主性,使旅行者能夠按照自己的節奏進行探索。
量身定製的建議
Pokémon Go 和 Google Gemini 有潛力提供高度個性化的體驗,並根據每位旅行者的獨特興趣和偏好進行策劃。透過複雜的演算法和使用者反饋機制,這些技術可以提供有針對性的推薦,引導旅行者前往隱藏的瑰寶、當地熱點和與個人品味產生共鳴的景點。
豐富的文化沉浸
透過整合筆譯、口譯和文化解說功能,Pokémon Go 和 Google Gemini 促進了更深層次的文化沉浸,使旅行者能夠更深入地與周圍環境互動。無論是破譯當地習俗、克服語言障礙,還是解開歷史謎團,這些技術都是不可或缺的伴侶,透過有意義的見解和理解豐富旅行體驗。
不斷發展的旅行應用程式
展望未來,大語言模型和增強現實技術在旅遊應用中的融合想象空間非常大。從觀光推薦到即時翻譯服務,這些創新解決方案有可能徹底改變旅行者探索和與周圍世界互動的方式。透過利用大語言模型和“我附近”的景點,旅行者可以踏上由知識、好奇心和陪伴引導的沉浸式旅程。
無盡的探索
在不斷發展的旅遊技術領域,Pokémon Go 和 Google Gemini 為未來鋪平了道路,讓旅行者不再孤獨。有了大語言模型的支援和增強現實的陪伴,每一次旅程都變成了一次冒險,每一個目的地都變成了一次發現,每一個時刻都變成了探索和啟迪的機會。
在我寫下最後這一段時,OpenAI 剛剛釋出了 GPT-4o – o 代表的就是全通路 (Omni-channel)和多模態:語音、文字、影像同步支援,而且時延小到讓人不覺得有頓挫感。如果我們把 GPT-4o 再配上手機 App,無線耳機,或者 AR 眼鏡,未來的旅行者會有一個前所未有的體驗。技術已經成熟,就看哪家公司跑得快了!
美國從電話發明到網際網路普及之間的近一百年的時間裡,有個非常大的職業群體叫旅遊代理(Travel Agent)。顧客瀏覽郵筒裡寄過來的紙質旅遊指南,然後打電話給旅遊代理訂機票,訂行程,訂酒店。旅遊代理就像房產經紀人一樣活得風生水起。
後來移動網際網路普及,Expedia/ 攜程革了旅遊代理的命,導致這個行業迅速萎縮,轉而提供高階定製或金融服務。而 Expedia/ 攜程這類公司,網際網路基因為重,它們的商業模式嚴重依賴於資源聚合(也就是 Aggregator 商業模式),搜尋引擎,和推薦引擎。它們無法提供對每個遊客的貼心服務,也無法面面俱到到旅遊過程中的切身體驗。這些反而是傳統旅行社比較擅長的。
網際網路和移動網際網路其實從沒有解決旅遊的最後一公里問題。大語言模型,尤其是旅遊業的大語言模型,在遊客好奇心的引導下,在更高旅遊體驗的強烈要求下,會成為一股摧枯拉朽的變革洪流去推翻去 disrupt 上一代網際網路巨頭們。將來的旅行者,會用最少的價錢得到喬布斯花高價僱傭歷史學教授遊覽土耳其的高階體驗。《孤獨星球》將慢慢退出歷史舞臺,旅行者和他們的地球目的地都將不再孤獨,因為他們有旅遊業大語言模型和口袋怪物 Pokémon 的陪伴。一些 AI 原生的旅遊業創業公司會成為新的巨頭,在全球旅遊的大市場下,成長為千億美金的破局者。
姚旭晨 Seasalt.ai CEO,自然語言處理和人工智慧領域的專家和創業者。本科畢業於南京大學電子系,碩士在荷蘭格羅寧根大學(自然語言處理和統計學)和德國薩爾蘭德大學(計算語言學),並於美國約翰霍普金斯大學取得博士學位,主要致力於機器學習領域的自然語言處理和語音技術研究。論文在自然語言理解和機器學習的頂級會議上多次發表。曾創立了語音喚醒和自然語言互動公司 KITT.AI,致力於語音喚醒和自然語音互動技術的研究開發,公司曾被 CBInsights 評選為首屆 AI 100 公司,並獲得微軟聯合創始人保羅·阿蘭旗下的阿蘭人工智慧研究所、亞馬遜 Alexa 基金等投資。
隨著大型 AI 模型在企業中的應用日益廣泛,為了助力企業更好地把握 AI 技術的最新趨勢和實踐,InfoQ 將於 8 月 18 日至 19 日在上海舉辦 AICon 全球人工智慧開發與應用大會,目前我們設定了端側模型落地探索、大模型訓練以及推理加速、大模型資料集構建及評測技術落地、大模型安全性實踐、RAG 落地應用與探索、AI Agent 技術突破與應用、多模態大語言模型的前沿應用與創新、大模型場景 + 行業應用落地實踐、大模型工具鏈與企業提效實踐、大模型在搜尋、廣告、推薦領域的探索、大模型產品應用構建、大模型產學研結合探索等話題。我們將邀請企業專家來為你分享當前的最新前沿實踐,期待能夠為參會的聽眾取得先發優勢。
現在大會已開始正式報名,6 月 30 日前可以享受 8 折優惠,單張門票節省 960 元(原價 4800 元),詳情可聯絡票務經理 13269078023 諮詢。

內容推薦
大模型已經在各種領域有著廣泛的應用和實踐,如BI、企業生產、AIoT、程式設計、資料分析等場景。各個企業當前的探索為大家在落地時解決各種問題提供了重要參考。「AI前線」整理了AICon 北京 2024上大模型在不同領域的應用探索和 Agent 實踐相關PPT以及資料。關注「AI前線」,回覆關鍵詞「應用探索」即可免費獲取。

你也「在看」嗎?👇