浪潮。革命。戰役。
當一件件大事件發生,每個人會給它不同的命名,也會在其中看到不同的景象、感受到迥異的情緒。對金山辦公來說,ChatGPT的釋出,更像一記槍響:開啟了辦公軟體新一輪的競爭,除非甘願出局,否則,除了立刻起跑、上場、加入競賽之外,別無選擇。哪怕眼前尚有很多混沌不明。
但是,無論恐懼驅動或者興奮驅動,僅有上場的激情和勇氣顯然不夠。從聽到振聾發聵的槍響、迅速起跑上場、到沉浸式All in AI,金山辦公在不到兩年多的時間裡,似乎已經在這場喧鬧激烈的新競技場上,日漸找到了自己的位置、策略和為之努力的方向。
金山辦公CEO
章慶元
2024年底,金山辦公CEO章慶元先生對《哈佛商業評論》中文版細緻講述了他們從看到ChatGPT釋出,到隨後推出生成式AI技術加持的WPS AI 1.0、2.0版本的全過程。其中既貫穿他們對基於大語言模型的AI技術的理解,對公司過往經驗教訓的領悟與借鑑,也包含他們對生成式AI究竟如何落地到產品體驗、使用者價值的探索和不斷迭代的思考,以及,他們對辦公軟體未來的嶄新介面與存在方式的想象。章慶元對金山辦公的戰略選擇的清晰解釋,對生成式AI加持下WPS產品邏輯與演進方向的諸多絕妙比喻,足以讓所有打工人期待,在不遠的未來能真正擁有一個簡單、強大又聽話的“智慧辦公助手”。
剛剛獲得《時代》雜誌2024年度CEO的AMD CEO蘇姿豐說,“這一輪AI會是一個5-10年的長週期,現在它還在很早期。”微軟CEO薩提亞則在2024年12月的一次最新專訪中說:“2025年,將是生成式AI的決勝之年。”
兩人的觀點其實並不矛盾,他們統一在章慶元的判斷中:這一輪AI戰事剛剛開啟,輸贏終局尚且遙遠,但如果起步晚、行動慢、策略有誤、資源和能力的用力點錯配,你很可能在第一輪就被淘汰,從而錯失一個時代。就像無數在技術浪潮中消失的公司。
章慶元覆盤金山辦公過去兩年多生成式AI戰事初體驗,讓我們看到,想在這場漫長又激烈的戰事中走得足夠遠,除了激情澎湃地滿懷擁抱新技術,企業還需要一顆極度冷靜清醒的頭腦,謙卑且耐心地沉潛到使用者需求與自己產品的功能價值之中。
生成式AI時代的贏家,最終贏得的不是技術皇冠、也不是競爭對手,而是最多的使用者/客戶。
HBR中文版:ChatGPT釋出後,你和團隊當時是怎樣的感受和判斷?
章慶元:當時我們非常非常的震驚。我自己是技術出身,金山辦公也一直強調技術立業,我們都沒有想到,當引數量擴充套件到千億甚至萬億級別的時候,真的量變引起質變,它表現出的智慧,第一次讓我們覺得AI離我們這麼近了。
這一次跟以往兩次AI浪潮很不一樣。之前無論基於神經網路的演算法,還是Alphago帶來的人工智慧熱潮,說實話都沒有對整個行業有特別大的影響。而這一次,雖然我們還看不清它未來會發展到什麼程度,但是就當時的表現來看,我們很快下了結論,這次極有可能是離真正的人工智慧最接近的一次。所以我們當時就決定,我們應該All in AI。那段時間,基本上沒有什麼事情比思考AI戰略更重要了,商業化等等都不重要。我們內部密集地開了很多會,就是想我們怎麼抓住這次浪潮,怎麼投入生成式AI。我們的結論很簡單,金山辦公一定要All in AI。
HBR中文版:堅定All in AI的戰略之後,下一步做了什麼事?
章慶元:All in AI的戰略確定之後,第一個決定就是,我們自己不做大模型,而是做AI的應用,跟所有大模型廠家合作。就是說,別人做發動機,我們造車。
我開玩笑說,訓練大模型就像養小孩,不是每個人都能培養出一個非常好的小孩,說實話它有點運氣在裡面,你的基因、你的實力,它甚至不是有錢就能做成的,谷歌和蘋果也很有錢,微軟也很有錢,都沒有自己做成這件事。而金山辦公最大的優勢是,我們的月活裝置數超過6億,所以,我們聚焦在怎麼把AI在辦公軟體裡用好,這是對我們的使用者、對社會更有價值的事。當時,我們還做了另外一個決定,跟小米、順為資本一起成立了一個基金,我們用這個基金投資了國內很多獨立的大模型廠家。
從今天來看我們這個決定是很正確的,我們開放地跟行業內最好的大模型廠家合作,然後思考在自己的產品裡怎麼做AI的應用。
雖然我們還看不清它未來會發展到什麼程度,但是就當時的表現來看,我們很快下了結論,這次極有可能是離真正的人工智慧最接近的一次。
HBR中文版:之後金山辦公連續釋出了WPS AI的1.0、2.0版本,其中包含了你們哪些思考和做法?
章慶元:2023年4月WPS AI 1.0上線,我們把AI的能力劃分為三個作用。
第一個是AIGC,就是大家用得最多的AI生成內容,包括文字、圖片,甚至寫文章、寫書,這是AI最擅長的,超越了絕大部分人類,這是它目前最成熟的一個能力。
第二個是Insight,就是閱讀理解,它能夠理解非結構化的資料了。以前計算機只能理解結構化資料,它對人類語言這種非結構化資料的理解是很糟糕的。但是大語言模型,它真的能夠幾乎完全理解人類的表達,它帶來的是人機互動方式的顛覆。之前的人機對話,比如智慧音箱等等,其實挺傻的,人類稍微說複雜點它就聽不懂,今天它完全能聽得懂你在說什麼。
第三就是Copilot,就是AI寫程式碼的能力,這是最可怕、最讓我們震撼的一件事。我們從前認為人類的能力是創造,能夠創新寫程式,現在發現AI寫的程式碼很不錯。
拆分它的這三個具體能力之後,我們就思考怎麼用在WPS裡面。第一個AIGC的能力,我們在產品里加入了幫你起草提綱、潤色和改寫文章、生成圖片、給文章配圖等等的功能。第二個Insight的能力,因為它能理解人類的語言了,我就可以直接問它,比如
《哈佛商業評論》採訪我的提綱,主要想了解什麼問題,幫我總結出來;甚至它可以幫我判斷,你的問題對我是善意的還是惡意的。這種情緒判斷的能力,我們也用在自己的客服上,整理客戶反饋。以前需要人工去看每一封使用者郵件,今天AI都幫我們做了。
喬布斯也說過,使用者永遠不知道自己想要什麼。很多時候需要對使用者有引導、提示,他才能把自己的問題和需求精準地表達出來。
第三個Copilot在辦公軟體裡的應用,一個很重要的領域就是資料分析,自動生成很多圖表、做出資料透視表、分析資料。比如,一個公司在珠海門店的經營情況,就可以跟它說,你把昨天珠海市門店某個商品的經營資料給我列出來,或者分析過去一個月某個商品的銷售趨勢等等,它就幫你做出圖表。這極大地提升了使用者對辦公軟體的使用和操作。以前辦公軟體的每個功能都是很抽象的,需要去學習使用這個軟體,對使用者的要求挺高的。現在,就像我剛才說的,這次的AI帶來了人機互動模式的顛覆,未來使用者只要表達需求就好了,你就說你想要幹嘛,剩下的事情就交給AI加持的辦公軟體去做了,這會導致整個軟體業的互動方式發生顛覆式的變化。
那麼1.0版本,我們經過備案、上線,到今天已經有幾百萬使用者在用WPS AI的產品了。經過一年的運營,2024年7月我們推出2.0版本,主要是因為我們發現了幾個很重要的問題。
第一個,我們發現使用者很多時候很難表達清楚自己的需求是什麼。我們之前以為使用者上來就直接問問題,但發現很多使用者並不會直接問問題,尤其是複雜的事情問不清楚。所以,生成式AI要跟現有的辦公軟體做非常好的整合。我們這一年的一個思想變化就是,GUI(圖形使用者介面)還有存在的價值,並不是我們之前以為的,所有軟體未來的趨勢都是LUI(語言使用者介面)。這一年下來,我們認為GUI要跟LUI做一個整合,才能幫助使用者更好地表達自己的需求。喬布斯也說過,使用者永遠不知道自己想要什麼。很多時候需要對使用者有引導、提示,他才能把自己的問題和需求精準地表達出來。
我們的第二個發現是,AIGC在生成內容的時候,它用的是世界知識,它把整個網際網路的文章都看了一遍,然後它寫出的文章,可能好一點、差一點,但都是來自通用知識,使用者無論是企業還是個人,但凡要求高一點,就發現基於通用知識寫出來的文章沒啥用,就像我們都痛恨沒有內容的PPT,它不是生產力。這個社會需要生產力。而生產力,一定來自私域知識。就像今天的採訪,一定是基於你的背景、我的背景、我們企業的情況、我們各自的人生,這樣的內容才是有意義的。但是去年我們所有產業做的AIGC都是基於公域知識、通用知識,它產出的東西價值不是特別大。所以,推出2.0版本第二個重要的點,就是我們覺得未來的發展方向,AI應該從通用的世界知識,轉向個人的和企業的私域知識去發展和生成內容。我們的產品也進展到面向企業去做AI應用,幫企業做它的企業大腦,幫政務辦公去做公文的AI處理等等。
這就是我們從1.0到2.0的進展,可能過一年我們又會有新的想法。整個AI領域會持續發展,我們在應用端也會隨著它與時俱進的發展。
HBR中文版:我是做文字工作的,我試用國內大廠和初創大模型公司的新產品後,說實話挺失望,試來試去,結果都很一般,花費好多時間,還不如回到我的老方法去完成工作,比如收集採訪物件和公司的背景資料、列提綱等等。所以我的結論是,得讓子彈再飛一會兒,AIGC的產品成為趁手工具還很遠。我不知道我的狀況是不是很多使用者的體驗?
章慶元:導致這種使用者體驗,有好幾個原因。首先我覺得目前的產品形態有點問題,無論國內大廠的產品還是ChatGPT、Claude也好,它給使用者一個完全開放性的產品形態,而且沒有管理好使用者的預期。就造成你使用前對它的預期特別高,用了之後發現它只是中學生水平,就很失望。
所以我們的做法是,拆分使用者行為,每一個環節都有對應的AI能力,比如“AI潤色”的功能,你寫完一篇文章不滿意,其中一段文字你想要更好的風格,更活潑或者更嚴肅或者黨政風等等,就可以提要求,它提供的版本就會給你一些啟發,WPS這個功能使用者就挺喜歡的。現在的AI就像是孫悟空,它有強大的通用的能力,但是它不可控,那我們就給它戴上幾個緊箍咒,每個孫悟空就給我做一件事情,不管潤色或者生成圖片,做這個任務的時候不許做別的,不要太發散,這樣子讓使用者也有確定的預期。我們會把使用者的需求拆解到原子化,把AI的能力在我們的產品裡化整為零,然後生成儘可能多的方案,讓使用者只做選擇就好了。可以說,現在所有AI產品產出內容的一次性滿意度都是很低的,那麼我們就在產品互動上去儘量解決這個問題,就是給使用者更多的選擇。打個比方,我自己不是廚師,但我是個吃貨,我知道哪些餐館好吃,我就多推薦幾個方案給使用者做選擇。這個圖片不滿意,就再多生成幾張,一直往對的方向走。
另一方面,WPS的使用者基數很大,對其中很多使用者來說,他的日常工作有大量繁瑣的報告和公文處理,AIGC的功能就能幫他完成很多工作,節省很多時間。就是說,AI的很多功能對非專業人士是有極大幫助,滿足需求的,但是對於專業內的人,還達不到要求。
所以,解決你說的問題,首先要管理好使用者的預期,不要吹牛說自己產品多厲害,結果使用者用了一兩次之後很失望,就不會再用了。就是我常說的笑話,你吹牛說你的AI有多厲害,使用者用了之後發現:“哦,你的AI產品只有兩個不會,這也不會,那也不會。”AI應用一定要考慮好使用者的需求,回到現階段AI應用能做的事情。金山內部做產品研發的思路很簡單,今天我們只思考一個問題,我們產品的每一個功能都要考慮怎麼用AI去重構它。
我覺得未來最好的AI應用,應該讓使用者感受不到你的產品背後是AI。其實使用者根本不關心你的產品是怎麼做的,使用者只關心一件事,好不好用,能不能幫我更好地完成工作,從前我做一個表格要1小時,現在10分鐘就做好了,那就是最牛的產品!使用者不在乎你的產品背後在用什麼技術。這是我們過去一年多在AI應用的產品探索上,最重要的一個想法。
HBR中文版:所以AI產品未來的形態可能會有很大變化,使用門檻大幅降低?
章慶元:從過去這麼多年科技的發展來看,一個新技術出來一開始一定是門檻很高,只有少部分使用者在用,慢慢積累、最佳化,之後使用者的成本、技術的成本都會越來越低,使用門檻也會越來越低,從而進入千家萬戶。現在的AI,就像10年前的移動網際網路,當時人們都說移動網際網路會替代PC,但那時手機能做的事情非常有限,到今天我們才知道,原來Mobile native(移動原生)的應用應該是這個樣子的。今天的AI是一樣的,我們所有人都還在摸索,思考一個問題,什麼是AI native application(AI原生應用)?我們還沒有答案,還在進化中,今天所有的應用都不夠好用。
但是我們堅信這條路能走出來。理由很簡單,現在全世界最多的錢、最聰明的人都在做這件事,投入在AI應用。WPS AI現在是2.0,可能要到5.0、6.0的版本,我們才能說,差不多了,AI原生的辦公軟體應該就是這種東西了。技術的變革和發展,它最後的成功會是潤物細無聲的存在。
現階段說誰好、誰會勝出,都太早了。對任何企業來說,在今天的AI浪潮中,都是逆水行舟,不進則退。
HBR中文版:ChatGPT出來後,國內迅速跟進了所謂“百模大戰”。你們選擇接入所有大模型,而不是自研。就你們的使用來看,國內大模型公司目前的競爭力、進化速度,包括未來會如何發展?你們的產品功能是不是也會受制於大模型的能力?
章慶元:國內大模型過去一年進步非常大。今天國內大模型廠商如果說,他們趕上了ChatGPT 3.5或者4.0,很大程度上不是在吹牛了。特別在文科領域,都已經趕上來了。這個行業的發展,很難一家企業獲得獨家秘笈,人類的知識一定會傳播的。但是模型跟模型之間還是會有差距。有的模型可能問答能力更好,尤其在某些細分領域,比如醫療類的問題,有些可能數學能力特別好。就像我前面的比喻,各家訓練大模型多多少少有點像廚師炒菜,同樣一道菜,這家辣一點、那家鹹一點,各有千秋。但是它們的完善程度、智慧程度,不會像是博士生和小學生之間的差別那麼大。未來大模型的發展,我認為,因為各家的訓練資料與訓練方法不一樣,應用場景不一樣,可能大家會在不同領域有各自的優勢與弱點。所有的應用肯定會受制於大模型,但是因為我們十分開放,接入所有大模型,我們可以在不同場景下使用不同的模型去解決使用者的問題。今天某個模型釋出了新版本,我們看它在哪個能力上做得特別好,就可以切換模型。所以自己不做大模型也是我們解決使用者需求的一個好方法。我估計大模型的進化週期可能需要3-5年,在這個週期中,我們就專注於利用各種各樣的模型幫使用者解決問題。
HBR中文版:生成式AI,會改變辦公軟體的競爭格局嗎?
章慶元:我覺得AI已經成為辦公軟體下一步競爭最大的一個變數。一個行業的競爭格局形成之後,沒有特別的事情發生,競爭格局一般是很難打破的。金山辦公過去有過成功的經驗,也有失敗的經驗。WPS一開始是國內領先,但是到了Windows時代,GUI的技術革命,我們當時犯了錯,沒有跟進“所見即所得”,導致有十年時間WPS幾乎快沒了。然後移動網際網路時代,我們抓住了機會,比較早開始做移動網際網路的產品。微軟則錯過了移動網際網路的時代,我們才重新回到市場中間。因為在移動網際網路時代的成功,今天我們在移動裝置辦公軟體的份額佔了90%多。
這些經歷讓我們對任何一次技術變革或者大的環境變革都特別敏感。我們覺得這一次不管它是對是錯,都得先上車,萬一它成了,你沒跟進,公司就掛了。其實對任何企業、任何行業都是這樣,當一個新的技術浪潮到來,或者新的商業革命發生,你不變,企業可能就沒了。而且我們認為這一次的AI浪潮,很可能比之前GUI、移動網際網路的影響更大、更深遠、更顛覆。所以這塊一定要去爭,AI現在仍然是個變數,才剛剛開始,我認為誰能夠把AI用好,誰就可能在未來勝出。
HBR中文版:在這個新的變數之下,你覺得金山辦公和同行,包括老對手微軟office、以及飛書、釘釘這些國內大廠新秀,會有怎樣的未來?
章慶元:微軟仍然是一個非常值得尊敬的公司,它在各個方面的科技都非常領先。金山辦公做了這麼多年辦公軟體,之前追趕微軟,但是從移動網際網路開始,我們已經在走自己的路了,我們更多聚焦國內使用者,一直在思考怎麼用好新技術,挖掘使用者新的需求、更好地解決使用者的需求。所以這幾年下來,我們跟微軟已經很不同了。微軟還是一個面向全球的辦公軟體,面對不同市場和文化,它一定是一個高度通用、高度抽象的辦公軟體,而我們更加聚焦中國使用者的習慣。這些年來WPS的很多創新點,比如PDF編輯功能等等,使用者都是願意為此付費的,國內使用者特別喜歡這些小功能。所以,可以說從移動網際網路開始,我們已經和微軟分道揚鑣,各自走各自的路,金山辦公開始了自己的創新之路。
我覺得AI會強化這種差異。今天我們看到微軟把Copilot放在右邊一個任務窗格,就是Copilot的原意,它是個副駕的角色,相當於使用者請了個教練坐在旁邊,指導我踩剎車、轉方向盤。但是WPS很不一樣,我們的方式是把油門、剎車、發動機都拆掉重新做一個。我們認為有了AI加持以後,辦公軟體應該越來越簡單,而不是疊加那麼多複雜的功能。雖然未來會怎樣我還不知道,但是今天已經能看到,從移動網際網路到AI時代,我們和微軟的思路差異蠻大的,AI會成為我們之間更大的一個分水嶺。
和飛書和釘釘相比,WPS不輸出管理理念,也不是平臺,而是一個通用的辦公軟體,我們尊重每一個客戶自己的管理方式,我們給企業提供各種基礎元件,組合成它需要的管理平臺。這是我們跟他們最大的不同。
我覺得未來的辦公軟體會發生脫胎換骨的變化,辦公軟體會成為每一個人的智慧辦公助手。使用者未來面對的不會是一個複雜的辦公軟體,而是一個非常簡單的辦公軟體,使用者最關注的是怎樣把自己的問題和需求說清楚,這會是辦公軟體一個質的變化。AI對辦公軟體的改變,也讓辦公軟體不僅僅是個工具,它其實是個雲服務。所以我們跟亞馬遜雲科技合作多年了。我認為AI其實是雲的延展,因為資料最好跟雲在一起,雲在哪,AI就在哪。WPS出海很早,我們出海時就選擇了亞馬遜雲科技,這麼多年,亞馬遜雲科技給我們提供了非常穩定可靠的支撐,它有非常成熟的運營體系,包括模型部署等等,極大地減輕了我們的工作量,讓我們的進度快很多。
HBR中文版:金山辦公在生成式AI的時代,會有更大的優勢和勝算嗎?
章慶元:競爭才剛剛開始。今天我們還是如履薄冰。就像10多年前,移動網際網路早期,手機上有哪些App你還記得嗎?比如湯姆貓,還有人記得嗎?移動網際網路早期的很多公司今天都沒了。所以,起個大早也可能趕個晚集。現階段說誰好、誰會勝出,都太早了。對任何企業來說,在今天的AI浪潮中,都是逆水行舟,不進則退。只有堅持到最後仍然在市場上領先的企業,才是真正的贏。