大模型之爭,訊飛星火準備好了

作者

碼客
郵箱

距離科大訊飛董事長劉慶峰所說,10月24日“超過”ChatGPT的時間點,還有不到70天。
Chatgpt從今年年初開始帶起一陣持續至今的國產大模型狂熱。熱錢流向這裡,推著年輕或已遠離商業競爭多年的技術領袖出山自立門戶,也推著行駛多年的火車頂著巨大的勢能變軌。究其原因,所有人都認定這是一場新革命的開始。
科大訊飛是這些競爭者中特殊的一個。
這是一家成立24年,超過1萬名員工的老牌公司。但它在技術上又離這場關於人工智慧的革命很近。
科大訊飛是國內與Transformer框架糾纏最深的公司之一,語音識別、圖文識別、機器翻譯——這些科大訊飛最關心的領域,在多年前已經無可置疑地基於Transformer框架而建立。
巨大的資料積累則是這些技術沉澱的另一面。科大訊飛擁有數十TB的行業語料,每天有超過10億人次使用者互動的活躍應用。
這讓劉慶峰顯得非常自信。在5月6日科大訊飛正式釋出訊飛星火認知大模型的釋出會現場,劉慶峰提到了今年訊飛星火認知大模型技術升級的三個關鍵里程碑節點:
6月9日,訊飛星火將突破開放式問答、多輪對話能力明顯提升、數學能力再升級。
8月15日,程式碼能力升級以及多模態互動能力提升。
10月24日,將實現通用模型對標ChatGPT,中文超越ChatGPT的當前版本,英文能做到相當水平,並在教育、醫療等領域做到業界領先。
現在這個目標走到中段。

訊飛星火認知大模型V2.0來了

在大模型能力的諸多維度中,程式碼能力是支撐認知大模型智慧的關鍵維度。根據OpenAI構建的程式碼能力公開測試集HumanEval,星火認知大模型V1.5 Python語言的效果只有41分,而這也是星火認知大模型V2.0中最亮眼的能力提升。
比如最基礎性的,星火認知大模型2.0可以實現以自然語言輸入來生成日常常見的“長度不少於8位,必須包含大小寫、數字及特殊符號”的密碼識別函式。
圖源:科大訊飛
更復雜一點,星火認知大模型V2.0可以實現用Python畫紅色的心形線或者畫出馬鞍面方程三維立體圖並設定漸變色,或者直接用程式碼生成貪吃蛇小遊戲。
圖源:科大訊飛
但對於大部分人來說更直觀的,或許是一個直接從影片轉成gif的演示。
“使用python處理影片星火.m4v,提取其中第2到10秒,把畫面縮小一半,加速5倍,儲存成gif圖片。”
科大訊飛研究院院長劉聰對星火認知大模型2.0輸入了這樣一段只要有程式設計基礎知識就能理解的句子,然後很快在資料夾裡得到了所要求的那個gif檔案。這個實用功能可以非常快速的把任何一段影片變成表情包。
在測試集HumanEval中,星火認知大模型2.0在Python語言的效果評分達到了61分。在程式碼生成、程式碼補齊、程式碼糾錯、程式碼解釋、單元測試生成五個維度的程式碼能力上相比星火認知大模型1.5有了單項最高28%的能力增長,並且在程式碼生成和程式碼補齊兩項能力上超過ChatGPT。
而在同一測試集Java、JS、C++語言上的程式碼表現,星火認知大模型V2.0也都超過了40分,程式碼水平逐漸接近ChatGPT。根據劉慶峰所說,訊飛星火程式碼各維度的能力將在今年10月24日超越ChatGPT,明年上半年對標GPT-4。
程式碼能力度量一個大模型在思維能力上的深度。但對於星火認知大模型來說,它的迅速迭代並不只是為了與更先進的大模型對標,也是為了“超腦2030計劃”奠定基礎。
科大訊飛在2022年雲年會上啟動了這個讓機器人走進每個家庭的“訊飛超腦2030計劃”。劉慶峰將其比作科大訊飛的一場“登月計劃”,他認為如果沒有陪伴機器人進入每一個家庭,人類社會的美好未來是不可能實現的。
圖源:科大訊飛
這個戰略性目標的核心技術就是多模態能力。這也是星火認知大模型V2.0在程式碼能力之外,另一個核心的能力提升方向。
星火認知大模型V2.0現在具有生成人物、風景等各類照片,生成班級手抄報,或者根據古詩詞“作畫”的多模態能力。並且在圖片輸入的理解能力方面,星火認知大模型V2.0可以在一幅景緻複雜的照片中辨認出一輛SUV,或是辨別出一幅圖片中的狗是一隻柯基。
值得注意的是,劉聰在釋出會現場以一張複雜的家庭場景照片考驗星火認知大模型V2.0,後者不只是可以“讀出”整張照片的內容,也準確識別出這個雜亂場景中一盆綠色盆栽在圖片中所描繪空間中的具體位置。這種感知和認知能力對未來像家庭陪伴機器人這樣的新物種出現有非常重要的意義。
圖源:科大訊飛
“多模態能力是賦能行業的剛需,也是實現通用人工智慧的必經之路”,劉慶峰強調,“多模態能力也是科大訊飛既定的人工智慧技術長期戰略。”

從程式碼能力走向iFlyCode1.0

新華社研究院近日釋出的一份國產大模型報告中,星火認知大模型在一個對標接受過高等教育的人類水平,按基礎能力指數、智商指數、情商指數、工具提效指數四大測評維度進行權重設計的測試集中,在智商評估、工作效率兩個維度測試項分數最高,總體評分壓過文心一言等國產主流大模型,位列測評榜第一。
各種不同維度的大模型橫評測試中,參與者越來越多。今年上海人工智慧大會(WAIC)上展出的大模型就超過了30個。在那之前,5月中關村論壇上釋出的《中國人工智慧大模型地圖研究報告》顯示,引數在10億規模以上的國產大模型在當時已釋出了79個,這一數字在7月破百。所謂的“百模大戰”至少在競爭者數量上已經名副其實。
星火認知大模型V2.0釋出的同一天(8月15日),《生成式人工智慧服務管理暫行辦法》開始實行,也意味著這場“百模大戰”將從上游的大模型基礎能力競爭,轉入一種更激烈的產品層面競爭。
星火認知大模型V2.0的能力也以更多應用的形式,更具體的呈現出來。
對於開發者來說,大模型的程式碼能力最終需要放在開發環境裡才有意義。基於星火認知大模型V2.0的程式碼能力,訊飛星火釋出了一款智慧程式設計助手的應用級產品——iFlyCode1.0。
圖源:科大訊飛
劉聰用曾在科大訊飛在去年全球1024開發者節期間展示過的,用兩個手指捏合寫字的“凌空手寫”功能來展示了iFlyCode1.0的強大能力。只需要以自然語言的形式輸入Prompt(提示詞),iFlyCode1.0就可以提供具體分步實現的步驟,同時提供需要匯入的package(軟體包)。整個過程不需要手寫一行程式碼,本來至少需要半天的開發過程,現在透過iFlyCode1.0只需要幾分鐘就可以完成。
劉慶峰表示,在釋出會之前,科大訊飛研發效能平臺已經用2000多名內部開發人員作為樣本,對iFlyCode1.0的開發效率做了週期一個月左右的內測,結果顯示在一些典型場景中,iFlyCode1.0程式碼採納率達30%,編碼效率提升30%,綜合效率提升15%。
星火認知大模型2.0的多模態能力則促成了科大訊飛在AIG上的應用升級——訊飛智作2.0。
訊飛智作目前已經是一個擁有超過375萬總使用者量,生產出超過2100萬個影片作品的AIGC內容生產平臺。在背後的大模型能力升級後,訊飛智作2.0能夠更精確的理解使用者的創作意圖,滿足多元的影片製作需求。
圖源:科大訊飛
劉聰釋出會現場用訊飛智作2.0做了一個介紹黃山毛峰茶葉的影片,在輸入對於影片的內容要求後,訊飛智作2.0會自己尋找關於茶葉的產地、包裝、色澤等特點的準確資訊。整個過程非常快,並且極大降低了影片創作的技術門檻。

平行的兩條進化路線

2010年科大訊飛推出訊飛雲平臺(後為訊飛開放平臺)與訊飛輸入法後,曾經提出了一個“漣漪效應”的觀點。
“漣漪效應”是說人工智慧相關技術被人們所使用的這個過程是一點點擴散的。當使用者越來越多,資料和反饋也會變多,系統誤差在大量資料的修正中變得越來越小,就像水紋向外的震盪一樣。
“漣漪效應”這個在十多年前看來非常直覺性的觀念,在星火認知智慧大模型這件事上有一個更明確的描述。
“1+N”。
科大訊飛將教育、辦公、醫療等場景看作“N”,星火認知智慧大模型則是放在“N”之前的“1”。OpenAI去年11月30日釋出ChatGPT後僅僅15天(12月15日),科大訊飛就啟動了“1+N”認知智慧大模型的專項攻關。
也就是說,星火認知大模型從最初開始就有兩條並行的進化過程。
一條是抽象層面的能力進化。
星火認知大模型的V1.0版本更像一個不錯的文科生。基於科大訊飛本身在NLP領域的技術積累,星火認知大模型V1.0已經能夠較好地完成中英文論文、品宣文案等豐富內容形式的撰寫。但除了文字生成和語言理解,星火認知大模型V1.0在知識問答、邏輯推理、數學能力、程式碼能力、多模態方面的素質仍亟待進化。
星火認知大模型V1.5開始逐漸“文理雙修”——它可以做高考數學試卷了。相比V1.0版本,星火認知大模型V1.5在文字生成、語言理解、邏輯數學能力和程式碼能力方面有最高10%的能力提升,在知識問答方面的提升則達到24%。邏輯能力是星火認知大模型V1.5相比之前提升最大的能力維度,它已經迭代出了不錯的多輪對話能力。
直到星火認知大模型V2.0,其在多模態以及程式碼能力上的迭代並不是無跡可尋。多模態是AI理解世界的長期方向,而生成式AI的需求普及意味著寫程式碼這件事本身勢必會一步步降低門檻。
除了模型能力的迭代,星火認知大模型的另一條進化路線在於產業。
教育產業是科大訊飛軟硬體體系的核心場景之一,訊飛的智慧課堂(暢言智慧課堂)已經在全國1200多萬師生中廣泛使用。星火認知大模型2.0的能力提升也快速反應到了這裡。
圖源:科大訊飛
青少年教育開始實現以素養培養為核心的教育三新(新課標、新教材、新高考)改革,這對教師提出了在教學設定上的變化和挑戰。為此科大訊飛推出了星火教師助手,後者在星火認知大模型V2.0的理解能力基礎上,可以根據學科內容進度完成單元教學設計、課堂活動設計,甚至一鍵生成課件。
劉慶峰表示,在上海、廣東、安徽等一線教師試點體驗後,結果顯示星火教師助手可以提升50%以上的單元教學規劃和課件製作效率,教學活動豐富度也提升了20%以上。
作為口語陪練老師的星火語伴此次升級到了2.0版本,主題對話數量從73個提升到了393個,多模態能力下的虛擬人沉浸式陪練機制進一步加強。並且相比之前,星火語伴2.0新增了CET、雅思、託福的智慧評價反饋以及新的情景交流功能,後者支援圖片、文件自定義情景。
而星火認知大模型V2.0強勢的程式碼能力則會成為學校的教育數字基座。對教育場景理解最深,但並不具備程式碼編譯能力的教職人員可以把教育數字基座作為自己的開發助手,來搭建最適合學生的教育應用。根據上海、湖北等試點學校的應用成效,教育應用的開發週期和投資成本都大幅度降低。
圖源:科大訊飛
劉慶峰也表示,程式碼能力不僅應用於訊飛教育數字基座,也廣泛應用於醫院、大學、企業、政府等不同的機構,透過iFlyCode都可以實現快速搭建和低成本迅速呈現。
“這就是我們說的通用人工智慧為什麼會深刻改變今天以人力和時長為主要邏輯的商業模式,實現整個產業的徹底的顛覆和升級”。
而隨著星火認知大模型在教育、醫療、工業、辦公等領域落地應用,一個更廣袤的開發者生態正在形成。從6月9日星火認知大模型V1.5釋出至今,新增了7862款星火助手,有4109多個助手開發者團隊加入進來。而在科大訊飛的人工智慧開放平臺角度,目前已經有500多項能力開放給各領域的創業者和合作夥伴去呼叫以構建各種新的應用。
"在通用人工智慧上,一定還是要堅持我們價值創造的根本,那就是要有能看得見摸得著的場景,能規模化推廣的應用和產品,同時能夠用統計資料來證明我們的應用成效。"劉慶峰在不久前的一場論壇上表示。
這條關於產業的進化道路可能是科大訊飛更加看重的。而這麼多場景的可能性,被更具像化的整合到一款新發布的“星火一體機”上。

一個更具體的方案

《生成式人工智慧服務管理暫行辦法》的實行意味著大模型競爭從基礎能力轉向產業,而對於人工智慧安全可控的訴求則變成了進入這場競爭的前提。
安全可控、場景驅動和專屬定製則是科大訊飛認為大模型在未來進入產業時需要具備的三個關鍵要素,而星火一體機則是為此準備的一個國產軟硬體一體化私有專屬大模型解決方案。
劉慶峰介紹,星火一體機能夠實現模型訓練和推理的一體化部署,並且針對星火模型的訓練演算法和推理應用進行了硬體定製,大大降低使用成本。其可以應用於問答、對話、知識圖譜、推薦等多個領域。提供從底層算力、AI框架、訓練演算法到應用效果的全棧AI能力,針對企業個性化的需求來定製企業專屬大模型。
圖源:科大訊飛
在場景寬度上,星火一體機基於科大訊飛在多行業積累的場景落地經驗,內建了辦公、程式碼、運維、客服、營銷、採購等10多個場景包,支援對話開發、任務編排、外掛執行、知識接入、提示工程等5種定製最佳化模式,並將持續拓展更多專業場景和模式最佳化。
在核心的安全可控方面,星火認知大模型針對汙語料和幻覺問題形成立體化的“內容安全機制”,保障大模型進入行業之後的內容安全;華為將會作為科大訊飛的合作伙伴保障算力安全。星火一體機基於昇騰AI硬體、昇思AI開源框架,提供業界領先的大模型訓練、推理能力,為大模型全流程創新提供堅實的自主創新算力底座。
“中國人工智慧的發展,尤其是擁抱這次通用人工智慧,絕不僅僅是單個企業、單個科研院所的工作和使命,而是整個社會的機會。”劉慶峰表示,“而在這個過程中,生態的發展決定了產業的繁榮,也是我們一直在孜孜不倦追求的事情。”
一場聚集人工智慧產業頭部公司與頂級資本的對話
點選下方圖片即可報名參加活動
品玩招聘作者,資深作者及編輯,並長期開放實習生招聘。

世界不平靜,我們希望在變動的技術週期和商業週期裡繼續我們的探索,不熄滅眼裡的光。
為了和更多個優秀的你一起記錄和改變這個激動人心的時代,做更多有價值的報道,品玩現開放招聘。
崗位資訊:全職:4人。實習生長期招聘。工作地點:北京。
一句話總結我們在招聘的崗位的工作內容,就是:
報道最重要的商業和技術新聞,並抽絲剝繭地解釋給讀者它們為什麼重要。
一些共同的崗位要求:
1. 尊重常識。
2.對好內容有感知,有選題發明能力。
3.掌握快速搜尋梳理資訊的方法,有較強的文獻閱讀能力,能獨立拓展相關資源。
4 英文流利。有閱讀英文內容的習慣,可以用英文完成溝通。
5.對真實世界有感知,心智成熟,有職業精神,溝通介面良好穩定。
在招崗位:
-新經濟作者、新技術作者
新經濟作者負責報道網際網路商業領域最新動態;新技術作者負責報道新技術領域(AI,晶片,機器人等)最新動態;
追蹤錢的流動,人的變化,商業世界的競爭與合作以及科技的變革,並把它們講述給我們的讀者;
不限工作經驗,不限專業背景,我們歡迎不同背景的候選人。
-資深作者/編輯
對網際網路商業領域或新技術領域有自己的研究和積累;
有自己獲取資訊的方法體系,有持續學習的能力;
能發明選題,撰寫深度文章,同時也可以輔導初級作者。
長期招募實習生
我們為實習生提供與全職同樣的指導與工作支援,並提供留用機會。
或者,以上的描述都不能定義你,但你認為你是我們需要的那個人,也可以發郵件給我們,介紹你自己。
以上崗位應聘者,請將簡歷及作品傳送至:[email protected] 。(請標明應聘崗位)
同時,我們也在招聘其他崗位:
運營部門
崗位資訊:全職:3人。實習生長期招聘。工作地點:北京。
內容運營
能夠敏銳的捕捉網際網路熱點,並將其轉化為出色的內容;
富有創新意識和強烈的主觀能動性,重視流量在工作中的重要性;
有自己獨特的資料分析方法論,能發現龐雜資料中的關鍵點,並反哺內容創作。
影片運營
具備影片的全流程的創作能力;
對各個內容平臺均有深刻理解,能抓住平臺規則紅利;
有自己獨特的資料分析方法論,能發現龐雜資料中的關鍵點,並反哺內容創作。
社群運營
有過國內外成熟知名社群的運營經驗;
能夠獨立承擔運營策略、節奏設計,結合運營目標、節點資源等因素制定精細化的社群運營規劃;
對UGC的熱點、流行趨勢、話語體系有充分理解,能夠透過創意、熱點玩法、活動策劃激發UGC參與。
長期招募實習生
我們為實習生提供與全職同樣的指導與工作支援,並提供留用機會。
運營崗位應聘者,請將簡歷及作品傳送至:[email protected] 。(請標明應聘崗位)
商務部門
銷售總監/高階銷售經理
崗位職責:
1. 負責品玩線上廣告、線下活動類、品牌營銷、市場公關、以及定製方案的商務拓展與銷售工作,透過對目標行業客戶的銷售完成指定收入目標;
2. 對目標行業客戶進行研究、識別、接洽、需求、分析、產品演示、方案規劃、談判與簽約;
3. 管理與維護指定客戶(包括新客戶與現有客戶),提供優秀的售前與售後服務,建立長期、穩定的合作關係,對客戶產品和需求進行持續性的研究與開發;
4. 與各部門保持緊密合作,回饋客戶需求與最新行業動向,協助最佳化產品與服務;
5. 積極參加行業商務與社交活動,拓展人脈資源,持續瞭解與提升行業知識和洞察力
任職要求:
1. 網際網路銷售經驗2年以上,銷售經驗5年以上優先;
2. 做事嚴謹、細心,較強的溝通協調能力;
3. 有市場營銷、品牌方或者市場公關乙方工作經歷優先;
4. 自我驅動,有很強的學習行業知識及專業知識的能力;
5. 具備應變能力,團隊協作能力,能適應多工處理及工作壓力;
6. 擁有intel、華為、華為雲、阿里、阿里雲、高通等網際網路行業直客資源者優先。
更多招聘資訊,可以進入官網招聘頁面獲取。
期待品玩有你的加入。

· 文章版權歸品玩所有,未經授權不得轉載。
· 傳送關鍵詞 轉載合作招聘 到品玩微信公眾號,獲得相應資訊。
· 您亦可在微博、知乎、今日頭條、百家號上關注我們。

相關文章