訊飛星火V4.0釋出:國產大模型真的很炸裂!

“西遊記中,孫悟空一共被唐僧唸了幾次緊箍咒?”
“孫悟空的金箍棒和哈利波特的魔杖有什麼不同?”
如果把《西遊記》和《哈利波特》這兩套書給我,我恐怕得翻上一個禮拜。

然而將這兩套書“喂”給星火,大模型幾秒鐘就給出了答案。
什麼?你懷疑大模型“已讀亂回”、“一本正經地胡說八道”
星火在每條答案的後面都附上了一個“小旗子🚩”,點開便可追溯到原文,甚至圖片、音訊、影片裡的具體來源。

這就是星火V4.0首發的內容溯源功能。
6月27日,科大訊飛正式對外發布訊飛星火大模型V4.0,以及在醫療、教育、商業等多個領域的人工智慧應用。
隨著新版本的釋出,訊飛星火V4.0七大核心能力全面升級,在8個國際主流測試集中排名第一。

訊飛星火V4.0對標的是美國人工智慧研究公司OpenAI釋出的GPT-4 Turbo大模型。

值得注意的是,從這個月的25日開始,中國開發者就陸續收到了來自OpenAI的“警告信”⚠️
OpenAI宣佈,將從7月9日起終止🚫對中國提供API服務。“斷供”也就意味著這些套殼應用開發團隊將遭受毀滅式的打擊。
其實,這已經不是美國第一次在人工智慧領域卡中國的脖子了。
去年10月17日,英偉達就因為美國商務部的要求,對中國所有能訓練大模型的智慧算力全面斷供🈲
如今,中國的大模型底座能力到底怎麼樣?大模型究竟如何應用落地?在昨天的釋出會中,科大訊飛董事長劉慶峰給出了答案。

劉慶峰表示,訊飛星火是中國第一個基於國產算力訓練出來的全民開放的大模型
什麼叫全民開放大模型?就是國家網信辦等八個部委聯合認證,老百姓可以隨時下載使用的大模型。
所有演算法都是我們自主可控的,每一行碼、每一個數據都是我們自己編寫、自己清洗出來的大模型。

訊飛星火大模型V4.0正式釋出,七大核心能力全面升級,全面對標GPT-4 Turbo,並在文字生成、語言理解、知識問答、邏輯推理、數學能力等方面,實現超越。
在國內外中英文12項大模型主流測試集中,訊飛星火在8個測試集中排名第一,超越GPT-4 Turbo等國際大模型。

當然,看資料可能不太直觀,咱們來舉幾個栗子

“Bob在客廳裡。他拿著一個杯子走到廚房。他把球放進杯子裡,然後拿著杯子走到臥室。他把杯子倒過來,然後走到花園。他把杯子放在花園裡,然後走到車庫。
提問球在什麼地方?
星火推斷出球在臥室的地面

這就是星火V4.0在複雜指令、複雜邏輯推理、空間推理、多模理解等方面的效果,是星火“智商”再度進化。
在釋出會的演示過程中,三位發言人在有高噪音的環境下同步講話,訊飛聽見仍然能夠同步識別出三位發言人以及他們的發言,大家可以戳影片感受下,效果是相當的炸裂👍👍👍
在方言演示階段,訊飛輸入法不僅支援37種方言,而且支援方言與語種免切換。
在底座能力全面升級的同時,訊飛星火大模型V4.0還引入了“個人空間”的概念,打造“更懂你的AI助手”
訊飛曉醫上線了“個人數字健康空間”,它能夠根據電子病歷、檢查報告、體檢報告等使用者個性化資料,構建個人數字健康空間,在看病前可以進一步剖析病症原因,用藥時給出藥物禁忌的個性判斷,在檢查後聯合對比給出資料變化。

還可以透過角色切換,瞭解其他家庭成員的健康狀況。
我們可以直接在星火中定義自己的AI人設。

我試著讓星火根據幾張圖片編寫一段故事,可讀性還是蠻強的。
它竟然還寫了媽媽對孩子的碎碎念“你一點也不胖”、“隔夜水不能喝”……
或許,這就是更適合中國寶寶體質的大模型吧。
大模型的能力升級固然重要,然而對消費者和企業而言,可能更關心的是大模型的能力具體會以什麼形式落地。
在本次釋出會上,訊飛還發布了星火智慧批閱機
這個外形酷似印表機的傢伙,可以對多學科、多題型作業進行批改,甚至輸出講評課件。
老師原來90分鐘的作業批改時間可以變成5分鐘,60分鐘的學情統計時間可以變成1分鐘。
模型上半場是技術較量,下半場是應用落地。或許這就是大模型賦能教育的最好例子了!
說了這麼多,其實OpenAI對中國地區停止服務,未必是一個壞事,它在另一方面會加速中國自己大模型產業的發展。
正如劉慶峰所說,訊飛星火V4.0全面對標GPT-4 Turbo當前能力水平。一旦GPT-5釋出,差距又會拉開,但科大訊飛有信心快速追趕上

星星之火,可以燎原!

為國產大模型點【贊】


相關文章