大家好,我是 Jack~
自從 ChatGPT 釋出以來,全球大模型技術蓬勃發展,各大廠商競相推出了自家的 AI 大模型。
國內的開發者們或許沒有想到,有朝一日,咱自家人開發的 AI 大模型,竟然讓其他國家的網友感慨萬千。


這個讓日本和韓國網友感慨萬千的「別人家的孩子」,就是阿里雲的通義千問(英文名為 Qwen)。
而就在 5 月 9 日,阿里雲正式釋出了通義 2.5 大模型,能力升級、效能卓越,在 OpenCompass 開源基座大模型排行榜中,中文效能全面趕超 GPT-4 Turbo。

免費使用地址:
https://tongyi.aliyun.com/qianwen
同時,阿里雲也正式宣佈了“通義千問App”更名為“通義App”,為所有使用者提供免費服務。
在 2.5 版本中,模型相比上一版本在各個方面都有顯著提升:
-
理解力:提升9%; -
邏輯推理:提升16%; -
指令執行:提升19%; -
程式設計能力:提升10%。
可以說,在中文處理能力上,通義絕對是保持在行業的領先地位上。
而在 4 月 26 日,通義推出的擁有 1100 億引數的開源模型 Qwen1.5-110B,更是在多個基準測試中超過了 Meta 的 Llama-3-70B 模型,直接把國外網友看傻了。
在 HuggingFace 的開源大模型排行榜 Open LLM Leaderboard 上,Qwen1.5-110B 榮登榜首。

模型釋出不到 24 小時,ollama 便火速上線了對 110B 的支援。這意味著,你現在就可以透過 ollama 將 Qwen1.5-110B 部署到自己的電腦上執行。

阿里雲 CTO 周靖人表示:
大模型這麼多家,大家都說的是同樣的故事,但最後比拼的就是能力差異。包括最後比拼的是怎麼融合生態,尤其是開發者的生態。怎麼把它落地運用起來,才是最大的差異。
5 月 13 日,OpenAI 釋出會上官宣的 GPT-4o 也印證了一點,OpenAI 也開始做落地應用,打造了擁有多模態即時互動能力的語音助理。
通義也在發力多模態上的應用,像聚焦音影片領域的通義聽悟、聚焦長文件的通義智穩、聚焦程式碼領域的通義靈碼等,提供了多場景、多模態的模型能力。
除了落地應用,通義也早早佈局開源,去年 8 月,通義宣佈加入開源行列,並迅速推出了多款開源模型。目前,通義開源模型的下載量已經超過 700 萬。

除了常規的我們知道的不同引數量的基準大模型,通義還開源了視覺理解模型 Qwen-VL、音訊理解模型 Qwen-Audio、程式碼模型 CodeQwen1.5-7B、混合專家模型 Qwen1.5-MoE 等。
這些模型也是廣受好評:

自從大模型爆火以來,弱智吧就成了檢測大模型能力的一項重要指標,我們來檢測下通義的實戰能力:
先輸入一個腦筋急轉:我今天有 3 個蘋果,昨天吃了一個。現在有幾個蘋果?

這個問題如果不仔細想,很容給出錯誤答案 2,但通義不但給出了準確的答案,還分析了原因。
再問問弱智吧問題:



接下來考察下文字創作能力:

像讀文件、寫程式碼,這些常見的能力我們就不看了,我們玩玩視覺理解能力。
生活中遇到問題了,拍張照片上傳,它也能給出一些意見。

大模型也給出了請及時就醫的指導意見。
還能根據 emoji 表情猜成語:

我們加大難度,給它一個經典的驗證碼圖:

說實話,這理解能力真的很強了!!

以上測試,只是通義眾多功能中的冰山一角,感興趣的讀者可以前去官方網站一試。
通義 2.5 大模型進步還是挺大的!
好了,今天的內容就是這麼多。
我是 Jack,我們下期見!
