攤牌了,程式碼不是我自己寫的

一、引言
函式計算 FC 是一款免運維、高效開發的雲服務工具,支援快速部署與彈性擴容,開發者可以透過簡單的配置和程式碼上傳,迅速上線新功能或修復問題,大大縮短了開發週期,讓開發者專注於業務邏輯而無需擔憂底層基礎設施。
Qwen2.5 是阿里雲推出的最新一代開源大模型,支援高達128K的上下文長度,覆蓋92種程式語言,顯著提升了程式碼生成和最佳化的能力。透過阿里雲函式計算 FC提供的免運維的高效開發環境,Qwen2.5 可以快速部署和更新,無需考慮底層資源管理和運維問題,只專注於應用的創新和開發。
將Qwen2.5開源模型部署到函式計算 FC,還需要藉助Ollama 和 Open WebUI 兩個應用。Ollama 負責託管 Qwen2.5 模型,其中預置了 1.5B 引數規模的 Qwen2.5 模型,支援模型推理任務;Open WebUI 則為使用者提供友好的互動介面,支援使用者輕鬆呼叫和互動,實現高效的模型使用體驗。
雲端部署 Qwen2.5 模型核心優勢:
  • 提供更高的靈活性:可根據使用者自身業務需求靈活調整雲服務資源配置,實現對高併發請求的有效支援。
  • 透過資源配置最佳化顯著提升推理速度:可以透過調整例項規格、多 GPU 分散式部署、實施模型量化等措施提升推理速度。
  • 按業務量選擇計費方式:計費方式靈活多樣(包年包月、按量付費),在面對高頻請求和大規模資料處理時,能夠顯著降低綜合成本。
  • 避免資料洩露風險:企業可以實現對自身業務資料的完全控制,確保敏感資訊的安全儲存和處理。
本文將詳細介紹如何利用函式計算 FC 部署 Qwen2.5 開源模型的流程。點選文末“閱讀原文”,瞭解更多方案詳情,開發更高效,智慧更貼近。
二、操作教程
(一)整體架構
(二)基於 Ollama 部署 Qwen2.5 模型
將部署Ollama應用以提供模型服務。Ollama 是一個便捷的模型部署和管理工具,幫助開發者高效託管和服務化模型,便於快速整合 AI 能力。
1. 點選Ollama模板鏈接:
https://fcnext.console.aliyun.com/applications/create,訪問建立Ollama應用頁面。
2. 當前應用模板提供了Qwen2.5:1.5B模型。
  1. 其餘配置項可不作修改,點選建立並部署預設環境按鈕部署應用,應用部署成功後如下圖所示。
(三)使用 Open WebUI 呼叫 Qwen2.5 模型
Open WebUI 是一個開源專案,提供了管理和操作模型的圖形介面。
  1. Open WebUI模板連結[1],訪問建立Open WebUI應用頁面。
  2. 在高階配置 > 地域下拉列表中選擇應用所屬地域。注意所選地域與Ollama應用建立時所選的地域一致。
  1. 應用模板中提供了開啟鑑權的選項,建議在生產環境開啟,以增加安全性,防止未經授權的訪問。
  1. Ollama介面地址填入Ollama應用的內網訪問地址。
說明 
Ollama應用內網訪問地址獲取方式:
開啟函式計算 FC應用[2]頁面,找到Ollama應用,點選應用名稱進入應用詳情。
在應用詳情頁找到函式資源,點選函式名稱進入函式詳情頁。
滑鼠移至HTTP 觸發器,在展開的資訊中複製內網訪問地址。
5.其餘配置項可不作修改,點選建立並部署預設環境按鈕部署應用,應用部署成功後如下圖所示。
6.Open WebUI應用部署完畢後,點選訪問域名。
三、應用體驗
(一)使用 Open WebUI 呼叫 Qwen2.5 模型
  1. 登入Open WebUI後,點選Select a model,在展開的下拉列表中選擇Qwen2.5模型。如果在下拉列表中未顯示可用的模型,請嘗試重新整理頁面以更新列表。
說明:首次部署需要等待約5分鐘,不斷重新整理會導致例項反覆呼叫,為避免消耗更多資源請不要反覆重新整理。
  1. 可以在對話方塊中與系統進行互動,呼叫模型服務獲得相應的響應。
  1. Qwen2.5 模型具備支援超過 29 種語言的能力,例如能夠用法語進行自我介紹。
  1. 由於融入了領域專業專家模型,Qwen2.5 的知識廣度和在編碼與數學領域的能力都顯著提升。我們可以提出一道數學題,Qwen2.5 能夠給出正確的解答。
  1. 點選

    圖示,選擇本地文件上傳,可以使用我們提供的“百鍊”手機詳細引數.docx[3]。

  1. 針對當前文件撰寫提示詞“總結文件內容”。
  1. 可以看到Qwen2.5模型成功提煉出了文件的關鍵資訊。
關於程式碼編寫的結果,可以親自去驗證一下哦😄
(二)函式計算 FC 自動擴縮容機制
  1. 回到 Ollama 函式詳情頁,點選例項標籤,如果當前例項列表為空,可以點選

    圖示重新整理列表。

  1. 例項列表中可以看到 Ollama 函式例項的數量發生了變化。這是因為函式計算 FC 會根據函式呼叫量自動擴縮容,呼叫增加時建立例項,請求減少後若例項空閒超過一定時間(通常3-5分鐘),則自動銷燬以節約資源。這種動態擴縮容的機制不僅提高了資源利用率,還降低了執行成本,使開發者能夠專注於業務邏輯,而無需擔心底層基礎設施的管理。
點選閱讀原文,體驗使用 Open WebUI 呼叫 Qwen2.5 模型,新年禮物,先到先得~
參考連結:
[1]https://fcnext.console.aliyun.com/applications/create?template=fc-open-webui&deployType=template-direct
[2]https://fcnext.console.aliyun.com/applications
[3]https://help-static-aliyun-doc.aliyuncs.com/file-manage-files/zh-CN/20240701/geijms/%E7%99%BE%E7%82%BC%E7%B3%BB%E5%88%97%E6%89%8B%E6%9C%BA%E4%BA%A7%E5%93%81%E4%BB%8B%E7%BB%8D.docx

相關文章