黑科技上線!AI幫你一眼看穿真實面貌

線上購物時,您是否曾遇到過圖片與實物不符的情況?
挑選衣物時,是否曾因為無法僅透過圖片準確識別面料而感到困擾?
是否希望在無法直接接觸物品的情況下,能夠迅速瞭解其材質型別?
一、引言
在資訊科技飛速發展的今天,我們每天都在與各種型別的資料打交道——從文字到圖片,從音訊到影片。資料的獲取與處理變得愈發重要,但如何有效提取這些不同型別資料中的有用資訊呢?這正是多模態檔案資訊抽取技術大顯身手的地方。
多模態檔案資訊抽取是一種利用人工智慧自動挖掘包含多種資料型別(如文字、影像、音訊、影片等)檔案中隱藏價值的技術。它不僅能夠顯著減少繁瑣的人工處理過程,還能大幅提升資訊處理的效率和準確性。這也正是為什麼AI工具可以打破資訊模態壁壘,成功識別圖片中物品材質。
具體來說,材質識別依賴於深度學習演算法和大量的訓練資料,使模型能夠精確區分不同材料的紋理、顏色及其他視覺特徵。無論是在電子商務中確保商品描述的真實性和一致性,還是在室內設計領域輔助設計師快速選材,亦或是在文物保護方面提供非接觸式的材料分析,這種技術都展現出了巨大的潛力和廣泛應用前景。
本文是一個圖片中物品的材質的實戰教程,跟隨我們的步驟實踐起來,人人都是鑑寶大師!
還等什麼?讓我們開啟這場資料智慧化的探索之旅吧!
點選文末閱讀原文,直通搭建頁面,參與還有驚喜禮物贈送~
二、實操教程
該教程以提取圖片資訊為例,準備好要進行資訊提取的圖片和關鍵詞,就可以開始我們的資訊提取之旅啦。
資源部署
在圖片資訊提取的流程中,使用計算資源構建的 Web 服務來接收使用者的請求,然後將圖片地址和提示詞傳送至百鍊模型服務,由其呼叫qwen-vl-max視覺模型處理後,最終將返回提取結果。
  1. 開通百鍊模型服務:前往百鍊控制檯,獲得免費額度。在控制檯的右上角選擇API-KEY,然後建立API Key,用於透過API呼叫大模型;
  2. 建立物件儲存OSS:

    登入OSS管理控制檯,建立Bucket,引數配置可參考下表;


  3. 建立並部署預設環境:

    部署函式計算應用模板,參考下表進行引數配置;


訪問示例應用

1. 應用部署完成後,您可以在環境詳情的環境資訊中找到示例網站的訪問域名。如下圖所示:


2. 點選訪問域名,即可開啟示例應用。參考下圖:
使用官方示例,進行資訊提取
  1. 在資訊提取時,使用預設填寫的關鍵詞,模型會根據給出的關鍵詞提取出對應的資訊。
  2. a. 滑鼠移動到

    示例1

    ,然後單擊

    使用該示例

    b. 單擊

    提取資訊

    ,等待片刻檢視結果。

  3. 在資訊提取時,不使用關鍵詞,模型會自動分析理解,可能會出現每次返回的差異性。
  4. a. 滑鼠移動到示例1,然後單擊使用該示例
    b. 刪除關鍵詞描述內容。
    c. 單擊提取資訊,等待片刻檢視結果。
若想用於生產環境,請點選連結下載原始碼,可以進行二次開發:
https://atomgit.com/aliyun_solution/image-attr-information-extraction.git
點選閱讀原文,體驗透過圖片視覺理解,結構化提取屬性資訊~
https://developer.aliyun.com/topic/dec/cv?utm_content=g_1000400290

相關文章