重點一:Qwen 推出 Qwen‑Image‑Layered,影像自動分層可獨立編修。
重點二:Qwen‑Image‑Layered 支援可變與遞迴分層,物件可移動、重色、縮放、刪除。
重點三:Qwen‑Image‑Layered 採 Apache‑2.0 開源,Hugging Face 月下載逾 1.3 萬。
中國阿里巴巴集團旗下Qwen(通義千問)推出全新影像模型 Qwen‑Image‑Layered(分層影像模型),主打把單張圖片拆成多個具透明度的 RGBA 分層,讓編修只作用在指定分層、其他內容不受牽連。
模型示範包含重著色、替換人物、修改文字、刪除物件、無失真縮放與自由移動物件,並支援可變層數與「一層再分解」的遞迴流程,強化影像編修的一致性與高保真度。
官方現於 Hugging Face(模型平台)開源該模型,並採 Apache‑2.0(授權條款)。
分層編修可以怎麼用?
Qwen‑Image‑Layered 核心概念頗為直覺,其會把圖片拆成多個語義或結構分層,最終以透明度疊合還原原圖。好處是每層都能獨立處理,不會「牽一髮動全身」。官方展示的案例包括:
- 只改變指定物件的顏色,背景完全不動
- 把人物從女生換成男生
- 直接改文字層內容
- 乾淨刪掉不需要的物件
- 在不變形的前提下縮放物件
- 把物件在畫布上自由拖移
更重要的是層數不固定,像 3 層或 8 層都可以;若編修需要更細,也能把某一層再往下分解,形成「分層中的分層」的迭代工作流。對設計、影像合成、行銷素材產出與後製場景,都能提升一致性與可控性,減少常見的語義漂移與幾何失真。
在開源與落地方面,Qwen‑Image‑Layered 以 Apache‑2.0(授權條款)釋出,方便研究與商用導入。Hugging Face 頁面顯示,過去一個月下載量為 13,246,代表已有一定的社群關注度。
官方亦提供 Python 程式碼,透過 QwenImageLayeredPipeline 載入模型,指定層數(例如 4 層)、解析度(例如 640),即可輸出分層結果,再逐層存成 PNG。
平台目前標示「尚無推理供應商部署」, 若要雲端即用,可能需自行在本地或自有算力環境實作;官方同時提供 Demo(線上展示),協助使用者快速感受分層編修的效果。
換言之,一般用戶最簡單的方式是不寫程式,直接用官方提供的頁面操作:上傳你的圖片,選擇層數與推理步數,提交後即可下載多個 RGBA 圖層檔,每層可獨立編修。若你有 GPU、熟悉 Python,再依「Quick Start」安裝 diffusers 與載入 QwenImageLayeredPipeline 本地執行;否則用網頁 Demo 就足夠且最快。
官方Demo網址請點我(有Hugging Face帳號可免費試用)
實測:可以拆出特定素材,可與其他AI混用
經過《數位時代》測試Demo版,雖然介面並未支援分層編輯,但確實可以把一張圖的素材拆分出來。本次測試一張隨機生成的圖片,就成功把一張圖分拆為4層,包括背景及3個素材(書堆+貓咪、魔法書、魔法桌)。
因此,凡是需要在「不影響整張圖」的前提下,精準、可控地變更局部元素的人與團隊,這項分層編修能力都能帶來顯著效率與一致性提升。
資料來源:Qwen
本文初稿為AI編撰,整理.編輯/ 李先泰
