Stable Diffusion img2img是Stable Diffusion中一個強大的圖像生成和編輯功能,它能夠通過隨機過程將一張圖像轉換為另一張具有不同風格和特徵的圖像。
Stable Diffusion img2img教學中,我將帶領你探索這一強大的圖像生成和編輯技術。img2img圖改圖功能以其高質量的圖像生成、風格轉換和編輯能力受到廣泛關注。你將學會如何有效地使用Stable Diffusion img2img功能來滿足自己的圖像創作和編輯需求。無論是專業人士還是初學者,本教學會為你提供實用的知識和技巧,在圖像處理領域更上一層樓。
這篇將介紹Stable Diffusion最好用的功能 img2img,若你還不了解Stable Diffusion,可以參考 Stable Diffusion完整教學:從3種安裝方式WebUI到咒語提詞一次懂(最推薦colab)
看完本篇可以學到:
Stable Diffusion圖像繪畫應用
Stable Diffusion在圖像生成、風格轉換和圖像編輯等領域具有廣泛的應用。以下是針對這些領域的具體應用說明。
由圖生圖的圖像生成
使用Stable Diffusion生成圖像,可以根據指定的條件和約束生成高質量的圖像。它可以用於創建合成圖像、生成特定主題的圖像,例如人臉、風景或動物等,或者生成獨特風格的藝術作品。通過合理調整相關參數,可以生成具有不同細節、顏色和風格的圖像。
以下圖為例,左邊是用prompts生出的原圖,中間與右邊是透過img2img功能,維持同一個主角,針對背景、髮型、服裝進行修改;本篇文章會提供詳細教學,繼續往下看。

風格轉換
Stable Diffusion可以實現風格轉換,將一張圖像的風格應用到另一張圖像上。例如,可以將梵高的星夜風格應用到一張風景照片上,使該風景照片呈現出獨特的藝術風格。通過調整參數,可以控制風格轉換的程度和效果,實現不同程度的風格融合。
圖像編輯
Stable Diffusion在圖像編輯方面具有很大的潛力。它可以用於圖像修復、圖像去噪、對比度增強、圖像分割等任務。利用遮罩功能,可以針對圖像的特定區域進行編輯,例如修復受損區域、去除水印或背景替換。同時,通過調整降噪強度、CFG縮放因子等參數,可以實現不同程度的圖像編輯效果。
Stable Diffusion在圖像生成、風格轉換和圖像編輯等領域具有廣泛的應用。通過靈活調整參數,可以實現不同的圖像處理任務,滿足各種圖像創作和編輯需求。
Stable Diffusion img2img功能概述
Stable Diffusion的img2img功能是一種強大的圖像生成和編輯技術,它可以通過一個隨機過程將一張圖像轉換為另一張圖像。利用這一功能,用戶可以根據需求生成新的圖像或對現有圖像進行編輯,例如替換圖片背景或更改人物服裝。
以下就是本篇將用來手把手教學的案例,從換背景到換服裝,到整個圖片風格換掉,一次學會。完成這過程只要5分鐘!

原圖,背景在巴黎市區的公寓陽台

背景從巴黎公寓陽台換到紐約高樓

換到室內,並一套衣服
Stable Diffusion img2img功能非常適合大量替換圖片背景或人物服裝的場景。通過使用適當的遮罩,用戶可以選擇保留圖像的某些部分,例如人物或物體,同時替換其他部分,如背景或服裝。此外,通過調整相關參數,用戶可以控制生成圖像的細節程度和風格,實現最佳的視覺效果。
Stable Diffusion img2img 應用場景教學
- 廣告業:在廣告設計中,可以使用Stable Diffusion img2img功能為產品或品牌打造不同風格的視覺形象,例如替換廣告背景,更改人物服裝等,以滿足不同市場需求。
- 電商平台:電商平台可以使用Stable Diffusion img2img功能對產品圖片進行批量編輯,例如替換背景、更改顏色等,以提高產品在線展示的吸引力。
- Youtube後期製作:Stable Diffusion img2img功能可以應用於影片後期製作,例如替換場景背景、更改角色服裝等,以實現更高品質的視覺效果。
- 社交媒體:用戶可以使用Stable Diffusion img2img功能對個人照片進行編輯,例如替換背景、更改服裝等,以創建具有個性化風格的社交媒體圖片。
- 藝術創作:藝術家可以使用Stable Diffusion img2img功能將自己的作品轉換成不同風格,並嘗試新的創作理念和技巧。
Stable Diffusion img2img功能在圖像生成和編輯方面具有很高的應用價值,尤其適合大量替換圖片背景或人物服裝的。
Stable Diffusion img2img功能參數教學
在進入手把手教學之前,先看看各種參數代表的意思,等等實做才不會亂調。Stable Diffusion具有廣泛的應用,包括圖像生成、風格轉換、圖像編輯等。接下來,我將為您解釋img2img功能中的各個參數。

Mask遮罩
遮罩是一個二值圖像,它可以用於標示要保留的原始圖像區域和需要生成或變換的區域。在遮罩中,使用inpaint masked 表示圈選起來是要進行修改的區域;inpaint not masked 則表示圈選部分是不要修改的區域。
Sampling steps
採樣步數是指在Stable Diffusion過程中使用的採樣步數。隨著採樣步數的增加,圖像生成的過程將更加細緻,生成的圖像質量可能更高。然而,過多的採樣步數可能導致計算時間過長。
Sampling method
採樣方法是指在Stable Diffusion過程中所使用的採樣方式,通常我都選 DPM++ 2S a Karras 或是 DPM++ 2S a。
一般來說,有兩種主要的採樣方法:Metropolis-Hastings (MH) 和Hamiltonian Monte Carlo (HMC)。MH是一個隨機採樣過程,而HMC則使用梯度信息來引導採樣過程。選擇不同的採樣方法可能會影響生成圖像的質量和計算時間。
CFG scale縮放因子
CFG縮放因子是一個用於控制圖像生成過程中的細節程度的參數。當CFG scale 縮放因子較大時,生成的圖像將具有更多你在提詞關鍵字中的要求;相反,當CFG scale 縮放因子較小,生成的圖像將更為簡單,可能不會用到所有你指定的元素,但好處是可能整體畫面比較協調。適當選擇CFG縮放因子可以使生成的圖像在保持細節的同時,避免出現噪點或過度渲染的現象。
Denoising strength 降噪強度
降噪強度(Denoising strength)是Stable Diffusion img2img功能中的一個重要參數,它用於控制生成圖像的降噪程度,可以理解為讓ai進行想像的程度。以下是降噪強度的影響以及如何選擇合適的降噪強度。
降噪強度對生成圖像的維持原始或大幅改變,在程度上有很大影響;增加降噪強度可以使生成的圖像更加具有想像力,換句話說就是讓ai依照Stable Diffusion關鍵字進行判斷,可能會為圖片帶來大幅改動,也可能會損失圖片原有細節。
適當選擇降噪強度,建議0.3~0.5之間,可以在保持原圖像細節,減少意外發生。不過在實際應用中,你需要根據生成圖像的具體需求以及原始圖像的特性來調整這些參數,以實現最佳的生成效果。
Stable Diffusion img2img 如何選擇合適的降噪強度
選擇合適的降噪強度取決於用戶對生成圖像的具體需求。以下是一些建議:
- 如果希望保留原始圖像的細節,同時只對圖像進行輕度修改,可以選擇較低的降噪強度。
- 如果用戶希望生成的圖像具有較高變化度,並且對原始細節保留的要求不高,可以選擇較高的降噪強度。
- 在某些情況下,用戶可能需要在細節保留和平滑度之間達到平衡,此時可以嘗試多個降噪強度值,並根據實際效果選擇最佳參數。
選擇合適的降噪強度是實現高質量圖像生成的關鍵。通過根據用戶需求和原始圖像特性選擇合適的降噪強度,用戶可以在保留原圖細節的同時,減少變化和不必要的紋理出現。
用Ai打造第2份收入|Stable Diffusion+ChatGPT 線上課程
雖然網絡上有許多Ai學習資源,但資源凌亂素質參差不齊,而且可能存在信息碎片化的問題,導致學習者難以系統的學習掌握知識。
這門課程提供完整管道,從0開始學會用Ai使用方式,打造賺錢技能帶來第2份收入;這門課專門為缺乏基礎知識的學生,提供系統性的手把手教學流程。
而且,這是強調實做與實際運用的ai教學課程,目標在幫助你學會『利用ai工具打造至少4種賺錢技能』。
不然…會ChatGPT和Stable Diffusion卻不拿來賺錢,那要幹嘛呢?今天就用正確工具打造新賺錢能力。
手把手 Stable Diffusion img2img 教學
需要時間: 15 minutes.
- 在Stable Diffusion的img2img功能頁面匯入圖片
在img2img功能頁面匯入圖片
接著準備使用mask做初步圖片調整,改成自己要的。以下圖為例,原圖多了一隻手,但是我真的很喜歡這張圖,於是我必須在不改動所有細節的狀況下修改這隻手。 - 使用遮罩功能並產出新圖
使用mask遮罩功能要點選 inpaint按鈕,接著用滑鼠把要改的地方塗黑,選paint masked(記得嗎就是要改遮罩的地方),再到到prompt輸入處寫上關鍵字『big window, paris skyline』。
因為我們需要非常微幅修改圖片而已,所以把Denoising strength 降噪強度選小一點,0.2,但又要強調巴黎的天際線,所以要搭配高一點的CFG scale縮放因子,選到12。 - 按下執行後就可以得到修正後的圖片了
- 使用mask進行背景調整
接著來學會改圖片背景,一樣用mask功能,先把人物圈起來,並選 Inpanit not masked,表示人物不要動。先使用簡單咒語prompts測試 :on the top of building, new York skyline, sunset,
因為需要ai自己幫圖片製作背景,所以Denoising strength 降噪強度可以選高一點,到0.5。執行後就能看到右邊得成品。
測試後沒問題,可以把咒語關鍵字加多、加長,並用or連結幾個詞,再用batch的功能讓ai一次出圖,出個40張我們再來慢慢挑。
加強版咒語:on the top of building, (new york or paris) skyline in the background, (midnight or sunset or sunrise)
(Stable Diffusion關鍵字使用方式可以參考 stable diffusion prompt 教學:解釋prompt使用規則、符號、參數與範例,用產生器幫忙
接著使用批次功能加上Stable Diffusion ai算圖自己做背景,一次得到多張圖,挑喜歡的存起來囉。 - 使用mask進行服裝與背景調整
因為要維持主角,所以用遮罩把臉部塗黑,並選擇 Inpaint not masked (修改沒遮罩區)
接著使用關鍵字prompts:((white t-shirt)), ((Shoulder-off t-shirt)), indoor, (headband), ((denim short shorts)))
更多精準描述人物和背景的關鍵字可以參考 Ai繪畫咒語字典,包括ai繪圖prompts的結構和大量實際案例|瘋狂整理持續更新
搭配適當的Denoising strength 降噪強度 和 CFG scale縮放因子,並使用batch批次功能也是一次就能的到很多變化版本,再挑選喜歡的留下囉。
Stable Diffusion img2img 教學結論
從上述案例,我說明並展示Stable Diffusion img2img功能的強大性能和優勢,它具有廣泛的應用,例如圖像生成、風格轉換和圖像編輯。通過靈活使用Stable Diffusion img2img功能,你也可以創建高質量的圖像,並其應用於各種場景,如廣告、電商、影片製作和藝術創作等。
記得根據需求調整參數以實現最佳生成效果。你可以通過調整遮罩、採樣步數、採樣方法、CFG縮放因子和降噪強度等參數,來實現不同程度的圖像編輯和風格轉換。選擇合適的參數值可以確保圖像具有更高的清晰度和細節保留。
通過實際應用,你可以更好地理解Stable Diffusion img2img功能的潛力,並將其應用於自己的創作和編輯需求。在這個過程中,讀者將能夠發現新的創作靈感,並提高自己在圖像處理領域的技能。
Stable Diffusion img2img常見問題QA
Denoising strength是Stable Diffusion img2img功能中的一個重要參數,用於控制生成圖像的降噪程度,它可以理解為讓AI進行想像的程度。降噪強度對生成圖像的維持原始或大幅改變具有很大影響。增加降噪強度可以使生成的圖像更具想像力,讓AI依照Stable Diffusion關鍵字進行判斷,可能帶來大幅改動,但也可能損失圖片原有細節。
適當選擇降噪強度,建議在0.3到0.5之間,可以在保持原圖像細節的同時,減少意外發生。然而,在實際應用中,您需要根據生成圖像的具體需求以及原始圖像的特性來調整這些參數,以實現最佳的生成效果。
CFG scale(配置縮放因子)是Stable Diffusion img2img功能中的一個參數,它用於控制生成圖像的尺寸。CFG scale可以幫助用戶調整生成圖像的大小,以適應不同的應用場景和需求。較大的CFG scale值可以使生成圖像具有更高的分辨率和細節,但計算成本可能較高;較小的CFG scale值則可以降低計算成本,但可能降低生成圖像的分辨率和細節。
Mask遮罩功能在Stable Diffusion img2img中起到控制圖像生成區域的作用。遮罩允許用戶在圖像的指定區域進行生成或編輯,同時保留其他區域的原始信息。通過適當使用遮罩功能,用戶可以實現更精確的圖像編輯和風格轉換,例如僅修改圖片背景或人物服裝等局部區域。這使得Stable Diffusion img2img技術在不同的應用場景中具有更大的靈活性和應用價值。
選擇合適的sampling steps(採樣步數)主要取決於生成圖像的需求和原始圖像的特性。較低的採樣步數通常會導致較快的生成速度,但可能會損失部分細節。反之,較高的採樣步數可以保留更多細節,但生成速度可能較慢。在實際應用中,建議從較低的採樣步數開始嘗試,並根據生成圖像的效果和需求逐步調整,以達到最佳的生成效果。