Stable-Diffusion基礎(chǔ)知識和概念

上傳人：1*** IP屬地：湖北上傳時間：2023-10-21 格式：PPTX 頁數(shù)：8 大?。?27.64KB 積分：6 舉報(bào) 版權(quán)申訴

已閱讀5頁，還剩3頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

StableDiffusion1基本操作文生圖txt2img為文生圖功能，重點(diǎn)參數(shù)介紹正向提示詞：描述圖片中希望出現(xiàn)的內(nèi)容反向提示詞：描述圖片中不希望出現(xiàn)的內(nèi)容Samplingmethod：采樣方法，推薦選擇Eulera或DPM++系列，采樣速度快Samplingsteps：迭代步數(shù)，數(shù)值越大圖像質(zhì)量越好，生成時間也越長，一般控制在30-50就能出效果Restorefaces：可以優(yōu)化臉部生成Width/Height：生成圖片的寬高，越大越消耗顯存，生成時間也越長，一般方圖512x512，豎圖512x768，需要更大尺寸，可以到Extras功能里進(jìn)行等比高清放大CFG：提示詞相關(guān)性，數(shù)值越大越相關(guān)，數(shù)值越小越不相關(guān)，一般建議7-12區(qū)間Batchcount/Batchsize：生成批次和每批數(shù)量，如果需要多圖，可以調(diào)整下每批數(shù)量Seed：種子數(shù)，-1表示隨機(jī)，相同的種子數(shù)可以保持圖像的一致性，如果覺得一張圖的結(jié)構(gòu)不錯，但對風(fēng)格不滿意，可以將種子數(shù)固定，再調(diào)整prompt生成圖生圖Resizemode：縮放模式，Justresize只調(diào)整圖片大小，如果輸入與輸出長寬比例不同，圖片會被拉伸。Cropandresize裁剪與調(diào)整大小，如果輸入與輸出長寬比例不同，會以圖片中心向四周，將比例外的部分進(jìn)行裁剪。Resizeandfill調(diào)整大小與填充，如果輸入與輸出分辨率不同，會以圖片中心向四周，將比例內(nèi)多余的部分進(jìn)行填充Maskblur：蒙版模糊度，值越大與原圖邊緣的過度越平滑，越小則邊緣越銳利Maskmode：蒙版模式，Inpaintmasked只重繪涂色部分，Inpaintnotmasked重繪除了涂色的部分MaskedContent：蒙版內(nèi)容，fill用其他內(nèi)容填充，original在原來的基礎(chǔ)上重繪Inpaintarea：重繪區(qū)域，Wholepicture整個圖像區(qū)域，Onlymasked只在蒙版區(qū)域Denoisingstrength：重繪幅度，值越大越自由發(fā)揮，越小越和原圖接近2Prompt語法技巧畫面畫風(fēng)：主要是大模型或LoRA模型的Tag、正向畫質(zhì)詞、畫作類型等畫面主體：畫面核心內(nèi)容、主體人/事/物/景、主體特征/動作等畫面細(xì)節(jié)：場景細(xì)節(jié)、人物細(xì)節(jié)、環(huán)境燈光、畫面構(gòu)圖等風(fēng)格參考：藝術(shù)風(fēng)格、渲染器、EmbeddingTag等3Prompt語法提示詞排序：越前面的詞匯越受AI重視，重要事物的提示詞放前面增強(qiáng)/減弱：(提示詞:權(quán)重?cái)?shù)值)，默認(rèn)1，大于1加強(qiáng)，低于1減弱。如(doctor:1.3)混合：提示詞|提示詞，實(shí)現(xiàn)多個要素混合，如\[red|blue\]hair紅藍(lán)色頭發(fā)混合\+和AND：用于連接短提示詞，AND兩端要加空格分步渲染：\[提示詞A:提示詞B:數(shù)值\]，先按提示詞A生成，在設(shè)定的數(shù)值后朝提示詞B變化。如\[dog:cat:30\]前30步畫狗后面的畫貓，\[dog:cat:0.9\]前面90%畫狗后面10%畫貓正向提示詞：masterpiece,bestquality等畫質(zhì)詞，用于提升畫面質(zhì)量反向提示詞：nsfw,badhands,missingfingers……,用于不想在畫面中出現(xiàn)的內(nèi)容Emoji：支持emoji，如形容表情，修飾手4ControlNetEnable：啟用ControlNetLowVRAM：低顯存模式優(yōu)化，建議8G顯存以下開啟Guessmode：猜測模式，可以不設(shè)置提示詞，自動生成圖片Preprocessor：選擇預(yù)處理器，主要有OpenPose、Canny、HED、Scribble、Mlsd、Seg、NormalMap、DepthModel：ControlNet模型，模型選擇要與預(yù)處理器對應(yīng)Weight：權(quán)重影響，使用ControlNet生成圖片的權(quán)重占比影響Guidancestrength(T)：引導(dǎo)強(qiáng)度，值為1時，代表每迭代1步就會被ControlNet引導(dǎo)1次Annotatorresolution：數(shù)值越高，預(yù)處理圖像越精細(xì)Cannylow/highthreshold：控制最低和最高采樣深度Resizemode：圖像大小模式，默認(rèn)選擇縮放至合適Canvaswidth/height：畫布寬高Createblankcanvas：創(chuàng)建空白畫布Previewannotatorresult：預(yù)覽注釋器結(jié)果，得到一張ControlNet模型提取的特征圖片Hideannotatorresult：隱藏預(yù)覽圖像窗口5圖像風(fēng)格控制Artist藝術(shù)家風(fēng)格主要通過畫作種類Tag（如：oilpainting、inkpainting、comic、illustration），畫家/畫風(fēng)Tag（如：HayaoMiyazaki、Cyberpunk）等控制圖像風(fēng)格。Checkpoint預(yù)訓(xùn)練大模型Checkpoint是根據(jù)特定風(fēng)格訓(xùn)練的大模型，模型風(fēng)格強(qiáng)大，但體積也較大，一般5-7GB。模型訓(xùn)練難度大，需要極高的顯卡算力。目前網(wǎng)上已經(jīng)有非常多的不同風(fēng)格的成熟大模型可供下載使用。LoRA微調(diào)模型LoRA模型是通過截取大模型的某一特定部分生成的小模型，雖然不如大模型的能力完整，但短小精悍。因?yàn)橛?xùn)練方向明確，所以在生成特定內(nèi)容的情況下，效果會更好。LoRA模型也常用于訓(xùn)練自有風(fēng)格模型，具有訓(xùn)練速度快，模型大小適中，配置要求低（8G顯存）的特點(diǎn)，能用少量圖片訓(xùn)練出風(fēng)格效果。TextualInversion文本反轉(zhuǎn)模型TextualInversion文本反轉(zhuǎn)模型也是微調(diào)模型的一種，它是針對一個風(fēng)格或一個主題訓(xùn)練的風(fēng)格模型，一般用于提高人物還原度或優(yōu)化畫風(fēng)，用這種方式生成的模型非常小，一般幾十KB，在生成畫作時使用對應(yīng)Tag在prompt中進(jìn)行調(diào)用。6圖像精準(zhǔn)控制OpenPose姿勢識別通過姿勢識別，達(dá)到精準(zhǔn)控制人體動作。除了生成單人的姿勢，它還可以生成多人的姿勢，此外還有手部骨骼模型，解決手部繪圖不精準(zhǔn)問題。以下圖為例：左側(cè)為參考圖像，經(jīng)OpenPose精準(zhǔn)識別后，得出中間的骨骼姿勢，再用文生圖功能，描述主體內(nèi)容、場景細(xì)節(jié)和畫風(fēng)后，就能得到一張同樣姿勢，但風(fēng)格完全不同的圖。Canny邊緣檢測模型可以根據(jù)邊緣檢測，從原始圖片中提取線稿，再根據(jù)提示詞，來生成同樣構(gòu)圖的畫面，也可以用來給線稿上色。HED邊緣檢測跟Canny類似，但自由發(fā)揮程度更高。HED邊界保留了輸入圖像中的細(xì)節(jié)，繪制的人物明暗對比明顯，輪廓感更強(qiáng)，適合在保持原來構(gòu)圖的基礎(chǔ)上對畫面風(fēng)格進(jìn)行改變時使用。Scribble黑白稿提取涂鴉成圖，比HED和Canny的自由發(fā)揮程度更高，也可以用于對手繪線稿進(jìn)行著色處理。Mlsd直線檢測通過分析圖片的線條結(jié)構(gòu)和幾何形狀來構(gòu)建出建筑外框，適合建筑設(shè)計(jì)的使用。Seg區(qū)塊標(biāo)注通過對原圖內(nèi)容進(jìn)行語義分割，可以區(qū)分畫面色塊，適用于大場景的畫風(fēng)更改。NormalMap法線貼圖適用于三維立體圖，通過提取用戶輸入圖片中的3D物體的法線向量，以法線為參考繪制出一副新圖，此圖與原圖的光影效果完全相同。Depth深度檢測通過提取原始圖片中的深度信息，可以生成具有同樣深度結(jié)構(gòu)的圖。還可以通過3D建模軟件直接搭建出一個簡單的場景，再用Depth模型渲染出圖。7部署安裝云端部署StableDiffusion通過GoogleColab進(jìn)行云端部署，推薦將成熟的StableDiffusionColab項(xiàng)目復(fù)制到自己的Google云端硬盤運(yùn)行，省去配置環(huán)境麻煩。這種部署方式的優(yōu)點(diǎn)是：不吃本機(jī)硬件，在有限時間段內(nèi)，可以免費(fèi)使用GoogleColab強(qiáng)大的硬件資源，通常能給到15G的GPU算力，出圖速度非常快。缺點(diǎn)是：免費(fèi)GPU使用時長不固定，通常情況下一天有幾個小時的使用時長，如果需要更長時間使用，可以訂閱Colab服務(wù)。本地部署

人人文庫> 全部分類> 教育資料 > 中學(xué)教育

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

Stable-Diffusion基礎(chǔ)知識和概念

文檔簡介

溫馨提示

最新文檔

評論

Stable-Diffusion基礎(chǔ)知識和概念

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔