全網最全stable diffusion webui API調用示例，包含controlneth和segment anything的API（附json示例）

在本文中，我們將探討如何通過Stable Diffusion WebUI接口來使用ControlNet和Segment Anything模型進行圖像生成和處理。這些API允許開發者以更精確的方式控制生成的圖像內容，以及自動分割圖像中的不同元素。以下是一份詳細的指南，包含了完整的JSON示例代碼。

準備工作

首先，確保您已經安裝了最新版本的Stable Diffusion WebUI，並且已經熟悉了其基本操作流程。如果您還沒有安裝WebUI，請按照官方文檔的指引進行安裝。

ControlNet的使用

ControlNet是一種高級控制功能，它可以通過一系列的網絡層來影響圖像的生成過程。例如，您可以指定一條路徑或曲線，讓生成的圖像中的物體沿着這條路徑排列。以下是使用ControlNet的基本步驟：

1. 獲取ControlNet JSON文件：從[ControlNet](https://github.com/lucidrains/control-net)庫下載所需的網絡模型的JSON配置文件。目前支持的控制類型有：

`”path_length”: “control_v0″` – 用於定義物體運動的路徑長度。

`”xform_trans”: “control_v0″` – 用於控制物體的位置轉換。

`”xform_scale”: “control_v0″` – 用於控制物體的縮放比例。

`”xform_rotate”: “control_v0″` – 用於控制物體的旋轉角度。

2. 設置ControlNet參數：在啓動Stable Diffusion WebUI後，進入“Configuration”界面，找到“ControlNet”部分，輸入如下配置信息：

{
"model": {
"name": "control_v0",
"path": "/PATH/TO/YOUR/CONTROLNET/MODEL/FILE" // 將此處的路徑替換爲您的實際模型路徑
},
"use_websocket": true,
"port": 5006,
"prompts": [
// 這裏可以添加多個提示詞，每個提示詞用逗號分隔
"your prompt here"
],
"num_batches": 1,
"batch_size": 1,
"progressive_steps": 300,
"sampler": {
"name": "DPM2",
"CFG.clip_range": 0.98,
"CFG.max_tokens": 4000
},
"denoiser": {
"name": "ADAM",
"beta": 0.75,
"strength": 0.25
}
}

在上述配置中，`”use_websocket”: true`表示啓用WebSocket通信，以便與ControlNet服務交互；`”port”: 5006`設置了WebSocket服務的端口號；`”prompts”: []`數組中填寫具體的提示詞；`”num_batches”: 1`和`”batch_size”: 1`分別指定了批次數量和每批次的樣本數；`”progressive_steps”: 300`設置了漸進式生成的步數；`”sampler”: {}`和`”denoiser”: {}`部分則分別配置了採樣器和降噪器。

3. 準備ControlNet數據：將您的ControlNet數據（如軌跡點列表或圖像對齊數據）保存爲一個JSON文件。該文件需要遵循特定的格式，具體取決於您想要使用的ControlNet類型。例如，對於`”path_length”`類型，您的JSON可能看起來像這樣：

[{
"points": [[x1, y1], [x2, y2], ...]
}]

這裏的`”points”`字段是一個由控制點座標組成的嵌套數組。

4. 運行Stable Diffusion：點擊“Start Inference”按鈕開始推理過程。Stable Diffusion會基於您提供的提示詞、ControlNet模型和控制數據生成新的圖像。

Segment Anything的使用

Segment Anything是一個先進的實例分割模型，它可以自動識別圖像中的對象併爲其分配一個標籤。要使用這個模型，您需要在本地部署SA模型，然後通過WebUI與之通信。以下是一些基本的步驟：

1. 安裝SegmenAnything：從[SegmentAnything](https://github.com/researchmm/SegmenAnything)倉庫克隆項目，並根據README中的說明進行安裝。這通常涉及到安裝依賴項，編譯模型，以及啓動服務器。

2. 修改WebUI配置：再次打開WebUI的“Configuration”頁面，這次我們需要更新“Segment Anything”部分的配置：

{
"enabled": true,
"api_key": "your segment anything api key",
"host": "localhost",
"port": 5000,
"output_dir": "outputs",
"image_width": 512,
"image_height": 512,
"quality": 75,
"progressive_steps": 200,
"sampler": {
"name": "Euler a",
"CFG.clip_range": 0.95,
"CFG.max_tokens": 4000
},
"denoiser": {
"name": "ADAM",
"beta": 0.75,
"strength": 0.25
}
}

在這裏，`”api_key”`是需要從Segment Anything註冊獲得的密鑰，用於身份驗證；`”host”`和`”port”`分別是SA服務器的地址和端口；`”output_dir”`是存儲輸出結果的目錄；其他選項類似於ControlNet中的配置。

3. 運行WebUI：現在，您應該能夠使用更新的配置來運行Stable Diffusion WebUI。當您選擇一張圖片進行處理時，Segment Anything模型將會被用來檢測其中的對象，並將它們標記出來。

通過結合使用ControlNet和Segment Anything API，開發人員可以爲他們的Stable Diffusion工作流增加強大的自動化和控制能力。無論是在圖像合成還是在圖像編輯方面，這些工具都可以幫助用戶創建出更加準確和多樣化的視覺內容。隨着技術的不斷發展，我們可以預期在未來看到更多類似的創新性應用。

準備工作

ControlNet的使用

Segment Anything的使用

为您推荐

在Windows本地部署Ollama+qwen本地大型語言模型Web互動介面，並實現公網訪問。

芋道SpringBoot配置Maven、創建SpringBoot項目、創建Web介面、讀取配置資訊

Vue2 使用 RTSP 視頻流接入海康威視攝像頭 (純前端)

【前端–Vue】元件之間的多種通訊方式，一文徹底搞懂元件通訊！

【前端–Vue】組件之間的多種通訊方式，一文徹底搞懂組件通訊！

於Windows本地部署Ollama+qwen本地大型語言模型Web互動介面並實現公網訪問。