Coisas que eu quero fazer
As imagens geradas com Difusão Estável podem parecer desfocadas ou apresentar baixo contraste.
Aqui estão duas maneiras de melhorar a situação.
Uso dos pés
O primeiro método é usar VAE.
Para obter instruções sobre como instalar e usar o VAE, consulte o seguinte artigo.
VAE recomendado
Conforme mencionado no artigo acima, apresentarei aqui também duas das mesmas VAEs.
O uso dessas VAEs para gerar imagens pode melhorar a qualidade da imagem.
VAE de uso geral
Este é um VAE (Engenharia de Valor Agregado) desenvolvido pela stability ai (desenvolvedora do Stable Diffusion).
Pode ser usado tanto com modelos de ação ao vivo quanto com modelos no estilo anime.
Você pode baixá-lo de vae-ft-mse-840000-ema-pruned.ckpt na página seguinte.

VAE para imagens de anime
Este é um VAE para imagens de anime.
Você pode baixá-lo em kl-f8-anime.ckpt na página seguinte.

exemplo
vae-ft-mse-840000-ema-pruned
Este é um exemplo usando vae-ft-mse-840000-ema-pruned .
A imagem à esquerda foi gerada sem VAE, e a imagem à direita foi gerada usando vae-ft-mse-840000-ema-pruned.
É possível observar que a imagem à direita possui maior contraste e é mais nítida.

kl-f8-anime
Este é um exemplo usando kl-f8-anime .
A imagem à esquerda foi gerada sem VAE, e a imagem à direita foi gerada usando kl-f8-anime.
É possível observar que a imagem à direita possui maior contraste e é mais nítida.
Aparentemente, apresenta maior contraste do que vae-ft-mse-840000-ema-pruned.
(Acho que isso ocorre porque kl-f8-anime é um VAE projetado para imagens no estilo anime.)

outros
O VAE funcionará com GPUs AMD (DirectML)?
Depende do item.
Os dois VAEs apresentados nesta página são funcionais.
No entanto, VAEs que utilizam formatos como fp8_e4m3fn têm grande probabilidade de não funcionar.
Utilização do Hires.fix
O segundo método consiste em usar o Hires.fix para aumentar a resolução da imagem e torná-la mais nítida.
Como usar
Marque a caixa Hires.fix para ativá-lo.

Por padrão, é gerada uma imagem ampliada para o dobro do seu tamanho original.
Se necessário, redimensione a imagem usando um aplicativo externo (como o Paint).
Gerar o dobro de imagens requer uma quantidade considerável de memória.
Embora seja possível reduzir a largura/altura para diminuir o uso de memória, alguns modelos podem não conseguir gerar imagens corretamente quando a largura/altura é reduzida.
O Hires.fix não amplia a imagem original de forma limpa. Portanto, pode gerar uma imagem indesejada (uma imagem diferente da gerada sem o Hires.fix). Nesse caso, você pode reduzir o valor da intensidade de redução de ruído para gerar uma imagem mais próxima da original.
exemplo
A imagem à esquerda mostra o resultado sem o Hires.fix, e a imagem à direita mostra o resultado com o Hires.fix.
A imagem mudou bastante (Intensidade da redução de ruído = 0,3), mas você pode ver que a imagem à direita está mais nítida.

Resultado
A Difusão Estável permitiu-nos gerar imagens mais nítidas/com maior contraste.


コメント