Stable Diffusion

Stable diffusion je text-to-image model hlbokého učenia (druh strojového učenia), ktorý vznikol v roku 2022. Jeho primárnym zameraním je tvorba obrázkov na základe textových príkazov. V súčasnosti má k dispozícii nasledovné funkcie:

  • Text to image – vytvorenie obrázku na základe textového príkazu
  • Image-to-image – použitie existujúceho obrázku a jeho následne spracovanie v kombinácii s textovým príkazom
  • Outpainting – možnosť dopočítania obrázku po jeho hranách
  • Upscaling – zväčšenie obrázku s nízkym rozlíšením na vyššie so zachovaním a doplnením detailov
Ukážka vygenerovaného obrázku na základe príkazu: Digital Garden

Jeho hlavnou výhodou, oproti ďalším známym modelom ako je Midjourney a Dall-e, je dostupnosť. Stable Diffusion si môže stiahnúť ktokoľvek a vytvárať obrázky použitím vlastného hardvéru, bez akejkoľvek monetizácie.  

Ukážka Image-to-image na základe príkazu: pixar movie, 3d rendering, unreal engine, smooth, amazing likeness, very detailed, cartoon caricature, young boy, cute smile

Stable Diffusion bol trénovaný na základe dostupných obrázkov na internete, jeho tvorcovia preto uvádzajú, že môže produkovať aj nevhodný, alebo diskriminatívny obsah.

Skvelé výsledky môžeme nájsť na stránke https://lexica.art/, kde sa okrem samotných obrázkov môžeme pozrieť aj na to, na základe akých príkazov vznikli.  

Další zasazené 2022