Stable Diffusion
Stable diffusion je text-to-image model hlbokého učenia (druh strojového učenia), ktorý vznikol v roku 2022. Jeho primárnym zameraním je tvorba obrázkov na základe textových príkazov. V súčasnosti má k dispozícii nasledovné funkcie:
- Text to image – vytvorenie obrázku na základe textového príkazu
- Image-to-image – použitie existujúceho obrázku a jeho následne spracovanie v kombinácii s textovým príkazom
- Outpainting – možnosť dopočítania obrázku po jeho hranách
- Upscaling – zväčšenie obrázku s nízkym rozlíšením na vyššie so zachovaním a doplnením detailov
Jeho hlavnou výhodou, oproti ďalším známym modelom ako je Midjourney a Dall-e, je dostupnosť. Stable Diffusion si môže stiahnúť ktokoľvek a vytvárať obrázky použitím vlastného hardvéru, bez akejkoľvek monetizácie.
Stable Diffusion bol trénovaný na základe dostupných obrázkov na internete, jeho tvorcovia preto uvádzajú, že môže produkovať aj nevhodný, alebo diskriminatívny obsah.
Skvelé výsledky môžeme nájsť na stránke https://lexica.art/, kde sa okrem samotných obrázkov môžeme pozrieť aj na to, na základe akých príkazov vznikli.