AI Archivy

Srovnání AI obrazových generátorů

autor: Lube | Lis 20, 2022 | AI, Grafický design

Nelze jednoznačně určit, který generátor je nejlepší, který toho umí nejvíce a který se používá nejsnadněji. Každý z nich má své specifické funkce, které ten druhý nemá. Některé z generátorů jsme vyzkoušeli a sepsali pár poznatků.

Midjourney

AI generátor Midjourney byl jeden z prvních generátorů v digitálním světě. Hned první zvláštností tohoto generátoru je fakt, že samotné tvoření obrázků probíhá na Discordu, což je komunikační (chatovací) platforma. Midjourney má veřejný charakter. To znamená, že vše můžete sdílet s ostatními uživateli, pokud chcete. Samotné vytváření obrázků funguje na principu komunikace s botem na Discordu. Do chatovacího řádku se zadávají příkazy (prompty) a to buď ve veřejných chatovacích místnostech, kde následně vaše výtvory vidí i ostatní uživatelé, nebo v soukromé komunikaci s botem. To je ovšem možné pouze při zakoupení členství. Všechny vaše vytvořené obrázky jsou pak ukládány v galerii na profilu v Midjourney.

Neplacená verze

Neplacená verze je omezena počtem vygenerovaných obrázků. Prvních cca 25 obrázků můžete vygenerovat zdarma, ale tím to jednou pro vždy hasne. Žádné obnovení „free kreditů“ se nekoná a žádné kredity nelze dokoupit. Pokud chcete dále tvořit, je nutné si koupit jedno z typů měsíčního členství, které Midjourney nabízí.

Měnou na Midjourney je tzv. GPU-minuta případně GPU-hodina (GPU = graphics processing unit = grafický procesor). Výchozí nastavení pro vygenerování jednoho obrázku odpovídá přibližně 1 GPU-minutě. V závislosti na zadaných parametrech v promptu (příkazu) lze regulovat náklady na jeden obrázek. Midjourney nabízí pro fyzické uživatele dva typy členství plus jedno pro firmy. My si řekneme více o členství Basic a Standard pro běžné uživatele.

Reklamní vizuál od umělé inteligence — Vizuální podklad reklamy na restauraci generovaný v Midjourney

Placená verze

Členství Basic zahrnuje 200 GPU-minut za $10 + tax/měsíc. To by mělo vystačit cca na 200 obrázků a po vyčerpání minut již dále není možné tvořit. Je to tedy spíše pro občasné uživatele. Nezdá se to, ale 200 GPU-minut je fuč během chvilky. Druhý typ členství, tedy Standard, je už o něco výhodnější. Za $30 + tax/měsíc budete mít k dispozici 15 GPU-hodin.

Midjourney umí tvořit ve dvou módech – Fast a Relax. Fast mód je automatický pro všechny typy členství. V členství Standard je možné zvolit režim Relax a tím šetřit GPU čas. V Relax režimu ve členství Standard je možné tvořit i poté, co vyčerpáte 15 GPU-hodin. Můžeme tedy říct, že Midjourney umožňuje v členství Standard neomezené množství času pro generování obrázků, ale pozor – po vyčerpání 15 GPU-hodin, kdy automaticky naskočíte do režimu Relax, se omezí některé funkce a generování obrázků se zpomalí. K opětovnému zrychlení a obnovení funkcí dojde při obnovení GPU-hodin, což je v den další měsíční automatické platby. Po obnovení členství automaticky skočíte opět do režimu Fast.

Chatování s botem na Discord

Ať už máte placenou či neplacenou verzi Midjourney, musíte mít vytvořený účet na Discordu. Discord je komunikační platforma, která funguje zdarma i v prohlížeči. Na Discordu pošlete chatovou zprávu Midjourney botovi a na základě toho vám během pár vteřin vygeneruje čtyři varianty vašeho obrázku. Pokud nezadáte bližší informace o stylu, barvách, kvalitě atd., tak vykreslí obrázky ve svém osobitém stylu. Obecně platí, že Midjourney je spíše více uměleckým nástrojem, než aby vykresloval obrázky v realistické podobě. My jsme pro příklad zadali jednoduchý prompt „Avocado on a table“. V galerii se můžete podívat jak si s tímto příkazem Midjourney poradil. Samozřejmě by to zvládl i lépe, pokud bychom více specifikovali různé parametry. Pro naše účely to prozatím stačí. Stejný prompt jsme zadali i do ostatních generátorů, abychom mohli porovnat výstupy.

Zkušební redesign loga na Apple generovaný v Midjourney

Tyto výstupy samozřejmě nemusí být výsledným produktem. Obrázky lze dále upravovat, vytvářet variace, upscalovat až do rozměru 2048×2048 px v případě čtverce. Více se nám zatím nepodařilo upscalovat. U obdélníku se maximální rozlišení různí podle poměru stran. Ovšem funkce se na Midjourney neustále rozrůstají, stejně tak jako schopnosti celého generátoru. Je možné, že i maximální rozlišení bude postupně stoupat. Midjourney má řadu příkazů, které se zadávají na konec promptu. Tím lze ovlivnit například velikost, míru realističnosti, jak moc se bot má vykreslením obrázku zabývat apod. Midjourney je velmi proaktivní, co se týče inovací. Například nejnovějším updatem na verzi 4 nechává daleko za sebou své předešlé verze a také již zmíněný osobitý Midjourney „signature“ styl. Verze 4 lépe reaguje na komplikovanější zadání, není tak obtížné vysvětlit botovi, co přesně by na obrázku mělo být. Záleží na preferencích a kdykoliv se lze vrátit do předešlých verzí. Tato nejnovější verze zatím neumí tvořit v jiném než čtvercovém tvaru (platí k 20.11.2022).

Více o funkcích Midjourney si řekneme v příštím článku.

plakát od umělé inteligence — Plakát na závody starých aut generovaný v Midjourney

Dall-E 2

Generátor obrázků Dall-E 2 je už dnes přístupný pro všechny a lze ho vyzkoušet zdarma. To znamená, že už není nutné se registrovat na waitlist a čekat na pozvánku. Při prvním přihlášení může prostředí Dall-E 2 působit trochu jednoduchým dojmem oproti Midjourney.

Do začátku dostanete 50 kreditů a každý další měsíc 15 kreditů zdarma. Oproti Midjourney je tedy šance si službu více vyzkoušet, než si zakoupíte další kredity. Pokud vás generování obrázků nadchne a rozhodnete se zakoupit kredity, bude vás to stát $15 za 115 kreditů. Čekali byste, že čím více jich koupíte, tím méně zaplatíte? Ne. Je to úplně jedno, ať si jich koupíte kolik chcete, pořád to vyjde nastejno.

Avokado na stole Dall-E 2 — „Avokádo na stole“ generované v Dall-E 2

Výstupy z Dall-E 2

Dall-E 2 tvoří na základně vašeho příkazu spíše realistické výstupy, pokud nebudete obrázek více specifikovat. Jak se povedlo „avokádo na stole“, můžete vidět v galerii. Aby byl výsledek trochu kreativní a nepřipomínal obyčejnou fotku, je nutné se trochu rozepsat a snažit se lépe popsat, jak by měl výsledek vypadat.

„Avokádo na stole“ generované v Dall-E 2

Dall-E 2 vytvoří na jeden prompt také vždy čtyři variace, které lze dále upravovat. Za každé vygenerování je stržen jeden kredit a to platí i pro generování dalších variací na již existující obrázek. V praktickém postranním panelu můžete vidět poslední vygenerované čtveřice obrázků a mezi nimi rychle vybírat. U variací pak vždy vidíte i originální obrázek, který byl použit pro vytvoření těchto variací. Rozlišení výstupu je 1024 x 1024 px. Na rozdíl od Midjourney ale obrázky nelze více vykreslovat a upscalovat. Jediný tvar, který Dall-E 2 vygeneruje po zadání promptu, je čtverec. Ovšem je tu možnost, jak výsledné rozlišení plátna a tvar změnit.

Pokročilejší funkce

Obrovskou předností Dall-E 2 je totiž možnost rozšiřování obrázku do stran, nahoru, dolu, jak je libo. Okolo celého obrázku lze přidat další navazující čtverce o stejném rozměru. Takže přidáte 3 čtvercové obrázky ke svému výtvoru a máte dvojnásobné rozlišení. Nebo přidáte jeden čtverec nad nebo pod obrázek a máte obdélník na výšku. Dokonce lze vygumovat určité části hotového obrazu, které se vám nelíbí a ty přetvořit. V editoru jednoduše zvolíte gumu, nastavíte si velikost a vymažete části obrázku, které chcete změnit. Samozřejmě je nutné znovu popsat, co by se ve vygumované oblasti mělo nacházet. Pak už jen dáte generovat a opět dostanete čtyři nové variace. Ostatní části obrázku zůstanou beze změny. Pokusili jsme se vytvořit úplně jednoduchý příklad, jak lze dosáhnout větších obrazů pomocí Dall-E 2 rozšířením původního obrazu do strany. Začali jsme pomerančem a postupně do stran přidávali další ovoce.

Rozsireny obrazek z Dall-E 2 — Rozšířený obrázek generovaný v Dall-E 2

Velkou nevýhodou Dall-E 2 je, že neukládá do galerie rozšířené varianty obrázků, ale pouze všechna nová rozšíření samostatně. Rozšířený obraz v jednom celku je nutné uložit do počítače. Pokud ho chcete dále upravovat, musíte ho nahrát zpět do Dall-E 2 a pak můžete pokračovat v úpravách. Na to upozorňuje i samotné Dall-E 2, které je zatím stále v beta verzi. Dotvořené a rozšířené obrázky se do galerie neuloží a pokud kliknete špatně, může celá práce přijít vniveč. Ale budete mít stále k dispozici všechna nová rozšíření obrázku, která si pak můžete dohromady poskládat v jakémkoliv grafickém programu. Dall-E 2 také umožňuje upload vlastní fotografie či obrázku. Ty můžete upravovat v editoru a dotvářet okolí vlastní fotografie o nové prvky. Je to super zábava, ale člověk musí přemýšlet, jinak vystřílí kredity během chvíle.

DreamStudio Lite

DreamStudio je nástroj vyvinutý týmem ze stability.ai. Přihlásit se lze pod Google účtem a do začátku je poskytnuto zdarma 200 jednorázových kreditů. Pro tvoření dalších obrázků je nutné si kredity přikoupit. Například za $10 pořídíte cca tisíc dalších pokusů na generování obrázků. Ve výchozím nastavení odpovídá jeden vygenerovaný obrázek hodnotě jednoho kreditu, což se dá regulovat nastavením parametrů obrázku.

„Avokádo na stole“ generované v DreamStudio

Základní velikost obrázku je nastavena na 512 x 512 px, což lze změnit až na dvojnásobek. Nastavením větších rozměrů ale zvyšujete náklady na vygenerování jednoho obrázku. Stejně tak pokud budete zvyšovat počet kroků, které má DreamStudio vynaložit na vygenerování obrázku. Například jeden obrázek sestavený během 50 kroků o velikosti 512 x 512 px bude stát 1 kredit. V parametrech je také defaultně nastaven pouze jeden generovaný obrázek, ale DreamStudio umí až devět variací na jeden prompt najednou. Každá další variace navíc navyšuje počet stržených kreditů. Nastavit můžete i stupeň přesnosti, neboli jak moc se má výstup blížit promptu. Čím vyšší hodnota, tím více by se měl generátor držet zadání. Čím nižší, tím více prostoru mu necháváte pro kreativitu.

Obrázek vygenerovaný pomocí DreamStudio — Obrázek generovaný v DreamStudio

Historie generování je uložena v historii prohlížeče. Jakmile vymažete údaje o prohlížení, tak zmizí i historie generování v DreamStudiu. To asi není taková pohroma, protože z historie už si obrázek stejně nelze stáhnout. Pokud se vám tedy podaří vygenerovat něco kloudného, tak je potřeba si to stáhnout ihned po vygenerování. Později už to není možné. Historie je dobrá pouze pro zkopírování promptu, nebo pro použití tlačítka „redream“ u obrázku. Tato funkce vytvoří na obrázek v historii novou variaci. V galerii najdete jen 100 posledních vygenerovaných obrázků a to ovšem jen do té doby, než smažete v prohlížeči údaje o prohlížení. Každý z obrázků má své tzv. seed number, což je unikátní číslo pro každý vygenerovaný obrázek. Toto číslo lze zadat do parametrů v nastavení a generátor se pak bude snažit vytvořit na základě promptu a vloženého seedu nový obrázek. Jak DreamStudio vytvořilo náš jednoduchý požadavek na „avokádo na stole“ můžete vidět v galerii.

Přímo v DreamStudiu je editor, kde lze obrázek ještě editovat. Podobně jako v Dall-E 2 můžete vymazat některé části obrázku a ty se pak vygenerují znovu. Je to celkem fajn funkce, která třeba na Midjourney chybí.

obrazek vygenerovany v DreamStudio — Obrázek generovaný v DreamStudio

Wombo Dream

Wombo Dream je nástroj, který funguje v prohlížeči zcela zdarma. Vyzkoušet si ho můžete i bez přihlášení, ale obrázky se vám neuloží do galerie. Abyste mohli nahlížet do historie vygenerovaných obrázků, lze se jednoduše přihlásit pomocí Google účtu. Prompt může obsahovat 200 znaků (včetně mezer) a je nutné zvolit jeden z nabízených stylů. Vygeneruje se jeden obraz, který si můžete uložit do galerie kliknutím na tlačítko „publish“. Jakmile na to zapomenete a obrázek si ani nestáhnete, nenávratně o něj přijdete. Pokud se vám obrázek nelíbí, můžete vytvářet nové a nové variace. Obrázky jsou generované pouze v orientaci na výšku a rozměr ani kvalitu nelze ovlivnit.

Wombo Dream můžete používat i jako mobilní aplikaci, ve které se otevírá více možností než v prohlížeči. Používání aplikace je zdarma, takže sem tam reklama, ale pro odemčení dalších funkcí je nutné si zakoupit Premium účet. Měsíční předplatné vychází na cca $6 včetně daně. Mezi výhody placené verze patří odemknutí dalších stylů, generování 4 obrázků namísto jednoho, historie zadaných promptů, tmavý režim aplikace, vytváření variací a další.

Stejně jako do ostatních výše zmíněných generátorů, tak i do Wombo Dream lze nahrát vlastní obrázek a nechat ho upravit pomocí umělé inteligence. Wombo Dream je poměrně rychlý generátor a během pár sekund dokáže vygenerovat celkem pěkné obrázky. Jediný rozměr, který tento nástroj dokáže udělat, je 960×1568 px. Hodí se dobře pro vytváření tapet na plochy mobilních telefonů. Dokáže vytvořit oku lahodící kompozice a zajímavě vyplnit celý prostor obrázku. Je to vhodný nástroj pro ty, kteří si chtějí generování obrázků vyzkoušet, nechtějí hned utrácet a zároveň mít kvalitní obrázky. Jak si poradil Wombo Dream s naším zadáním „avokádo na stole“ můžete vidět v galerii.

avokado na stole generovane ve Wombo Dream — „Avokádo na stole“ generované ve Wombo Dream

Co říci závěrem?

Je asi jasné, že záleží na osobních preferencích a očekáváních každého člověka. Každému mohou vyhovovat jiné funkce, rozměry, ceny, kvalita či styly výstupů. Vyzkoušet již lze všechny veřejně známé generátory bez nutnosti čekání na pozvánku. Do některých se lze registrovat Google účtem, ale třeba do Midjourney je registrace trochu náročnější. Po vyzkoušení free verzí generátorů se stačí rozhodnout, zda budete tvořit jen pro sebe a pro zábavu, nebo budete tvořit na profesionální úrovni. Nejpokročilejší funkce nabízí AI generátor Midjourney, kde lze tvořit v mnoha stylech, rozměrech a lze výstupy dále upravovat. Také nabízí nejlepší rozlišení obrázku. Toho v Dall-E 2 docílíte také a to pomocí rozšiřování o nové obrázky do stran, což je trochu namáhavější. Finální rozlišení je ale neomezené. Dall-E 2 nabízí realističtější výstupy podobné fotografiím. Midjourney umí velmi umělecké výstupy. Docílíte i realistických výstupů připomínajících fotografii, ale daný prompt musíte velmi podrobně rozepsat. DreamStudio má velmi problematickou práci s galerií obrázků a jeho výstupy jsou ve velmi malém rozlišení. Wombo Dream zase umí obrázky pouze na výšku a v nižším rozlišení oproti Midjourney a Dall-E 2. Takže vyzkoušejte všechny a sami uvidíte. Třeba budete nakonec ve své tvorbě kombinovat více generátorů.

Na závěr ještě přikládáme tabulku s přehlednými informacemi. Myslete na to, že umělá inteligence se nyní velmi rychle vyvíjí a s tím se budou měnit i její funkce a cenové plány. Aktuální informace proto vždy hledejte na oficiálních stránkách vývojářů AI.

srovnání cen jednotlivých obrazových generátorů s umělou inteligencí

Použité zdroje:

https://runesnielsen.com/news/2022/8/18/ai-art-and-why-its-a-whole-new-game-with-stable-diffusion

https://dataconomy.com/2022/09/ai-art-how-to-use-wombo-dream-app-prompts

https://www.makeuseof.com/ai-text-to-art-generators

https://www.unite.ai/10-best-ai-art-generators

https://www.youtube.com/watch?v=ZRox1WHqZWs

https://docs.midjourney.com/docs/plans

20.11.2022, Sonet Studio Dream Team

Mohlo by tě zajímat:

Spory o autorství v umělé inteligenci

AI obrazové generátory: Otázka etiky a copyrightu

Vizuál generovaný umělou inteligencí

Jak na obrazový generátor Midjourney s umělou inteligencí

AI obrazové generátory: Otázka etiky a copyrightu

autor: Lube | Lis 13, 2022 | AI, Grafický design

AI generátor dokáže generovat obrazy reálných i nereálných lidí na reálných i smyšlených místech. Dokáží tak vizualizovat třeba známou celebritu na místě, kde nikdy nebyla, a v situaci, která se jí nikdy nepřihodila. Vzpomeňte si třeba na obrázek nahé Emmy Watson, který byl vyroben pomocí umělé inteligence. Odlišení těchto deep fakes od pravdy je díky neustálému zdokonalování AI opravdu velmi obtížné. Vzhledem k těmto neuvěřitelným schopnostem je až děsivé si představit, čeho budou tyto nástroje v budoucnosti schopny. V souvislosti s tím rostou obavy týkající se především etiky a porušování autorských práv. Znepokojující také mohou být tak zvané fake news, kdy nám jsou podstrkovány smyšlené informace, které lze nyní díky umělé inteligenci obohatit i o smyšlený obrazový materiál.

Jak to funguje na AI generátoru Midjourney?

Co se týká výchozího nastavení Midjourney, tak galerie uživatelů jsou veřejné. Každý může vidět obrázky ostatních tvůrců, stáhnout si je, zkopírovat si celý příkaz, pomocí kterého byl obrázek vygenerován, a dokonce samotný obrázek dále upravovat a vytvořit si na něj vlastní variace. Tvůrce tedy nemůže počítat s tím, že bude výhradním uživatelem vygenerovaného obrazu, i když podle podmínek na oficiálních stránkách je výslovně zakázáno sdílet obrazy ostatních tvůrců bez jejich svolení. Kdo ovšem studuje tyto podmínky, když si chce jen udělat hezký obrázek? Z běžných uživatelů málokdo.

Lze se tedy poměrně lehce inspirovat od ostatních tvůrců, kopírovat jejich prompty (příkazy), styly a jiná nastavení. Zároveň je potřeba brát v potaz tento veřejný charakter platformy, protože i naše výtvory se mohou stát objektem inspirace. Pokud tvůrce nechce s ostatními své výtvory sdílet, může tvořit v režimu soukromého účtu. Možnost soukromého účtu je samozřejmě placená. Nutno podotknout, že poplatek není součástí placeného členství. Je to služba navíc a proto je nutné hradit extra poplatek na měsíční bázi. Vygenerované obrázky budou v galerii skryté ostatním uživatelům a zůstanou skryté i po uplynutí doby privátního módu.

Více o cenách a poplatcích v jednotlivých AI generátorech bude popsáno v samostatném článku. Další obrazové materiály vytvořené pomocí umělé inteligenci najdete třeba na instagramovém profilu Sonet Studia. Velké množství různorodých vizuálů od AI naleznete na největším českém instagramovém profilu věnujícímu se pouze obrazové AI zde. Obrazy a plakáty v České republice tvoří třeba Maxmilián Kavalír. Jeho tvorbu můžete shlédnout na Behance stránkách nebo na jeho Instagramu.

Praha očima umělé inteligence — Praha očima Alfonse Muchy, autor Maxmilián Kavalír

Kdo tedy může vygenerované obrázky používat a jak?

V případě neplacené verze Midjourney lze obrázky používat jen k nekomerčním účelůma zároveň musí být Midjourney uveden jako zdroj. Pokud si uživatel zakoupí jakoukoliv placenou verzi účtu, může s vygenerovanými obrázky nakládat jakkoliv, což zahrnuje například i jejich prodej. Zde je potřeba zmínit, že používáním služeb uděluje tvůrce automaticky licenci na autorská práva také Midjourney a na základě toho pak může vaše obrázky Midjourney a jeho tvůrci jakkoliv používat. Výjimkou jsou obrázky vytvořené v placeném privátním módu.

Midjourney na svých oficiálních stránkách informuje, že jeho algoritmus byl vycvičen na veřejných souborech, a tak se některé výstupy mohou podobat materiálům, které jsou chráněné autorským právem. V případě, že se autor původního originálního obrázku nebo fotografie domnívá, že byla jeho autorská práva porušena, může službu Midjourney kontaktovat. Mimo jiné se zde dočteme, že by měli být tvůrci opatrní při sdílení svých výtvorů vygenerovanými umělou inteligencí, přičemž Midjourney nenese odpovědnost za škody, které mohou vzniknout vinou tvůrce. Tím Midjourney samozřejmě chrání hlavně sebe.

Postmoderní obraz Davida Lynche od Maxmiliána Kavalíra — Postmoderní portrét Davida Lynche, autor Maxmilián Kavalír

Plagiát nebo pouhá inspirace?

O tom, kdy jde o porušení autorských práv a kdy ne, lze polemizovat. Žádný zákon nehovoří jasně. Generátory byly trénovány na milionech fotografií a není zcela jasné, jestli tvůrci generátorů čerpali tyto obrázky pouze ze zdrojů s otevřenou licencí. Toto se nesetkává s velkým nadšením malířů, grafiků, ilustrátorů nebo fotografů, kteří vlastní autorská práva ke svým obrázkům, protože jejich vizuály tak mohly být teoreticky použity pro trénink a vývoj generátorů. Nemluvě o následně vygenerovaných obrázcích, které byly vytvořeny za pomoci klíčových slov odkazujících přímo na autory. Umělá inteligence sice vygeneruje nové jedinečné obrázky, ale mohou být nápadně podobné těm originálním. Zde vzniká problém, který se zatím ocitá v šedé zóně legislativy.

Kubistická Praha očima umělé inteligence — Kubistický obraz, autor Maxmilián Kavalír

Jde ale o plagiát? Spíš ne. Stejně tak jako lidé se i AI inspiruje ostatními tvůrci a jejich výtvory. I slavní malíři vycházeli ze svých předchůdců a učili se od nich. Pokud by šlo o nerozeznatelný duplikát původního díla, byla by situace jiná a nové dílo by pak opravdu bylo plagiátem. Každá země má ovšem jiný autorský zákon, který posuzuje autorství a plagiátorství zcela odlišně. Může se i očekávat, že někde bude komerční užívání AI výtvorů zakázáno a jinde zcela legalizováno.

Praha ve stylu Josefa Lady očima umělé inteligence — Portrét Prahy ve stylu Josefa Čapka, autor Maxmilián Kavalír

Problém nebo příležitost fotobank?

Problémům se chtějí vyhnout například fotobanky. Některé z nich už nepovolují upload obrázků, které byly vygenerované umělou inteligencí. Chtějí se tak vyhnout případným právním konfliktům a chránit své klienty. Firma OpenAI, která provozuje generátor Dall-E 2, informovala, že si od fotobanky Shutterstock koupila licenci na obrázky, na kterých software trénovala. Dokonce spolu uzavřeli partnerství s vyhlídkou do budoucna, kdy by mělo být možné generovat obrázky přímo ve fotobance. Také vznikají nové fotobanky zaměřené právě na obrázky generované umělou inteligencí a jejich prodej.

V tomto ohledu kontroverzní a někým odmítané obrázky od umělé inteligence jsou nezastavitelným fenoménem. Společnost je částečně rozdělena. Na jedné straně se brání nové technologii, mluví o tom, že by takto vytvořené obrázky měly být používány pouze pro soukromé účely. Druhá strana je nadšená a aktivně prosazuje tento nový druh digitálního umění a co víc, začleňuje ho do svého portfolia služeb. Je to velmi živé téma a výstupy generátorů se stále zlepšují. Stejně tak se může měnit situace ohledně autorských práv. Budeme tedy sledovat, jestli se tento nový druh digitálního umění dokáže udržet v šedé zóně, nebo jestli bude donucen virtuální scénu opustit. To se ovšem s největší pravděpodobností nestane a obrázky od AI budou stále hojněji využívány v nejrůznějších odvětvích, především v reklamě. S největší pravděpodobností to povede i k naprosté legalizaci a legitimnímu využívání umělé inteligence. Jak se říká, pokrok nezastavíš.

Základní informace o obrazové umělé inteligenci najdete v předešlém článku Vizuál generovaný umělou inteligencí.

surrealistický obraz od Maxmiliána Kavalíra — Surrealistický obraz, autor Maxmilián Kavalír

Použité zdroje:

https://www.xda-developers.com/ai-image-generators

https://midjourney.gitbook.io

https://expertphotography.com/midjourney

https://insmart.cz/umela-inteligence-generujici-obrazky-a-autorska-prava

https://cdr.cz/clanek/fotobanky-bojuji-s-umelou-inteligenci-je-seda-zona-copyrightu-kdo-je-autor

https://www.zive.cz/clanky/fotobanka-shutterstock-spojuje-sily-s-generatorem-obrazku-dall-e-odmeni-umelce-na-kterych-se-ucila-ai/sc-3-a-219062/default.aspx

https://support.shutterstock.com/s/article/How-is-Shutterstock-bringing-AI-generated-content-to-their-platform?language=en_US

https://www.prnewswire.com/news-releases/shutterstock-partners-with-openai-and-leads-the-way-to-bring-ai-generated-content-to-all-301658310.html

13.11.2022, Sonet Studio Dream Team

Mohlo by tě zajímat:

Spory o autorství v umělé inteligenci

AI obrazové generátory: Otázka etiky a copyrightu

Vizuál generovaný umělou inteligencí

autor: Lube | Lis 6, 2022 | AI, Grafický design

Jistě jste si už všimli, že umělá inteligence za nás dnes dělá kde co a usnadňuje náš každodenní život. Vyhledávače, překladače, mobilní aplikace nebo automatické funkce v kdejakém software nám neustále urychlují řešení pracovních nebo osobních záležitostí. Ale že na základě slovního příkazu dokáže vytvořit obrázek, grafiku nebo v podstatě jakýkoliv vizuál? Je to poměrně novinka, ale možná že jste o tom už slyšeli.

Generátor obrázků s umělou inteligencí neboli text-to-image generator je zajímavým nástrojem pro převedení pouhé fantazie, přestav, snů do vizuální podoby. Na výběr je již několik dostupných generátorů, které se do povědomí společnosti začaly vkrádat již v první polovině roku 2022 a to díky programu DALL-E 2, který byl spuštěn jako první. Nicméně člověk musel obdržet pozvánku, aby mohl tvořit. To se změnilo 28. září, kdy se DALL-E 2 otevřelo všem uživatelům. Během čekání na přístup do DALL-E 2 asi mnoho uživatelů využilo jiné volně přístupné generátory, které se postupně objevovaly. Po zprovoznění programu DALL-E 2 následovalo spuštění programu Midjourney, Stable Diffusion a dalších.

návrh pivní láhve od umělé inteligence — Produktový design nových lahví pro Pilsner Urquell, Midjourney, 2022

A jak to funguje?

Pro takový generátor je hračka během pár vteřin vytvořit zcela nový obrázek, který poskládá jen na základě slovního příkazu. Jakmile obdrží zprávu, začne prohledávat internet, kde vybírá zhruba mezi 6 miliardami dostupných obrázků, a z těch tvoří unikátní variace na daný požadavek. Obvykle generátor vytvoří hned čtyři návrhy, které lze dále různými příkazy a funkcemi upravovat. Vizualizace a obrazy vytvořené pomocí umělé inteligence si můžete prohlédnout třeba na našem Behance profilu, nebo na našem FB profilu. Větší galerie AI obrazů je k vidění na tomto českém instagramovém profilu zde.

Samozřejmě ještě nejsme tak daleko, aby nám generátor obrázků četl myšlenky, takže se výsledek často příliš nepodobá našim představám. Takový slovní příkaz má svá pravidla a měl by mít určitou strukturu. Pokud člověk nechce dlouhosáhle studovat dopodrobna jednotlivé funkce a vymýšlet příkazy (prompts), tak je ideální se nechat inspirovat od ostatních tvůrců. Někdy se to povede, někdy přimhouříte oko nad tím, co vám umělá inteligence nabídne a někdy si řeknete prostě jen wtf. Může ale vzniknout i něco daleko lepšího, než si člověk představuje.

Představu je dobré popsat od nejzákladnějších parametrů až po detaily. Určitě je dobré definovat styl, rozlišení, barvy, rozměr, jak moc má být výtvor abstraktní nebo realistický a podobně. Zohlednit se dá vše. Ale neplatí, že čím delší příkaz, tím lepší výsledný obraz. Je nutné volit správná slova a správně je řadit. Jednotlivé příkazy si nesmějí odporovat, jinak umělá inteligence vytvoří neskutečný hybrid. Vlastnosti požadovaného obrázku, které nedefinujete pomocí promptu (slovního příkazu), tak necháváte na umělé inteligenci a ta to udělá podle sebe. Výsledek potom často není úplně podle představ.

Říkáte si, že podle slovního zadání to samé zvládne i grafik, ilustrátor či malíř? Samozřejmě, že to zvládne. A možná to svede mnohem lépe, ale také za to zaplatíte a počkáte si. Grafik nebo ilustrátor musí mít nejdříve nápad, ten naskicovat, pak namalovat, digitalizovat, přetáhnout do Photoshopu a upravit ho. Už tušíte, co je výhodou AI generátoru? Rychlost. Doslova během několika vteřin máte připravené podklady pro další úpravy. S takovým návrhem lze přijít třeba za grafikem a ten může dotahovat už jen detaily místo toho, aby nad tím strávil hodiny času. Pro mnohé reklamní agentury bude toto opravdová úspora času a financí. Ovšem s nadsázkou řečeno, grafici a ilustrátoři možná nebudou mít co žrát.

Zkušební redesign loga na Apple, Midjourney, 2023

Reklama od umělé inteligence?

Už ano! Sonet Studio používá vizuál generovaný umělou inteligencí pro tvorbu reklam, na obaly CD, na plakáty nebo na různé potisky produktů na merch. Stále věší množství zákazníků chce něco velmi originálního ve svých reklamách nebo na svých produktech a obrazy od AI jim tuto potřebu plní. Množství agentur, které zkouší používat umělou inteligenci pro tvorbu vizuálu, se stále zvyšuje. Je to trend nebo po AI za chvíli ani pes neštěkne? To nikdo neví. Pravdou je, že díky rozrůstajícím se funkcím a příkazům je časově náročné držet tempo a brzy bude nezbytné mít na tento obor v agenturách specialistu. Předpokládá se, že časem vzniknou i nové pracovní pozice, které budou mít na starosti právě generování prvotřídních vizuálních digitálních podkladů třeba pro reklamu. Takoví prompteři (vyzývači umělé inteligence, našeptávači, příkazci) budou mít najeté funkce a příkazy a budou schopni tvořit vysoce kvalitní obrazy lusknutím prstu. Více se o tomto tématu dotete na focus-age.cz.

Digitální obrazovou tvorbu si může vyzkoušet každý zdarma. Některé generátory, v zásadě ty, které nejsou tak kvalitní nebo neprodukují kvalitní materiál, jsou zdarma. Neplacené verze lepších generátorů vystačí na pár obrázků, které mohou být vygenerovány. V podstatě to stačí k tomu, aby člověk trochu pochopil, jak takový generátor funguje. Placené verze pak umožňují až neomezené generování kvalitnějších obrázků a odemykají několik funkcí, které ve free verzích nejsou dostupné. Z naší strany ovšem musíme dát velké upozornění – je to nebezpečně návykové.

Co napsat závěrem?

Takže si to shrňme. Umí generátor ultra kvalitní výtvory v perfektním rozlišení? Ne. Umělá inteligence Midjourney, Dall-E 2 a další nejsou zatím vůbec dokonalé nástroje. Výstupy jsou často v nízkém rozlišení a pokud tvoříte vizuál na billboard nebo jinou venkovní reklamu většího formátu, je nutné je graficky zvětšit, dotvořit a dokreslit. Ale od toho už jsme tu právě my – lidé, grafici, digitální tvůrci, abychom se postarali o to, aby výsledný obraz byl použitelný nejen jako hezký obrázek v počítači, ale i třeba jako obraz na zdi, na tričku nebo v reklamě.

Je také snad jen otázkou času, kdy ve Photoshopu a podobných grafických programech vznikne tlačítko s AI generátorem, které bude grafikům sázet nápady jeden za druhým, ze kterých si grafik vybere a použije ho k dalšímu zpracování. On-line grafický nástroj Canva už takový AI generátor zařadil mezi své placené funkce, ovšem výsledky jsou zatím horší než bídné. Automatické funkce jako je zvětšování obrázku, změna rozlišení nebo dokreslení detailů obrázku tu už snad budou coby dup – doufejme, že s další verzí Photoshopu.

obal CD navržený pomocí AI — Obal CD, Midjourney, 2023

vizuál reklamy od umělé inteligence — vizuál do reklamy, podkladový obrázek z Midjourney, 2023

Použité zdroje:

https://www.xda-developers.com/ai-image-generators

https://expertphotography.com/midjourney

https://www.howtogeek.com/823337/how-to-create-synthetic-ai-art-with-midjourney

https://www.weforum.org/agenda/2022/10/ai-artist-systems-bring-delight-and-concern

6.11.2022, Sonet Studio