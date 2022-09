Een stortvloed aan laagdrempelige programma’s biedt iedereen de mogelijkheid prachtige illustraties te maken. Een kwast hanteren is niet nodig, een paar woorden volstaan. We doken in de AI-kunstwereld en keken onze ogen uit.

Een citroen met een zonnebril op het strand, Pixar-stijl. Een Black Hawk-helikopter in de stijl van Leonardo da Vinci. Het laatste avondmaal, maar met iedereen als skelet. De geboorte van het universum. Een kindertekening van Satan die een ijsje eet. Wie een kijkje neemt op bijvoorbeeld Midjourney ziet de verbeelding van gebruikers aan het werk en kijkt met verbazing en bewondering hoe dit kunstmatige-intelligentieprogramma (AI) op basis van een paar woorden in mum van tijd iets tevoorschijn tovert.

‘Lemon wearing sun glasses relaxing on the beach pixar movie still 3d realistic render hyper detailed'. Beeld Midjourney

‘Het laatste avondmaal’ met skeletten. Beeld Midjourney @steph4n

'Een Black Hawk-helikopter in Leonardo da Vinci stijl'. Midjourney en Dall-E geven eerst vier opties waarmee verder kan worden gespeeld. Beeld Midjourney

Midjourney is een van de programma’s die de laatste tijd voor een breed publiek beschikbaar zijn gemaakt en die afbeeldingen produceren op basis van een tekstopdracht. De bekendste is Dall-E 2 van OpenAI. Dit AI-bedrijf, mede opgericht door Elon Musk, maakte eerder al furore met zijn taalmodel GPT3 dat teksten kan vertalen, een chatbotgesprek voeren of een essay schrijven.

'Close-up van vrouw met hoofdtelefoon synthwave stijl 2d digital vector art’ Beeld Dall-E

Ook Dall-E 2 (een vervlechting van Salvador Dalí en de Pixar-film WALL-E) werkt (deels) met taal. “Het interessante van dit soort modellen is dat ze een brug slaan tussen tekst en afbeeldingen”, zegt Eric Postma, hoogleraar kunstmatige intelligentie van Tilburg University. “Ze zijn getraind met een grote database met afbeeldingen waar beschrijvingen bij staan.”

Vervolgens wordt een zogenoemd diffusion-model aan het werk gezet om afbeeldingen te genereren. Nee, de computer begrijpt de ingevoerde tekst niet, waarschuwt Postma. “Wat ze kunnen, is een tekstinvoer koppelen aan betekenisvol beeld.” Dat laatste gaat almaar beter, als gevolg van alle AI-inspanningen van de laatste jaren. En het interessante is dat die programma’s nu ook publiekelijk beschikbaar worden.

‘Dog with a cookie face drinking a glass of milk' illustreert dat er geen sprake is van 'begrip' van een tekst. Alleen de derde variant snijdt hout. Beeld Midjourney

De programma's hebben soms ook nog moeite met details van gezichten. Let op de neus van het meisje. Beeld Midjourney

Midjourney en Dall-E, met in het kielzog programma’s als Stable Diffusion (open source), het supereenvoudige Craiyon of Disco Diffusion, leiden de laatste maanden tot een ware hype en groot enthousiasme onder kunstenaars, programmeurs en designers. Voor de eindgebruiker werken ze opvallend eenvoudig.

Voor Craiyon is geen login nodig, maar de resultaten zijn aanzienlijk slechter dan bij Dall-E of Midjourney Beeld Craiyon

Dezelfde tekstinvoer als bij Craiyon, maar nu bij Midjourney. Hier met onbedoeld surrealistisch effect: de dieren lijken terug te komen in de takken van de boom, die overgaan in de wolken. Beeld Midjourney

Midjourney werkt in combinatie met de vooral onder gamers populaire chatdienst Discord. Het tekengereedschap is voor iedereen beschikbaar, maar er zit een limiet aan het aantal plaatjes dat je kunt maken. Daarna moet de portemonnee worden getrokken. De instapdrempel bij Dall-E is wat lager, omdat er geen apart Discord-account nodig is. Een uitnodiging is nog wel vereist.

‘Hyperrealistic, ultra detailed, real engine, symmetric, 3d with volkswagen hippie van in a beautiful landscape with trees and a river’. Beeld Dall-E 2

De programma’s werken daarna in de basis hetzelfde: het invoeren van een aantal woorden zet de boel in werking. Dat kan van simpel (‘een bos’) tot erg specifiek, inclusief technische aanwijzingen over de lichtinval, stijl, formaat en mate van gedetailleerdheid of realisme. De enige beperking is dat sommige woorden worden geblokt en Dall-E niet toestaat met beroemdheden aan de slag te gaan. Vervolgens komt het programma met vier afbeeldingen, waarna je kunt kiezen om de software verder te laten variëren op een daarvan. Dall-E geeft bovendien de optie om onderdelen van een plaatje digitaal weg te gummen.

'Donald Trump als grotschildering'. Midjourney staat wél toe om beroemdheden te noemen. Beeld Midjourney

'Donald Trump in Beksinski stijl'. Beeld Midjourney @r00t

De uitkomsten van de twee programma’s kunnen behoorlijk verschillen, zonder overtuigende winnaar, al is het maar omdat het een kwestie van smaak is. Midjourney onderscheidt zich met de levendige Discord-community die eraan zit vastgeklonken. Dat heeft zowel voor- als nadelen. Zo is het lastiger om overzicht te behouden. Daartegenover staat juist dat het erg leuk is in real time andere creaties voorbij te zien komen, inclusief de woorden die andere mensen daarvoor hebben gebruikt. Ook is er een leuk overzicht met de door de community meest gewaardeerde creaties.

Een van de door de community hoogstgewaardeerde illustraties: 'bold ornate fantasy ecosystem infographics in the style of Herbert Bauer, Edward Tufte, David McCandless' Beeld Midjourney @whatnostop

Daar zitten indrukwekkende plaatjes tussen, vaak gevoed door een even indrukwekkende woordenbrij en niet zelden de vrucht van professionele designers.

Sommigen geven hun creatie een zeer uitgebreide beschrijving mee: 'a man standing in a room of symmetric chaos and divinity on 35mm, dramatic lightning sadness, intriquet nature etherial hyper detailed, elite, ornate, hypermaximalist, golden ratio, environmental key art, octane render geometry pictorialism story --ar 16:9' Beeld Midjourney @Agave

Een van hen is de in Guadeloupe geboren en in Canada werkzame Manuel Sainsily. De 2D- en 3D-artiest is de laatste tijd volop aan het experimenteren met diverse programma’s. “Ze werken voor kunstenaars ongelofelijk goed om hun creativiteit op te krikken”, zegt hij. Sainsily gebruikt ze bijvoorbeeld in de ideeënfase, om zo heel snel concepten te verkennen. Maar het gaat verder dan dat: “De programma’s stellen kunstenaars in staat verder te denken dan hun eigen verbeelding en andere, nieuwe invloeden onder hun aandacht te brengen.” Voor Sainsily is Midjourney overigens de duidelijke favoriet, vooral vanwege de community en de aanwezigheid van een encyclopedie met tips en stijlen (bij de betaalversie).

Sneakerfan Sainsily maakte een speciale 'levende schoencollectie' met Midjourney. Beeld Manu Sainsily

De vrees van sommigen dat kunstenaars en designers overbodig worden, deelt hij niet, integendeel. “lk denk dat elke nieuwe technologie meer kansen biedt dan ze doodt. Photoshop maakte schilders ook niet overbodig. Het creëerde een golf van digitale kunstenaars. Op dezelfde manier zal AI het werk van een kunstenaar doen evolueren.”

‘The godess of light, human like form, Glass Paint, Overglaze, Ornament, Time-Lapse, Photojournalism, Wide Angle, Perspective, Double-Exposure, Light, Tones of white and gold in Background, Ultra-HD, Super-Resolution, Massive Scale, Perfectionism, Soft Lighting, Ray Tracing Global Illumination, Translucidluminescence, Crystalline, Lumen Reflections, in a symbolic and meaningful style, symmetrical, by Yoshitaka Amano'. Beeld Midjourney @Tarweiler

Ook Postma is enthousiast over de mogelijkheden die de nieuwe programma’s bieden. “Dit verrijkt de kunst omdat er een nieuw soort visuele kunstenaar bij komt, namelijk mensen die vaardig zijn met tekst. Zij krijgen hiermee fantastisch gereedschap in handen.”

‘Antieke vaas, vlinder, 2D, illustratie'. Beeld Midjourney @ALEx

We staan pas aan het begin, stelt Postma. Afbeeldingen zullen steeds indrukwekkender worden en de volgende fase is ook al duidelijk: video. Postma stelt zich een wereld voor waar realistische films kunnen worden gemaakt zonder acteurs. Ter geruststelling van deze beroepsgroep: “Maar dat duurt nog wel minimaal tien jaar.”

‘Brain vortex twisted colorful lsd explosion’. Beeld Midjourney

‘A small open space pop up cart in the middle of park ave street in new york city, sand waves, sound amp, music, dramatic lighting, intriquet nature etherial hyper detailed, elite, ornate, hypermaximalist, golden ratio, environmental key art, octane render geometry pictorialism story’. Beeld Midjourney