Var med och testa DALL-E 2

Bild skapade med DALLE-2 och frasen "A stone statue of a Aztec god with headphones holding an iPhone"

I förra veckan fick Bazookas egen Simon chansen att testa DALL-E 2. Det handlar alltså om ett AI från OpenAI som kan tolka text och förvandla det till bilder. Vi har tidigare skrivit om hur DALL-E 2 fungerar och därför var det väldigt spännande att få chansen att testa själva.

Simon frågade i en av Bazookas Slack-kanaler vad alla ville se för bilder och kreativiteten började flöda direkt. Men 176 trådsvar under en dag kan det vara en av Bazookas mest uppskattade diskussioner och resultaten både oroade och roade deltagarna.

Bilder skapade med DALLE-2 och frasen "Mike Tyson worshipping pigeons in the style of monet"
Bilder skapade med DALLE-2 och frasen ”Mike Tyson worshipping pigeons in the style of monet”

Hur funkar det?

Vi märkte snart vilka styrkor systemet har. Exempelvis kan man få en väldig massa variationer av bilder och det går snabbt att testa olika kreativa spår. Perfekt för utforskande i uppstarten av ett kreativt projekt alltså.

Men vi kunde också se svagheter, som att de regler som finns kring sex och våld även innebär begränsningar. Om man exempelvis vill ta fram en bild som innehåller ordet ”Bazooka” blir det problem. DALL-E förstår inte att det handlar om Sveriges trevligaste digitalbyrå utan tror vi syftar på ett vapen och säger helt enkelt stopp. Det samma gäller flera andra begrepp kring nakenhet. DALL-E är alltså en liten moralpolis. Samtidigt är det lätt att förutse vilken katastrof det skulle kunna bli utan begränsningar så vi är ändå tacksamma för OpenAI:s reglering.

DALL-E är också bättre på att porträttera män än kvinnor och man kan ana att sexism, rasism och andra mänskliga tillkortakommanden återspeglas i ett AI som lärt sig betrakta världen genom maskininlärning. Information som den tränas på är trots allt skapad av människor.

Begränsningar och svagheter

DALL-E klarar inte heller av att ta fram porträttlika bilder på kändisar. Skriver man ”Elvis Presley” blir det förvisso en vit man men mörkt hår och lustig frisyr men Elvis är det inte. Om det är en slags skydd som finns eller om det handlar om begränsningar framgår inte.

En annan brist är oförmågan att skriva begripliga texter. DALL-E skapar något som ser ut som text men som är oläsbart. Anatomin kan ibland bli lite tokig. Någon kan få för många ben eller en hand som ser ut som en potatis.

Bilder skapade med DALLE-2 och frasen "A mouse in a black leather jacket riding a bike"
Bilder skapade med DALLE-2 och frasen ”A mouse in a black leather jacket riding a bike”

Otroligt imponerande

Trots de brister som finns är det lite svårt att ta in hur kraftfullt det här verktyget är och vilken utvecklingspotential som finns. Man har pratat om att AI kommer förändra bildskapande på ett lika radikalt sätt som kameran gjorde då den uppfanns men jag skulle vilja påstå att det är en underdrift. Vi kan ännu inte ta in hur revolutionerande det här är och man kan bara hoppas att vi människor hanterar den här nya superkraften med den respekt och försiktighet som krävs.

Några exempel på vad DALL-E gör bra:

  • Olika stilar. Oavsett om det är foto, emoji, 3D, pixlat, som Picasso eller skulpterat i lera så klarar DALL-E av det.
  • Det går väldigt snabbt att ta fram nya bilder. Ett arbete som skulle ta dagar är klart på några sekunder.
  • Man kan ta fram varianter av en befintlig bild för att utforska olika variationer av färger, ljussättningar eller manér.
  • Förvånansvärt hög kvalitet på motiv och kompositioner. Även om det blir väldigt fel ibland så tappar man lika ofta hakan över hur bra det kan bli.

Framtiden

Det är inte svårt att föreställa sig att kvalitén på bilderna kommer stiga med tiden och om man även föreställer sig att DALL-E kommer kunna generera video eller 3D-modeller så inser man att världen som digital kreatör håller på att förändras för alltid. Kanske även hur vi ser på skapande, upphovsrätt och en lång rad andra frågor.

 Bilder skapade med DALLE-2 och frasen "Mark Zuckerberg and Elon Musk trying to make a fire in a cave"
Bilder skapade med DALLE-2 och frasen ”Mark Zuckerberg and Elon Musk trying to make a fire in a cave”

Testa själv!

Nu tänkte vi att ni som läser skulle få en chans att testa DALL-E 2! Gör så här:

  1. Skriv en mening på engelska i kommentarerna till det här instagraminlägget. Gärna något knäppt som t.e.x ”a stone statue of a aztec god with headphones holding an iphone”
  2. Undvik ämnen som sex, våld, hat och politik eftersom DALL-E 2 inte accepterar det.
  3. Vi postar så många bilder vi hinner med på Bazookas Instagram.

  • AI