nlc.hu
Aktuális
A fotorealisztikus AI-videók veszélyei

Még fél év, és fogalmunk sem lesz, mi a valóság és mi kamu

Egy éve is lehetetlennek tűnt, most megérkezett: olyan videókat készít a mesterséges intelligencia, amelyekről csak szakavatott szemmel, nagyon közelről nézve derül ki, hogy nem valódiak. Mi lesz itt, ha már úgy sem?

Hóban játszó cuki kölyök golden retrieverek. Borneó egyik folyópartján ejtőző színes, egzotikus madarak. Sziklás tengerpart a naplementében világítótoronnyal. Szakállas, szkafanderes férfi egy furcsa, fehér sivatag közepén, mintha egy szovjet sci-fi filmből lépett volna elő – a fején kötött (!) sisak. Narancssárga cica ébreszti gazdáját, Kiotóban hullik a cseresznyefák levele, fehérpólós férfi olvas egy felhő tetején ülve. Színes, kellemes, itt-ott furcsa stockvideók, ilyenekkel reklámozzák az elektronikai cégek a tévéiket az áruházakban. Legfeljebb itt-ott tűnik fel egy-egy furán mozduló végtag, eltűnő és feltűnő apró tárgyak és egyéb pontatlanságok.

Ha megfoghatatlanul és megfogalmazhatatlanul furcsa érzésed van a videók láttán, az nem véletlen. Ez ugyanis az OpenAI nevű mesterségesintelligencia-vállalkozás legújabb terméke, a SORA bemutatkozó filmje. Abból tehát, amit látsz, semmi sem valóságos: sosem léteztek a kutyák, a cica, a madarak és a kötöttsapkás férfi. Az egészet egy algoritmus generálta, méghozzá külső segítség, betáplált „valódi” képek és videók nélkül, csak egy-két mondat alapján, amit a fejlesztők kértek tőle. „Mutass nekem egy táncoló kengurut” – és némi számítás után ott is volt a kenguru.

Az internet természetesen azonnal két részre szakadt, pontosabban egy kicsit még szélesebb lett a távolság az eleve meglévő szakadék két széle között: az egyik fele tárt karokkal várja a technológiai forradalmat, amely elhozza végre a korlátlan kreativitást, a másik fél dühös és szomorú egyszerre. A mesterséges intelligencia által létrehozott kép és videó ugyanis hatásos, de üres, látványos, de unalmas, és rengeteg veszélyt rejt, például azt, hogy – a fenti példából kiindulva – lassan nem tudjuk megmondani, mi a valóság és mi a kamu. Ők a hatóságoktól és az óriáscégek józan belátásától (haha!) várják, hogy korlátozzák, esetleg tiltsák be az egészet, ennek hiányában a civilizáció bukását vizonálják, ahogy oly’ sokan előttük az elmúlt évtizedekben (nagyjából ötévente). A jóslatokat megcáfolva azonban még mindig itt vagyunk, igaz, olyan állapotban, amilyenben.

Tisztázzunk pár dolgot, ami már most biztos a mesterséges intelligencia kapcsán:

  • Az AI már régóta velünk van, az átlagfelhasználó nem is tudja, mennyire. Része a telefonja kamerájának, a TikTok-algoritmusának, a szelfifilterének, segítségül hívják az animációs stúdiók (legfeljebb nem verik nagydobra), sőt, ha hihetünk a reklámoknak, márpedig miért ne hihetnénk, mostanában magyar (!) energiaitalt is tervez. A Hell A.I. megjelenése az utóbbi évek talán legerősebb azemberiségmegérettapusztulásra-pillanata.
  • Biztosan korlátozzák majd a realisztikus AI-videókat. A nagy cégek, mint a Google, Microsoft, Facebook/Meta és Apple mind szeretnek a progresszív és szociálisan érzékeny forradalmár képében tündökölni, összefognak tehát (részben már össze is fogtak), és kitalálnak egy csomó szabályt arra, hogy hogyan kötelező jelezni ezeken a képeken és videókon, hogy nem valódiak.
  • A korlátozás semmit sem ér majd. Ahogy most is, a szoftvereket ezen túl is ellopják, feltörik, szabadon terjesztik, ahogy a videókat is ész és szerzőijog-meggondolás nélkül osztják, a vízjeleket blőrözik vagy (akár AI-val) egyszerűen eltávolítják. Aki nem hiszi, hogy az interneten mindenféle borzadály szabadon terjed, az biztosan nem bízta rá magát az algoritmusra legalább pár percig az Instagram Reel szekciójában, vagy nem töltött el legalább harminc másodpercet a 4chan képmegosztó fórumon.
  • Valakik ezen nagyon-nagyon meg fognak gazdagodni. A feltalálók is, persze, de a pornóipar képviselői sokkal inkább.
  • Senki sem veszíti el a munkáját, aki az eszközt és a lehetőséget látja ebben, nem az embernél okosabb és gyorsabb konkurenciát. Mivel a többségi az utóbbit látja benne, sokan elveszítik majd a munkájukat.
  • A valósággal való viszonyunkat csak egy kicsit teszi egészségtelenebbé az AI, az ugyanis már rég lefutott kör: most is képtelenség eldönteni, mi a valóság és mi nem az, és erről nem a mesterséges intelligencia tehet.

Az előző bekezdés megírása után alt-taboztam egyet a Facebookra, ahol rögtön szembejött egy fotó Deutsch Tamásról, amint éppen mariachiszerkóban gitározik, orra alatt gyanús fehér por, mellette Pixar-logó, a kép címe pedig: Kokó. Ha letakarom a szöveget, semmi, de semmi nem árulja el, hogy ez egy AI generálta kép. Értitek, hova szeretnék kilyukadni, ugye?

A SORA-val egyébként bárki készíthet majd videókat – most még nem, mert tesztüzemben működik, egyelőre (szerencsére) csak pár beavatott fér hozzá a rendszerhez –, már csak azért is, mert elég egy rövid szöveges parancs és már kész is a mozgókép. Még csak részletezni sem kell, mit szeretnénk: ha mi nem mondjuk meg, milyen legyen, ő dönt a kameramozgásról, a kompozícióról, a szereplők mozgásáról és mindenről. Táncoló kenguru, csikóhalak papírból, életkép egy építkezésen: ennyi elég is neki és már szállítja is a videót. Mindezt úgy, hogy egy három évvel ezelőtti Reddit-fórumon, ahol valaki felvetette, hogy „képzeljétek el, milyen lenne, ha pár mondatból fotorealisztikus animációk készülhetnének”, a felhasználók jó része azzal jött, hogy ez lehetetlen. A legtöbb szavazatot kapott komment szerint

a mi életünkben ilyesmi biztos, hogy nem lesz, esetleg majd az ükunokáink szórakozhatnak vele.

Csak hogy értsük a fejlődés ütemét: az alábbi videó felső fele egy éve készült, akkoriban ezt dobta ki az AI, miután egy felhasználó megkérte, hogy készítsen egy klipet Will Smithről, amit spagettit eszik. Borzalmas, ugye? Az alsó része pedig friss változat – az pedig szinte mellékes, hogy az pont valódi, maga Will Smith töltötte fel, miután meglátta az első videót.

Erős versenyző még Jennifer Aniston és Brad Pitt közös tánca, amiről még senki sem hitte el, hogy valódi, már csak azért sem, mert a két szereplőn tíz képkockántként váltakoznak a ruhák. A SORA azonban alighanem hamarosan fotorealisztikus spagettizabálást és celebtáncot prezentál nekünk, az igazi buli pedig akkor kezdődik majd, amikor kombinálják az emberi arcokat reprodukálni és különböző testekre ráilleszteni képes, manapság főleg a pornóipar által (akár gyerekpornográfiára is) használt deepfake technológiával, vagy magát a SORA-t tanítják/győzik meg, hogy valódi embereket is ábrázoljon. Ennek tényleg beláthatatlan következményei lesznek.

Most még csak bennfentesek használhatják, hamarosan azonban valamilyen formában demokratizálják, azaz bárki használhatja majd. Olyanok is, akik nem tudják, mekkora felelősség ez, és olyanok is, akik tudják, csak nem érdekli őket. A hatóságok például már több országban már most lázasan brainstormingolnak arról, mi lesz, ha a felhasználók elkezdik gyártani a fiktív bűnözést ábrázoló ipari kamerás „felvételeket”, és úgy általában is megállapíthatatlan lesz egy videóról, hogy van-e köze a valósághoz. Sarkított és elsőre talán kissé demagóg példával:

Ha egy vidéki nagyváros jól bejáratott polgármesteréről manapság kiszivárogna egy videó, amin éppen lyukas zokniban, olcsó alkoholos italok és félig felszívott kokaincsíkok között szexel egy jachton két nővel, akik a lányai lehetnének, simán bemondhatná, hogy ez egy AI-videó, és a legtöbben hinnének is neki, hiszen az egész annyira abszurd, hogy biztosan nem történt meg.

Megfordítva: egy politikai párt – amely, tegyük fel, álhírterjesztésben, csúsztatásban és módszeres lejáratásban egyébként is rutinos és erkölcsi-morális aggályai sincsenek ezen a téren – simán legyárthat és elterjeszthet AI-videókat ellenfeleiről, amint éppen kenőpézt fogadnak el, vagy drag queenekkel drogoznak egy lányvécében. Ha hozzávesszük, hogy ez a – természetesen nem létező – párt birtokolja az ország médiájának négyötödét, vannak embereik és cégeik, akiket azért fizetnek, hogy elvigyék a balhéikat, és pénzük, hogy kifizessék a bírságokat, akkor tényleg semmi nem állíthatja meg őket. A valóság biztosan nem. Még szerencse, hogy ez csak kitalált példa, sem országot, sem pártot nem tudnánk mondani, ahol az ilyesmi egyáltalán felmerülhetne.

Lesznek persze pozitív hozadékai is az AI-robbanásnak. A magazinokat elborító sablonos stockfotók és -videók hamarosan hivatalosan is a „nem létező” kategóriába kerülnek, ahol egyébként eddig is voltak, csak miután valódi emberek valódi felszereléssel rögzítették őket, illetlen volt kimondani, hogy a valósághoz legfeljebb érintőleges közük van. A családon belüli bántalmazásról szóló cikkeket például rendszeresen fekete-fehér, sarokban magzatpózban rettegő, koszos arcú gyerekek fotóival illusztrálják, (az igazán hatásos képek szélén még egy összeszorított férfiöklöt is láthatunk), ami végtelenül káros és leegyszerűsítő. (A gyermekbántalmazásban ugyanis többek közt az a szörnyű, hogy kívülről láthatatlan.) Ezentúl is ez lesz, de legalább abban a megnyugtató tudatban dolgozhatnak a képszerkesztők, hogy nem valódi, a hatáskeltés érdekében kizsákmányolt gyerekek fotóit használják.

Robbanás előtt áll a pornóipar is, és bár borzongató belegondolni, mire használják majd a technológiát, az pozitívum, hogy az AI-videókban már nem valódi nők testét árulják majd az eufemisztikusan „felnőttfilmes platformoknak” becézett, főleg emberkereskedelemből élő cégek. Akik ettől persze csak még gazdagabbak lesznek, pedig az ő munkájukat aztán tényleg elvehetné a mesterséges intelligencia.

SORA AI

Egy teljesen átlagos képkocka a SORA bemutatkozó videójából (forrás: OpenAI)

A világvége-jóslatokkal szemben az AI legfeljebb átalakít bizonyos szakmákat, nem szünteti meg őket, és nem veszi el a valódi művészek munkáját sem. Százötven éve a fotográfiáról hitték, hogy megöli a klasszikus festészetet, és ez részben igazi is volt (a portréfestők munka nélkül maradtak, az élelmesebbje pedig megtanult fotózni), aztán – leegyszerűsítve – a festők rájöttek, hogy nem a valóság ábrázolása a dolguk, inkább az, hogy megmutassák, ők hogyan látják az őket körülvevő világot. Külön szót is kitaláltak erre: impresszionizmus. Manapság pedig egy kreatív és talpraesett grafikus, illusztrátor, fotós, videós és animációs szakember valószínűleg eleve nem is akarna olyan megrendelővel dolgozni, aki költséghatékonysági okokból és szimpla butaságból inkább maga hozza össze a képet, videót AI segítségével, hogy aztán rájöjjön, hogy bármilyen látványos a végeredmény, a közönség azonnal átlát rajta és átugorja.

Márpedig átugorja: alig egy-két évvel az AI-val létrehozott képek és videók elterjedése után máris kezd elfáradni a scrollozó fiatalság. A szakemberek AI-kiégésnek hívják ezt; aki sokat lóg az Instán, az pontosan tudja, miről van szó. A közösségi médiában olyan mennyiségben és ütemben ömlenek ezek az üres, hatásvadász képek és videók, hogy az instázó, tiktokozó fiatalok általában csak ennyit mondanak:

Aha, oké.

És pöccintenek is tovább. Úgy, hogy pár éve még hihetetlennek tűnt, hogy bárki egy-két jól irányzott utasítással (prompt) áthelyezi a Harry Potter szereplőit Berlinbe, és ebből videót készít.

A SORA videóival is ez történik majd: pár hónapig rácsodálkozunk, aztán elfogadjuk, hogy az életünk része – és közben, szép csendben, észrevétlenül elkezdünk gyanakodni minden képre és minden videóra, ami csak elénk kerül. Lenyűgöző sportteljesítmény? Nyilván AI. 360 fokos videó Új-Zéland legszebb hegycsúcsáról? Csak SORA lehet. Minden eddiginél unalmasabb lett az új Marvel-film? Persze, hiszen AI írta. Végre megjelent egy jó Marvel-film? Persze, hiszen AI írta.

Az igazi veszély azonban nem az, hogy nem tudjuk többé eldönteni, mi a valóság. Hanem az, hogy annyira elfáradunk abban, hogy ezen kell gondolkodnunk, hogy abba is hagyjuk – és onnantól végképp nem számít többé.

Ha kommentelni, beszélgetni, vitatkozni szeretnél, vagy csak megosztanád a véleményedet másokkal, az nlc Facebook-oldalán teheted meg.

Címlap

top