AI-val mutatják meg a vakok, hogyan „látják” Budapestet

Végre találtak egy értelmes célt az AI-képgenerátornak: vakok mutatják meg a segítségével, hogyan érzékelik a környezetüket, például Budapest forgalmas tereit. Hét művész készített hét képet, az eredmény egyszerre csodás és borzongató.

Neményi Márton

2024. Február 08.

Ha a mesterséges intelligenciáról van szó – márpedig szó van róla, mindenhol és szünet nélkül –, vagy a hasznosságára hivatkozva dicsőítik a fejlesztésében és terjesztésében érdekeltek, vagy a veszélyeire hívják fel a figyelmet a szakértők. Ez persze mind érdekes, de így, hogy évek óta ez megy, Monty Python után szabadon ideje feltennünk a kérdést:

Mit adott nekünk az AI valójában?

És most nem a mobilunkban megbúvó chipekre és algoritmusokra gondolunk – ezek többsége eleve marketinglózung – és nem is a nagy cégek által használt „forradalmi” megoldásokra, mint az addiktívabb ütemben sorsolt TikTok-videók, vagy a meggyőzőnek szánt, valójában tök béna fiatalítós filmtrükkök. Hanem olyasmire, ami valóban kézzel fogható, segít, vagy legalább szórakoztató. Viccesnek szánt, valójában hátborzongató „így néznének ki a Harry Potter szereplői, ha Berlinben játszódna” videók? Hagyjuk már! ChatGPT-vel íratott motivációs levelek? Oké, ez adott esetben valóban hasznos, de azt azért nem formálja át, ahogy a világról gondolkodunk.

Egy kis csapat most megmutatta, hogy igenis van helye az AI-nak a hétköznapokban, a művészetben és az érzékenyítésben. És hogy csak azért, mert mesterséges intelligencia kreált egy képsorozatot, még lehet emberi, ötletes és elgondolkodtató. Csak az kell, hogy hozzáértő emberek irányítsák, akik, pontosan tudják, mit szeretnének mondani vele. Például vakok, akik meg szeretnék mutatni végre a látóknak, hogyan gondolnak az őket körülvevő terekre.

Lévai Balázs és Erdődy Viktor, az egyik vak alkotó a kiállítás megnyitóján az Akváriumban. Fotó: Neményi Márton

Erdődy Viktor, az egyik vak alkotó és Gaskó Balázs a kiállítás megnyitóján az Akváriumban (Fotó: Neményi Márton)

Erről szól a BlindJourney projekt, amelynek kedvéért hét születésétől fogva vak embert kértek fel, hogy írják le, hogyan érzékelik a körülöttük lévő világot. Fontos volt, hogy vakon születetteket szerepeltessenek, a látók ugyanis emlékezhetnek a képekre, a színekre, a vizuális jelekre, itt pedig éppen az volt a lényeg, hogy az érzést, a hangulatot adják át, illetve egy kicsit azt is, hogy hogyan tájékozódnak ők Budapest forgalmas terein. A leírásokat aztán – persze némi IT-bűvészkedéssel – promptként használták a képgeneráló AI-ban.

Ha az előző mondatból nem sokat értettél, nem a te hibád; fontos azonban, hogy alapszinten elmagyarázzuk, hogyan születnek ezek a képek, és hogy működik az, amit némi poétikus éllel mesterséges intelligenciának hívunk, és amelynek hála egyre több a furcsa, de időnként egészen hihető fotóimitáció. Az internet, mint tudjuk, hatalmas és tele van képekkel; ezeket fésülik át az algoritmusok, amelyek – eleinte némi emberi útmutatással – képesek azonosítani és kategorizálni a vizuális elemeket. Ha ez kicsit tág kategóriának tűnik: az is. A lényeg, hogy minél több képet kell ellátni minél több címkével – „nézd, AI, ez itt egy naplemente, ez itt egy emberi kéz, ez a festmény Bauhaus stílusban készült, ez pedig egy 80-as évekbeli sci-fi horrorból való” –, egy idő után pedig megtanulja a gép, mi micsoda, mi több, ha elég alapanyagot gyűjtött, akkor sablonosan és hozzávetőlegesen, de alkotni is képes. Ezt persze mind idézőjelben kell érteni:

A mesterséges intelligencia legfeljebb mesterséges, de egy csöppet sem intelligens, nincsenek gondolatai, érzései, így alkotói szándéka, stílusa sincs, csak a sablonokat, kliséket képes kombinálni emberi utasítások alapján. Ezeket az utasításokat hívják promptnak.

Azaz – szerencsére – maga az alkotás még mindig az ember kezében van.

Forrás: Blind Journey

A BlindJourney projektben tehát nem tettek mást, mint fogták a hét vak alkotó szavait, és parancsként betáplálták egy képgenerátorba. Az egyik résztvevő, Kónya Barbara például a következőt mesélte, amikor megkérdezték, milyen a Keleti Pályaudvar:

Ha erre járok, az boldogsággal tölt el, mert megyek haza a szüleimhez. A boldogság nekem rózsaszín, ezért rózsaszínnek képzelem a vonatokat, az állomás tetejét meg szép csipkésnek!

(Igen, a vakok is képzelnek színeket, árnyalatokat – többek közt az a projekt célja, hogy ehhez hasonlóakat tanulhassunk róluk.) Ezeket aztán promptba foglalta vele a projekt informatikusa; ez a megfelelő paranccsal együtt a következőképpen nézett ki a képgenerátorban:

/imagine vannak körülöttünk irodaházak, szűk a lépcső, néha nem állnak félre az emberek, végre van vezetősáv, teteje is van az állomásnak, sokszor hangosak a vonatok, nem félek, izgalmas kihívás közlekedni, megyek haza a szüleimhez, rózsaszínek a vonatok

A generátor ilyenkor több képet is felkínál, ezekből választhat a felhasználó, és tovább finomíthatja az alkotást, amíg megfelelő nem lesz a végeredmény. Amely a Keleti pályaudvar esetében így néz ki (kattintás után pedig az összes alkotást megnézheted):

7 fotó

„Ha megkérdezünk látássérült és vak embereket, akkor számtalan olyan történetet tudnak elmesélni nekünk, amelyek arról szólnak, hogy olykor nehéz helyzetekben – bár körbe vannak véve látó emberekkel – mégsem kaptak segítséget, vagy a legjobb indulattal, de rosszul segítenek nekik” – közölte a vak alkotókat segítő Kézzelfogható Alapítvány. A szervezet azért jött létre 15 éve, hogy látássérültek társadalmi rehabilitációját segítse különböző művészeti és kézműves képzésekkel, programokkal. A „rosszul segítés” persze nem rosszindulatot jelent, hanem azt, hogy „az emberek jelentős részének nincsen olyan tudása, amelyre támaszkodhatnak akkor, amikor egy vak embernek szüksége lenne segítségre”. A BlindJourney ezen próbál változtatni: a képeket látva közelebb juthatunk ahhoz, mit és mennyit érzékel egy vak ember a környezetéből – pontosabban hogy a látókhoz képest mit és mennyit. A számunkra ismerős helyszínek ezeken a képeken ugyanis absztraktak, meseszerűek, mégis hűen tükrözik azt, ami a fejükben róluk él.

A legszebb az egészben az, hogy bár nem mondták meg az AI-nak, mely terekről van szó, azok így is felismerhetőek, azaz a vakok és a látók érzékelése között nem is akkora a különbség.

Ezt a kiállítás helyszínén, az Akvárium Klub előterében be is mutatták: az egyik alkotót, Erdődy Viktort körbevezették a helyszínen – aki járt itt, tudja, hogy egy brutalista betonszerkezetre épült tágas, oszlopos, fényes térről van szó –, részben meséltek neki, részben hagyták, hogy maga tapasztalja és tapogassa meg, majd hozzáfogtak az alkotáshoz az informatikussal. „Szimmetrikus elrendezésű, minden oldalán termek, kisebbek és nagyobbak, és elég sok a kút, szinte mindenhol ott vannak. Az jut eszembe, hogy jól átgondolt, átérezhető tér, nem az, ahol el tudsz veszni” – mesélte Viktor. „Érdekesek a lépcsők, egy kicsit kihívást jelenthetnek; én vakon simán felmegyek rajtuk, de egy kerekesszékes már nem biztos. Jól behatárolhatók a tér részei, egyértelműek az irányok, szimmetrikus a tér.” Mindezt így képzelte az AI:

8 fotó

A képekkel az érdeklődők Budapest hét pontján köztéri plakátokon, az Akvárium Klubban egy interaktív kiállításon, valamint a projekt weboldalán találkozhatnak: https://blindjourney.hu. Az egyedülálló képek és az általuk képviselt nézőpontok örökbefogadásra várnak, amellyel nem csak az alapítvány munkáját támogathatják, hanem részt vehetnek a vakok és látók közötti híd építésében. Az ebből befolyt összeg teljes egészében a Kézzelfogható Alapítványt illeti. A képek az Akváriumban ingyenesen megnézhetőek, 13-án, 26-án és a zárónapon, 29-én még szerepet is cserélhetünk a vakokkal: a látogatók szemét lefedik, és a tapintható műalkotásokat megérintve kell megtippelniük, hol járnak éppen.

ajánlott videó

egészségrovat vak látássérült vakság AI mesterséges intelligencia

Ha kommentelni, beszélgetni, vitatkozni szeretnél, vagy csak megosztanád a véleményedet másokkal, az nlc Facebook-oldalán teheted meg.

AI-val mutatják meg a vakok, hogyan „látják” Budapestet

Neményi Márton

kapcsolódó

ajánlott videó