Data scientist, magyarul adattudós. Számomra elég „kínaian” hangzik, mégis bármikor, mikor megláttam ezt a kifejezést, rögtön egy számítógép előtt görnyedő férfi képe jelent meg lelki szemeim előtt. Automatikusan működésbe lépő sztereotípiáimat aztán gyorsan elmosta a Women in Data Science (WiDS) elnevezésű konferencia, ahol kizárólag adattudós nők tartottak tudományos prezentációkat a szakma képviselőinek. Lehet, hogy ez a tudományterület nem is annyira „férfias”? Tényleg képes diszkriminálni egy algoritmus? Mi minden olvasható ki rólunk az adatainkból? A konferencia magyarországi szervezőivel, Koltai Júliával és Vásárhelyi Orsolyával beszélgettünk.
Bugyuta kérdéssel kezdem, de tulajdonképpen mi az a data science? Mit csinál egy adattudós?
Vásárhelyi Orsolya: Az a jó, hogy ezt senki nem tudja, rengeteg definíciója van. Data scientist az az ember, aki a telefonodon az arcfelismerő algoritmust csinálja, de idetartozik az az üzleti elemző is, aki megpróbálja megjósolni, mit fognak csinálni az ügyfelek, vagy az, aki az Amazonnál az ajánló rendszert építi. Data scientist lényegében bárki, aki adatokat használ arra, hogy olyan információt nyerjen ki, melyek üzleti döntésekben felhasználhatóak. Illetve vannak a data scientist engineerek, akik különböző algoritmusokat építenek termékekbe. Ez egy nagyon sokrétű, széles körben használt terület, sokféle tudást ötvöz. Sok data scientist szakértője egy adott területnek, például nagyon jó közgazdász, vagy szerteágazó gyógyszeripari tudása van. Az elmúlt tíz évben mióta dolgozom, voltam már statisztikus, data mining expert, big data specialista, elemző, data analyst, data scientist, computational social scientist.
Koltai Júlia: Aki ezen az interdiszciplináris területen dolgozik, nemcsak programozni tud, de valamilyen módon érti az adatbázis strukturálását, nemcsak kiszámol dolgokat, hanem értelmezi is azokat a számokat. Kell hozzá valamilyen programozási, matematikai tudás, elemzői készség. Amivel nagyon összekapcsolódott ez a terület, az a big data, a nagy adatok. Egyre fontosabb lett, hogy nagyon nagy adatokat tudjunk kezelni, vagyis olyan adatokat, amelyeket tradicionális módszerekkel már nem lehet értelmezni. A big data a NASA-nál például azt jelenti, hogy most már nem milliós, hanem milliárdos nagyságrendű adatokkal dolgoznak, a társadalomtudósoknál pedig azt, hogy már nem ezer fős kutatásokat elemeznek, hanem például több millió hozzászólást a közösségi médiából. Újfajta módszerek, képességek szükségesek ahhoz, hogy ezeket az adatokat kezelni lehessen. Ezekkel rendelkezik egy adattudós.
Gondolom akkor jó matekosok voltatok.
Koltai Júlia: Nagyon jó tanáraink voltak a Radnótiban, de igazából mindkettőnk az egyetemen került igazán közel a matekhoz. Egyébként én gimiben alap matek csoportba jártam, nem az emelt szintűbe.
Vásárhelyi Orsolya: Az én matektanárom még az év matektanára is lett. De én sem mentem matekfaktra, mert azt gondoltam, soha nem lesz szükségem rá, még emelt szintű érettségit sem írtam. Csak az egyetemen, a Társadalomtudományi Karon jöttem rá, hogy a mateknak értelme van.
A tanár személye sokat tud javítani vagy rontani a helyzeten.
K. J.: A matekszeretetünkhöz mindenképpen hozzájárultak a jó tanárok: Kornai Julcsi, Hegyi Erzsébet, Barna Ildikó, Rudas Tamás. Székelyi Mária mindkettőnk életében nagyon meghatározó ember volt, ő tanította a kutatásmódszertant. Nagyon karizmatikus nő, és jól adta át a matematikai alapokat és az egész gondolkodásmódot, ez mindkettőnket inspirált arra, hogy erre a pályára menjünk.
Nőktől többet kaptatok pozitív visszaigazolást?
V.O.: Ha egy nő olyan területen dolgozik, ahol kevés a nő, talán egy kicsit jobban odafigyel más nőkre. Ez nem biztos, hogy tudatos. Mikor azt nézem, milyen típusú kapcsolataim vannak a volt főnökeimmel, mentoraimmal, azt látom, a nőkkel kicsit egyszerűbb a kapcsolatom. Lehet, hogy én is jobban megbízom bennük, empatikusabb vagyok velük. Több nem építő-jellegű kritikát kaptam férfiaktól, mint nőktől
K.J.: Nálam ez inkább fordítva van. Amikor kritikáról van szó, az a benyomásom, hogy többször kaptam meg nőktől, mint férfiaktól. Viszont a jó női szerepmodellek nagyon fontosak. Nagyon sok lány, amikor elvégzi az egyetemet, elgondolkodik, milyen karriert válasszon, ha családot is szeretne. Vannak gyerekbarát pályák, amik kevesebb kötöttséggel járnak, több idő jut a családra, miközben lehet, hogy más pályát választanának, ha nem kellene aggódniuk a családi életük miatt. Ezért borzasztó fontos, hogy lássunk olyan női példákat, akik család mellett is tudják azt csinálni, amit igazán szeretnek. A gender egyenlőtlenségek szerintem nem az explicit kritikában jelennek meg, hanem sokkal inkább a lehetőségekhez juttatásban, a feladatok kiosztásának mértékében, abban, hogy mennyire kérnek fel olyan pozíciókra nőket, amelyek valamilyen hatalommal is járnak, vagy abban, hogy egy projektben ki kapja azokat a feladatokat, amik kevésbé láthatók, de több munkát igényelnek. Az előrejutást nehezíti, hogy az ilyen pozíciókban inkább férfiak ülnek, de ahogy Orsi is mondta, biztosan van egyfajta nemi szolidaritás.
V.O.: Én azért megkaptam a szakdolgozatom védésénél, hogy sose foglalkozzak tudománnyal, vagy a PhD első évében azt, hogy nekem sokkal többet kell tanulnom, mint a négy másik fiúnak, akit felvettek a szakra. Mivel akkor nem volt körülöttem más nő, aki viszonyítási pont lehetett volna, erősebben éltek ezek a sztereotípiák. Ha már több lány van, ott talán nem mondják, hogy neked többet kell tanulnod. Ennek ellenére úgy érzem, a kvóta önmagában nem oldja meg a fennálló egyenlőtlenségeket. A kutatásaim során azt elemzem big data adatok alapján, hogy a nők és a férfiak miként használják a hálózataikat, mitől sikeresek és mitől nem. Az összes kutatásunk azt mutatja, hogy másképp viselkednek, működnek együtt a nők, mint a férfiak. Hogy egy nő egy másik nő társaságát keresi, már önmagában keresztülvágja a jövőjét, különösen azért, mert a nők ritkán vannak magas beosztásban. Ha csak több nőt rakunk egy csapatba, ha a nőket nem integráluk, és nem adunk nekik valódi felelősséget nem sokat ér a diverzitásba fektetett energia. Egyébként kutatásokból tudjuk, hogy azok a csapatok, amelyek nemcsak genderszempontból sokszínűek, kisebb eséllyel hoznak létre olyan termékeket, melyek másokat diszkriminálnak. Ugyanis például az, hogy az Amazon mit ajánl fel neked, mint termék, nagyban függ a te nemedtől, bőrszínedtől. A kérdés az, hogy ez diszkriminál téged, például más árat fog-e mutatni vagy sem.
Ez előfordulhat?
K.J.: Igen, az Amazonnál előfordult. Az amerikai bíróságokon például működik egy rendszer, aminek a lényege, hogy felajánl a bíróknak valamilyenfajta ítéletet a körülmények alapján. Az egyik elítélt viszont beperelte ezt a szoftvert, és bebizonyosodott, hogy ez a szoftver diszkriminál. De ez nem azért van, mert rasszisták írták. Ennek oka az, hogy olyan korábbi ítéletek alapján készítették az algoritmust, melyek diszkriminatívak voltak. Mivel ezen az adatbázison tanult a gép, maga az ajánlásai is ilyenné váltak. De a HR oldalak ajánló algoritmusainál is észrevehető, hogy a nőket kevésbé ajánlják bizonyos pozíciókra. A fejvadászoknál is van ilyen tudattalan torzítás.
Tehát már egy algoritmus is tud diszkriminálni?
V.O.: Az algoritmusok nagyon jól tudnak diszkriminálni. Ezt már külön tudományterület kutatja, megjelent az algorithmic fairness (“algoritmikus korrektség”) fogalma. A data science-ben az a legérdekesebb és legveszélyesebb egyszerre, hogy olyan algoritmusokat csinálunk, melyek a társadalomban meglévő egyenlőtlenségeket csökkenthetik, vagy még nagyobbá tehetik, ha nem figyelünk.
A konferencia esetében miért fontos hangsúlyozni, hogy itt a női adattudósok állnak a fókuszban?
V.O.: A WiDS konferencián nem arról beszélünk, hogy nők vagyunk, hanem olyan erős szerepmodellek szólalnak fel, akik tényleg értenek a tudományhoz. Tavaly augusztusban kaptam egy ösztöndíjat, és megismerkedhettem azokkal a nőkkel, akik Stanfordban ezt a konferenciát csinálják. Margot Gerritsen (Stanford Egyetem professzora, a WiDS Konferencia kitalálója) elmesélte, hogy egyszer data scientist előadóként meghívták egy konferenciára, de valamilyen okból le kellett mondania. Másnap, amikor nézte a fotókat, azt vette észre, hogy nulla darab női előadó volt. Teljesen kikészült, hogy lehet az, hogy a Szilícium-völgy közepén, ahol a világ legokosabb emberei ülnek, a Stanford Egyetemen nem találtak még egy nőt. Eldöntötte, hogy revansot vesz, és csinál egy olyan konferenciát, ahol csak nők lesznek, és csak arról fognak beszélni, mit csinálnak nagyon jól, akár sokkal jobban, mint mások. Ezek után neki senki nem mondhatja azt, hogy nem találnak még egy nőt, aki data scientist. Ezzel elindított egy új hullámot, például ma már sok férfi sem megy el olyan beszélgetésre, ahol nincs nő.
K.J.: Például az én férjem sem. A pasik is tök sokat tehetnek azért, hogy ez változzon. Több más férfi ismerősöm jelzi a szervezőknek, ha ilyen beszélgetésre hívják, ajánl női előadókat és nem vállalja, ha nem változtatnak ezen. Persze az is lényeges, hogy ez nem azt jelenti, hogy minden területen és mindenáron kellenek nők egy konferenciára, bizottságba vagy kerekasztal beszélgetésbe: olyan területeken, ahol alig vannak jelen nők, nem feltétlenül lehet fele-fele arányt elérni. Arra viszont nagyon fontos lenne figyelni, hogy ha vannak női szakértők is egy területen, ők is jelen legyenek, mert sajnos akár a médiában, akár a tudományos életben, de az élet más területein is túl sok példát látni arra, hogy ez nem így van.
Koltai Júlia szociológus, survey statisztikus. PhD fokozatát 2013-ban szerezte meg. Az ELTE Társadalomtudományi Karának adjunktusa, a (volt MTA) Társadalomtudományi Kutatóközpont kutatója és a CEU vendégprofesszora. Az utóbbi években komplex hálózatokon és nagy mennyiségű szöveges adaton vizsgál társadalomtudományi problémákat mesterséges intelligencia alapú algoritmusok segítségével. Vásárhelyi Orsolya adattudós és hálózatkutató, a CEU Hálózat és Adattudományi tanszékének doktorjelöltje. Kutatásai során azt elemzi mesterséges intelligencia alapú algoritmusok segítségével, hogy a nem tudatos diszkrimináció és az informális hálózatokban betöltött pozíció hogyan hat a nők és a férfiak sikerességére a tudomány és a technológia területén. Dolgozott többek között a Typeformnál Barcelonában, részt vett a Data Science for Social Good és a Bridge Budapest ösztöndíjain. Rendszeresen tanít és ad elő, legutóbb a TEDx Liberty Bridge konferencián beszélt tudományos munkájáról.
Mi lehet az oka annak, hogy a gimi után kevés lány választja ezt a pályát? Mi rettenti el mégis a lányokat?
K.J.: Ebben abszolút közrejátszanak a sztereotípiák. Végeztek egy kísérletet arról, mit mondanak az emberek, ha egy kisbabát kékbe öltöztetnek. Ha azt hiszik, hogy fiú, erős izomzatúnak, bátornak látják, de ha rózsaszín ruha van rajta, kedvesnek, finom vonásúnak. Ha a nemekről esik szó, az emberek dobozokban kezdenek el gondolkodni, ez a doboz itthon pedig az – amit a politikusaink egy része is rendszeresen hangoztat – hogy a lányoknak az a dolga, hogy a családdal, gyerekszüléssel foglalkozzanak, nincs helyük a közéletben. Emellett van egy olyan megkülönböztetés is, hogy a reál dolgokhoz a fiúk, a humán dolgokhoz a lányok értenek. Még ha át is lépi az ember ezt az oktatási küszöböt, akkor is szembesül azzal, hogy más dolgokat várnak el tőle például a tanárai, iskolatársai, szülei. Az egész társadalom abba az irányba tolja a lányokat, hogy ne foglalkozzanak “hard core” természettudományokkal, nekik maradjanak meg a “puhább” humán tudományok.
V.O.: Itt vagyok például én, aki most végzem a PhD-met, és még nekem is végig kell gondolnom, hány női tudós van a környezetemben, akiről azt látom, hogy össze tudta egyeztetni a munkáját a magánéletével. Még az én fejemben is végigfut, mi van, ha pár évre elmegyek majd GYES-re, és vége a karrieremnek. Alapvetően a munka világát a férfiak találták ki a 20. század elején, amikor még szó sem volt arról, hogy nők, meg lila hajúak, meg féllábúak fognak dolgozni. És ezt egyáltalán nem változtattuk meg.
K.J.: Nekem egy lányom és egy fiam van, és a férjemmel abszolút figyelünk arra, hogy ezek a sztereotípiák ne jöjjenek ki. Mindezek ellenére a lányom egy nap úgy jött haza az oviból, hogy megtanulta, „lányoké az elsőbbség, fiúké a dicsőség”. Két hétnyi beszélgetésbe tellett, míg megértette, hogy ez hülyeség. Pedig ebből semmit nem kap itthon, tényleg nem így élünk. Talán ezért is igaz Orsira és rám is, hogy a szakmán belül különösen próbálunk figyelni a lányokra, főleg azért, mert a fiúk valahogy nyíltabban közlik, ha ambíciójuk van, jobban megmutatják magukat. A lányok sokkal visszahúzódóbbak ilyen szempontból.
Miért nem látják a lányok a lehetőségeiket ezeken a területeken, és mit lehet tenni azért, hogy ez ne így legyen?
V.O.: Szerintem csomó kislány nem is tudja, mit lehet csinálni a függvényábrázolással. Nem tudjuk, mire jó az, amit tanulunk. Ráadásul, nagyon kevés a látható női példakép technológiai területeken, és amíg a NAT-ban az van, hogy erősítsük a nemi sztereotípiákat, addig ez nem is fog megváltozni. A Skoolnak van most egy STEMsisters nevű kezdeményezése, ahol érthető szintre hozzuk a lányoknak, mit csinál például egy data scientist.
Mennyire nehéz összeegyeztetni a data scientist karriert a családdal?
K.J.: Mivel kicsi gyerekeim vannak, nálam ennek az egyik legfontosabb előfeltétele, hogy egy olyan férjem van, aki támogat ebben. Persze a nagyszülők segítsége is legalább ennyire fontos az életünkben, de ez szupportív partner nélkül nem, vagy csak nagyon nehezen működne. A másik, ami nehéz ebben, hogy valami mindig sérülni fog, és választanod kell, hogy a családod, a munkád, vagy az énidőd sínyli meg. Nálam ez az alvás. A második gyerekünk születése óta elég keveset alszom, és ez nem panasz, csak mérlegelés, erről mondok le a legszívesebben. Annak érdekében, hogy a délutánt együtt töltsük a gyerekekkel, a napközbeni munka után még este is leülök dolgozni. Szerencsére ez a munka ebből a szempontból elég rugalmas, nem fix idősávokhoz kötött és ha az ember szereti azt, amit csinál, akkor ez nem akkora teher. Így nem kell lemondanom sem a karrieremről, sem arról, hogy a gyerekeinkkel legyek délutánonként, és értelmes időt töltsek velük.
Mi a legvonzóbb ebben a pályában, amiért megéri a kevés alvást?
K. J.: Nagyon szeretem benne, hogy rengeteg mindenre lehet alkalmazni, nagyon sokféle emberrel lehet együtt dolgozni. A legjobb kooperációk mindig abból születnek, ha van valaki, aki egyáltalán nem ért ehhez, mégis van egy izgalmas kutatási kérdése, megkeres, hogy kollaboráljunk az én módszereimmel, az ő kérdésfeltevésével és háttértudásával. Ez olyan, mint nálad az újságírás – nem kell leragadnod egy dolognál, mindig bele tudsz mélyülni abba, ami éppen érdekel. Az egész szakma olyan szellemi szabadságot ad, amely számomra megfizethetetlen.
V.O.: Én is nagyon szeretem benne, hogy egyik nap azt kell megértenem, mitől lesznek élhetőbbek a városok, a másik nap a nemi egyenlőtlenségek hatásaival foglalkozom, majd az influenszerekkel a twitteren. Szeretem, hogy sokat utazhatok vele, és viszonylag könnyen el tudok vele helyezkedni. Nagyon király dolog, hogy be van ágyazva a tudományos közösségbe is, és az iparban is jelen van. Szeretem, és persze néha idegesít is, hogy folyamatosan meg kell érteni, újra kell tanulni a dolgokat.
Úgy tűnik, az adatelemzőknek nemcsak a számokhoz, de az emberekhez is érteniük kell.
K.J. Az esetek nagyon nagy részében embereket elemzünk. Embereknek a hozzászólásait, telefonhívásait, banki költségeit, mozgásait. Ha a kutató nem érti azokat a társadalmi folyamatokat, melyek körülötte vannak, akkor teljes mértékben félreinterpretálhatja az eredményeket.
V.O. Attól igazán jó egy adatelemző, hogy érti, hogyan működnek a felhasználói, ismeri az adott területet. Például ha a hangfelismerő programot csak férfiakon tesztelem, akkor úgy megy ki a piacra, hogy nem ismeri fel a nők hangját. Ez megtörtént. Rengeteg mindent el lehet rontani azzal, ha nem gondolunk arra, hogy mások különbözhetnek tőlünk, például nem élnek olyan jól, mint mi, vagy rosszabbul látnak. Az tud jó lenni ebben a szakmában, akinek van empátiája.
További cikkeink tudósnőkről
- Nálunk dolgozik majdnem a legkevesebb női mérnök és tudósnő Európában
- Hibázott a Nobel-díjas tudós, visszavonta a tanulmányát
- Nem létezett a tudós nő Csernobilban