A közösségi oldalak közül a magyarok leggyakrabban a Facebookot használják, így a vizes vb alatt is itt született a legtöbb bejegyzés. A szurkolók több, mint háromezer nyilvános bejegyzésben osztották meg, hol és hogyan szurkolnak a magyar sportolóknak, milyen eseményeken vettek részt, vagy melyik sportág a kedvencük. Kommentálták természetesen az eredményeket is.
Az adatbányászattal foglalkozó Clementine azt vizsgálta, milyen hashtageket és szavakat, kifejezéseket használtunk a leggyakrabban a vb-vel kapcsolatban, nem számítva a hivatalos, minden bejegyzésben előforduló #fina, #finabudapest, #avizosszekot kifejezéseket.
A cég egy rövid videóban foglalta össze napi bontásban az eredményt. A #hashtagekből, szógyakoriságokból gyakorlatilag kirajzolódik a teljes program. Így például a nyitónapon még a #megnyitó vezetett, majd később az egyes sportágak, sportolók nevei, valamint a #döntö kifejezések is beléptek. A teljes vb ideje alatt leggyakrabban a #hajrá magyarok, a #vizilabda és a #duna arena hashtageket írtuk le.
A sportágak közül a #szinkronuszas, a #toronyugras, az #uszas és az olyan kapcsolódó szavak, mint a távokat jelző 200, 400 vagy a versenyszámokra utaló vegyes, váltó, valamint a #vizilabda kifejezések szerepeltek leginkább, ezek közül is kiemelkedett a #vizilabda. A sportolók közül pedig a legtöbbször Cseh László, Hosszú Katinka, Kenderesi Tamás neve szerepelt a vizsgált szövegekben.
“A szövegbányászat célja, hogy a nagy mennyiségben, ömlesztett, szöveges formában rendelkezésre álló adatokból strukturált információt nyerjünk ki” – mondta Körmendi György, a Clementine ügyvezető igazgatója. “Erre volt szükségünk, amikor arra voltunk kíváncsiak, hogy a vizes világbajnokság ideje alatt hogyan alakulnak a vélemények a social médiában. Letöltöttük tehát a #finabudapest2017 és #avizosszekot hashtaggel ellátott nyilvános bejegyzéseket. Az adatokat rendszereztük és elemezhető formába hoztuk, különválasztottuk a hashtageket, a bejegyzés szövegét, valamint időpontját. Ezeket szövegbányászati eszközökkel dolgoztuk fel. A szövegbányászat angol nyelvterületen már régóta alkalmazott technológia, sokan használjuk is az erre épülő alkalmazásokat, amikor például a telefonunkon a Google Asszisztenst vagy a Sirit hívjuk segítségül. Magyarországon azonban ma még kevesen látják vagy legalábbis kevesen használják ki az ilyen adatokban rejlő lehetőségeket, pedig a technológia már magyar nyelven is adott” – mondta Körmendi György, a Clementine ügyvezető igazgatója.