Az Interspeech konferencia a beszédtechnológiával foglalkozók legnagyobb és legrangosabb éves konferenciája, amelyet idén Drezdában rendeztek. A szervezők minden évben versenyt is kiírnak a résztvevőknek. A Computational Paralinguistic Challenge-en a feladat a beszédben rejlő információ kinyerése automatikus módszerekkel. A korábbi években beszéd alapján kellett az alany véralkoholszintjét megbecsülni, megsaccolni, hogy mióta fut valaki a futópadon vagy milyen ételt rág a beszéde közben. Idén többek között a Parkinson-kór felismerése volt a cél a beszélő hangja alapján.
A versenyen idén a szegedi csapat – Gosztolya Gábor és Tóth László, az MTA-SZTE Mesterséges Intelligencia Kutatócsoport tudományos munkatársa és főmunkatársa, Grósz Tamás, az SZTE TTIK Informatikai Tanszékcsoport doktorandusz hallgatója és Busa-Fekete Róbert, a németországi Paderborni Egyetem oktatója – bizonyult a legjobbnak. A szegedi kutatók nem először vettek részt a konferencián és a versenyen, amelyről a korábbi években is szép eredményekkel tértek haza.
“A verseny lényege a gépi tanulási algoritmusok használata. Ennek során tanítópéldákat adunk az algoritmusnak, az pedig automatikusan megtalálja az összefüggéseket. A nehézséget általában a megfelelő algoritmus kiválasztása és finomhangolása jelenti. A hang felismerése ezután számítógépen keresztül szoftver segítségével történik” – mondta el Tóth László.