Seamless M4T. Így hívják azt az új multimodális mesterséges intelligenciát, ami a Meta szerint forradalmasítja majd a kommunikációt azon emberek között, akik különböző nyelveken beszélnek. A Zuckerberg által csak M4T-nak becézett mesterséges intelligencia 100 különböző nyelven lesz képes szöveg-szöveg, beszéd-beszéd, szöveg-beszéd és beszéd szöveg fordításokra, és a cég nem titkolt célja, hogy ezek a képességek a közeljövőben a Facebookot, az Instagramot, a Threadset, a Messengert és a WhatsAppot is gazdagítsák. De tényleg olyan forradalmi a Seamless M4T, mint amilyennek első hallásra hangzik?
A Meta összefoglalója szerint a Seamless M4T az alábbi funkciókkal kerül bemutatkozásra:
- 100 különböző nyelvet képes felismerni.
- 100 nyelvről tud 100 nyelvre élőbeszédből írott szövegre fordítani.
- 100 különböző nyelvről tud élőbeszédből fordítani, de egyelőre „csak” 35 (+ angol) nyelven tudja élőbeszédben visszaadni a fordítást.
- 100 nyelvről tud 100 nyelvre írásban fordítani.
- 100 nyelvről tud írott beszédből fordítani, de élőbeszédben „csak” 35 (+ angol) nyelven tudja elvégezni a tolmácsolást.
Paco Guzman, a Meta kutatási vezetője szerint az M4T azért lesz más, mint a már létező fordítóprogramok, mert:
A meglévő fordítórendszereknek két hiányossága van: a korlátozott nyelvi lefedettségük akadályt jelent a többnyelvű kommunikációban, az pedig, hogy több modellre támaszkodnak, gyakran okoz fordítási hibákat, késéseket és telepítési nehézségeket. A SeamlessM4T nagyobb nyelvi lefedettségével, pontosságával és többfunkciós modellképességével kezeli ezeket a kihívásokat. Ezek a fejlesztések megkönnyítik a kommunikációt a különböző nyelvi hátterű emberek között, és jobb fordítási képességeket tesznek lehetővé egy olyan modellből, amelyet könnyedén lehet használni és tovább építeni.
A galaxis útikalauz stopposoknak után szabadon
A Meta saját készítésű tesztjei azt mutatják, hogy a terméke jobb eredményeket ér el, mint az Open AI Whisperje vagy a Google AudioPaLM2-je a beszéd-szöveg fordításban. A nyílt forráskóddal dolgozó mesterséges intelligencia forradalmasítja a beszédfelismerő és a fordítási piacot azáltal, hogy a rengeteg hozzáférhető adat miatt a fejlesztésük sokkal kevésbé költséges. Sokan már a fordító- és tolmácsmunkák végét vizionálják, és ez már akár rövidtávon is bekövetkezhet.
A Meta forradalmi fordítóprogramjához az inspirációt A galaxis útikalauz stopposoknak Bábeli hala szolgáltatta, ami egy olyan fordító volt, ami képes bármely nyelvről bármely nyelvre tolmácsolni. Az M4T olyan fejlett, hogy képes kezelni és lefordítani a kevert nyelven folytatott beszélgetéseket is. A Meta célja, hogy idővel az MI-jük kisebb, kevesebbek által beszélt nyelveken is képes legyen az élőbeszédes tolmácsolásra.