Váš portrét dokáže vygenerovať umelá inteligencia iba z Vášho hlasu! Znie to síce ako sci-fi, ale rekonštrukcia tváre osoby z krátkeho zvukového záznamu rozprávajúcej osoby je už relitou.
Umelá inteligencia dosiahla priam neuveriteľné výsledky. Výskumníci najskôr navrhli a naučili hlbokú neurónovú sieť pomocou miliónov videí z YouTube a internetu. Išlo hlavne o videá, ktoré ukazujú ľudí počas konverzácie a tiež ako sa rozprávajú. Počas tohto „učenia a trénovania“ sa umelá inteligencia naučila korelácie medzi hlasom a tým, ako rečník vyzeral. Tieto korelácie umožnili algoritmu umelej inteligencie čo najlepšie odhadnúť vek, pohlavie a etnickú príslušnosť hovoriaceho.
Do tréningového procesu nebola zainteresovaná ľudská účasť. Inak povedané, umelá inteligencia jednoducho dostala obrovské množstvo videí a mala za úlohu zistiť korelácie medzi hlasovými funkciami a črtami tváre. Po hlbokom učení bola umelá inteligencia pozoruhodne dobrá pri vytváraní portrétov založených výlučne iba na hlasových záznamoch jednotlivých osôb.
Ako sa teoreticky aj prakticky dá využiť generovanie portrétov v reálnom svete?
Jednou z možných aplikácií algoritmu umelej inteligencie Speech2Face v reálnom svete by mohlo byť vytvorenie portrétu osoby počas telefonického alebo videokonferenčného hovoru, keď identita tejto osoby nie je známa alebo nechce zdieľať svoju skutočnú tvár.
Tváre vygenerované umelou inteligenciou možno ďalej použiť aj priamo v trestnom konaní na vytvorenie identikitu ak je k dispozícii iba hlasová nahrávka podozrivého.
Ak niekedy v budúcnosti bude táto umelá inteligencia nasadená v praxi, určite bude predmetom mnohých polemík a diskusií týkajúcich sa súkromia, morálky a etiky. Samotnú úvahu v tejto veci necháme na Vás...
Vedci zaoberajúci sa umelou inteligenciou z MIT Computer Science and Artificial Intelligence Laboratory (CSAIL) ako prví publikovali informácie o algoritme AI s názvom Speech2Face v článku v roku 2019 . Viac informácií tu.
Preklad: Digitálna agentúra Webiano
© 2022 webiano.digital