Startup soutenue par Nvidia dévoile des avatars qui expriment les émotions humaines

Synthesia présente des avatars IA expressifs pour des présentations d’entreprise et du marketing

Synthesia, une start-up spécialisée dans l’intelligence artificielle (IA) soutenue par Nvidia, a annoncé une nouvelle mise à niveau permettant aux avatars IA de transmettre des émotions et des mouvements humains.

Le 25 avril, l’entreprise a dévoilé ses « avatars expressifs », qui visent à exprimer des émotions en se basant sur des instructions textuelles pour des présentations d’entreprise, du marketing et des formations.

Si l’IA générative a souvent été saluée pour sa capacité à créer des images animées réalistes, comme c’est le cas avec le générateur vidéo Sora d’OpenAI, elle présente également des défauts lorsqu’il s’agit de représenter des humains. Ces derniers sont souvent montrés avec des mains ou des membres déformés, des arrière-plans collés ou des lèvres qui ne sont pas synchronisées avec la parole.

Synthesia vise à corriger ces problèmes dans sa dernière version, qui a été développée à partir d’humains réels lisant des scripts dans leur studio. Cela a été fait pour aider les bots à capturer le suivi des lèvres et à être plus précis dans leurs expressions émotionnelles.

Victor Ribarbelli, le PDG et co-fondateur de Synthesia, a déclaré dans une vidéo que la pièce manquante était que, contrairement aux humains, « les avatars ne comprennent pas ce qu’ils disent », ce qui a précédemment conduit à un manque de réponse faciale aux émotions.

Dans le studio, ils ont été formés à répondre à des indications simples telles que « Je suis heureux. Je suis triste. Je suis frustré » en transmettant les expressions faciales et le ton corrects associés à l’émotion donnée.

Des avatars disponibles en plus de 130 langues

Les nouveaux avatars sont également disponibles dans plus de 130 langues, peuvent fournir leurs propres sous-titres et même cloner les voix des utilisateurs.

Cependant, parmi les modèles d’avatars présentés sur le site web de Synthesia parlant des langues autres que l’anglais, comme le français, l’allemand et l’espagnol, le modèle en anglais est le plus avancé et le plus proche de l’humain, selon un test réalisé par Cointelegraph.

La start-up compte apparemment au moins la moitié des entreprises du Fortune 100 parmi ses clients et fournit des services à plus de 55 000 entreprises, dont des leaders de divers secteurs tels que Zoom, Xerox, Microsoft et Reuters, entre autres.

Synthesia est une entreprise basée au Royaume-Uni fondée en 2017. Grâce à son approche plus ciblée – la création d’avatars ressemblant à des humains pour une utilisation dans le monde des affaires – Synthesia a réussi à se démarquer de la concurrence féroce entre les modèles de chatbot concurrents tels que ChatGPT d’OpenAI et Gemini de Google.

Source: How to get better crypto predictions from ChatGPT, Humane AI pin slammed: AI Eye