BFM Tech

Voice Engine, le nouvel outil d'OpenAI capable de cloner une voix en 15 secondes

BFM Business Kesso Diallo avec AFP
placeholder video
La startup californienne a présenté son nouvel outil de clonage de voix, précisant que son utilisation sera restreinte à cause de risque de fraude et d'autres crimes.

OpenAI, géant de l'intelligence artificielle (IA) générative et éditeur de ChatGPT, a présenté vendredi un outil de clonage de voix, dont l'utilisation sera restreinte pour empêcher des fraudes ou des crimes, comme l'usurpation d'identité.

Baptisé "Voice Engine", ce modèle d'IA peut reproduire la voix d'une personne à partir d'un échantillon audio de 15 secondes, selon un communiqué d'OpenAI sur les résultats d'un test à petite échelle.

300 millions d'emplois menacés par l'intelligence artificielle ?
300 millions d'emplois menacés par l'intelligence artificielle ?
3:44

"Une approche prudente et informée"

OpenAI a assuré avoir adopté "une approche prudente et informée" avant une diffusion plus large du nouvel outil "en raison du potentiel d'utilisation abusive des voix synthétiques".

"Nous reconnaissons que la capacité de générer des voix ressemblant à celles de personnes comporte de sérieux risques, qui sont particulièrement importants en cette année électorale", a déclaré l'entreprise basée à San Francisco.

"Nous travaillons avec des partenaires américains et internationaux issus du gouvernement, des médias, du divertissement, de l'éducation, de la société civile et d'autres secteurs et nous prenons en compte leurs commentaires au fur et à mesure que nous développons l'outil".

En cette année électorale cruciale dans le monde, les chercheurs en désinformation craignent une utilisation abusive des applications d'IA générative (production automatisée de textes, images, etc), et notamment des outils de clonage de voix, qui sont bon marché, faciles à utiliser et difficiles à retracer.

Des règles à suivre

OpenAI a précisé que les partenaires qui testent "Voice Engine" ont accepté des règles exigeant notamment le consentement explicite et informé de toute personne dont la voix est dupliquée et la transparence pour les auditeurs: ils doivent savoir clairement que les voix qu'ils entendent sont générées par l'IA.

"Nous avons mis en place un ensemble de mesures de sécurité, y compris une marque en filigrane pour pouvoir retracer l'origine de tout son généré par Voice Engine, ainsi qu'un contrôle proactif de son utilisation", a insisté OpenAI.

Cette présentation prudente intervient après un incident politique majeur, quand un consultant travaillant pour la campagne présidentielle d'un rival démocrate de Joe Biden a mis au point un programme automatisé qui usurpait l'identité du président américain, en campagne pour sa réélection.

La voix imitant celle de Joe Biden appelait des électeurs pour les inciter à s'abstenir lors de la primaire du New Hampshire. Les Etats-Unis ont depuis interdit les appels par des voix clonées, générées par de l'IA, afin de lutter contre les arnaques politiques ou commerciales.