Le cerveau humain peut distinguer les fausses voix des vraies

Les fausses voix semblent moins agréables à écouter

13.06.2024
Computer-generated image

Image symbolique

Notre cerveau traite-t-il différemment les voix naturelles et les fausses voix ? Des recherches menées à l'université de Zurich indiquent que c'est le cas. Dans une nouvelle étude, les chercheurs ont identifié deux régions du cerveau qui réagissent différemment aux voix naturelles et aux fausses voix.

Tout comme les empreintes digitales, nos voix sont uniques et peuvent nous aider à identifier les gens. Les derniers algorithmes de synthèse vocale sont devenus si puissants qu'il est désormais possible de créer des clones de voix profondes qui ressemblent étroitement aux caractéristiques identitaires des locuteurs naturels. Cela signifie qu'il est de plus en plus facile d'utiliser la technologie du deepfake pour imiter les voix naturelles, par exemple pour escroquer les gens au téléphone ou pour reproduire la voix d'un acteur célèbre dans un assistant vocal d'IA.

Jusqu'à présent, cependant, on ne savait pas exactement comment le cerveau humain réagissait lorsqu'il était confronté à ces fausses voix. Notre cerveau les accepte-t-il comme des voix réelles ou reconnaît-il les "fausses" ? Une équipe de chercheurs de l'université de Zurich a découvert que les gens acceptent souvent les fausses identités vocales comme étant réelles, mais que notre cerveau réagit différemment aux fausses voix profondes qu'à celles des locuteurs naturels.

L'identité des fausses voix se ressemble presque à s'y méprendre

Les chercheurs ont d'abord utilisé des méthodes psychoacoustiques pour vérifier dans quelle mesure l'identité de la voix humaine est préservée dans les fausses voix profondes. Pour ce faire, ils ont enregistré les voix de quatre locuteurs masculins et ont ensuite utilisé un algorithme de conversion pour générer de fausses voix. Dans l'expérience principale, 25 participants ont écouté plusieurs voix et ont été invités à décider si les identités de deux voix étaient identiques ou non. Les participants devaient soit faire correspondre l'identité de deux voix naturelles, soit celle d'une voix naturelle et d'une fausse voix.

Les deepfakes ont été correctement identifiés dans deux tiers des cas. "Cela montre que les fausses voix actuelles peuvent ne pas imiter parfaitement une identité, mais qu'elles ont le potentiel de tromper les gens", explique Claudia Roswandowitz, premier auteur et post-doctorante au département de linguistique informatique.

Le système de récompense réagit aux voix naturelles, mais pas aux imitations profondes

Les chercheurs ont ensuite utilisé des techniques d'imagerie pour examiner quelles régions du cerveau réagissaient différemment aux voix profondes par rapport aux voix naturelles. Ils ont réussi à identifier deux régions capables de reconnaître les fausses voix : le noyau accumbens et le cortex auditif. "Le noyau accumbens est une partie cruciale du système de récompense du cerveau. Il était moins actif lorsque les participants devaient faire correspondre l'identité des voix profondes et des voix naturelles", explique Claudia Roswandowitz. En revanche, le noyau accumbens était beaucoup plus actif lorsqu'il s'agissait de comparer deux voix naturelles.

Le cortex auditif distingue la qualité acoustique des voix naturelles et des fausses voix profondes

La deuxième région cérébrale active au cours des expériences, le cortex auditif, semble réagir aux différences acoustiques entre les voix naturelles et les deepfakes. Cette région, qui traite les informations auditives, était plus active lorsque les participants devaient faire la distinction entre les voix profondes et les voix naturelles. "Nous pensons que cette région réagit à l'imitation imparfaite des voix profondes pour tenter de compenser les informations acoustiques manquantes dans les voix profondes", explique Roswandowitz. Plus une fausse voix était perçue comme moins naturelle et moins agréable que la voix naturelle correspondante, plus les différences d'activité dans le cortex auditif étaient importantes.

Les fausses voix profondes semblent moins agréables à écouter, quelle que soit la qualité du son acoustique. "Les humains ne peuvent donc être que partiellement trompés par les deepfakes. Les mécanismes neuronaux identifiés lors du traitement des deepfakes mettent particulièrement en évidence notre résistance aux fausses informations, que nous rencontrons plus fréquemment dans la vie de tous les jours", explique Roswandowitz.

Note: Cet article a été traduit à l'aide d'un système informatique sans intervention humaine. LUMITOS propose ces traductions automatiques pour présenter un plus large éventail d'actualités. Comme cet article a été traduit avec traduction automatique, il est possible qu'il contienne des erreurs de vocabulaire, de syntaxe ou de grammaire. L'article original dans Anglais peut être trouvé ici.

Publication originale

Autres actualités du département science

Actualités les plus lues

Plus actualités de nos autres portails

Vis-à-Vis avec UV/VIS