Les robots trouvent leur voix: le doublage algorithmique fait son cinéma

L’avènement du phénomène de longue traîne, favorisant le succès spontané, planétaire et inattendu de certaines séries de niche - on l’a vu avec Squid Game - accroît la demande pour des séries « étrangères » accessibles pour les auditoires de différents pays.

L’industrie cinématographique, les diffuseurs et leurs publics ont collectivement tout à gagner à rendre disponibles les œuvres dans plusieurs langues, le plus rapidement et au plus haut niveau de qualité possible. Des succès planétaires comme la série Casa De Papel, le film Parasite, ou des succès canadiens comme C.R.A.Z.Y. du regretté Jean-Marc Vallée, ont largement bénéficié d’une industrie du doublage dynamique et en expansion.

Dans ce contexte, le magazine BusinessWire évoque une croissance continue du doublage, un marché qui passera de 2.4Mds US en 2019 à 3.6Mds US  en 2027 – une croissance de plus de 50% en moins d’une décennie. Peut-être, comme l’a écrit Kevin Drum dans Motherjones, est-ce parce que « les audiences n’aiment plus les sous-titres » – provoquant l’ire de différents spécialistes sur les réseaux sociaux – mais force est aussi d’admettre que la qualité et la rapidité du processus de post-production requis pour le doublage ont rendu cette sous-industrie véritablement compétitive.

Au cœur d’un cinéma de plus en plus mondial, le doublage et le sous-titrage jouent un rôle de plus en plus crucial.

Doubler en double

Historiquement, seuls quelques importants marchés (non anglophones) avaient l’opportunité de visionner films et séries dans leur langue maternelle, comme le rapportait il y a une dizaine d’années le Hollywood Reporter. La France, l’Italie, l’Espagne et l’Allemagne sont ainsi devenus experts dans l’art du doublage, mettant à contribution des comédiens et des studios locaux avec des moyens conséquents.

Les plus petits marchés devaient, quant à eux, se contenter de sous-titres.

Il est difficile d’estimer précisément le coût que représente le doublage pour les producteurs. Au Québec, Joey Galimi, président de l’Association nationale des doubleurs professionnels, évoque un investissement pouvant parfois atteindre 80 000$ à 85 000$ pour les longs-métrages complexes. Aux Etats-Unis, le Hollywood Reporter fait lui état de sommes allant entre 100 000 et 150 000$ par marché linguistique. Dans tous les cas, pour un long métrage à grand déploiement, cherchant à atteindre 40 pays, cela signifie un investissement de plusieurs millions de dollars, un pari risqué surtout pour les producteurs issus de petits marchés comme le Canada.

Afin d’éviter ce ‘dédoublement’ des efforts, de nouveaux acteurs sont entrés en scène ces dernières années afin d’automatiser et d’améliorer la qualité du doublage, en utilisant différentes strates de technologies qui permettent d’accroître le niveau de la traduction, mais aussi l’adéquation entre le ton de l’acteur original et celui de « l’acteur » de synthèse dans la langue de destination.

Anatomie du doublage

L’idée de programmer des algorithmes afin de traduire n’est évidemment pas nouvelle. Google Translate continue de faire des progrès constants en matière de qualité; son score d’exactitude, mesurée selon la mesure BLEU (Bilingual Evaluation Understudy), s’apprécierait d’environ 1 point par année depuis 10 ans.

Cela signifie que, pour plusieurs langues communes, la traduction depuis l’anglais et vers l’anglais excède aujourd’hui la barre du ‘50’, qui correspond à des « traductions de très haute qualité, adéquates et fluides ». 

Au niveau 60, la qualité est jugée «meilleure que celle d’une traduction humaine». Ce niveau pourrait être atteint dans les prochaines années.

Comme l’écrivait Srishti Mukherjee en janvier dernier:

«Auparavant, les voix synthétiques n'étaient que des mots collés ensemble pour produire un effet robotique maladroit. De nos jours, les développeurs vocaux n'ont plus besoin de fournir eux-mêmes le rythme, la prononciation ou l'intonation exacts du discours généré. Au lieu de cela, ils remplissent simplement des heures d'audio dans un algorithme qui déchiffre ces modèles pour lui-même. Ces voix peuvent changer de style et d'émotion, faire des pauses et respirer aux bons endroits, et apprendre le ton et les schémas du discours d'un acteur».

L’entreprise israélienne DeepDub a d’ailleurs obtenu un investissement de 20M$ US en février dernier afin de poursuivre le développement de son algorithme permettant de préserver une voix pratiquement identique dans différentes langues. À partir d’un échantillon relativement réduit, il sera désormais possible de préserver la voix de l’acteur d’origine, plutôt que de lui assigner une nouvelle personnalité selon la qualité du doublage local.

Enfin, l’un des enjeux majeurs du doublage consiste à rapprocher les mouvements du visage et de la bouche des sons et des mots qui sont exprimés. Qu’à cela ne tienne, des startups comme la britannique Synthesia se concentrent à ajuster les mouvements de la bouche de l’acteur pour s’adapter à la langue locale. On corrige ainsi l’image pour y faire coller les mots, avec un résultat aussi réaliste que renversant.

L’ensemble de ces avancées promet de réduire drastiquement les temps requis pour le doublage, mais également de rendre le processus plus abordable, augmentant le nombre de productions internationales accessibles dans plusieurs langues.

Le côté sombre du doublage algorithmique

Si ces technologies promettent de rendre plus accessible et plus agréable le visionnement de films et de séries étrangères, l’intérêt et les investissements envers ces entreprises favorisent les mêmes avancées technologiques que celles employées par les créateurs d’hypertrucages (deep fakes).

En rendant l’art et la création plus accessibles, ils minent donc la confiance des consommateurs de contenus envers l’authenticité et l’intention derrière ceux-ci. Au croisement entre l’art et l’action politique, le doublage algorithmique pourrait avoir besoin d’un certain encadrement.

Du point de vue microéconomique, il est également probable que l’industrie du doublage, prise d’assaut par un petit nombre de startups technologiques, empruntera la voix du ‘gagnant-prend-tout’ (winner takes all), ce qui pourrait être extrêmement dommageable pour les écosystèmes locaux où les entreprises de doublage jouent un rôle majeur.

En effet, pour de nombreuses entreprises de post-production, mais aussi pour les comédiens qui ‘donnent vie’ aux acteurs originaux, le passage à l’algorithme pourrait signifier la fin d’un métier, d’une sensibilité et d’une compétence locale bien ancrée.

Évolution? Révolution? Le doublage constitue une opportunité majeure pour les créateurs d’un peu partout, mais une menace pour l’intégrité des contenus et des écosystèmes qui les alimentent, particulièrement dans les petits marchés. 


Francis Gosselin
Francis est docteur en économie et entrepreneur en série. Consultant et aviseur auprès de dirigeants et de conseils d’administration, il est également président de Norbert Hill et président du conseil de FailCamp, une OBNL dédiée à la promotion de l’entrepreneuriat et de l’apprentissage. Il a travaillé comme consultant dans le domaine de l’éducation, des médias, de l’immobilier et des services financiers pour des clients comme Ubisoft, l’École Supérieure de Gestion—UQAM, Radio-Canada, Lune Rouge, BNP Paribas, Allied Properties et l’Institut de Développement Urbain. Croyant fermement aux vertus de l’engagement social et philanthropique, il siège sur le Conseil d’administration du festival MUTEK, et est membre du Club des 100 jeunes philanthropes d’HEC Montréal. Il élève depuis 2012 des chiens MIRA destinés à des personnes dans le besoin, en plus de contribuer financièrement à cette cause importante.
En savoir plus
This site is registered on wpml.org as a development site. Switch to a production site key to remove this banner.