Scribe - Ceméa - Pourquoi

Un transcripteur libre Audio/Vidéo en Texte

Les envois de fichiers vidéos sont supportés, mais il est plutôt conseillé d'envoyer un fichier audio (wav, mp3, m4a, ogg...) pour limiter les délais et de veiller à la qualité des voix et de l'environnement sonore pour un résultat optimal.

Pourquoi un tel outil ?

Un outil comme celui-ci est utile pour fournir une version texte d'un fichier média (audio ou vidéo). L'objectif de ce programme est de fournir un outil simple et rapide pour permettre de récupérer un texte et l'utiliser comme version numérique. Ceci peut être pratique pour retransmettre rapidement des notes audio par écrit, par exemple. Il vous suffit de vous enregistrer en train de les lire à haute voix, puis d'envoyer votre fichier audio pour qu'il soit transcrit au format texte.

Il est aussi possible d'utiliser cette interface pour créer des sous-titres d'une vidéo, et d'en effectuer ensuite la traduction, pour obtenir une version dans d'autres langues. Dans ce cas, il est nécessaire d'utiliser un outil de gestion de sous-titres pour récupérer les sous-titres transcrits et de les corriger (car ils ne sont pas parfaits). Puis la plupart des logiciels de sous-titrages proposent d'en faire une traduction en respectant le timing identifié par Scribe.

Avec quels logiciels de sous-titrages ?

Il existe plusieurs logiciels libres, plus ou moins ergonomiques, qui peuvent vous aider à mieux gérer vos sous-titres. Certains permettent de visualiser votre vidéo en même temps que vous travaillez vos sous-titres. En voici quelques-uns parmi les plus actualisés :

  • Gaupol : disponible pour Linux, il permet de voir la vidéo en direct et proposer une version de traduction à côté de la version actuelle. Il existe aussi une version (plutôt ancienne) pour Windows.
  • Subtitle Editl : disponible pour Windows uniquement, il propose de nombreuses options d'édition.
  • Jubler : disponible pour Linux, MacOS et Windows, il reste d'aspect vieillot mais propose de nombreuses options d'édition ainsi que la visualisation de la vidéo en cours.
  • Et bien d'autres selon votre système

Comment cette interface a-t-elle été conçue ?

Cet outil est le résultat d'un travail issu d'une lignée de logiciels libres et de communs numériques.

Au commencement était le projet de communs numériques "Common Voice" initié par la fondation Mozilla qui a souhaité mettre à disposition de toutes et tous, une solution de reconnaissance vocale, pour que ce domaine ne soit pas la "main mise" de grands groupes du numérique (GAFAM...) (En savoir plus). Une interface web a donc été mise en place pour recueillir un maximum de voix et de textes dans plus de 100 langues. Chacun·e est donc invité·e à contribuer et à donner un peu de sa voix pour que ce projet aboutisse et devient un "commun numérique". Il manque aujourd'hui encore de nombreuses contributions pour que les voix soient assez fiables et suffisamment diversifiées. La langue française nécessite encore 400h de temps d'enregistrement pour proposer un modèle abouti. Aucune compétence n'est nécessaire, il vous suffit d'un ordi et de lire des phrases et de valider des phrases lues par d'autres. Un petit essai de contribution, même anonmyme ?

Puis vint le projet du logiciel libre Vosk, à l'initiative d'un collectif de chercheurs (Alpha Cephei), tirant partie d'un extrait de ces voix modélisées, et proposant un outil pertinent, mais relativement technique à prendre en main et permettant la reconnaissance partielle de 18 langues. Cependant, il restait inaccessible pour le grand public.

Enfin, vint le projet de transcription de Tykayn, contributeur de l'association "April", Association pour la Promotion et la Défense du Logiciel Libre, qui permettait, grâce au projet Vosk, de convertir un fichier wav en une transcription textuelle. Cependant, aucune interface n'était utilisable facilement, les commandes devant être lancées à la main. Depuis mai 2022, cette partie n'est plus utiisée dans le projet Scribe, nous n'utilisons plus que la partie serveur de Vosk.

Pour finir, vint le projet Scribe, à l'initiative de l'équipe SI des Ceméa qui créa cette interface, simple et fonctionnelle, pour proposer aux utilisateur·rices de bénéficier de l'ensemble de ces fonctionnalités sous une forme plus conviviale.

Cette petite histoire a notamment pour objectif de démontrer que c'est grâce à la contribution de chacun·e (y compris de celles et ceux à l'origine de Common Voice) et à la production de ressources communes et libres que tous ces projets ont pu voir le jour. Chacun·e peut en effet s'appuyer sur les efforts et les possiblités offertes par tous ces logiciels libres et l'esprit d'ouverture qui s'y rapporte. Aujourd'hui encore, Scribe est et restera un logiciel libre, ce qui permettra sa poursuite et des évolutions futures par d'autres développeurs·euses.

Vos données restent vos données !

Contributions

N'hésitez pas à nous contacter si vous souhaitez contribuer à la solution Scribe, rapporter des bugs ou faire des propositions d'améliorations.

Retour à l'accueil