Evolutions des transcriptions

Evolutions du site

Version 0.2 - mai 2022

Début mai 2022, une forte affluence sur Scribe (60 transcriptions par jour) nous incite à revoir cette version 0.1 et à l'optimiser ( @glorf).

  • Une refonte complète du coeur de Scribe permet de ne plus gaspiller de mémoire et d'éviter la saturation du serveur, grâce à Vosk-server. Il faut néanmoins compter un consommation minimale de 3,2 Go de Ram pour le Français et 4,8 Go pour l'Anglais.
  • L'utilisation de Vosk-server permet de bénéficier de versions plus récentes des modèles de voix, donc avec des transcriptions de meilleure qualité.
  • Les scripts de Tykayn ne sont plus utilisés, le système Scribe est plus stable.
  • La refonte de Scribe permet de ne plus stocker de textes localement mais d'intégrer directement les transcriptions (avec les sous-titres) comme pièce jointe dans le contenu du mail envoyé à la fin de la transcription. Rien n'est conservé.
  • Un filtre est mis en place pour ne pas lancer de transcriptions pour des hébergeurs de vidéos qui bloqueraient le téléchargement distant (Dailymotion...). Une version récente des certains programmes (ffmpeg) permet de garantir un maximum de sites compatibles (voir la liste des sites supportés)
  • Le contenu des fichiers audio ou vidéo est toujours systématiquement détruit à la fin de chaque transcription.
  • L'ajout d'une page expliquant notre politique de récolte et conservation des données et la vigilance que nous portons à la protection des données personnelles.
  • Un formulaire de consentement de récolte de l'adresse e-mail est ajouté.
  • Des statistiques internes sont ajoutées pour compter le temps de la vidéo/son et le temps de traitement pour en obtenir un ratio.
  • Il est désormais possible d'auto-ponctuer le texte grâce à deep multilingual punctuation prediction, un modèle de ML dédié à cela, grâce à la contribution de @spoinsart.
  • Les mentions légales sur le propriétaire et l'hébergeur du site sont ajoutées.

Version 0.1 - mai 2021

  • La première version fonctionnelle de Scribe est installée.
  • Elle conserve localement le texte transcrit sous forme de fichiers, mais ni l'audio, ni les vidéos ne sont conservés.
  • Ajout d'une page "Pourquoi" qui explique l'historique et le processus de création de ce projet.
  • Le programme Scribe se base sur les scripts de Tykayn mais ça ressemble à du bricolage à base de scotch, mais ça marche !

Contributions

N'hésitez pas à nous contacter si vous souhaitez contribuer à cette solution, rapporter des bugs ou faire des propositions d'améliorations.

Retour à l'accueil - Faire une autre transcription