Mostrar el registro sencillo del ítem

hal.structure.identifierUniversité de Lausanne = University of Lausanne [UNIL]
dc.contributor.authorTANCOIGNE, Elise
hal.structure.identifierMaison des Sciences de l'Homme Val de Loire [MSH VL]
dc.contributor.authorCORBELLINI, Jean Philippe
hal.structure.identifierTransitions Energétiques et Environnementales [TREE]
dc.contributor.authorDELETRAZ, Gaëlle
hal.structure.identifierCentre d'études et de recherches sur les qualifications [CEREQ]
hal.structure.identifierCentre Émile Durkheim [CED]
dc.contributor.authorGAYRAUD, Laure
hal.structure.identifierAnalyse et Traitement Informatique de la Langue Française [ATILF]
dc.contributor.authorOLLINGER, Sandrine
hal.structure.identifierInteractions, Corpus, Apprentissages, Représentations [ICAR]
dc.contributor.authorVALERO, Daniel
dc.date.issued2022-07
dc.identifier.issn0759-1063
dc.description.abstractCet article compare les fonctionnalités et résultats de huit outils de transcription automatique (Go Transcribe, Happy Scribe, Headliner, Sonix, Video Indexer, Vocalmatic, Vocapia et YouTube), pour des extraits audio de langue française. Une méthodologie innovante, fruit d’un travail interdisciplinaire, est proposée pour comparer les transcriptions. Elle repose sur un assemblage de trois approches complémentaires : (1) une approche quantitative de comparaison de textes à partir d’une métrique couramment employée, le Word Error Rate (WER), (2) une approche fine de classification et compréhension des erreurs générées par les plateformes, et enfin (3) une estimation du potentiel de gain de temps de transcription pour chacun des fichiers et des plateformes. In fine, aucune plateforme ne serait plus efficace que les autres pour l’ensemble des extraits audio mais deux outils se démarquent : Vocapia et Sonix, chacun ayant ses domaines de prédilection. Quel que soit le type de fichier ou de plateforme, un temps de réécoute et de correction reste indispensable à l’issue des traitements, pour un gain de temps final observé pouvant aller jusqu’à 75 % par rapport à une transcription manuelle. Par ailleurs, l’utilisation de ces outils en ligne peut engendrer des problèmes importants liés à la confidentialité et la sécurité des données. Pour finir, nous revenons sur l’expérience de travail interdisciplinaire qui a rendu ce projet possible.
dc.description.abstractEnThis article compares the functionalities and results of eight automatic transcription platforms (Go Transcribe, Happy Scribe, Headliner, Sonix, Video Indexer, Vocalmatic, Vocapia and YouTube), for audio samples in French. We propose an original methodology, designed through an interdisciplinary work, to compare the transcriptions. It combines three complementary approaches: (1) a quantitative approach which compares the textual outcomes using a common metric, the Word Error Rate (WER), (2) a fine-grained approach to classify and understand the errors generated by the platforms, and finally (3) an approach estimating the amount of transcription time which can be saved for each file on each platform. We show that no platform surpassed the others for all the samples, but two nevertheless stood out: Vocapia and Sonix, each with their own areas of expertise. Regardless of the type of file or platform, listening and correcting the text remains a necessary step. However the use of such tools can save up to 75% of time compared with manual transcription. Yet, the use of these online tools can create major problems relating to data confidentiality and security. Finally, we reflect on the interdisciplinary setting that made this project possible. Résumé Cet article compare les fonctionnalités et résultats de huit outils de transcription automatique (Go Transcribe, Happy Scribe, Headliner, Sonix, Video Indexer, Vocalmatic, Vocapia et YouTube), pour des extraits audio de langue française. Une méthodologie innovante, fruit d'un travail interdisciplinaire, est proposée pour comparer les transcriptions. Elle repose sur un assemblage de trois approches complémentaires : (1) une approche quantitative de comparaison de textes à partir d'une métrique couramment employée, le Word Error Rate (WER), (2) une approche fine de classification et compréhension des erreurs générées par les plateformes, et enfin (3) une estimation du potentiel de gain de temps de transcription pour chacun des fichiers et des plateformes. In fine, aucune plateforme ne serait plus efficace que les
dc.language.isofr
dc.publisherSAGE Publications
dc.rights.urihttp://creativecommons.org/licenses/by-nc/
dc.subjectcorpus oraux
dc.subjectdonnées de la recherche
dc.subjectévaluation logiciels
dc.subjectreconnaissance automatique de la parole
dc.subjectretranscription entretien
dc.subjecttranscription automatique
dc.subject.enautomatic speech recognition system
dc.subject.enautomatic transcription
dc.subject.eninterview transcription
dc.subject.enresearch data
dc.subject.enspeech corpora
dc.subject.ensoftware evaluation
dc.titleUn mot pour un autre ? Analyse et comparaison de huit plateformes de transcription automatique
dc.title.enOne word for another? Analysis and comparison of eight automatic transcription platforms
dc.typeArticle de revue
dc.identifier.doi10.1177/07591063221088322
dc.subject.halSciences de l'Homme et Société
bordeaux.journalBulletin de Méthodologie Sociologique / Bulletin of Sociological Methodology
bordeaux.page45 - 81
bordeaux.volume155
bordeaux.issue1
bordeaux.peerReviewedoui
hal.identifierhal-03730474
hal.version1
hal.popularnon
hal.audienceInternationale
hal.origin.linkhttps://hal.archives-ouvertes.fr//hal-03730474v1
bordeaux.COinSctx_ver=Z39.88-2004&rft_val_fmt=info:ofi/fmt:kev:mtx:journal&rft.title=Un%20mot%20pour%20un%20autre%20?%20Analyse%20et%20comparaison%20de%20huit%20plateformes%20de%20transcription%20automatique&rft.atitle=Un%20mot%20pour%20un%20autre%20?%20Analyse%20et%20comparaison%20de%20huit%20plateformes%20de%20transcription%20automatique&rft.jtitle=Bulletin%20de%20M%C3%A9thodologie%20Sociologique%20/%20Bulletin%20of%20Sociological%20Methodology&rft.date=2022-07&rft.volume=155&rft.issue=1&rft.spage=45%20-%2081&rft.epage=45%20-%2081&rft.eissn=0759-1063&rft.issn=0759-1063&rft.au=TANCOIGNE,%20Elise&CORBELLINI,%20Jean%20Philippe&DELETRAZ,%20Ga%C3%ABlle&GAYRAUD,%20Laure&OLLINGER,%20Sandrine&rft.genre=article


Archivos en el ítem

ArchivosTamañoFormatoVer

No hay archivos asociados a este ítem.

Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro sencillo del ítem