L’axe formation du Labex EFL, dans le cadre du projet IDEX « Outillage informatique pour les doctorants en Sciences du langage », propose une série de formations intensives à destination des doctorants et enseignants-chercheurs de SPC.

Vous trouverez ci-dessous le descriptif de la prochaine formation qui aura lieu les 26 et 27 février 2018 : Tools for Speech Annotation : ELAN / Outils pour l’annotation de la parole : ELAN (26/02 et 27/02/2018, 9h30-17h, INALCO) – Christian Chanard. 

Tous les membres du Labex EFL intéressés peuvent s’inscrire via le formulaire en ligne : https://goo.gl/forms/4qn65BsCcB71gUKY2

Si d’aventure il y a plus d’inscrits que de place, une préférence sera donnée aux doctorants. N’hésitez pas à transmettre cette information à tous vos contacts!

Descriptif de la formation

Tools for Speech Annotation : ELAN / Outils pour l’annotation de la parole : ELAN (26/02 et 27/02/2018, 9h30-17h, INALCO) – Christian Chanard.

Présentation du contenu
Formation compacte, sur 2 jours, d’initiation à l’annotation linguistique d’enregistrements audio/vidéo de la parole à travers l’utilisation du logiciel ELAN dans sa version CorpA. Cette formation sera précédée d’un rapide tour d’horizon d’autres outils existants dans ce domaine (Praat, Anvil…)

Programme détaillé
Multi-modalité : parole/gestualité
Les logiciels Praat, Anvil, ELAN pour annoter des enregistrements audio et vidéo
Question de l’unité de découpage de l’information
Question de la transcription, du codage de l’information
Initiation à ELAN
Les tiers indépendantes : segmentation des unités, chevauchement de l’information
Les tiers hiérarchisées : stéreotype, dépendance, niveau d’analyse
La saisie : phonétique, vocabulaire controlé
L’importation de données (CSV, textGrid…)
La recherche dans un corpus annoté
L’exportation (HTML, CSV…)

Objectifs pédagogiques
Donner un bref aperçu des fonctionnalités de différents logiciels utilisables pour la représentation et l’analyse de la parole dans ses différents modes d’expression. Prise en main du logiciel ELAN.

Pré-requis
Savoir utiliser communément un ordinateur personnel (visualiser, copier, supprimer, des fichiers  sous un système couran)

Mode de validation
Une attestation de présence sera délivrée à chaque étudiant ayant suivi l’ensemble de la formation. Un contrôle sous la forme d’une minute d’annotation d’un enregistrement audio ou vidéo selon un schéma spécifié sera demandé à l’étudiant pour juger de son aptitude à utiliser ELAN.

Formateur
Christian Chanard, ingénieur en informatique dans un laboratoire de linguistique africaine, développe des extensions d’ELAN pour assister l’annotation morpho-syntaxique de textes issus de l’oral et l’analyse de la structure de l’information.
Effectif : maximum 20 personnes
Langue utilisée durant la formation : français
Informations pratiques
Email (contact pédagogique, pour toutes questions sur le contenu de la formation) : chanard@vjf.cnrs.fr
Labex EFL : axes 1, 3, 6 et 7

********************************* ENGLISH VERSION

Contents
A two-day training session for the linguistic annotation of audio/video recordings of speech with the ELAN software in its CorpA version. It will be preceded by a short survey of other tools in this domain (Praat, Anvil…)

Validation mode 
A presence certificate will be delivered to all students who followed the whole training session. A one-minute annotation of audio or video recording test will be proposed to assess ability to use ELAN.

Detailed programme
Multi-modality: speech/gesture
Praat, Anvil, ELAN softwares for the annotation of audio and video recordings
Information parsing unit
Transcription and information coding
Initiation to ELAN
Independent tiers: parsing of units, overlapping of information
Hierarchical tiers: stereotypes, dependence, level of analysis
Input: phonetics, controlled vocabulary
Importation of data (CSV, textGrid…)
Searching an annotated corpus
Exportation (HTML, CSV…)

Pedagogical aims
Provide an overview of the functionalities of the different softwares used for representing and analysing speech in its various modes of expression. Getting familiar with ELAN software.

Prerequisite
Basic proficiency in computer usage (view, copy, erase files in mainstream systems)

Trainee
Christian Chanard, engineer in computer science in a research unit of African linguistics, develops expansions of ELAN to ease morpho-syntactic annotations of oral texts and information structure.

Number of participants: maximum 20
Dates : 26/02 and 27/02
Location : INALCO

Email (for questions about the training content): christian.chanard@cnrs.fr
Labex EFL Strands 1, 3, 6 and 7