Projet PASTEL

Découvrez le projet

A propos de PASTEL

Description et objectifs du projet

Le projet PASTEL est un projet financé par l'Agence Nationale pour la Rercherche ayant pour objectif d’explorer le potentiel de la transcription automatique en temps réel pour l’instrumentation de situations pédagogiques se déroulant en situation présentielle ou à distance, synchrones ou asynchrones. Ce potentiel sera exploré par la création et l'évaluation d'outils novateurs permettant notamment une transcription fidèle et sans latence du discours de l'enseignant.

Deux situations types sont au cœur du projet : l'une centrée sur les cours magistraux et l'autre sur le travail collaboratif mené dans le cadre de travaux dirigés ou de travaux pratiques. Outre ces deux situations, le but est de proposer un panel d’outils qui puisse assister les enseignants et les apprenants au cours des différents stades du module d’enseignement : depuis la préparation des cours par l'enseignant jusqu'à la révision pour les étudiants.

Sur la base de transcriptions automatiques, réalisées en temps réel avec une latence faible, et comportant un nombre limité d’erreurs, il est possible de développer des outils pour faciliter les échanges entre les apprenants ou entre tuteurs et apprenants. Ces derniers peuvent par exemple assister à la prise de notes individuelle et collaborative, la rédaction de compte-rendu, ou pour la délimitation de zones particulièrement intéressantes du discours pouvant être gérées par le tuteur en direct ou a posteriori : zones traitant de notions mal comprises, demandes d’approfondissement ou d’exemple, etc.

D'autres fonctionnalités seront explorées en se basant notamment sur des outils de segmentation thématique d’énoncés, d'analyse d'actes du langage, d'analyse sémantique pour la recommandation de contenu pédagogique connexe. Ces outils seront utilisés pour enrichir la transcription et rendre compte le mieux possible du déroulement du cours en obtenant des enregistrements étiquetés dans lequel il sera facile de retrouver du contenu. Ces enregistrements pourront être diffusés pour servir à la révision, mais également être utilisés par l’enseignant comme contenu pour la conception de cours en ligne.

Outre ceux basés sur le traitement automatique des langues, d'autres outils seront réalisés afin de pouvoir collecter et exploiter les traces d'utilisation du dispositif. Ils permettront de rendre compte de manière synthétique de situations complexes d'enseignement. Ils aideront l'apprenant à évaluer son propre apprentissage, et permettront à l'enseignant d'obtenir un retour sur l'activité de l'ensemble des apprenants, qui est moins facile à évaluer en ligne que dans un cadre de cours classique.

Tous les documents produits, les contenus rassemblés et les bilans d'activité pourront être ré-exploités par l'enseignant pour préparer la prochaine itération du cours. Le matériel pédagogique produit pourra être exploité afin de faciliter l'adaptation d'un cours présentiel en cours en ligne. Cette réutilisation permettra d'automatiser en partie un processus de création de cours aujourd'hui coûteux en temps.

Cette chaîne d'instruments est destinée à un vaste public et son usage ne nécessitera pas un temps d'apprentissage long. Obtenir des outils utilisables rapidement pour dispenser modules de cours pré-existants est l'un des buts du projet. Afin d'obtenir le plus rapidement la transcription la plus fidèle possible quelle que soit la spécificité du thème du cours, l'enseignant sera invité à fournir ses ressources préparatoires pour entraîner le modèle de langage.

La conception des outils est guidée par une analyse des besoins et des usages pré-existants auprès d'utilisateurs-cible du dispositif, à savoir les enseignants et apprenants de l'enseignement supérieur. Au cours de la démarche de conception du projet, le système sera expérimenté en situation réelle d’enseignement à distance, lors de cours magistraux et travaux de groupes. Cette expérience permettra d’évaluer son utilisabilité, de le confronter à un nombre conséquent d'utilisateurs, ainsi que de recueillir de véritables traces d’utilisation. Ces informations alimenteront la démarche de conception itérative du système.

À propos de pastel

Partenaires

Le Laboratoire d'Informatique de l'Université du Maine et les deux équipes qui le composent :

 

L'équipe EIAH pour son expertise envers les Environnements Informatiques pour l'Apprentissage Humain.

#Descriptif?

L’équipe interviendra pour l'analyse des besoins utilisateurs et des usages, la construction de modèles, le recueil et l'analyse de trace, ainsi que le développement des outils.

 

L'équipe Language and Speed Technology pour son expertise dans la transcription de la parole.

#Descriptif?

L’équipe intervient dans la construction de modèles de langages adaptés à la situation et d'algorithmes de reconnaissance de la parole.

L'équipe TALN du Laboratoire d'Informatique Nantes Atlantique pour son expertise dans le Traitement Automatique du Langage Naturel, notamment dans le cadre de cours en ligne.

#Descriptif?

segmentation thématique et reconnaissance des actes de dialogue, proposition de ressources sémantiquement pertinentes en temps réel

#Descriptif? ⇒ où le trouver

Les équipes du département CONTENT et équipe MAS d’Orange Labs interviendront dans le traitement automatique de la parole, la segmentation thématique, la reconnaissance de la parole et de l'audio et apporteront leur expérience dans le développement et l’organisation d’une plateforme d'e-education.

Le Centre de Recherche en Education de Nantes interviendra dans le cadre de l'analyse des besoins ainsi que des pratiques des étudiants et des enseignants.

#Descriptif?

À propos de PASTEL

Lots

Lot 0 : Pilotage du projet et dissémination


Lot 1 : Analyse des besoins et des usages et validation

Identification des acteurs représentatifs dans les situations pédagogiques ainsi que leur rôles et leur fonctions
Identification des ressources et les outils nécessaires
Proposition des scénarios pour les situations pédagogiques
Analyse des scénarios
Validation des scénarios


Lot 2: Traitement automatique de la parole

Adaptation du modèle de langage
Optimisation des performances de la reconnaissance automatique de la parole dans les deux principaux cas d’usage :

  • la reconnaissance en différé 
  • la reconnaissance en direct et à latence contrainte

 

Lot 3: Enrichissement du matériel pédagogique

Liaison des parties du discours des cours avec des informations et des connaissances contenues dans des documents extérieurs ( web, wikipédia, …)

 

Lot 4: Instrumentation de l’apprentissage et de la conception

Collecte des traces et modélisation d’indicateurs d’activité
Instrumentation dans des situations pédagogiques réele