Corpus Alector

Le corpus Alector contient 79 textes originaux (52.704 occurrences, moyenne d’environ 300 mots/texte) extraits de sites proposant du matériel pédagogique pour les niveaux CE1, CE2 et CM1 de l’école primaire. Chaque texte original a été adapté (simplifié) au niveau du lexique (vocabulaire), de la morpho-syntaxe (catégories grammaticales, structures de phrase) et du discours (co-référence).  21 nouveaux textes originaux sont en train d’être adaptés et intègreront rapidement l’ensemble du corpus (il atteindra 100 textes originaux avec leurs équivalents simplifiés courant de l’été 2023).

La recherche d’un texte peut se faire : par mot clé, par tranche d’âge, par type de texte (littéraire ou documentaire scientifique), par nombre de mots et selon la ‘difficulté du texte’. Cette variable a été obtenue grâce à des tests de lecture dans 6 écoles du Var (970 enfants de 52 classes au total en 3 ans, 2017 à 2019). Il s’agit de la moyenne de la vitesse de lecture et des résultats des tests de compréhension des textes lus (Alector indice difficulté).

La ressource est disponible sur la plateforme Huma-Num.

Pour accéder aux textes simplifiés il faut s’identifier. Différentes possibilités d’affichage ont été prévues (taille de la police, interligne, espacement entre caractères, textes en parallèle ou un seul texte). Plus d’informations dans les publications du projet.

recherche_1 - Copie

 

Le corpus Alector a été créé grâce au financement de l’ANR, projet Alector (ANR-16-CE28-0005).

Publicité
%d blogueurs aiment cette page :