Corpus

Le corpus Alector contient 79 textes originaux (52.704 occurrences, moyenne d’environ 300 mots/texte) extraits de sites proposant du matériel pédagogique pour les niveaux CE1, CE2 et CM1 de l’école primaire. Chaque texte original a été adapté (simplifié) au niveau du lexique (vocabulaire), de la morpho-syntaxe (catégories grammaticales, structures de phrase) et du discours (co-référence).

La recherche d’un texte peut se faire : par mot clé, par tranche d’âge, par type de texte (littéraire ou documentaire scientifique), par nombre de mots et selon la ‘difficulté du texte’. Cette variable a été obtenue grâce à des tests de lecture dans 6 écoles du Var (970 enfants de 52 classes au total en 3 ans, 2017 à 2019). Il s’agit de la moyenne de la vitesse de lecture et des résultats des tests de compréhension des textes lus (Alector indice difficulté).

La ressource est disponible sur la plateforme Huma-Num.

Pour accéder aux textes simplifiés il faut s’identifier. Différentes possibilités d’affichage ont été prévues (taille de la police, interligne, espacement entre caractères, textes en parallèle ou un seul texte). Plus d’informations dans les publications du projet.

recherche_1 - Copie