Guide d'utilisation

La base de données Omnilex est structurée comme une feuille Excel. Les mots sont inscrits dans la colonne à l’extrême gauche et les caractéristiques (variables) qui lui sont associées se trouvent dans les colonnes suivantes à droite. Chaque colonne est identifiée par une abréviation. Dans ce guide nous expliquons les caractéristiques des données dans chaque colonne, comment inclure une caractéristique dans une recherche de mot, comment utiliser des filtres et les fonctionnalités de la base de données.

Le contenu de la base de données lexicales

Nous présentons ci-dessous le nom abrégé de chaque caractéristique et des informations sur le codage de cette caractéristique.

Caractéristiques Signification Codage
Graph Représentation orthographique du mot Alphabétique
Phon Transcription phonétique du mot Alphabet phonétique du français
Cgram Catégorie grammaticale ou fonctionnelle du mot Menu déroulant : nom, pronom, adjectif, verbe, adverbe, auxiliaire, conjonction, élément, interjection, onomatopée, préposition, abréviation, locution, sigle, symbole,
Genre Genre grammatical du mot, s’il y a lieu Menu déroulant : masculin, féminin, variable
Nombre Nombre du mot, s’il y a lieu Menu déroulant : singulier (par défaut), pluriel, indéterminé
Ngraph Longueur du mot en lettres Nombre entier
Nphon Longueur du mot en phonèmes Nombre entier
NsylPH Longueur du mot en syllabes phonologiques Nombre entier
NsylOR Longueur du mot en syllabes orthographiques Nombre entier
Frq_Lex3_L Fréquence d’utilisation des mots (sur 1 million d’occurrences) dans les livres Source : New et coll. (2004, 2007) Nombre réel
Frq_lex3_F Fréquence d’utilisation des mots (sur 1 million d’occurrences) dans les dialogues de film Source : New et coll. (2004, 2007) Nombre réel
Frq subj Évaluation subjective par un échantillon de jeunes adultes de la fréquence subjective d’occurrence des mots Score moyen sur une échelle de Likert : 1 étant la valeur la plus faible et 7 la valeur la plus forte
Imagerie Évaluation subjective par un échantillon de jeunes adultes de la capacité des mots à évoquer une image mentale Score moyen sur une échelle de Likert : 1 étant la valeur la plus faible et 7 la valeur la plus forte
SegSylPH Syllabation phonologique de la transcription phonétique du mot P.ex. ‘por1tabl2’
SegSylOR Syllabation orthographique du mot P.ex. ‘por1ta2ble3’
StrucSylPH Structure syllabique à l’oral P.ex. ‘portable’ → cvccvcc
StrucSylOR Structure syllabique à l’écrit P.ex. ‘portable’ → cvccvccv


L’inclusion des variables dans le résultat de la recherche

Une variable peut servir de filtre sans qu’elle soit incluse dans le résultat de votre recherche. Pour l’inclure, il suffit de cliquer sur l’icône . Une fois choisie, cette icône se transformera en . L’orthographe du mot est sélectionnée par défaut.

L'utilisation des filtres

Les filtres que vous souhaitez utiliser doivent être inscrits dans la fenêtre à droite de chaque variable. Pour hausser la versatilité des filtres, nous exploitons un ensemble de codes appelés « expressions régulières ». Les principales expressions régulières sont les suivantes :

Les expressions régulières peuvent être utilisées pour toutes les caractéristiques représentées par caractères alphanumériques : p. ex. Graph, Phon, SegSylPH, SegSylOR, StrucSylPH, StrucSylOR. Elles peuvent aussi être combinées pour une même caractéristique.

1 Les contextes sont tirés d’une base de données constituée de quelque 250 ouvrages pour la jeunesse sélectionnés par les spécialistes du site Livres ouverts. Ces contextes authentiques d’emploi des mots constituent un matériau d’observation utile non seulement pour le travail sur l’orthographe d’usage, mais aussi pour celui sur les accords, la conjugaison, le lexique et la syntaxe. Tous les contextes ne présentant pas une égale pertinence pédagogique, il appartient aux enseignantes et aux enseignants de sélectionner ceux qu’ils jugent appropriés aux apprentissages qu’ils planifient.