Littré, schéma d’encodage TEI
Présentation de la structure informatique du Dictionnaire de la langue française d'Émile Littré, encodé en XML et respectant les spécifications de la TEI-P5. Ce projet a été réalisé à partir de la version électronique du Littré conçue par François Gannaz (version 1.3) et correspond à l'intégralité de l’édition originale de 1872 en 4 volumes, enrichie de son supplément de 1877.
« Le passé de la langue conduit immédiatement l'esprit vers son avenir. »
(Émile Littré, Préface du Dictionnaire de la langue française)
Nomenclature
Convaincu de la nécessité de connaître les emplois passés pour éclairer les usages présents, Émile Littré construit la nomenclature de son Dictionnaire de la langue française sur le socle de celle du Dictionnaire de l'Académie Française ; ce « corps de la langue » est donc enrichi à partir de nombreuses sources d'addition :
- le « dépouillement des auteurs classiques » d'une part, ainsi que les « auteurs du seizième siècle, du quinzième, et même [...] les auteurs antérieurs, s'il était possible d'y puiser sans réserve » ;
- les « termes de métier » (à partir de la nomenclature des travaux de Furetière et Richelet) et les termes scientifiques d'autre part, deux objets par ailleurs bien distincts : « tandis que la langue des métiers est toujours populaire, souvent archaïque, et tirée des entrailles même de notre idiome, la langue scientifique est presque toute grecque, artificielle et systématique : là l'étymologie se présente d'elle-même ».
| Enfants | B. <body> |
|---|---|
| Modèle | body |
| Parents | T. <TEI> |
| Enfants | |
|---|---|
| Modèle | ( entry | entryFree ) + |
| Parents | T. <text> |
| Attributs |
|
||||||
|---|---|---|---|---|---|---|---|
| Enfants | E. <etym> F. <form> S. <sense> |
||||||
| Modèle | form note type="REM." ? note type="plan" ? sense + re type="PROV." * ( note type="REM." | re type="SYN." | note type="HIST." | etym ) * re ana="supplement" ? | ||||||
| Parents | B. <body> |
Chaque entrée est dotée d'un identifiant unique, correspondant à sa vedette. Cet identifiant permet d'assurer la liaison entre les nombreux renvois et les entrées auxquelles ils réfèrent. Il peut-être :
- une forme simple, auquel cas il s'agit du lemme de ce mot, éventuellement suivi d'un point et d'un indice numérique afin de différencier deux entrées portant sur le même lemme
exemple : @xml:id="abrégé.1" et xml:id="abrégé.2" ; - une forme composée – type locution – transcrite telle quelle
exemple : @xml:id="te_deum" et @xml:id="vaque_à_tout" ;
| Attributs |
|
|||||||||
|---|---|---|---|---|---|---|---|---|---|---|
| Enfants | E. <etym> F. <form> N. <note type="REM."> X. <xr> |
|||||||||
| Modèle | form ( xr | etym | dictScrap | def | note type="REM." ) * | |||||||||
| Parents | B. <body> |
Cet élément permet de distinguer les entrées courtes.
- un préfixe, auquel cas sa forme sera suivie d'un tiret court, son statut de suffixe étant précisé par l'attribut @type
exemple : @xml:id="andr-" ; - un suffixe, auquel cas sa forme sera la même que celle d'un mot simple, son statut de suffixe étant précisé par l'attribut @type
exemple : @xml:id="acé" ;
| Enfants | G. <gram> O. <orth> P. <pron> |
|---|---|
| Modèle | orth + pron ? gram ? |
| Parents | E. <entryFree> |
Littré intègre à son Dictionnaire de la langue française de nombreux renvois entre différentes entrées, qu'il convient de structurer finement afin de mieux comprendre le squelette définitionnel des items. Cela permettrait de représenter systématiquement ce réseau voulu par l'auteur et donner ainsi au texte une vraie dimension électronique, une réelle épaisseur.
Le lien entre le renvoi et sa référence est désormais assuré par la mise en place des attributs @xml:id
| Attributs |
|
|||
|---|---|---|---|---|
| Modèle | {text} | |||
| Parents | B. <bibl> D. <dictScrap> E. <etym> G. <gram> N. <note> <note type="REM."> R. <re type="PROV."> <re type="SYN."> X. <xr> |
| Enfants | R. <ref> |
|---|---|
| Modèle | ( {text} | ref ) + |
| Parents | F. <form> N. <note type="REM."> |
Morphologie
| Enfants | C. <cit> G. <gram> N. <note> O. <orth> P. <pron> X. <xr> |
|---|---|
| Modèle | ( orth + note * pron * note * gram ? ) + xr ? cit * note ? |
| Parents | E. <entry> |
| Modèle | {text} |
|---|---|
| Parents |
| Enfants | C. <cit> R. <ref> |
|---|---|
| Modèle | ( {text} | ref | cit ) * |
| Parents |
| Attributs |
|
|||
|---|---|---|---|---|
| Enfants | R. <ref> |
|||
| Modèle | ( {text} | ref ) * | |||
| Parents |
| Enfants | O. <oVar> R. <ref> |
|---|---|
| Modèle | ( {text} | ref | oVar ) * |
| Parents | C. <cit> F. <form> N. <note type="HIST."> Q. <quote> |
Significations
« l'Académie met toujours en premier rang la signification qui est la principale dans l'usage, c'est-à-dire celle avec laquelle le mot revient le plus souvent soit dans le parler, soit dans les écrits. [...] Sans doute, en un dictionnaire qui ne donne ni l'étymologie ni l'historique des mots, ce procédé empirique a été le meilleur à suivre. [...] en plaçant de la sorte au premier rang ce que le lecteur est disposé à trouver le plus naturel comme étant le plus habituel, on lui donne une satisfaction superficielle il est vrai, mais réelle pourtant. Toutefois cet avantage est acheté au prix d'inconvénients qui le dépassent de beaucoup. En effet ce sens le plus usité, le premier qui se présente d'ordinaire à la pensée quand on prononce le mot, le premier aussi que l'Académie inscrit, est souvent, par cela même qu'il est habituel et courant dans le langage moderne, un sens fort éloigné de l'acception vraie et primitive ; il en résulte que, ce sens ayant été ainsi posé tout d'abord, il ne reste plus aucun moyen de déduire et de ranger les acceptions subséquentes. [...]
Autre a dû être la méthode d'un dictionnaire qui consigne l'historique des mots et en recherche l'étymologie. Là, tous les éléments étant inscrits, on peut reconnaître la signification primordiale des mots. L'étymologie indique le sens originel dans la langue où le mot a été puisé ; l'historique indique comment, dès les premiers temps de la langue française, ce mot a été entendu, et supplée, ce qui est souvent fort important, des intermédiaires de signification qui ont disparu. Avec cet ensemble de documents, il devenait praticable, et, j'ajouterai, indispensable de soumettre la classification à un arrangement rationnel, sans désormais rien laisser à ce fait tout accidentel de la prédominance de tel ou tel sens dans l'usage commun, et de disposer les significations diverses d'un même mot en une telle série, que l'on comprît, en les suivant, par quels degrés et par quelles vues l'esprit avait passé de l'une a l'autre. »
(Préface du Littré)
| Attributs |
|
||||||
|---|---|---|---|---|---|---|---|
| Enfants | C. <cit> D. <dictScrap> N. <note type="REM."> Q. <q> R. <re type="PROV."> S. <sense> X. <xr> |
||||||
| Modèle | ( dictScrap | cit | xr ) note type="REM." ? ( cit | dictScrap ) * sense * ( re type="PROV." | q | xr ) * | ||||||
| Parents | E. <entry> R. <re ana="supplement"> |
La structure des acceptions formule cette hypothèses à valider :
- Une acception est toujours introduite par une glose (ou citation de définition).
- Les sous-acceptions se succèdent en série stricte, sans insertions d'autres composants entre les items.
- Les proverbes et les renvois sont toujours renvoyés en fin d'acception.
| Attributs |
|
|||
|---|---|---|---|---|
| Enfants | C. <cit> D. <dictScrap> R. <re type="PROV."> X. <xr> |
|||
| Modèle | ( cit | dictScrap ) ( cit | dictScrap ) * ( xr | re type="PROV." ) * | |||
| Parents | S. <sense> |
| Attributs |
|
|||
|---|---|---|---|---|
| Enfants | D. <def> O. <oVar> Q. <q> R. <ref> |
|||
| Modèle | ( {text} | def | q | ref | oVar ) * | |||
| Parents | E. <entryFree> N. <note type="plan"> R. <re ana="supplement"> |
(Pierre Larousse, Préface du Grand Dictionnaire universel, 1865)
| Modèle | {text} * |
|---|---|
| Parents | D. <dictScrap> E. <entryFree> |
| Enfants | O. <oVar> |
|---|---|
| Modèle | ( {text} | oVar ) * |
| Parents | D. <dictScrap> S. <sense> |
Cet élément, codant un discours à détacher de celui de l'auteur, dénote principalement des exemples, éventuellement des locutions figées voire des proverbes (la frontière est parfois mince).
Le besoin de sous-structuration de ces textes permet le repérage et l'analyse de nombreuses marques chères à l'auteur, révélant un texte très structuré, notamment dans la séparation entre les locutions et leur glose.
exemple : « se dit de », « se dit quand », « c'est-à-dire ».
| Attributs |
|
|||
|---|---|---|---|---|
| Enfants | D. <dictScrap> L. <list> |
|||
| Modèle | dictScrap ? list | |||
| Parents | E. <entry> |
| Enfants | I. <item> |
|---|---|
| Modèle | item + |
| Parents | N. <note type="plan"> |
| Attributs |
|
|||
|---|---|---|---|---|
| Modèle | {text} | |||
| Parents | L. <list> |
Citations
| Attributs |
|
|||
|---|---|---|---|---|
| Enfants | B. <bibl> N. <note> Q. <quote> |
|||
| Modèle | quote bibl note ? | |||
| Parents | E. <etym> F. <form> |
(Préface du Littré)
| Enfants | N. <note> O. <oVar> |
|---|---|
| Modèle | ( {text} | oVar | note ) * |
| Parents | C. <cit> |
| Enfants | A. <author> B. <biblScope> |
|---|---|
| Modèle | author ? biblScope |
| Parents | C. <cit> |
| Attributs |
|
|||
|---|---|---|---|---|
| Modèle | {text} | |||
| Parents | B. <bibl> |
| Modèle | {text} |
|---|---|
| Parents | D. <dictScrap> E. <etym> N. <note> <note type="REM."> |
Remarques, histoire, étymologie…
| Attributs |
|
||||||
|---|---|---|---|---|---|---|---|
| Enfants | C. <cit> O. <oVar> P. <p> R. <ref> X. <xr> |
||||||
| Modèle | ( p + | ( {text} | cit | ref | oVar | xr ) + ) | ||||||
| Parents | R. <re ana="supplement"> S. <sense> |
« Sous ce chef, j'ai réuni quelques notions complémentaires qui n'entrent pas d'ordinaire dans les plans lexicographiques, mais qui pourtant ne me semblent pas dénuées d'intérêt et d'utilité. [...] Ces remarques, de leur nature, sont très diverses. »
(Préface du Littré)
Ainsi, ces remarques concernent notamment des difficultés de la langue, et l'auteur s'inspire des grammairiens, tout en apportant des éléments nouveaux, afin d'éclairer l'usage tant dans l'emploi que dans l'orthographe.
Toujours suivant ce principe directeur de « combine[r] l'usage présent de la langue et son usage passé, afin de donner à l'usage présent toute la plénitude et la sûreté qu'il comporte », Littré éclaire certaines proscriptions contemporaines concernant des faits de langue pourtant attestés chez les grands auteurs classiques.
| Enfants | C. <cit> R. <ref> |
|---|---|
| Modèle | ( {text} | ref | cit ) * |
| Parents | N. <note type="REM."> |
| Attributs |
|
|||
|---|---|---|---|---|
| Enfants | C. <cit> F. <form> R. <ref> |
|||
| Modèle | ( {text} | form | cit | ref ) * | |||
| Parents | E. <entry> R. <re ana="supplement"> |
« Il est enfin un dernier ordre de remarques, tantôt mises sous ce chef, tantôt incorporées dans la série des acceptions du mot. Il s'agit de l'interprétation de certaines locutions figurées ou proverbiales. »
(Préface du Littré)
| Attributs |
|
|||
|---|---|---|---|---|
| Enfants | C. <cit> R. <ref> |
|||
| Modèle | ( {text} | cit | ref ) * | |||
| Parents | E. <entry> R. <re ana="supplement"> |
« [...] la discussion des synonymes m'a souvent averti de prendre garde aux nuances et de ne pas recevoir comme une véritable explication le renvoi d'un terme à l'autre. »
(Préface du Littré)
La structuration raffinée et aboutie des nuances du Littré, d'ores et déjà effectuée par Frédéric Glorieux, est un bon exemple du degré de balisage pouvant être atteint sur l'ensemble du texte, donnant ainsi l'occasion de se pencher sur la lecture et l'étude d'une partie signifiante et cohérente de ce dictionnaire.
| Attributs |
|
|||
|---|---|---|---|---|
| Enfants | C. <cit> L. <label> N. <note> |
|||
| Modèle | ( label( cit | note ) + ) + | |||
| Parents | E. <entry> R. <re ana="supplement"> |
« Je donne le nom d'historique à une collection de phrases appartenant à l'ancienne langue. Lorsqu'un mot a été exposé complètement tel qu'il est aujourd'hui dans l'usage, lorsque les sens y ont été rangés d'après l'ordre logique, lorsque des exemples classiques, autant que faire se peut, ont été rapportés à l'appui, lorsque la prononciation a été indiquée et, au besoin, discutée, lorsque enfin des remarques grammaticales et critiques ont touché, dans les cas qui le comportent, à l'emploi du mot ou aux difficultés qu'il présente, alors s'ouvre un nouveau paragraphe pour les textes tirés de la langue d'oïl. Ainsi placé, c'est le prolongement naturel d'une série que l'on tronque quand on s'arrête à notre temps et aux temps classiques. Après avoir vu comment écrivent Corneille, Pascal, Bossuet, Voltaire, Montesquieu et nos contemporains, on pénètre en arrière et l'on voit comment ont écrit Montaigne, Amyot, Commines et Froissart, Oresme et Machaut, Joinville, Jean de Meung, Guillaume de Lorris, Villehardouin, le sire de Couci, le traducteur du livre des Psaumes, et Turold, l'auteur de la Chanson de Roland. »
(Préface du Littré)
| Attributs |
|
|||
|---|---|---|---|---|
| Enfants | C. <cit> O. <oVar> R. <ref> X. <xr> |
|||
| Modèle | ( ( {text} | oVar | cit | xr | ref ){text} ) * | |||
| Parents | R. <re ana="supplement"> |
« Cette rubrique, née toujours de la volonté de l'auteur de lié passé et présent, prend corps dans « la détermination ou du moins la discussion de l’origine de chaque mot établie par la comparaison des mêmes formes dans le français, dans les patois et dans l'espagnol, l'italien, et le provençal ou langue d'oc. »
(Page de garde du Littré)
« [...] ceux qui iront jusqu'à désirer de connaître l'étymologie entreront dans l'histoire du mot, et trouveront, au-dessous de cette histoire, l'étymologie qui très souvent en est dépendante. »
(Préface du Littré)
| Contenu | @ana="supplement"="supplement" ? |
|---|---|
| Usage | C. <cit> D. <dictScrap> N. <note type="REM."> |
| Attributs |
|
||||||
|---|---|---|---|---|---|---|---|
| Enfants | C. <cit> D. <dictScrap> E. <etym> R. <re type="PROV."> <re type="SYN."> S. <sense> |
||||||
| Modèle | ( sense | cit | dictScrap | etym | note type="HIST." | note type="REM." | re type="SYN." | re type="PROV." ) * | ||||||
| Parents | E. <entry> |
Structure générale et entête
| Attributs |
|
|||
|---|---|---|---|---|
| Enfants | ||||
| Modèle | teiHeader text | |||
| Parents | start. |
| Enfants | F. <fileDesc> |
|---|---|
| Modèle | fileDesc |
| Parents | T. <TEI> |
| Enfants | P. <publicationStmt> S. <sourceDesc> T. <titleStmt> |
|---|---|
| Modèle | titleStmt publicationStmt sourceDesc |
| Parents | T. <teiHeader> |
| Enfants | T. <title> |
|---|---|
| Modèle | title |
| Parents | F. <fileDesc> |
| Enfants | D. <date> I. <idno> P. <publisher> |
|---|---|
| Modèle | date idno publisher availability status="restricted" |
| Parents | F. <fileDesc> |
| Attributs |
|
|||
|---|---|---|---|---|
| Enfants | P. <p> |
|||
| Modèle | p + | |||
| Parents | P. <publicationStmt> |
| Enfants | B. <bibl> |
|---|---|
| Modèle | bibl + |
| Parents | F. <fileDesc> |
| Enfants | R. <ref> |
|---|---|
| Modèle | ( {text} | ref ) * |
| Parents | S. <sourceDesc> |