Deux projets du Laboratoire de français ancien

Pierre Kunstmann et France Martineau

Département des lettres françaises, Université d'Ottawa

I. Introduction

Le site du Laboratoire de Français Ancien est sur la Toile depuis deux ans (http://aix1.uottawa.ca/academic/arts/lfa). Il a été créé pour permettre une large diffusion de travaux effectués en conformité aux normes et critères de la linguistique et de la philologie françaises. Les responsables du Laboratoire ont divisé leurs activités en deux catégories: textes numérisés et bases de données. Leur but est d'allier ces deux volets en présentant, à partir de manuscrits ou de premières éditions, certaines oeuvres de l'ancienne langue, selon la lettre des originaux mais de façon suffisamment lisible pour alimenter les bases de données et s'en nourrir en retour. Nous exposerons deux projets en cours: le premier porte sur le Chevalier au Lion de Chrétien de Troyes; c'est une présentation, une analyse et une interprétation des manuscrits qui ont conservé ce roman. Il comporte notamment une base grammaticale interactive, qui permet des liens entre l'unité grammaticale étudiée et son contexte. Nous comptons aussi élaborer une base lexicale et un dictionnaire de l'oeuvre. Le second projet est une édition critique du corpus de Miracles de Nostre Dame par personnage, permettant de naviguer dans le texte, d'avoir accès, en direct, à plusieurs niveaux d'analyse, ainsi qu'à d'autres textes pertinents pour l'étude de ces pièces.

II. Base grammaticale du Chevalier au Lion

France Martineau, Lettres françaises, Université d'Ottawa

Le projet du Chevalier au Lion se veut une présentation des différents manuscrits et fragments de ce texte important de Chrétien de Troyes suivie d'une analyse grammaticale et lexicale. Les principaux manuscrits sont déjà sur notre site, grâce aux éditions de Pierre Kunstmann, et la base grammaticale que j'ai entreprise est bien avancée.

La base grammaticale du Chevalier au Lion de Chrétien de Troyes que j'ai établie a pour but de présenter une analyse morpho-syntaxique des principaux verbes des différents manuscrits de ce texte et d'en permettre une étude comparative. J'ai procédé, non pas par ordre alphabétique, mais par domaine d'emplois communs, de façon encore là à rendre rapidement accessible à la communauté des chercheurs et chercheures une étude systématique et approfondie de traits appartenant à une classe de verbes (verbes de connaissance, de sentiment, dubotatifs, de volonté, etc.). Pour l'instant, les verbes de connaissance et de volonté ont été analysés dans les manuscrits H (mon manuscrit étalon) et V (manuscrit nettement distinct de H, si l'on considère la généalogie des manuscrits). À la fin de cette recherche, l'ensemble des verbes pour l'ensemble des manuscrits du Chevalier au Lion devraient avoir été examinés. Le travail en cours se fait donc sur deux axes: à la fois, travail d'analyse exhaustive du manuscrit H, copie de Guiot, mon manuscrit étalon; travail d'analyse comparative dans les autres manuscrits (manuscrits qui seront étudiés en priorité: H, V, S et P).

J'ai voulu garder une grande liberté d'accès et une transparence à la base grammaticale. Toutefois, comme une partie du travail nécessite des analyses plus approfondies, sujettes à des corrections plus fréquentes, j'ai décidé de limiter provisoirement l'accessibilié d'une partie de la base aux collaborateurs. À la fin de la recherche, cette partie de la base, qui touche la valence verbale et l'ordre des mots, sera ouverte à tous.

Une fiche est créée pour chaque occurrence de verbe. Les fiches sont structurées selon les critères morphologiques et syntaxiques suivants (voir le texte Remarques sur l'élaboration de la base grammaticale du Chevalier au Lion pour plus de détails):

1. Texte Lion

Ce sont les différents manuscrits du Chevalier au Lion. Voir sous Textes en liberté pour plus de détails. (http://aix1.uottawa.ca/academic/arts/lfa/activites/textes/chevalier-au-lion)

2. Forme graphique occurrente

C'est la forme occurrente, telle qu'elle apparaît dans le manuscrit. Ce critère permettra une analyse comparative rapide des graphies, d'un copiste à l'autre.

Si dans les manuscrits autres que H, il n'y a pas de forme équivalente (par exemple, le vers a été omis), la mention non applicable apparaît.

3. Lemme V (P, S, etc.)

C'est le lemme de l'occurrence, dans le manuscrit à l'étude, par exemple Lemme V dans la base V, du manuscrit V. Ainsi, sous cuida, on aura cuidier.

Si dans les manuscrits autres que H, il n'y a pas de forme équivalente (par exemple, le vers a été omis), la mention non applicable apparaît.

4. Lemme H

Comme le manuscrit H sert de manuscrit étalon, ce critère a été intégré dans toutes les bases de façon à faciliter la comparaison. Ainsi, pour l'emploi de cuida (forme graphique) correspondant au lemme V cuidier dans le msV, on pourra parfois trouver cuidier mais aussi penser ou croire sous lemme H.

5. Source du lemme

Nous avons suivi le Tobler-Lommatzsch. Suite à la suggestion de Marie-Luce Demonet, de l'Université de Poitiers, lors de notre rencontre à Toronto, je pense également ajouter une entrée 'lemme moderne', de façon à faciliter la comparaison d'une période du français à l'autre.

6. Référence V (P, S. etc.)

C'est le numéro du vers du manuscrit à l'étude. Les vers sont numérotés en fonction de l'édition électronique apparaissant sur le site du Laboratoire de français ancien.

7. Référence H

C'est le numéro du vers du manuscrit étalon, le manuscrit H. J'ai suivi l'édition électronique apparaissant sur le site du Laboratoire de français ancien. Le lien entre la base grammaticale et l'édition électronique du manuscrit (texte en continu) est établi à partir de cette référence. J'étudie la possibilité de faire également un lien entre le manuscrit (texte en continu) et la base grammaticale; l'utilisateur pourrait ainsi sélectionner un verbe dans le texte et voir apparaître, un peu comme une note, l'analyse grammaticale complète de ce verbe. Dans l'esprit de ce projet, il serait également possible de développer des interrogations croisées dans le texte même (du type: chercher tous les verbes suivis d'un complément nominal). À suivre.

8. Forme: simple, composée

J'ai voulu distinguer ici la forme simple du verbe (par exemple l'imparfait cuidait), de la forme composée à un auxiliaire (par exemple, le plus-que-parfait, avait cuidé) et de la forme composée à deux auxiliaires (par exemple, au passif où on retrouve à la fois l'auxiliaire marquant le temps et celui marquant le passif (avait été cuit)).

9. Temps

C'est le temps de l'élément conjugué. Ainsi, cuidait et avait cuidé seront tous deux catégorisés sous imparfait, la différence étant récupérée par l'emploi de la forme simple ou composée. Cinq temps sont distingués: présent, passé simple, imparfait, futur et conditionnel.

10. Mode

Les modes suivants sont distingués: infinitif, participe passé, participe présent, subjonctif, impératif, indicatif, indéterminé.

Il arrive que la morphologie du verbe ne puisse permettre de distinguer le mode, entre autres en ce qui concerne l'indicatif et le subjonctif. Afin de ne pas présumer d'un mode à partir de nos connaissances sur le français moderne, j'ai décidé d'inclure une rubrique 'indéterminé'.

11. Voix

Les voix suivantes sont distinguées : actif, passif, pronominal. Pour ce dernier cas, j'ai suivi suivi la distinction traditionnelle entre les différents types de pronominaux (réfléchi, réciproque, passif, inhérent).

12. Personne

13. Construction

Les constructions personnelles sont distinguées des constructions impersonnelles. J'ai aussi distingué les constructions à possession inaliénable, qui posent des problèmes particuliers en termes de valence verbale.

14. Citation V (P, S, etc.)

Quelques vers du manuscrit à l'étude qui permettent de voir l'environnement syntaxique et sémantique.

15. Citation H

Quelques vers du manuscrit étalon qui permettent de voir l'environnement syntaxique et sémantique.

16/17. Valence réalisée et valence maximale

La valence va de zéro à 4.

Valence réalisée

La valence réalisée renvoie à la réalisation des arguments du verbe dans le contexte de l'occurrence. Sont considérés arguments du verbe le sujet et les compléments essentiels.

Valence maximale

La valence maximale renvoie à l'expansion maimale des arguments du verbe dans le contexte de l'occurrence examinée. Il est important de souligner que la valence maximale se définit dans le cadre de l'occurrence en contexte. On aurait aussi pu concevoir une grille unique de valence maximale pour toutes les occurrences d'un verbe donné. J'ai toutefois préféré noter la valence maximale que le verbe aurait pu avoir dans le contexte particulier de l'occurrence, de façon à ne pas imposer, dès le départ, une analyse générale pour un verbe donné. L'outil d'interrogation permettra de faire rapidement les généralisations nécessaires.

18. Pronom anaphorique

L'ancien français utilise fréquemment un pronom démonstratif comme ce qui par cataphore annonce le complément. Je n'ai pas voulu inclure ce pronom, lorsqu'il exprimait une double représentation, dans la valence du verbe. Il est toutefois récupéré sous cette rubrique.

19. Autres compléments

Les compléments non essentiels, comme les circonstanciels de phrase, sont inclus sous cette entrée.

20. Ordre des arguments

J'ai inclus l'ordre des arguments du verbe, devant ou après, et leur expression ou non expression.

21. Remarques

La base permet deux modes de consultation: soit le mode de visualisation des fiches, l'une après l'autre, soit le mode de recherche, qui permet des interrogations croisées (exemple: tous les verbes au futur dans le manuscrit H ou encore le lemme cuider dans tous les manuscrits analysés). Cette base permet également des analyses comparatives: par exemple, au verbe cuidier dans le manuscrit H correspond quel verbe dans les autres manuscrits? Il reste à développer des liens entre les autres modules d'analyse du texte du Chevalier au Lion, afin de permettre à l'utilisateur d'avoir une vue en profondeur du texte (le texte lui-même, l'analyse grammaticale et lexicale, etc.).

III. Miracles de Nostre Dame par personnage

par Pierre Kunstmann, Département des lettres françaises, Université d'Ottawa

Les quarante pièces de théâtre conservées dans les manuscrits fr. 819 et 820 de la BNF forment un ensemble considérable, de par sa taille et pour l'intérêt qu'il présente. Dans l'édition de la S.A.T.F. on compte 70 227 vers octosyllabiques (les paroles placées dans la bouche des personnages), 1 409 décasyllabes (des compositions lyriques qu'on trouve après certains miracles, sous la rubrique serventois ), 2 083 lignes de sermons en prose et quelques douzaines de lignes d'indications scéniques. Donc un total d'à peu près 74 000 lignes, une longueur record comme l'a indiqué R. Glutz en tête de son étude sur notre recueil. Pour ce dernier il s'agit incontestablement du document le plus important du théâtre français au XIVe siècle. Ces textes ne sont certes pas des chefs d'oeuvre et ne constituent probablement pas de la grande littérature; mais je souscris entièrement à l'avis de R.-L. Wagner, qui écrivait, il y a une vingtaine d'années à propos de cette collection : outre que la diversité, l'agrément, l'intérêt de ces pièces en rendent le dépouillement facile, les Miracles abondent en données utilisables tant au plan de la grammaire qu'à celui du vocabulaire.

Ces données ont été effectivement recueillies, pour ce qui est du lexique, dans l'ouvrage paru en 1996. Leur importance est manifeste vu le grand nombre de mots et d'exemples figurant dans les premiers articles du DMF (voir le volume correspondant à A-AH, paru à tirage restreint et à titre expérimental en 1998). Quant à l'exploitation grammaticale, elle ne fait que commencer. J. Monfrin, chargé d'effectuer la synthèse des communications au colloque de Strasbourg lors de la séance de clôture, avait présenté l'édition que je projetais comme un sous-produit du lexique qui venait de paraître. En fait, je considère plutôt ce lexique comme le point de départ d'un travail nouveau qui mettra en valeur l'intérêt de chaque pièce du recueil, permettra même une meilleure connaissance du vocabulaire de l'ensemble et l'établissement d'un nouveau lexique conçu non plus dans la perspective de la préparation du DMF, mais pour mieux rendre compte du détail du texte et dans un souci d'exhaustivité.

J'avais annoncé à Strasbourg que je voulais offrir aux chercheurs et aux étudiants un texte critique, accompagné (pour un public plus large) d'une traduction en français moderne et suivi d'un commentaire, d'une analyse (et même d'une édition) des sources, d'un index complet, établi à partir d'une concordance, puis d'un index lemmatisé et d'un glossaire. Envisageant alors ce travail comme une production multimédia, je voulais obtenir de mes collègues du Département de théâtre à Ottawa des tableaux de mise en scène et une bande sonore où l'on entendrait des acteurs étudiants jouer les rôles et prononcer les vers de moyen français. Je réservais pour plus tard (après l'obtention des fonds nécessaires...) la présentation - format image - des feuillets du manuscrit.

En deux ans, certains points du projet ont été réalisés, d'autres ont été laissés de côté ou simplement différés. Parlons d'abord de ce qui n'a pas été fait: la numérisation en JPEG des pages du manuscrit m'apparaît maintenant comme une entreprise trop ambitieuse, conçue témérairement dans la lignée du projet Charrette de Princeton. Le coût de l'opération, pour les deux volumes manuscrits, serait prohibitif et sans commune mesure avec l'intérêt que présenterait un tel fac-similé. D'autre part, nos "matériaux" ou supports devenant vite obsolètes dans le domaine de l'électronique, je crains qu'il ne soit difficile (sans frais élevés ou manipulations importantes) de transférer ces documents régulièrement, au fil des années, d'un logiciel ou d'un système d'exploitation à un autre. Ce genre de présentation devrait relever plutôt des grandes bibliothèques aux collections de manuscrits importantes; elles seraient mieux à même d'assurer la conservation et le transfert de ce type de document. C'est d'ailleurs le programme que s'est donné la Bibliothèque Bodléienne à Oxford, qui permet la lecture des manuscrits du Roland ou du Tristan en accès direct. Dans le cas du manuscrit Cangé, on pourrait toutefois, vu son luxe et la grande qualité de ses peintures, numériser au moins, avec l'accord de la BNF, l'image qui illustre chaque miracle et qui en présente une scène caractéristique.

Si l'on excepte les schémas de mise en scène et l'accompagnement sonore, pour l'instant au point mort, le projet prévu est maintenant réalisé pour la première des pièces du recueil, le Miracle de l'enfant donné au diable.

[Présentation sur écran des diverses parties de l'édition électronique de ce miracle dans la collection Textes en liberté sur le site du LFA]

Comme on peut le voir dans le sommaire qui suit immédiatement le titre de l'oeuvre, l'édition comporte sept sections:

L'introduction présente en quelques pages l'intérêt et l'importance de ce miracle, qui trouve de nombreux échos dans le reste du recueil; deux autres pièces en reprennent d'ailleurs les thèmes fondamentaux et, dans une certaine mesure, la structure narrative (les numéros XVII Miracle de un parroissian esconmenié et XXXIII Miracle de Robert le Dyable). Une série de liens hypertextuels relient cette oeuvre à des versions plus anciennes - ainsi en cliquant on peut faire venir une page où se trouve transcrit le vingt-deuxième miracle de Gautier de Coinci ainsi que sa probable source latine. D'autres liens mènent à des textes postérieurs: la compilation du franciscain Jean le Conte, écrite vers la fin du XIVe siècle, ou celle de Jean Miélot, secrétaire de Philippe le Bon. Ces liens sont établis entre éléments contenus dans le site (fichiers); d'autres sont faits avec l'extérieur (URL) et mettent tel point de l'introduction en relation avec tel site qui présente un point commun - on peut ainsi accéder à une reproduction du 115e des Cantigas de Santa Maria d'Alphonse le Sage ou voir une enluminure du livre d'heures de Catherine de Clèves illustrant un moment pathétique d'un planctus Mariae (pour reprendre l'expression de Moshe Lazar).

Le texte du miracle peut se lire de façon continue en deux cellules juxtaposées: à gauche le texte de moyen français, à droite sa traduction en langue moderne. L'apparat critique présente les leçons rejetées et des observations sur le manuscrit. Les notes sont d'ordre gramatical, littéraire ou historique. La concordance permet un repérage commode des mots dans leur contexte.

Lors de la lecture du texte, si une forme fait difficulté, le lecteur peut la noter et cliquer sur INDEX, dans le sommaire. En s'aidant de la fonction "recherche" de son navigateur, il pourra localiser la forme, qui apparaîtra classée sous le lemme correspondant. Cliquant alors sur ce lemme, il verra s'ouvrir le Lexique à l'article ou à la section d'article où la forme reçoit sa définition.

Ce lexique, comme je l'ai signalé plus haut, n'est pas une simple reprise de celui de 1996; il est construit sur des principes nouveaux. Toutes les occurrences et toutes les acceptions des mots, lexicaux et grammaticaux, y sont indiquées pour le premier miracle; les références comportent deux parties: l'une en chiffres romains pour indiquer le numéro du miracle dans le recueil; l'autre en chiffres arabes renvoie au vers.

Quant à la dernière section, ANALYSE DES FORMES VERBALES, l'auteur en est Lene Schøsler, de l'Université de Copenhague. Pour chaque forme occurrente sont indiqués le lemme correspondant (avec sa source), la référence (miracle et vers), la voix, le mode, le temps, la personne ainsi que la valence. Ce fichier est établi à l'aide du logiciel FileMaker, qui permet de procéder à des recherches en utilisant plusieurs paramètres. Actuellement, pour des raisons techniques (serveur Unix et non Windows), les données apparaissent seulement dans le cadre d'un tableau fixe; elles seront bientôt présentées en format fichier, facilement interrogeable.

Chaque miracle du recueil sera analysé d'un point de vue narratologique afin de grossir l'Index des éléments narratifs établi dans les éditions du Gracial d'Adgar et des miracles de Notre-Dame du Rosarius; cet index progressif sera placé dans la section "Archives Miracles de Notre-Dame" du site LFA. J'envisage aussi la possibilité de faire des liens avec des outils extérieurs au projet, comme la base de graphies verbales constituée à l'INaLF par R. Martin et numérisée au LFA, ou les lemmes du DMF.

Le texte présenté de cette façon devient une sorte d'escale pour les internautes. Par effet réflexif, de miroir, le texte, qui s'approprie d'autres documents à ses fins propres, est aussi utilisé, devient un document que s'approprient d'autres textes, à leurs fins particulières. L'hypertexte permet de saisir en établissant des liens, mais il conduit aussi à être saisi par d'autres liens et contraint à donner, à se livrer.

Cette édition électronique du premier des miracles de Notre-Dame dramatiques me semble une expérience dont pourraient s'inspirer d'autres éditeurs pour la présentation des mystères ou des recueils de farces. Après le Sémiopathelin d'il y a quinze ans, serait-ce maintenant le tour de Cyberpathelin?