0. INTRODUCTION

0.0. But et approche

Cette thèse se propose d'étudier les exemples de dénomination terminologique observés dans un corpus constitué de noms de vêtements tirés des catalogues de vente en ligne.

Il s'agit donc de la linguistique de corpus qui est une linguistique descriptive dans le sens que l'objet de la recherche est un langage concret et non pas la faculté langagière en général, qui est l'objet de la linguistique théorique (Tosca 1987 : 3). Toutefois, le fait que ma recherche cible la performance et non la compétence linguistique ne veut pas dire qu'elle vise à produire une pure description du matériel linguistique accumulé dans le corpus.

Le but de ma thèse est non seulement de décrire les particularités des unités du corpus mais aussi de découvrir des régularités qui déterminent le processus de dénomination vestimentaire. Dans ce sens, mon travail s'inscrit plutôt dans le cadre de l'approche motivée par le corpus (corpus-driven approach, cf. Sinclair et son projet COBUILD 1987) que de l'approche appliquée au corpus (corpus-based approach, cf. Leech 1993, Biber 1999). L'approche appliquée au corpus utilise ces données comme des exemples authentiques qui peuvent illustrer la validité des propositions théoriques. L'approche motivée par le corpus demande une observation des unités du corpus sans charpente théorique préétablie : c'est l'étude des patrons récurrents et des constructions lexicales et grammaticales qui doit aboutir à la description des régularités linguistiques et à la formulation des conceptions théoriques (Martelli 2003 : 15). Cependant, mon étude des données du corpus ne serait pas possible sans aucune hypothèse ou base théorique.

L'hypothèse principale de cette recherche est la suivante :
la structuration conceptuelle de la terminologie vestimentaire doit amener à la création d'une taxonomie des termes qui, à son tour, peut aboutir à repérer une corrélation entre les concepts et les modèles de formation des noms de vêtements. Si cette corrélation peut être établie, elle permettra de tirer des conclusions à propos de régularités de dénomination dans le corpus étudié.

Pour ce travail je m'appuierai sur des exemples précédents d'études de corpus spécialisés français, sur les principes onomasiologiques d'investigation terminologique et sur des méthodes d'analyse linguistique développées par la grammaire générative. Les travaux et les théories pertinents seront présentés dans les chapitres correspondants. Ici, je n'expliquerai que les notions et les termes linguistiques qui sont utilisés à travers toute la thèse.

0.1. Terminologie linguistique, signes et abréviations

Pour spécifier, dans le texte de la thèse et dans les figures, les objets matériels, leurs notions et leurs noms, je distinguerai : Dans les figures et les tableaux, j'utiliserai les abréviations suivantes : Je ferai la distinction entre terme simple et son équivalent du vocabulaire courant, mot non-construit ou simplex ; entre terme dérivé (affixé, préfixé, suffixé) et mot construit ou dérivé ; entre terme composé et mot composé ; et, finalement, entre terme syntagme et syntagme nominal, ainsi qu'entre terme emprunté et mot emprunté. J'utiliserai encore le groupe terme complexe pour désigner termes composés et termes syntagmes ensemble et le groupe terme construit pour englober termes complexes et termes dérivés. Finalement, je distinguerai cinq formes de termes : J'entendrai par termes simples des éléments terminologiques qui ne manifestent aucun signe de construction morphologique, ce qui veut dire que les termes qui contiennent des affixes non-productifs (chaussure) ou des restes de mots vieillis (jaquette) ne seront pas considérés comme simples mais comme construits. Ce qui permettra, à l'étape du relèvement et de la première classification des termes, de contourner la nécessité de considérer la productivité - non-productivité des affixes, qui n'est pas entendue de la même façon par tous les linguistes (cf. Halle 1973) qui considèrent plutôt l'aspect quantitatif de la productivité affixale ; Jackendoff (1975) et Aronoff (1976), qui envisagent plutôt la régularité des propriétés des mots résultant de l'affixation ; van Marle (1985), Baayen & Lieber (1991), qui attirent plus d'attention à la spontanéité et l'omni-potentialité du processus de l'affixation).

La distinction entre termes composés et termes syntagmes soulève un problème impossible à obvier. La similarité de leur forme oblige à soumettre aux tests spéciaux la plupart des termes dont la graphie représente deux mots séparés. Des quatre types de critères d'identification des mots composés - phonologiques, morphologiques, syntaxiques et sémantiques - je n'utiliserai que les trois derniers, puisqu'il ne serait pas facile de porter un jugement sur la forme phonétique des termes extraits de l'Internet.

L'expérimentation avec quelques groupes terminologiques m'a permis de choisir onze tests applicables aux termes complexes pour distinguer termes composés et termes syntagmes. Je les appellerai par les noms utilisés par Bouvier (2000) quand ces dénominations reflètent bien le contenu des tests ou donnerai les miens si je ne les trouve pas assez explicites ou si les tests viennent d'autres sources (Bauer 1978 ; Brousseau & Nikiema 2001) où ils n'ont pas de désignation. Si le sens du test ne peut pas être interprété d'après son nom, je donnerai des explications courtes entre parenthèses.

Finalement, puisque pour être reconnus termes tous les éléments linguistiques de la terminologie doivent passer le « Test du concept unique », le critère d'interprétation sémantique, qui permet de distinguer le composé de la structure syntaxique parce qu'il « fait référence à une idée unique » (Brousseau & Nikiema 2001 : 341), ne peut pas être suffisant pour identifier les termes composés. Pour que la nature d'un terme complexe soit confirmée comme celle d'un composé ce terme doit être passé par les autres tests ci-dessus. S'il n'en passe aucun alors c'est un terme syntagme, s'il en passe au moins un c'est un terme composé.

La morphologie traditionnelle propose soit cinq, soit six procédés principaux de formation de mots. Par exemple, Béchade (1992) en énumère cinq avec cinq subdivisions pour la dérivation et deux pour la composition :

Les travaux terminologiques, consacrés à l'étude d'un vocabulaire spécifique, comme celui de Galisson (1978), étudiant le vocabulaire du football, ou celui de Boswell (1982), englobant tout le vocabulaire sportif français, ajoutent encore deux procédés de formation propres aux vocabulaires spéciaux : le conservatisme linguistique et la synapsie. Ces deux modèles de formation sont nécessaires pour décrire la formation des termes qui sont souvent empruntés à la langue générale par conservatisme linguistique et qui sont souvent formés comme des syntagmes par synapsie. D'autre part, les procédés comme l'onomatopée ou la siglaison semblent être peu productifs dans la terminologie vestimentaire. Je spécifierai donc cinq modèles de formation correspondant à cinq formes de termes :

0.2. Notions essentielles

0.2.1. Signe linguistique [1] et trait terminogénique

Pour étudier la dénomination terminologique, j'ai créé le terme linguistique « trait terminogénique » basé sur la notion de « sèmes lexicogéniques » empruntée à Guiraud (1967 : 33). Guiraud expliquait les sèmes lexicogéniques comme « des caractères physiques, fonctionnels, circonstanciels, etc., générateurs de noms ». Pour mon travail, j'ai élaboré une définition plus précise en me basant sur le modèle saussurien de signe linguistique qui distingue trois composants dans la structure du signifié : denotatum, designatum et connotatum (Piotrowski et al. 1990 : 23).

Pour considérer la dénomination dans une perspective élargie, j'ai choisi le modèle du signe linguistique de Piotrowski (1990 : 20-30) qui permet de démontrer la structure complexe du signifié et de présenter les relations entre le signe et les réalités du monde physique et du système linguistique. Ce modèle appartient à la tradition saussurienne qui représente le signe linguistique comme une unité psychologique bilatérale composée du signifiant et du signifié. Dans le modèle de Piotrowski, le concept du signifié est structuré à l'aide de trois composants - denotatum, designatum et connotatum : le denotatum (Dn) reflète une image intégrale ou générale de l'objet réel ou le référent (Rf) ; le designatum (Ds) contient l'ensemble de traits conceptuels dominants qui permettent de distinguer cet objet des autres ; finalement, le connotatum (Cn) comporte des nuances de sens supplémentaires reliées aux évaluations émotionnelles ou stylistique. Le signifiant est l'image psychologique du nom. Puisque dans ma recherche il s'agit des termes, je représenterai le nom-terme comme « Tm » et son image psychologique comme 'Tm'.

Chaque élément de cette unité psychique peut être relié aux paradigmes linguistiques correspondants qui reflètent les classifications du monde physique. Par exemple, les relations du signe linguistique du terme « vêtement » peuvent être représentées de la manière suivante : Le denotatum et le designatum correspondent au même système paradigmatique parce que, en fait, le designatum ne fait que préciser conceptuellement le denotatum. De plus, ces deux composants ne sont pas toujours « remplis » pour tous les noms mais ils sont toujours présents, même potentiellement : par exemple, un nom propre dénote normalement mais peut aussi désigner le porteur de ce nom propre comme possesseur de quelques traits distincts qui peuvent former un concept désignatif [2].

Je relierai le sème lexicogénique au designatum qui correspond au concept ou à la caractéristique la plus saillante de l'objet qui permet de le distinguer de tous les autres objets du même domaine. Je ne considère pas les caractéristiques physiques d'un objet réel mais seulement le reflet de ces caractéristiques dans le cerveau du sujet parlant (ou du sujet nommant cet objet). Plus précisément, le reflet de la caractéristique (ou des caractéristiques) selon laquelle cet objet est dénommé. En d'autres termes, je ne m'intéresse qu'à la relation `Designatum - Terme` à l'intérieur du signe linguistique.

Je peux donc définir le sème lexicogénique d'un terme comme l'élément le plus important de son designatum qui permet de distinguer son référent des autres référents ayant le même classificateur et qui est reflété dans sa forme linguistique.

Puisque dans ce travail, il s'agit de l'étude de termes et puisque la notion de terme adoptée est plus large que la notion de mot ou de lexème, je rebaptiserai le sème lexicogénique d'un terme en trait terminogénique.

0.2.2. Notion de système terminologique

Dans ma recherche la terminologie est entendue comme un signe complexe dont le signifié est représenté par le système des notions d'un domaine d'expérience humaine et dont le signifiant est exprimé par l'inventaire linguistique décrivant ce domaine. Cette compréhension du système terminologique tient beaucoup de l'approche onomasiologique de l'école terminologique de Vienne (Felber 1984 ; Wüster, 1991).

Strictement dit, dans ma recherche, il ne s'agit pas d'une terminologie mais d'une nomenclature spontanée des noms vestimentaires. Cependant, j'appellerai cette nomenclature « terminologie » pour deux raisons : premièrement, parce qu'il s'agit d'une nomenclature spécialisée ; deuxièmement, pour ne pas avoir de confusions dans le métalangage linguistique de ma recherche puisque j'y utiliserai des méthodes d'études terminologiques.

0.2.3. Notion de « banalisation »

Le concept du phénomène de « la banalisation » du langage, proposé par Robert Galisson (1978) et expliqué infra en 1.1.2., présente une grande importance pour l'étude de la terminologie vestimentaire. Il permet de différencier deux types de terminologies utilisées dans le domaine de la mode : l'une, spécialisée, employée par les spécialistes-créateurs ; l'autre, banalisée, servant à populariser leurs créations.

Robert Galisson place le langage banalisé entre le jargon des spécialistes et le langage courant et étudie les relations lexicales entre ces trois langages. Pour faciliter mes futures définitions je représenterai les zones des trois « systèmes » lexicaux correspondants sous forme de trois continuums sans frontières précises.

La différenciation de la terminologie « banalisée » vestimentaire de la terminologie spécialisée du domaine de la mode et du vocabulaire courant permet de limiter l'objet de mon étude par le lexique normatif utilisé dans les catalogues de vente et dans les revues de mode, ce qui veut dire en exclure des unités lexicales trop spécifiques du jargon professionnel et des unités familières, populaires et argotiques du vocabulaire courant.

0.2.4. Terminologie et dichotomie langue-discours

Le système de la mode hiérarchisée selon les relations entre les notions du domaine d'expérience reflète la hiérarchie de ces termes du point de vue de la dichotomie langue-discours. Les termes des niveaux supérieurs sont partagés avec la langue commune alors que les dénominations occasionnelles des niveaux inférieurs se rapprochent de descriptions. Quand il s'agit de locutions, plusieurs linguistes reconnaissent l'existence des unités transitoires, oscillant entre les composés et les groupes de mots libres (Rey 1977, Gross 1988, Pillon 1993, Benette 1997, Tláskal 2000).

Dans le cas des désignations vestimentaires, il existerait donc logiquement une couche de termes transitifs, oscillant entre les termes courants qui font partie de la langue commune et les dénominations occasionnelles. Dans cette optique, la hiérarchie de la terminologie peut être représentée sous forme de pyramide.

Les unités du niveau de la langue et celles du niveau suivant constituent l'objet des études terminologiques comme unités systématiques ou « systématisables », alors que les unités qui appartiennent au niveau inférieur sont normalement laissées hors du cadre des études terminologiques comme occasionnelles et innombrables. Dans ce travail, je prendrai en considération les unités occasionnelles attestées dans le corpus puisque, selon mon hypothèse de travail, ces unités peuvent révéler certaines tendances dénominatives.

0.3. Objet d'étude

En utilisant les notions décrites en 0.2. je peux déterminer les limites de l'objet de ma recherche : premièrement, la thèse n'étudie que la partie « banalisée » de la terminologie vestimentaire; deuxièmement, dans cette partie « banalisée » ce ne sont que des unités des niveaux de la langue et des termes oscillants qui peuvent être considérés systématiques et terminologiques. Ceci peut être représenté sous forme d'une pyramide qui combine les deux schémas précédents (0.c.) et (0.d.). La pyramide en (0.e) montre que ce ne sont que les segments 2 et 5 qui font l'objet principal de la présente recherche. Plus exactement, l'objet d'étude est représenté par les termes « banalisés » de deux niveaux supérieurs. Cependant, le corpus comporte beaucoup d'unités non-terminologiques qui appartiennent plutôt au niveau de discours qui correspond au segment 8. Ces unités non-systématiques sont étudiées comme le matériel « vivant » ou la source du développement de la terminologie.

Du point de vue de la limitation du champ sémantique de la recherche, le corpus ne comprend que les unités qui désignent des vêtements proprement dits. Les données d'autres domaines de la mode, tels que « accessoires « ou « chaussures », ne sont pas prises en considération. Bien que ces données puissent être utilisées pour illustrer ou vérifier les résultats des analyses proposées, elles doivent être laissées hors du cadre de cette recherche pour limiter sa longueur. Il faut aussi mentionner qu'il ne s'agit que de français hexagonal - le français canadien ayant été dérouté pour la même raison que les données d'autres domaines de la mode : la longueur limitée de la thèse ne permet pas d'investiguer les différences régionales en même temps que les hypothèses principales de la recherche.

0.4. Matériel et sources

Le matériel de la thèse est représenté par les bases de données électroniques contenant 8 131 unités terminologiques. Cette quantité inclut plusieurs termes à fréquence élevée, ce qui doit assurer la présence dans le corpus de tous les termes des niveaux supérieurs et de tous les termes des niveaux intermédiaires, ainsi que la quantité de dénominations occasionnelles suffisante pour les objectifs de ma recherche.

Tous les termes étudiés sont extraits de l'Internet qui est la source principale du matériel linguistique de mon travail. Les données d'autres sources - dictionnaires, encyclopédies, revues de mode, catalogues de ventes de vêtement - sont utilisées pour l'estimation du degré de la lexicalisation des termes ainsi que pour la vérification ou la précision des concepts vestimentaires correspondant aux termes relevés.

0.5. Organisation de la thèse

Ce travail se compose de quatre parties principales. Le premier chapitre expose les méthodes de constitution du corpus qui ont été incitées par le développement des nouvelles technologies et qui ont été élaborées au cours de ce travail. Ces méthodes portent sur le dépouillement des sources premières électroniques, sur la constitution des bases de données informatiques et sur leur traitement. Le deuxième chapitre présente la hiérarchie conceptuelle de la terminologie vestimentaire et étudie la structure sémantique et les modèles de formation des termes des niveaux supérieurs de cette hiérarchie (segments 2 et 5, figure (0.e)). Le troisième chapitre étudie la syntaxe et les régularités de formation des termes complexes qui se situent aux niveaux inférieurs du système terminologique (segments 5 et 8, figure (0.e)). Le quatrième chapitre explique les mécanismes de dénomination et les particularités des termes discutées dans le deuxième et le troisième chapitres.