LEXIQUE, SYNTAXE ET LEXIQUE-GRAMMAIRE / SYNTAX, LEXIS & LEXICON-GRAMMAR
LINGVISTICÆ INVESTIGATIONS: SUPPLEMENTA Studies in French & General Linguistics / Etudes en Linguistique Frangaise et Générale This series has been established as a companion series to the periodical "LINGVISTIC^ INVESTIGATIONES", which started publication in 1977. It is published by the Laboratoire d'Automatique Documentaire et Linguistique du C.N.R.S.
Series-Editors: Jean-Claude Chevalier (Université Paris VIII) f Maurice Gross (Université de Marne-la-Vallée) Christian Leclère (L.A.D.L.)
Volume 24 Edited by Christian Leclère, Éric Laporte, Mireille Piot et Max Silberztein Lexique, Syntaxe et Lexique-Grammaire / Syntax, Lexis & Lexicon-Grammar Papers in honour of Maurice Gross
LEXIQUE, SYNTAXE ET LEXIQUE-GRAMMAIRE SYNTAX, LEXIS & LEXICON-GRAMMAR PAPERS IN HONOUR OF MAURICE GROSS
Edited by CHRISTIAN LECLÈRE ÉRIC LAPORTE MIREILLE PIOT MAX SILBERZTEIN
JOHN BENJAMINS PUBLISHING COMPANY AMSTERDAM/PHILADELPHIA
The paper used in this publication meets the minimum requirements of American National Standard for Information Sciences — Permanence of Paper for Printed Library Materials, ANSI Z39.48-1984.
Library of Congress Cataloging-in-Publication Data Lexique, Syntaxe et Lexique-Grammaire / Syntax, Lexis & Lexicon-Grammar. Papers in hon our of Maurice Gross / edited by Christian Leclère ... [et al.]. p. cm. ~ (Linguisticae investigationes. Supplementa ISSN; 0165-7569; v. 24) Includes bibliographical references and index. 1. Grammar, Comparative and general—Syntax. 2. Lexicology. I. Title: Syntaxe, lexique and lexique-grammaire. II. Leclère, Christian. III. Series. P291.S9576 2004 15-dc24 2004053768 ISBN 90 272 3134 6 (Eur.) /1 58811 556 9 (US) (Hb: alk. paper) © 2004 - John Benjamins B.V. No part of this book may be reproduced in any form, by print, photoprint, microfilm, or any other means, without written permission from the publisher. John Benjamins Publishing Co. • P.O.Box 36224 • 1020 ME Amsterdam • The Netherlands John Benjamins North America • P.O.Box 27519 • Philadelphia PA 19118-0519 • USA
TABLE DES MATIÈRES / TABLE OF CONTENTS
Foreword Jean-Claude Chevalier Entretien avec Maurice Gross
xi
1
Anna Anastassiadis-Syméonidis Le Lexique-Grammaire du grec moderne
11
Antoinette Balibar-Mrabti Lexique-Grammaire et extensions lexicales. Note sur le semi-figement
23
Jorge Baptista Instrument Nouns and Fusion. Predicative nouns designating violent actions
31
Hava Bat-Zeev Shildkrot La constitution d'une concordance de verbes de l'ancien français
41
Andrée Borillo Les adjectifs dérivés de noms de parties du corps dans les textes médicaux
51
Mohamed Chad Ä propos des phrases transitives en arabe. Sur quelques critères de recon naissance des objets directs
63
Cheng Ting-Au Étude distributionnelle des constructions en ba en chinois
79
Mirella Conenna Principes d'analyse automatique des proverbes
91
Benoit de Cornuilier Sur la valeur de l' «incise » et sa postposition. Signe mimique et« style indirect libre »
105
Blandine Courtois Dictionnaires électroniques DELAF anglais et français
113
EmilioD'Agostino, Annibale Elia & Simonetta Vietri Lexicon-Grammar, Electronic Dictionaries and Local Grammars of Italian
125
Laurence Danlos Coréférence événementielle entre deux phrases
137
vi
TABLE DES MATIÈRES / TABLE OF CONTENTS
Ray C. Dougherty Strings, Lists and Intonation in Garden Path Sentences: Can it, plan it, or planet?
155
Jean Dubois & Françoise Dubois-Charlier Les relatifs de surface
175
André Dugas Les attributs du complément d'objet
185
Cédrick Fairon Une étude de corpus pour éclairer la question du verbe de l'incise en Français
195
David Gaatone Les prépositions forment-elles une classe ?
211
Jacqueline Giry-Schneider Une construction tronquée du verbe faire : Jean fait le (brave + cachottier + repentant + enfant gâte)
223
Gaston Gross Classes sémantiques et description des langues
231
Frantz Guenthner & Xavier Blanco Multi-Lexemic Expressions: an overview
239
Richard S. Kayne Here and There
253
Ferenc Kiefer Sur l'ordre des adjectifs
275
Georges Kleiber Anaphores associatives: du large à l'étroit
287
S.-Y. Kuroda Tree pruning
303
Jacques Labelle Lexiques-grammaires comparés. Quelques observations sur des différences syntaxiques en français de France et du Québec
313
Nunzio La Fauci & Ignazio Mirto Italian People at Work. Jobs in Lexical Syntax
325
Beatrice Lamiroy & Jean Klein La structure de la phrase en français de Belgique
343
Éric Laporte Restructuration and the subject of adjectives
373
Christian Leclère & Jacqueline Brisbois-Leenhardt Synonymie de mots et synonymie de phrases: une approche formelle
389
TABLE DES MATIÈRES / TABLE OF CONTENTS
vii
Danielle Leeman Les aventures de Max et Eve, j'ai aimé. À propos (Tun C.O.D. "Canada Dry"
405
Peter Machonis Nominalizations of English Neutral Verbs
413
Elisabete Marques-Ranchhod Remarks on the Complementation of Aspectual Verbs
423
Claude Muller A propos de [pe-z.]
439
Jee-Sun Nam Some Linguistic Problems in Building a Korean Electronic Lexicon of Simple Verbs
455
Kozué Ogata Du locatif directionnel au datif dans les constructions du verbe arriver
All
Mireille Piot La conjonction ê si n'existe pas !
485
Paul M. Postal A Remark on English Double Negatives
497
Roger-Bruno Rabenilaina Déverbatif et diathèse en malgache
509
Lucie Raharinirina Rabaovololona & Baholisoa Simone Ralalaoherivony Les travaux en Lexique-Grammaire du malgache et leurs extensions
517
Antoinette Renouf Shall we hors d'oeuvres ? The Assimilation of Gallicisms into English
527
Haj Ross The Syntax of Emphasis - A Base Camp
547
Morris Salkoff Verbs of Mental States
561
Sandford Schane Diphtongues vocaliques et diphtongues consonantiques
573
Helmut Schnelle Time in Language - Language in Time. A Leibnizian Perspective
581
Max Silberztein Reconnaissance des déterminants français
589
Yoichiro Tsuruga Essai d'interprétation fonctionnelle des tables du Lexique-Grammaire
601
Jean-Roger Vergnaud & Maria Luisa Zubizarreta Some Elements for an Empirical Approach to the Study of Meaning
613
viii
TABLE DES MATIÈRES / TABLE OF CONTENTS
Dusko Vitas Morphologie dérivationnelle et mots simples. Le cas du serbo-croate
629
Robert Vivès Une grille d'analyse pour les prédicais nominaux
641
Publications de Maurice Gross Bibliographie établie par Takuya Nakamura
649
Maurice Gross
FOREWORD
When the contributions in this volume were written, we intended to present them to Maurice Gross at some festive occasion such as a birthday or a conference. They are numerous and diverse, as are the friends and collaborators of the great linguist. Probably most of the authors were eager to discuss their article with him, once published. But the text editing was a long job. He became ill, and his condition worsened. Christian Leclère made a tremendous effort to present him with a preliminary version, and Maurice Gross was fortunately able to take a glance at it before he passed away in December 2001. These articles, which were written for a living and vital man, are now published to pay homage to his memory. We have added the list of references to his works, as established by Takuya Nakamura. We also mention references to some of the texts that were published to his memory in 2001 and 2002. The academic life of Maurice Gross was prolific and rich in innovation. He had a reputation as an anti-conventional linguist. He questioned traditional views and challenged traditional ideas, and not for mere provocation. It is an epistemologically healthy attitude, as long as it is applied to oneself. In this foreword, I shall set out and defend some of his views, in an attempt to illustrate the originality of his methodology and results. Of course, I shall be paraphrasing what he has already said. Almost all examples quoted will be his or by members of his team; the issues that I shall mention are exemplified and discussed in more detail in Maurice Gross' books and articles. Model and reality in syntax - "Mr. Gross' empiricism" The major contribution to linguistics made by Maurice Gross is of a methodo logical nature. He was the first to adapt and apply to the syntax of natural languages methods borrowed from experimental sciences. In my view, his originality explains the major impact he had on the linguistics of the 1970's; most of his contemporaries testify to his charisma, but that does not account fully for his lasting influence. Let me be more specific. In the field of syntax, the degree of generality of facts or rales is felt to be a core measure of success. An assertion about the syntax of languages can be general in several ways. If it applies to a particular language, it
xii
FOREWORD
can have some degree of generality with respect to words and constructs in the language. For example, in English, nearly all sentences contain at least one verb. If the assertion applies to all human languages, it is celebrated as a "universal". Here are two simple examples of informal universals about language evolution: (i) many lexical words evolve until they become grammatical words, but the opposite trend is rare; (ii) words with concrete or physical meanings acquire abstract or psychologi cal additional meanings much more easily than the reverse. In contrast with a general assertion, a "directly observable fact" applies to a particular sequence of words or pair of sequences. For example, the preposition that occurs in Max has some influence on Mary is not acceptable in *Max influ ences on Mary. As in all sciences, there is a duality between general or even universal rules, and particular facts. Theoretical conjectures, which by definition are stated with fairly general applicability, can provide a reason to search for particular examples or counter-examples, which are directly observable pieces of information. Con versely, an accumulation of particular observations is a source of inspiration for shaping new theories. The recognition of the duality between theory and fact, and the view that there is a synergy between the two, are widely accepted in epistemology; they are even a stereotype. In syntax, how can this synergy work in practice? Here, Maurice Gross9 methodological approach was innovative, in that it was akin to methods practised in experimental sciences, whereas the attitude of most syntacticians is influenced more by mathematics. These divergent philosophies are not necessarily explicit, nor even conscious, but they are highly significant. The popular view has it that the more general an intuition is about language, the more valuable it is. A very general assertion is better than a specific assertion. The best assertions of all have universal applicability. The analogy with mathe matics is striking: if a theorem states that some infinite set of entire numbers are primes, it becomes unnecessary to prove that one of these numbers is prime. This way of thinking thus leads us to focus on the most general assertions possible. Intuition is naturally quite creative of generalities, and this activity is an intellec tual pleasure. The prestige of what is "general" is further enhanced in two cases: one, where it is felt to be "explanatory",1 and two, where it is complex or abstract, thus acquiring an aura of mathematics, the supreme science. One of the most derogatory terms used in syntax, ad hoc, means "insufficiently general". This view that general assertions are highly valuable is correct, on one condi tion: even if an intuition about language is general, explanatory and abstract, it must be tested against specific, individual facts. Each of Maurice Gross' works provides several examples of this basic requirement; his 1979 article in Language 1
The significance of the explanatory value of general representations of facts has been theorized in the form of the three levels of adequacy of generative grammar: explanatory, descriptive and observational adequacy.
ÉRIC LAPORTE
xiii
points out cases where syntacticians neglected it. Indeed, the danger of over valuing generality lies in overlooking the duality between theory and fact. In syntactic study, real language use is the only means of verifying conjectures, hypotheses and models. It involves millions of observable facts, and thousands of languages. However, few linguists seriously contemplate the possibility of ex haustive investigation. Words like descriptive and empirical, which relate to experimentation, can actually express disapproval, i.e. in descriptive adequacy, as opposed to explanatory adequacy. Some linguists sincerely believe that uncons cious introspection is an adequate means of authentication of general assertions, and omit to check them consciously. The problem is different in mathematics: there are formal axioms, and there is a notion of formal demonstration on the basis of axioms. Thus, the analogy with mathematics does not necessarily entail the methodological stance of focussing on general assertions. I think that the lack of familiarity of many linguists with hard sciences has some responsibility for the popularity of this practice. Moreover, mathematicians do not make the same mistake. There are famous confusions between conjecture and theorem, but they are exceptional. Fermat's Last Theorem and the "Four Colour" Theorem were traditionally called "theorems" before they were proved, but this was only a word: the mathematical community definitely considered them conjectures for decades. The "Four Colour" Theorem was called a theorem because of the publication of a wrong proof. As soon as the defect of the proof was pointed out, it was clearly a conjecture again. In addition, the proof of the "Four Colour" theorem required the examination of millions of cases, which was done explicitly before it was back among theorems. The work of Maurice Gross is in many respects a reaction to that epistemological attitude. He graduated as an engineer and a scientist. In experimental sciences, priority is given to accumulating empirical data in order to design and test models, theories and conjectures; humility before the fact goes without saying. Even when models or hypotheses naturally come to mind, their scientific value depends on their correspondence to reality, so they must be systematically checked against observable facts. This involves experimentation. In syntax, as in any field interest, experimentation requires effort and skill; it must be explicit and take into account large-scale data; namely, the vocabulary of the language and the syntactic constructions of the language. This is one of the fundamental principles of the Lexicon-Grammar method of Maurice Gross. The following examples illustrate some applications of these principles. Predicates and arguments The predicate/argument model is one of the most general models of sentence structure because it applies to many languages and many types of sentence. Let us state it in terms of mathematical combinatorics on words: many elementary sen tences can be accounted for by sentence schemes of the form P0A0P1A1... AnPn+1,
FOREWORD
xiv
where the concatenation P0P1...Pn+1 represents a particular predicate, and A0, A1... An free arguments. For example, in Max takes Mary under his wing, the predicate is P0P1P2 =: take under Poss0 wing and the two free arguments are A0 =: Max and A1 =: Mary. Fundamental syntactic issues surrounding the pre dicate/argument model involve an extensive empirical study of the vocabulary: - Does it apply to all elementary sentences? - What is the extension of the predicate in the sentence? - When there are several arguments, is their distribution independent? As regards the second issue, a long tradition holds that the predicate is the verb: King John attacked the city Zellig Harris2 formulated a theory of derivation that implies the existence of nomi nal and adjectival predicates: King John launched an attack against the city Max is faithful to Mary The description of nominal and adjectival predicates by Maurice Gross and his followers validated Zellig Harris' approach. The discovery of a large set of compound predicates {Max takes Mary under his wing) was not a predicted by a theory, but uncovered as a result of the systematic study of the lexicon. The question as to whether arguments have independent distribution is signi ficant, because the predicate/argument model loses much of its interest if argu ments have interdependent distributions. There are examples where it seems to be the case: The lady swallowed (a whitebeam berry water-ice with banana + ? the anaconda) The alligator swallowed (7 a whitebeam berry water-ice with banana + the anaconda) but it is not clear whether these constraints are linguistic or extra-linguistic. The model according to which arguments have independent distributions is an appro ximation to reality. It is a convenient descriptive framework that has led to interesting results and is far from being exhausted, even for French. It would therefore be unreasonable to consider this model obsolete. Finite automata For Noam Chomsky, the finite automaton was not the best formal model for the syntax of natural languages; it was too simple. He represented his viewpoint in the 2
Harris, Zellig. 1964. The Elementary Transformations, Philadelphia: University of Pennsylvania.
ÉRIC LAPORTE
XV
form of the sketch of a mathematical proof,3 and though the sketch has never been extended into a complete proof, many still believe today that it might be. Even if it were, such a mathematical proof would hardly be relevant, since the total evi dence exists out in the real world and is not straightforwardly transposable into an axiomatic domain. Maurice Gross' approach to the finite automaton model was more constructive. He perceived that it would be a convenient, invaluable tool for syntactic descrip tion, and that the taboo imposed was absurd. Empirical study in the framework of Lexicon-Grammar led to the design of an actual model of the syntax of natural languages in the form of... a large network of finite automata. New transformations During the systematic investigation of the French lexicon undertaken by Maurice Gross' laboratory, new transformations have been discovered. The following is a case of conversion: Max gives his consent to this manipulation = This manipulation receives Max's consent The transformational status of several other relations between sentences might have remained unclear without such a systematic review of their productivity. The following is a case of object transposition: Max sprays repellent on his ankles = Max sprays his ankles with repellent The study of such syntactic relations provided key arguments for elaborating formal models of sets of syntactic variations.4 Theory stemmed from experience, since choices about the properties of formal models required taking into account empirical facts about hundreds of sentences. Reproducibility Let us return to properties which have some degree of generality, and to the question of assessing the limits of this generality. Take for example the following assertion. Many neutral constructions present an intuitive semantic difference between a construction with an implicit external human agent (the "ghost agent") and a construction without an implicit external human agent:
3
4
Noam Chomsky. 1956. Three models for the description of language, IRE Transactions on Information Theory 2:3.113-124. Salkoff, Morris. 1983. Bees are swarming in the garden: a systematic synchronic study of productivity, Language 59:2.288-346.
FOREWORD
xvi This door opens easily The door opened
Any hypothesis as to the degree of generality of such a fact has the status of a conjecture until it is supported by evidence, which in this case is bound to be empirical. Maurice Gross took care to base descriptive or elassificatory choices on criteria liable to give results without resorting to double-bind experiments, obviously too costly. Reproducibility of experimentation is an essential require ment; it is ensured when the result of an experiment does not depend on the experimenter, which is of course never entirely true in the case of language, but can be approximately so, in so far as there are linguistic communities. However, the result depends heavily on the criteria adopted. Formal criteria make use of forms, their acceptability, their differential acceptability and a few other notions; they are usually much more reproducible than those that simply refer to semantic intuitions: even if these seem clear and sound, they may be reproducible for some words and not for others. For instance, the status of the following sentence with regard to the difference perceived so clearly above is not detected in a repro ducible way: The second theory naturally relates to the first The systematic description of the neutral transformation(s) remains to be done, largely because of this difficulty. In general, the practice of semantic description and formalisation within the Lexicon-Grammar framework involves methodolo gical caution; I would justify it by saying that caution is a condition of rigour. In the same vein, methodological precautions restrict the scope of LexiconGrammar as regards the description of lexical ambiguity and of idioms. Lexical ambiguity Ambiguous words, like miss, give rise to questions and intuitions about connections between senses, about the historical evolution of senses... but this field can hardly be formalized and such intuitions are difficult to reproduce. Maurice Gross avoided this field and excluded it from his model of syntax. This exclusion is based on a theoretical and methodological principle, which originates in Zellig Harris' conception of syntax, and that Maurice Gross stated as follows: the elementary sentence is taken as the minimal unit for the study of meaning and syntax. As a matter of fact, meanings of sentences are much easier to distinguish than meaning of words: Max missed the target Max missed collapsing Max misses Mary
ÉRIC LAPORTE
xvii
This principle also means that when an ambiguous word, like miss, occurs in different elementary sentences with distinct meanings, the respective lexical entries are considered separate and unrelated. Thus, relations between homographic entries are usually not addressed in Lexicon-Grammar studies. This is the price to be paid for an essential epistemological feature: the model is designed so as it can be confronted with reality through a set of sufficiently reproducible expe rimental processes, which includes acceptability judgment, differential acceptabi lity, paraphrase judgment, ambiguity judgment, and a few others, all applied to sentences. Idioms Figurative and metaphorical senses are fascinating for linguists. These linguistic features stimulate intuitions about metaphorical creativity, connotation, historical evolution, etc. Maurice Gross was a pioneer in the syntactic description of idioms and produced comprehen-sive lexicons of French adverbial and verbal idioms. However, in his practice of syntax, he focussed on those phenomena that allow formalisation, even if they do not attract intuition. For example, figurative idioms such as take to heart: Max took this delay to heart do not behave in an essentially different way, from the syntactic point of view, from the idioms that are not particularly figurative, like take into account: Max took this delay into account or from those that belong to the technical vocabulary, like free on parole: The court freed Max on parole
Explanations Maurice Gross' attitude towards explanations was strikingly prudent, as compared to many linguists. Linguists use the word explanation in at least three ways. Firstly, a simple correlation between two facts is often termed an explanation. For example, the two following sentences illustrate a difference of acceptability: The branch broke ? The branch bent Some speakers connect this difference with the fact that the existence of an external cause is necessary in the situation denoted by the second sentence. This semantic and pragmatic difference is said to explain the difference of accep tability. However, it does not properly explain it, as long as no logical connection
FOREWORD
xviii
is shown between the two facts. (Moreover, the utmost caution is required with regard to such impressions, on the basis of scientific doubt; a correlation is often less general than it is felt to be, as is shown by other examples, like: The branch burnt which is quite natural although an external cause is definitely required.) Secondly, saying that a rule or a theory explains facts sometimes just means that the facts do not contradict the rule or the theory. For example, if we connect predicative noun phrases to support-verb constructions and if we describe: John had a surprise as a support-verb construction, we explain the noun phrase: John's surprise With this notion of explanation, a theory has a great explanatory power simply if it is compatible with a lot of facts. Thirdly, an explanation, in the proper sense, is a logical relation of causality. For example, the different inflection of to win and to gain is explained by their Old English and French origins respectively. This kind of explanation is actually informative and satisfactory. However, it is usually of an historical nature, and therefore often unavailable. In particular, explanations of precise lexico-syntactic facts are likely to be quite contingent and almost always impossible to obtain, for lack of documentary evidence. Formal and terminological minimalism Maurice Gross agreed fully with Zellig Harris' aim of building a formally mini mal theory, and limiting the introduction of abstract notions. He demonstrated the same inclination when he himself created and applied models. These models are among the simplest in existence and make use of very little mathematics, though he was a specialist in formal modelling and his intellectual partners in the 1960's were very active in mathematics: Zellig Harris, Marcel-Paul Schützenberger, Noam Chomsky. Zellig Harris5 changed the notion of syntactic fact in transformational grammar by making relations between sentences the central point. In traditional and generative grammar, a large proportion of grammatical information is attached to surface structures, i.e. abstract constructions associated with observable syntactic constituents: noun phrases, verb phrases, various types of complements... Maurice Gross adopted and implemented Zellig Harris9 view by attaching syntactic information to relations between sentences rather than to surface structures or to 5
Harris, Zellig. 1957. "Co-Occurrence and Transformation in Linguistic Structure", Language 33:3.283-340.
ÉRIC LAPORTE
xix
deep structures. Syntactic information identifies acceptable constructions, their relations and their meaning variations. Since this information depends on the lexical items and different syntactic constructions, it is straightforward and natural to associate it with transformations (relations between constructions) and with relations between lexical items and constructions. Lexicon-Grammar uses a small number of surface structures: sentence, noun phrase, lexical tags, and so on. This economy in structure facilitated the comprehensive description of syntactic variation. The difference with generative grammar is striking in this regard. Generative grammar embeds numerous kinds of syntactic structures within one another: for instance, the noun phrase is distinguished from the prepositional phrase, and the sentence from the verb phrase; in addition, these surface structures are duplicated into a piling up of tree nodes; complex syntactic information is attached to them. In practice, these choices do not favour effective large-scale descriptive syntax. Maurice Gross seldom resorted to theoretical sentences in syntax. Here are a few exceptions for French: Luc sort (du + *de le) camion Je veta (me promener + *que je me promene) He created very little terminology: link operator, uniqueness modifiers, a few categories of determiners {adjectival, nominal adverbial, predeterminer), some syntactic transformations ([se passive]) - hardly any more than these. He was careful about the definition of notions and the use of existing labels, but consi dered that creating a label for a new notion or a new combination of properties was often useless; and arguing about which label should be created, even more so. Parsimony in syntactic description The attitude of Maurice Gross towards parsimony in syntactic description was pragmatic. When several solutions are equivalent as regards their informative content, he saw the choice of the simplest as more a question of good sense than of mathematics. In other words, he thought that in such situations, better decisions are reached on the basis of a human, informal choice than on formal grounds. The choice can even be quite arbitrary. When a lexical entry is losing or acquiring a construction attested with other entries, two approximate models can be envisaged: either the obsolescent item is present in the model or it is absent. La façon dont Marc présente les choses est diplomatique (The way Mark puts it is diplomatic) = ? Marc est diplomatique (cf. Marc est diplomate, more standard) (Mark is diplomatic)
XX
FOREWORD
Wherever this evolution is taking place, the choice is arbitrary. The same can be said more generally when one system of forms is reorganised into another: it is possible that no intermediate system can be represented simply in a formal model. The issue occurs more frequently when several formal models for a given set of data can be devised. For example, the notion of verb phrase that is traditionally used in generative grammar includes the verb and its complements, subject excluded. Using this structure certainly simplifies a number of operations, but doing without it simplifies others. A structure that would combine subject and verb, complements excluded, would certainly simplify others. In principle, generative grammar provides a definition of the simplest device describing a set of linguistic phenomena, but it is purely theoretical and cannot be practically applied. In mathematics, a choice between notational variants is usually consi dered as an arbitrary choice, and is made, in fact, on practical grounds. In our example, the choice between the three solutions involves practical considerations. For example, the structure with no intermediate tree node between sentence and predicate or constituents is obviously simpler. One of the arguments in favour of the traditional syntactic tree with a verb phrase node is that it can be used to encode properties of adverbs: Max probably accepted the proposal Max enthusiastically accepted the proposal by attaching different kinds of adverbs to distinct nodes. However, the same pro perties are more naturally attached to relations with syntactic variants of the sentences. Another fact is that specialists in Lexicon-Grammar actually described thousands of predicates and dozens of syntactic transformations without noticing how the notion of verb phrase could be helpful. This result is an a posteriori confirmation of the wisdom of Maurice Gross' choice of dispensing with the notion of verb phrase. Targeted use of the computer: "Mr, Gross' pessimism" Maurice Gross designed linguistic data so that a computational exploitation in natural language processing was possible. He pioneered the concept of linguisticbased natural language processing. The data he accumulated is used by several laboratories and companies, some of them founded by his followers. However, he had a clear position as to the role to be assigned to computers in syntactic description: computers are suited to the exploration of texts and to the organization and processing of data, but not to the syntactic description itself; syntactic description is not automatable. Computer science provides comfort and aid but not a real shift from handcrafted activity to mechanisation. This theoretical position brought Maurice Gross into lengthy conflict with language-processing computer scientists, who basically adapt weather-forecasting-type techniques to the description of syntax. They obtain predictions of
ÉRIC LAPORTE
xxi
syntactic behaviour in order to use them as a substitute for syntactic description. In the case of meteorology, when all relevant fundamental data are observable: temperature, humidity, nebulosity, precipitation, wind, currents etc., at points that make up a sufficiently dense network in space and time, weather forecasts are reliable. In syntax, the only primary data that can be automatically acquired from samples of texts are sequences and forms of words, but not sense distinctions or paraphrase relations. These data are partial and offer a simplistic model of syntax, but the approximation seems satisfactory, or at least promising, to computer scientists with an engineering background but little familiarity with linguistics. But the two positions have grown closer over recent years. ***
The authors of the contributions in this volume are from different schools of thought and from different continents. They do not share all the views I have recorded here. However, all of them had a close relationship with Maurice Gross, and they have taken the opportunity to express their position on significant views of his. Those who worked with Maurice Gross, and those who wish to remain faithful to all or part of his ideas are now responsible for carrying on the legacy of work which he initiated and did not complete. I hope that we shall be creative and rigorous in this enterprise.
Paris, May 2004 Éric Laporte University of Marne-la-Vallée
Merci pour leur aide a / Thanks for their help to: Jacqueline Brisbois-Leenhardt Béatrice Lamiroy Takuya Nakamura Antoinette Renouf & Nancy Jézéquel
Plusieurs textes consacrés á Maurice Gross, après sa mort, sont consultables sur le site / Several articles devoted to Maurice Gross, after his death, can be consulted on the website: http://infolingu.univ-mlv.fr/LADL/ArticlesMG.htm La plupart des articles contenus dans ce recueil ont été écrits il a plusieurs mois, voire plusieurs années. Certaines indications bibliographiques peuvent donc ne pas êtreàjour / Most of the articles in this book were written a few months (or even several years) ago. Some bibliographical information may therefore not be up to date.
ENTRETIEN AVEC MAURICE GROSS JEAN-CLAUDE CHEVALIER Professeur émérite, Université de Paris VIII En 1982, nous avons eu, Pierre Encrevé et moi, l'idée d'une recherche balisée en histoire sociale de la linguistique. L'époque choisie était 1958-1968, en France; nous avons justifié ailleurs le choix de ces dates. Le moyen d'investigation retenu était d'interviewer des linguistes, notables en ce qu'ils avaient fondé des revues dans cet espace de temps ou un peu après. Fonder une revue signifie qu'on entre a part entière dans une modification du champ disciplinaire et qu'on projette en ce lieu de création un certain nombre de chercheurs. Nous avons donc questionné ces linguistes sur leur formation, leur carrière antérieure, pour comprendre ce qui les avait conduits à se situer ainsi dans le champ. Pour fixer un protocole d'enquête, nous avons fait un premier essai avec l'auteur de ces lignes (secrétaire général de la revue Langue frangaise, créée en 1969) interrogé par Pierre Bourdieu et Pierre Encrevé; cette esquisse nous a servi de guide et de grille dans la suite. A une première liste de douze noms, nous avons ajouté Antoine Culioli et Maurice Gross; Gross comme fondateur un peu plus tard, chez Benjamins en 1976, de Lingvisticœ Investigationes (avec J.-C. Chevalier et Ch. Leclère). Des éléments de ces entretiens ont été utilisés dans l'article de Langue franqaise para en 1983 (n° 63); je voudrais ici élargir le tableau en citant plus largement les propos de M. Gross, pour tenter d'analyser la construction du champ linguistique au travers de son entreprise. J'utiliserai la bande d'enregistrement de 1982; l'entretien avait lieu dans le bureau de M. Gross, au 9ème étage de la Grande Tour Jussieu; je revois nettement Maurice passant de son fauteuil aux rayonnages de son bureau, vérifiant une citation, revenant sur ses pas, un itinéraire compliqué comme était l'évocation de souvenirs qui souvent se mêlaient. Le style était incisif, volontiers polémique. Pierre Encrevé avait donné le « la », fixé la ligne de notre réflexion: « Ce qui nous a le plus frappés, c'est que des gens qui jouent un role aujourd'hui dans le domaine linguistique, ä peu près aucun n'a eu une carrière normale, n'a suivi une voie académique .» Nous lui avons donc posé des questions sur sa carrière. Et ce qu'on trouvera ici, c'est le point de vue de Gross sur sa propre carrière, lié a sa propre représentation; on trouvera ailleurs d'excellentes et détaillées mises au point fac-
2
JEAN-CLAUDE CHEVALIER
tuelles sur le développement des institutions dans lesquelles s'est inséré le jeune ingénieur. Au départ, donc, ce jeune ingénieur polytechnicien qui, en 1960, entre dans un Laboratoire de Calcul. Il était alors totalement étranger ä la linguistique: « Un linguiste, je ne savais même pas ce que 'était. Je ne savais même pas que ça existait». Mais, comme il le remarque, « La philologie a toujours intéressé les scientifiques. Le mathématicien Riemann a hésité entre une carrière de mathématicien et une de philologue ». D'emblée, un premier obstacle est levé: il n'y a pas de frontière étanche entre les préoccupations des linguistes et des mathématiciens. Mais il n'y a pas non plus de voies de communication prévues. Aucun exemple dans les promotions précédentes de l'X. L'état d'incertitude du débutant est orienté vers d'autres carrières. Comme pas mal d'X, il devient ingénieur de l'Armement et se trouve affecté au Centre de Calcul du Laboratoire Central; il y avait là le premier ordinateur français. 'était en 1960. Conjointement avec le CNRS, le Centre avait créé un groupe particulier pour la traduction automatique, nécessaire en ces temps de guerre froide et de diffusion des calculs automatisés. Le Centre était dirigé par un ingénieur militaire, A. Sestier. Sestier avait déja noué des relations avec de jeunes linguistes par l'entremise du Centre de Codage des Messages qu'animaient, depuis la guerre d'Egypte, J. Favard et D. Hérault. En outre, depuis 1959, des rapports se sont établis avec les services de Unesco qui s'occupaient de traduction automatique, animés par E. Delavenay et aussi un américain, M. Corbé; ils avaient fondé une association, l'ATALA, qui avait des réunions régulières. Il en sortirait un petit manuel chez Mouton: La machine ä traduire. La situation politique de guerre froide offre au débutant un champ d'action. Pour cause de guerre froide, donc, on traduisait surtout du rasse, avec des spécialistes de langues comme J. Train (russe), Y. Gentilhomme (rasse) et aussi Pierre Meile (langues indoues et russe). Des gens de formations diverses, caractéristique de l'époque; ainsi, Gentilhomme, bilingue de mère rasse, avait fait des études de maths, P. Meile du comparatisme. Au Labo, on lisait énormément et «dans le désordre ». La progression était hasardeuse. Gross était chargé plus spécialement de comparer 1'allemand et le fran9ais. On connaissait beaucoup, dit-il, les travaux des américains et ceux des russes. On pratiquait la morphologie surtout, qui semblait plus aisément formalisable, mais aussi tout ce qui ressemblait a des classements de langue: « On faisait un peu de tout. On regardait aussi la syntaxe, bien sûr. On regardait tout ce qui nous tombait sous la main. On était complètement analphabètes. Je me souviens avoir lu des manuels de conjugaison en rasse.» « On avait besoin de choses extrêmement concrètes. On pensait qu'on allait avoir des règles un peu mécanisées, ou du moins qu'on allait pouvoir les mécaniser facilement, comme on avait fait pour la morphologie. Je pense que le boulot qu'on avait fait était très bien. De toute façon, le système était ouvert;
ENTRETIEN AVEC MAURICE GROSS
3
on pouvait toujours ajouter de nouveaux paradigmes.» « La syntaxe, on en a cherché partout. Il n'y avait pas grand chose a se mettre sous la dent, á part toutes les grammaires habituelles qui ne nous donnaient guère satisfaction. Mais, quand on avait réussi a mettre au point les règles d'accord Sujet-Verbe, Adjectif-Nom, que faire après ? » Pierre Encrevé s'étonne qu'ils n'aient pas cherché a joindre les linguistes. Réponse de M. Gross: « Je ne connaissais pas, je ne soupçonnais même pas.» Et pourtant, il remarque: « On a soupçonné rapidement que les linguistes n'allaient pas nous aider beaucoup pour la syntaxe. Mais on avait tout de même l'impression qu'il avait des choses. En regardant de plus près les grammaires, en remettant de l'ordre dedans, on arriverait à faire des règies.» En somme, équilibre instable entre deux milieux professionnels qui ne se pénètrent pas, bien qu'ils aient quelques raisons de se fréquenter. Il faudra d'autres truchements. Gross essaie de joindre d'autres groupes constitués dépen dant davantage de son milieu professionnel. Il lui semble bien qu'à 1'été 1961 il assistait au 1er Congrès de Traduction Automatique, en Angleterre. Il y aurait connu Klima et Matthews. Mais s'il est certain d'avoir assisté au Second Congrès, en 1963, à Teddington, pour le premier, ce n'est qu'un souvenir vague, peut-être un désir d'organisation plus qu'une réalité. Toute réflexion faite, il lui semble bien qu'il y était. L'émulation, le désir d'une plus forte professionnalisation, entraînent des ini tiatives. En octobre 61 - il a alors 27 ans -, il obtient de l'Unesco une bourse d'un an pour aller aux États-Unis; il va a Harvard, chez A.E. Oettinger, qui était ingénieur en calcul automatique. Les groupes qui travaillent sur ordinateur sont un vecteur qui s'impose a lui avec plus d'évidence que le champ des linguistes en France. Gross opère là ou il a des repères. Et, introduit aux États-Unis, il trouve un champ mieux ordonné, moins bricolé et les rapports vont s'établir facilement: car la traduction automatique était très développée aux États-Unis. Et il y en avait dans pas mal de grandes universités. Au bout d'un moment, il va faire un tour au MIT, voir V. Yngvie, l'ingénieur qui est responsable de la traduction. Il va y connaïtre d'abord E. Klima et Matthews, puis Chomsky. Endroit curieux et fascinant où les chercheurs défilent; les jeunes ne peuvent rester que deux ans, le temps de se former et de produire un diplome. C'était vraiment un travail de laboratoire. Les linguistes étaient regroupés dans un laboratoire de recherche en électronique, qui était un truc énorme. On y faisait aussi de la phonétique: « Ça englobait la linguistique; il y avait de l'acoustique phonétique. Morris Halle en faisait. Il y avait Strevens. Ils y sont toujours. Ils avaient des contacts
4
JEAN-CLAUDE CHEVALIER
avec Jakobson, qui était alors á Harvard.» C'était un « lieu incroyable ». On voyait passer N. Wiener, fatigué, peut-être deja en retraite. Chomsky, qui était arrivé tout gamin au Labo, était a l'époque très connu, grace surtout aux Syntactic Structures de 1957. Gross va suivre ses cours. Voici le dialogue de l'entretien: « P.E. M.G. P.E. M.G.
Est-ce que tu vas suivre les cours de Chomsky ? Oui. Mais alors tu es le premier français ä avoir suivi ses cours ? Oui, sürement. A l'époque, personne n'avait vu de français. Au MIT, personne ne savait ce que c'était qu'un français. J.-C.C. Pourtant, Syntactic structures avait été publié en 57 et par Mouton. P.E. Qui Pavait lu en France ? M.G. Moi, je l'avais lu avant de partir, en 60. Ça ne m'avait pas impressionné, je n'avais pas compris. C'était assez difficile a comprendre quand on avait lu la littérature traditionnelle, qui était ce qu'on avait sous la main, y compris Tesnière d'ailleurs. Tesnière, j'ai commencé a le lire en France et je l'ai terminé aux Etats Unis. Je m'en souviens; et j'ai fait un exposé sur Tesnière au MIT. Il a fallu que je lise Bloomfield pour comprendre un peu mieux. J.-C.C. C'était le livre de base là-bas ? M.G. Oui, c'est un livre ancien, les années 30 et quelques; même a Paris, on l'avait. Je l'avais lu en 60. »
Ce n'était pas le genre de livres qu'on lisait en France a cette époque, même chez beaucoup de novateurs. Mais Gross ambitionne surtout d'approfondir ses compétences d'ingénieur-calcul. Il profite d'extensions présentes dans le Labo du MIT: « P.E. M.G.
P.E. M.G. P.E. M.G.
Tu avais travaillé avec Chomsky. Quand tu le vois, c'est le déclic. Non, pas du tout. Je faisais mon boulot de traducteur informaticien. Donc, j'ai appris de la logique, ce que je n'avais jamais fait en France, les fonctions récursives. J'aliáis suivre des cours, plus des maths qu'autre chose, les cours de Chomsky; j'ai suivi un cours de Morris Halle, je suis allé écouter Klima. Mais, ä Pépoque, mes intérêts étaient plus informatiques, finalement, que linguistiques; j'ai appris a pro grammer, j'ai fait un programme, un analyseur syntaxique en LISP, j'ai regardé dans 1'intelligence artificielle. Ce programme, ce n'est pas bien de nos jours ? Je pense qu'on n'a pas fait tellement mieux. C'est un algorithme assez Standard. Et là-bas, tu avais des ordinateurs plus performants qu'ici ? Oui, ils avaient un IBM 704. A Paris, on venait de se moderniser et on avait un IBM 650. »
ENTRETIEN AVEC MAURICE GROSS
5
Bourse épuisée, Gross revient à Paris, au rapport. Il ajoute sa voix a ceux qui critiquaient l'avenir de la traduction automatique. Sestier ferme la boutique Armement-CNRS: les autorités laissent a ses collaborateurs mis au chômage le choix entre les deux filières: Gross choisit le CNRS et devient attaché. Rattaché a l'Institut Blaise-Pascal où fonctionnait le Centre d'Informatique du CNRS. Ses recherches d'informaticien prennent un tour légèrement différent. Orientées par de nouvelles rencontres dans 1'institution. D'abord, celle de Schützenberger, biologiste mathématicien, qui a travaillé avec Chomsky en lui proposant des grilles mathématiques. Puis du groupe Hérault (dirigé par Favart) qui vient de Polytechnique avec le capitaine Moreau et s'est occupé des codes, donc du langage et des systèmes formels, qui sera appelé Groupe de Linguistique Quantitative, parce que ce titre attire les crédits, ce qui lui permettra d'éditer une publication et de s'installer à Henri-Poincaré. Il voisine seulement, sans plus, avec la Section d'Automatique Documentaire, dirigée par Parchéologue J.-C. Gardin, organisme qu'il dirigera par la suite sous le nom de LADL. Toujours informaticien, mais dans une voie nouvelle: « La profession était mal défmie. Il y avait l'informatique numérique. Ça existait: la résolution d'équations différentielles, les méthodes de calcul numé rique; on n'avait pas attendu Pinformatique pour démarrer. Mais il avait quelque chose de nouveau qui se dessinait: Pinformatique non numérique, comme on Pappelait a Pépoque, qui consistait à faire des compilateurs, étudier des langages de programmation, une activité de linguistique formelle quand même; et c'est ce que je fais ä Pépoque. » Il est relativement isolé, sauf quand arrive Hérault, Hérault qui cherchera à recruter des logiciens (peut-être Lacombe, tente de se souvenir Gross). Gross ne fré quente toujours pas les linguistes, pas plus Benveniste que Guillaume. Il a juste assisté à quelques cours de Martinet, avec d'autres ingénieurs, quand il était au CETA, mais a vite abandonné. Il les rencontrera surtout comme étudiants quand il enseignera a Henri-Poincaré, la deuxième année. Il traite des langages formels. Et là, il a parmi les auditeurs de très jeunes linguistes intéressés, des étudiants de Martinet surtout, comme Blanche-Noëlle Grunig, elle-même filie de polytechnicien. Elle tirera du cours un article, qui paraïtra en 1965 dans le n° 2 de La Linguistique. Il avait aussi Françoise Soublin, jeune sévrienne, Annie Meunier, étudiante aux Langues O., Dominique de Négroni, étudiante a la Sorbonne, et aussi le jeune Ruwet qui, parti du violon et des analyses poétiques, avait fait un peu de tout, de Pethnologie, de la psychanalyse. Mounin était autrefois venu au CETA, pour nourrir sa thèse sur les traductions, par des interviews, mais n'était pas resté. On ne délivrait pas de diplomes a Henri-Poincaré; c'étaient des cours libres. On allait les uns chez les autres; Gross se souvient être allé écouter Pottier. Esquisse d'un type d'enseignement très nouveau qui s'institutionnaliserait au Centre Universitaire de Vincennes. Moreau était un peu a part, car il s'occupait surtout de statistique, de traitement du vocabulaire. Il était le seul à fréquenter les
6
JEAN-CLAUDE CHEVALIER
linguistes d'un autre réseau, celui de Besançon. Ses cours d'initiation avaient partout un énorme succès. Gross ne se sent toujours pas linguiste. Il voit pas mal André Lentin, de BlaisePascal, un agrégé de maths, maïtre de recherches au CNRS. Lentin est informaticien, mais attiré par la linguistique comme gendre de Marcel Cohen, qui avec Gougenheim a suivi de près ces développements nouveaux d'analyse du langage. Lentin et Gross se rejoignent dans un gout communpour les grammaires for melles. Ils publieront un livre ensemble, en 1967. Après deux ans a Henri-Poincaré, Gross part pour une expérience exceptionnelle, mais raisonnée, a l'Université de Pennsylvanie: « Schützenberger avait rencontré Harris et lui avait parlé de moi. Il m'invite. J'avais un petit job lá-bas; j'étais assistant. » Détaché du CNRS en octobre 1964. raconte avec un sens aigu des dispositifs épistémologiques: «Alors la, j'apprends la linguistique. J'en avais appris pas mal finalement; mais ça ne s'était pas mis en place. Je n'avais pas fait de travail personnel sur le langage et, cette année-lá, j'avais des cours particuliers: ceux de Harris. » Moment crucial: des apprentissages hétérogènes s'organisent dans un modèle d'ensemble. suffit de reproduire l'entretien: « M.G.
C'est la que je me mets a travailler sur le fran9ais. C'est la que j'ai commencé la Grammaire transformationnelle du français. J'étais devenu linguiste, de façon bizarre quand même. Harris opérait aussi de façon très formalisée. Ça me convenait très bien. P.E. Mais Harris était matheux de formation. M.G. Non, il était tenté par les maths, une petite affection. Il y avait plusieurs projets. Il m'a offert d'essayer de formaliser et c'est pour cela qu'il m'avait invité; pour essayer de formaliser un peu plus ce qu'il faisait; en fait, j'étais spécialiste des grammaires formelles. J.-C.C. Parce qu'il n'avait pas autour de lui des américains ? P.E. Il n'avait pas d'éléves ? M.G. Il n'en avait pas. C'était pire que cela: il les évitait. Il avait des étudiants inscrits; mais il ne voulait pas les voir. Moi, il me voyait très souvent. P.E. A ton avis, pourquoi cette attitude ? M.G. C'était comme ça; je ne sais pas. C'est curieux. P.E. Il avait des amis ? M.G. Oui, beaucoup. Il connaissait toute une élite intellectuelle newyorkaise. P.E. Il avait été de gauche... M.G. Sérieusement de gauche. P.E. Il avait été au parti communiste américain comme Labov ?
ENTRETIEN AVEC MAURICE GROSS
7
M.G. P.E.
Je ne sais pas. Plutôt trotzkyste. Et il connaissait très bien Goodmann. Mais moment-là, Maurice, tu apprends toute la linguistique, compris la phonologic M.G. Un petit peu de phonologie; et même pas mal. Quand j'ai travaillé sur les temps du verbe français, il avait des problèmes qui m'ont fait regarder la phonologie. P.E. Il ne parlait jamais de sémantique ? M.G. Non. P.E. C'était vraiment la tradition de Bloomfield. Pas de sémantique; de la syntaxe. M.G. Oui. Et le discours. J'en entendais parier. Et je m'y intéressais. J.-C.C. Tu as commencé a préparer le bouquin, qui sera d'abord une thèse américaine ? M.G. Oui, c'était le projet. Ce devait être un PhD américain. J'étais inscrit; mais il fallait deux ans. P.E. Mais la comparaison français-anglais a été écrite en français ou en anglais ? M.G. En français. C'est un peu plus tard. J'ai fait ça dans une école d'été de linguistique, a Los Angeles. C'est la Comparaison qui est devenue mon Troisième Cycle en France. En Pennsylvanie, je préparais la Grammaire transformationnelle du français, qui a été écrite en anglais. C'était un rapport de l'Université de Pennsylvanie. P.E. A la fin de l'année 64-65, tu reviens en France ? M.G. Non. Je m'étais marié et il a fallu que je gagne ma vie. Au CNRS, ce n'était pas suffisant pour deux. Je prends un job ä Genève, a l'OMS. Un job d'informaticien. J'étais toxicologue. » Une opportunité, comme on dit, en 1966-67: un poste d'enseignant associé a la Faculté d'Aix-en-Provence. Et cette fois, il vit avec des linguistes, comparatistes et philologues. Le professeur est un linguiste d'une qualité exceptionnelle: Jean Stefanini. Qui s'instruit dans les grammaires formelles et apporte sa connaissance du français et de l'histoire de la langue. Inversement, les liens avec l'autre profes seur, Mounin, ne s'établiront pas. D'autant plus que Martinet, maître de Mounin, est de plus en plus hostile a la « linguistique d'ingénieurs ». En même temps, il rencontre Culioli et peut discuter avec lui. Paradoxalement, mais logiquement, Gross se retrouve du coté de ceux que passionnent la langue et ses organisations les plus délicates marquées dans les « bons exemples ». Il importe de produire une Thèse d'État qui lui ouvrira une carrière de professeur. Les choses iront très vite. Il reprend ce qu'il avait esquissé á Los Angeles (et discuté avec Kuroda): une comparaison des complétives en français et en anglais, et élargit. Il confronte ses résultats avec le travail sur les complétives que vient de publier Rosenbaum. Les tables avaient été commencées a l'Université de Pennsylvanie. Reste a accumuler, vérifier. Et ce sera la soutenance.
8
JEAN-CLAUDE CHEVALIER
Pour l'été 1967, Culioli organise á Nancy le 3 eme Séminaire d'été de l'Associa tion de Linguistique Appliquée (après Besançon et Grenoble). Pour être enseignés, 250 inscrits; pour enseigner, le trio Bresson-Culioli-Grize; les linguistes: Ruwet, qui vient de soutenir sa thèse a Liège et la publie en livre, Gross évidemment, les agrégés convertís, Jean Dubois et Jean-Claude Chevalier, les confé renciers Tatiana Cazacu ou Th. Sebeok, d'autres. Une atmosphère d'exaltation et d'enthousiasme: l'avenir est aux grammaires formelles et a la linguistique. On sort, on danse, on arrose au whisky, on va á la piscine. Gross un jour dit: « Aux États-Unis, on pourrait proposer toute cette organisation pour monter un Centre d'Etudes dans une Université. On l'aurait en trois mois.» Quand, fin 1968, le ministre E. Faure organisera une Université Expérimentale a Vincennes, avec une unité de pilotage où figurent Barthes, Todorov, Gross et d'autres, Gross saura s'en souvenir. Le Centre s'ouvrira en janvier 1969, avec un Département de linguis tique animé par le quatuor Chevalier-Dubois-Gross-Ruwet et des américains comme S. Schane et J. Mehler. Début pour Gross d'une très grande carrière, d'autant plus qu'il double le poste universitaire par l'élargissement du LADL (rue du Maroc, dépendant de Blaise-Pascal), pour lequel il commence tout de suite des recrutements. ***
Quelques remarques terminales pour entrer dans une épistémologie 1. Intérêt du mode de ¡Interview pour marquer les points forts d'une formation Si Ton inventorie les lectures de Maurice Gross, on voit qu'elles recouvrent un champ très vaste. Ses lectures étaient celles d'un autodidacte, orientées par le souci de la traduction automatique de textes militaires. Elles se portaient donc en premier vers les structures morphosyntaxiques, même si la quête se montrait fort peu fructueuse. Mais le canal des traducteurs dans lequel il est entré restreint très rapidement le champ: d'abord vers le formalisme tel qu'il est pratiqué par les anglo-saxons et surtout au MIT, puis vers des inventaires plus systématiques, tels que devait les pratiquer un traducteur, et 'est la grammaire de Harris qui devient un modèle. Le récit autobiographique permet de décrire cet itinéraire stratégique, mais encore plus de dégager les points forts. Dans le récit de Gross, on voit s'articuler quelques ouvrages de base qui servent de pivot a la réflexion et interviennent pour ordonner le champ (ainsi Language de L. Bloomfield ou la Syntaxe structurale de Tesnière), avec un ensemble de recherches mises a la disposition des boursiers dans les centres de recherche comme les travaux de Chomsky, Halle, Schützenberger, etc.
ENTRETIEN AVEC MAURICE GROSS
9
2. Cette recherche suppose qu'existent des supports institutionnels Ils sont provoqués par l'explosion scientifique de l'après-guerre. Celle-ci se marquera particulièrement dans le développement du CNRS et d'unites scientifiques puissantes comme le Centre Blaise-Pascal, le Centre de Linguistique Quan titative ou l'Institut Henri-Poincaré, centres qui, selon une vieille tradition mathématique dont le caractère va s'accentuant, s'intéressent au fonctionnement du langage. En outre: 1) Un Système de colloques et conférences permet de se découvrir des pairs et la possibilité de bourses qui conduisent a des recherches approfondies. 2) En second lieu, mais de façon bien plus faible, existent de petits groupes de recherche qui s'étaient constitués en France depuis 1960 pour pallier les blocages de la machine universitaire. En ce qui concerne M. Gross, ces groupes lui seront peu utiles parce qu'il possède des voies et moyens beaucoup plus puissants. En France, il s'installera a l'Institut Henri-Poincaré, fera un notable parcours comme attaché au CNRS, mais ne fréquentera ni le groupe de Marcel Cohen, ni la SELF, ni les colloques de Besançon, bien que certains collègues de son milieu assurent la liaison (comme le capitaine Moreau, qui faisait des cours de statistique, utiles dans tous les milieux). 'est seulement quand il sera parvenu a une certaine notoriété que Gross les fréquentera, mais à titre d'invité (SELF, colloque de l'AFLA, etc.). Il faut donc prendre en compte non seulement la fondation des institutions, mais aussi leur spécialisation et même leur hiérarchisation. Ce dispositif institutionnel, croisé avec les préoccupations de M. Gross, permet de saisir 1'organisation théorique de son oeuvre. Elle est fondée sur un Système de recensements étendus définis par un Système formel: la rencontre avec Z. Harris est donc déterminante et la démarche de Gross s'opérera pendant un an en sym biose avec Harris. Système fermé qui ne se préoccupe pas d'épistémologie: le métier de traducteur ne conduit pas á une réflexion de cet ordre; et d'ailleurs, dans le domaine, la réflexion épistémologique est fort peu développée. D'autres s'en chargeront a la marge. On remarquera pourtant que la rencontre avec Y. Kuroda en Californie, qui se perpétuera dans une longue amitié, est le signe et la marque d'une curiosité dépassant largement les compilations, d'une ouverture d'esprit qui sera un des traits de l'épistémè de Gross. 3) Le positionnement politique n'apparait chez Gross que comme un horizon, mais important néanmoins. Si, en France, les prises de position politiques entrainent des conséquences directes et, en particulier, un clivage entre partisans et adversaires de la nouvelle linguistique qui correspond a peu près exactement au clivage: progressistes (actifs autant lors des événements d'Algérie que pour les tempêtes qui secouent les communistes et marxistes) / conservateurs (linguistes comparatistes et philologues), la causalité est d'un type différent aux États-Unis. Comme Chomsky, Harris est très marqué l'extrême gauche, très lié à des grou-
10
JEAN-CLAUDE CHEVALIER
puscules animés par des intellectuels; ce qui le conduira a fréquenter plus volontiers les milieux intellectuels new-yorkais que les universitaires de Philadelphie. Et lui donnera une grande liberté d'innovation scientifique et une grande indépendance d'esprit. Ses liens avec les kibboutz - dont Gross ne parle pas ici - assureront également une grande force d'innovation dans l'aventure de Z. Harris. 4) Démographie et développement scientifique: Tage des chercheurs et leur situation dans l'échelle des générations est un élément important de la constitution du savoir. La première génération des linguistes qui arrivent dans le champ après avoir passé les concours suivent deux cursus: ou bien, surtout quand ils sont normaliens (comme Culioli, Perrot, Lazard), ils entrent brillamment dans la carrière universitaire grâce à leur compétences comparatistes; ainsi Culioli est professeur a la Sorbonne au début des années 60. Les agrégés comme Dubois se sortent moins brillamment du travail de professeur de lycée et de travaux de bricolage lexicographique comme ceux qu'il poursuit chez Larousse, et émergent lentement. Ce qui conduit a un double inconvénient: - ces chercheurs, déjá savants réputés, sont écrasés par leurs taches universitaires (cours de philologie, copies, etc.) et, par là, disposent d'un temps restreint pour s'initier a la nouvelle linguistique; - d'autre part, ce sont des maitres confirmés: ils ont quelque difficulté a se lancer dans des entreprises hasardeuses qui risquent de compromettre leur réputation. Ils le feront par élèves interposés comme Culioli á TENS Ulm (role de Milner, qui va aux États-Unis quand Culioli est retenu a la Sorbonne). Gross n'a pas de réputation établie; il peut donc suivre un parcours original, jusqu'à ce qu'il ait trouvé la place qui lui permettra de déployer un Système qui tranche avec la plupart des travaux contemporains. L'affirmation d'un génie propre met donc en jeu des ensembles institutionnels autant que des situations dans le champ scientifique.
Références Pour une étude attentive des systèmes institutionnels, voir Traduction Automatique des longues, Spécial Trentenaire, 1992, Vol. 33, n° 1-2, et plus particulièrement: André Lentin, Naissance et premiers pas de l'ATALA: quelques souvenirs et quelques réflexions, p.7-24. Jacqueline Léon, De la traduction automatique a la linguistique computationnelle. Contribution a une chronologie des années 1959-1965, p. 25-44.
LE LEXIQUE-GRAMMAIRE DU GEEC MODERNE ANNA ANASTASSIADIS-SYMÉONIDIS Université Avistote de Thessaloniki
Introduction Les relations de l'équipe grecque avec le LADL ne datent que de 1987, quand, lors d'un séjour sabbatique à Paris, j'ai suivi de nouveau1 les séminaires de Maurice Gross a Paris 7. La conjoncture favorable, cette année-là, a été l'organisation des séminaires de linguistique grecque, qui, sous les auspices de M. Gross, réunissaient une quinzaine de jeunes linguistes grecs préparant a Paris leur thèse ou leur mémoire de D.E.A. et venant d'horizons théoriques très divers. Le débat fructueux qui suivait chaque exposé, dans une ambiance fraternelle, a sans aucun doute été profitable a la linguistique grecque. Certains exposés de ces ren contres ont fait l'objet d'une publication dans la série Mémoires du CERIL (n° 4). Mon retour en Grèce n'a pas arrêté ce courant d'échanges. M. Gross a été parmi les invités d'honneur du 9ème Congrès Mondial de Linguistique Appliquée, organisé en Grèce en 1990, et les participants des séminaires de linguistique grecque au LADL ont été incités a communiquer les résultats de leurs travaux aux rencontres annuelles de linguistique grecque, organisées par l'Université de Thessaloniki. Depuis, les Actes de ces rencontres constituent la tribune par excellence du Lexique-Grammaire en Grèce. Peu après, ces relations ont pris de l'ampleur, grace au projet ERASMUS/SOCRATES coordonné par l'Université de Thessaloniki, qui, depuis l'année universitaire 1991-1992, permet aux étudiants de poursuivre leurs études, comme boursiers, dans une des universités qui travaillent dans le cadre théorique du Lexique-Grammaire.2 Il est important de souligner que tous les jeunes chercheurs ont été recrutés parmi les étudiants boursiers, soit du projet ERASMUS/SOCRATES, soit de l'École d'été de la C.U.M. à Bari en 1991. Dans la même direction, le projet franco-grec « Platon » a permis aux étudiants grecs de suivre les séminaires organisés à Thessaloniki par les membres du LADL 1
Attirée par le titre Lexique-Grammaire, j'avais suivi pour la première fois les séminaires de Mau rice Gross á Paris 7 en 1981-1982. 2 Université de Thessaloniki, Paris 7, Paris 13, Université Autonome de Barcelone jusqu'en 1997, Université de Salerne jusqu'en 1998 et Université de Grenoble 3 depuis 1999.
12
ANNA ANASTASSÏADIS-SYMEONÏDIS
en 1992 et 1993, ainsi que de travailler, depuis 1999, sur le dictionnaire électronique fran9ais-grec. L'absence d'une description minutieuse, complète et explicite du grec est due avant tout, a mon avis, l'introduction tardive de l'enseignement de la linguistique synchronique en Grèce, qui ne date que de 1970, ainsi qu'à la nature du grec, une langue caractérisée, pour des raisons historiques, par de nombreux cas de variation linguistique. 'est pour cela qu'il m'a semblé que la théorie du Lexique-Grammaire représente le cadre adéquat pour la description d'une langue telle que le grec. Dans ce qui suit, je vais présenter brièvement les travaux sur le grec inscrits dans ce cadre théorique.
1. Description linguistique A part les problèmes de traduction et de linguistique contrastive, qui occupent la partie centrale de tous ces travaux, certains thèmes ont davantage inspiré les chercheurs grecs. Voici les principaux. 1.1. La morphologie flexionnelle et dérivationnelle Le grec, langue à flexion en genre, en nombre et en cas, possède, ä cause aussi des cas de variation linguistique mentionnés ci-dessus, une morphologie plus développée qu'une langue comme le français. Dans sa thèse (1990d), T. Kyriacopoulou décrit, avec une minutie remarquable, le Système de conjugaison de 8 000 verbes l'aide de 508 tableaux de conjugaison. Dans Kyriacopoulou (1992a) est présenté le dictionnaire électronique de 10 000 verbes, qui permet la génération automatique de plus de 500 000 formes. E. Sklavounou (1997b, 1999c) a construit le dictionnaire morphologique des noms (53 800), adjectifs (35 500), pronoms et déterminants du grec, qui constitue l'outil de base de l'interface du traitement automatique des textes INTEX. I. Thilikos (2000), après avoir déterminé les cas d'ambiguítés des formes nominales et adjectivales imputables a la flexion, propose, pour leur désambiguïsation, des règles syntaxiques régissant le groupe nominal. En ce qui concerne la morphologie dérivationnelle, E. Sklavounou (1994a, 1995a,b, 1996, 1997a,c, 1999a,b) aborde, avec une minutie exemplaire, les pro blèmes que posent les adjectifs morphologiquement liés á des substantifs, en décrivant leurs propriétés syntaxiques, elles-mêmes liées a des variations sémantiques. 1.2. Les noms composés (NC) Dans ce domaine, voici les travaux: A. Anastassiadis-Syméonidis (1994) présente des cas d'asymétrie lexicale et structurelle entre les composés du type AN
LE LEXIQUE-GRAMMAIRE DU GREC MODERNE
13
(adjectif-nom) en français et en grec, ainsi que les indices de figement, qui permettent de distinguer les composés AN des séquences libres de même struc ture. Enfin, elle propose de représenter les multiples variantes par des automates finis. S. Panayotopoulou (1992) présente les propriétés distributionnelles des AN, dont 4 000 appartiennent au vocabulaire général et 1 500 au vocabulaire de la médecine, ainsi que la structure des entrées du dictionnaire électronique des noms composés du type AN. Le travail de A. Anastassiadis-Syméonidis, T. Kyriacopoulou, E. Sklavounou, I. Thilikos, R. Voskaki (2000) constitue une contribution au développement de la version grecque du système INTEX, illustrée par la représentation par graphes des composés du type AN. E. Sklavounou (1993) construit, dans une étude originale, des tables trilingues (grec-fran9ais-anglais) des noms composés appartenant ä trois classes (AN, NNgénitif, NNrelative) et représente par des automates finis les NC les plus productifs. Z. Gavriilidou (1994a, 1994c, 1996, 1997a-b) étudie les noms composés du type NN en grec et en français, d'un point de vue morphosyntaxique et sémantique. Dans sa thèse remarquable (1997c), elle procède à l'analyse syntaxique et pragmatico-sémantique de ces NN. Dans Gavriilidou (1995a-b) sont étudiées les suites NN métaphoriques en grec et en français, et dans (1998b) les compléments de nom intensifs en grec. Enfin, dans (1998c et 1999), est proposée une forme du dictionnaire électronique des composés NN en grec. 1.3. Les expressions figées Dans ce domaine, nous avons les travaux de A. Fotopoulou et de A. Moustaki. Fotopoulou (1985, 1989a, 1990a,b, 1991, 1993b, 1997) s'occupe des divers as pects concernant les phrases figées. Dans sa thèse remarquable (1993a), elle pro cede au classement de 4 500 phrases figées et décrit leurs propriétés distribu tionnelles et transformationnelles, dont l'association a donné des informations originales sur la distinction entre adverbes et compléments de même structure, sur l'ordre des mots, les pronominalisations, ainsi que sur la relation entre passif et complément libre pronominalisable. Dans Fotopoulou (1993c), l'auteur analyse les compléments au génitif des phrases figées l'aide de trois tests, qui lui per mettent d'aboutir à deux classes plus homogénes. Moustaki (1990a, 1992a,b,c, 1993) traite les problèmes que posent 2 200 ex pressions prépositionnelles figées construites autour de eimai « être », par exemple leur classification, les critères servant a distinguer les phrases figées des phrases libres et ceux qui servent a mesurer le degré de figement, les variantes aspectuelles de eimai (inchoatif, statique, duratif, terminatif) ou stylistiques, ainsi que les verbes operateurs de eimai. Dans sa thèse exemplaire (1998), Moustaki présente une analyse affinée de ces expressions figées, qui pourra rendre de
14
ANNA ANASTASSIADIS-SYMEONIDIS
grands services á la construction du dictionnaire électronique grec-français et ä la traduction automatique. 1.4. Les supports Six chercheurs s'occupent de ce que l'on a appelé, dans le Lexique-Grammaire, les "verbes-supports": A. Fotopoulou, A. Giannakopoulou, S. Théodorou, A. Moustaki et E. Lambrou. E. Sklavounou étudie des verbes et des noms supports. A. Fotopoulou (1989b), dans une perspective contrastive entre le français et le grec, fait des remarques intéressantes sur les déterminants, après examen des rela tions entre les verbes supports eho « avoir », eimai « être » et kano « faire », et des verbes considérés comme leurs variantes aspectuelles. En travaillant sur le Vsup eho « avoir », A. Giannakopoulou (1991), a partir d'une liste de 600 substantifs, dresse quatre tables a l'aide des critères suivants: la présence d'un complément, la qualité obligatoire du complément et sa nature (prépositionnel ou phrastique). S. Théodorou (1992) présente six structures verbales nominalisées (substantifs prédicatifs déverbaux) á l'aide du Vsup « faire ». A. Moustaki (1997b), en examinant, de façon contrastive, les transformations, les prépositions et l'aspect dans les phrases libres construites autour de eimai/être, met en lumière des tendances des langues romanes et des particularités du grec. Voir aussi les autres travaux de Moustaki présentés dans la section 1.3. E. Lamprou (1997) étudie les verbes supports du grec a partir du nom prédicatif qui est responsable de leur sélection, en appliquant la théorie des classes d'objets. E. Sklavounou (1994b) détecte, dans une perspective trilingue (anglais, fran ais, grec), dans le vocabulaire spécialisé du tennis, les composés du type AN et ceux du type NNgénitif, au moyen de noms supports et, dans (1994c), elle traite les verbes supports de ce même vocabulaire du tennis. 1.5. D 'autres classes L'étude des classes verbales porte sur les verbes psychologiques et les verbes de mouvement et de communication. L'étude de l'adverbe concerne les adverbes figés ainsi que la distinction entre adverbe de verbe et adverbe de phrase. Parmi les conjonctions, ont été étudiées les locutions conjonctives finales. Enfin les déterminants nominaux figés ainsi que les proverbes ont fait aussi objet d'études. J. Antoniou (1984) étudie la classe des verbes psychologiques et examine une vingtaine de leurs propriétés syntaxiques. T. Kyriacopoulou (1989) examine les verbes de mouvement et les verbes de communication, en insistant sur le critère syntaxique du mode, qui délimite des classes syntaxiquement mais aussi sémantiquement homogène. M. Pantazara (sous presse) traite la classe des verbes symétriques (intransitifs a
LE LEXIQUE-GRAMMAIRE DU GREC MODERNE
15
un complément prépositionnel), en étudiant pour chaque verbe, par le biais des transformations, les formes nominales et adjectivales qui lui sont morphologiquement apparentées. A. Moustaki (1995a) dresse le Lexique-Grammaire de 800 adverbes figés du grec, tandis que, dans A. Moustaki (1995b), à l'aide de la théorie de la coréférence, est examinée la distinction entre phrases simples et phrases complexes, pour donner une forme cohérente aux entrées du Lexique-Grammaire. Z. Gavriilidou (1994b) traite des locutions conjonctives finales en grec, dans son article (sous presse ) est présenté en prospection le dictionnaire électronique des proverbes du grec, et dans d'autres articles (1998a, Buvet et al 1999 et sous presse e) les déterminants figés en grec, en français et en espagnol. M. Pantazara (1994) présente l'analyse morphosyntaxique et sémantique des expressions de temps (adverbes temporels, compléments circonstanciels et propo sitions circonstancielles ainsi que leurs verbes supports). L'interprétation séman tique est fondée sur les catégories de date, de durée et de répétition. Des remar ques intéressantes sont faites sur l'emploi des temps verbaux et leur combinatoire avec les adverbes temporels. M. Pantazara (1994) aborde les conjonctions temporelles, en étudiant leurs propriétés distributionnelles et transformationnelles et, dans une perspective unitaire, a partir de l'emploi conjonctif sont dérivés les autres emplois, prépositionnel et adverbial. A. Fotopoulou (a paraitre) traite du génitif-datif. 1.6. Le dictionnaire inverse A. Anastassiadis-Syméonidis (article sous presse), avec l'aide de E. Sklavounou et al a construit, à l'exemple du Dictionnaire Inverse du LADL, un dictionnaire électronique inverse du grec de 180 000 entrées, où chacune est accompagnée de sa catégorie grammaticale. Voir aussi A. Anastassiadis-Syméonidis et E. Sklavou nou (1997). 1.7. Vocabulaires de spécialité E. Sklavounou (1993, 1994 b,c) décrit les noms composés du vocabulaire du tennis en trois langues (cf. 1.4.). A. Moustaki (sous presse a) décrit la syntaxe du verbe dans des textes de droit, de médecine, de la banque et de l'hôtellerie, pour contribuer a la construction des dictionnaires électroniques de ces langues de spécialité, ainsi qu'à leur enseignement. A. Moustaki (sous presse b) a rédigé un dictionnaire bilingue grec-fran9ais de 1000 phrases élémentaires du vocabulaire du football, ainsi qu'un dictionnaire bilingue grec-français des 32 classes d'objets du même vocabulaire.
16
ANNA ANASTASSIADIS-SYMEONIDIS
1.8. Enseignement/apprentissage du FLE et du grc langue maternelle/étrangère A. Moustaki (1997a) décrit 5 000 phrases libres avec eimai « être », dont les noms-têtes sont classés sous un hyperonyme, dans le but de construire la grammaire des fautes de traduction du grec en fran9ais. Dans Moustaki (1999), elle procède à l'étude contrastive du grec et du français dans le champ de la synonymic Cf. aussi Moustaki (1993 et sous presse a). Z. Gavriilidou (1999, sous presse a et b) aborde des questions concernant l'enseignement du vocabulaire du grec en tant que langue maternelle ou étrangère. E. Sklavounou, dans toute son oeuvre, est préoccupée de problèmes de traduction et d'enseignement d'une langue étrangère.
2. Perspectives Les travaux en cours couvrent un répertoire thématique assez large, tel que l'intégration des 12 000 verbes dans le système INTEX, le dictionnaire électronique des noms composés de type AN et NN, les noms déverbaux autour de kano « être », les proverbes, ainsi que des problèmes de désambiguïsation. Pourtant, il reste encore beaucoup a faire pour le Lexique-Grammaire du grec moderne: i) tout d'abord, en ce qui concerne les sujets déjà traités, comme la flexion, il faut en assurer une couverture comparable a celle du français, pour prétendre a un traitement automatique, par exemple en traduction. Il faut aussi étendre la descrip tion par automates l'exemple de E. Sklavounou, a qui revient le mérite de les avoir, la première, appliqués au grec. ii) ensuite, il y a aussi des sujets qui n'ont pas été traités du tout, comme les locatifs, les adverbes ou les conjonctions, mis à part les adverbes et les conjonc tions de temps. Pour remédier a cette situation, il faut intensifier les efforts en élargissant l'équipe de Thessaloniki et en en implantant d'autres au sein des universités grecques. Le projet ERASMUS /SOCRATES et d'autres projets communautaires s'avèrent indispensables pour atteindre cet objectif, car l'elaboration du LexiqueGrammaire du grec servira non seulement la linguistique théorique mais aussi la linguistique appliquée, puisqu'il y aura ainsi des conséquences pratiques liées au traitement automatique, à la traduction en général et ä Penseignement et a l'apprentissage du grec.
LE LEXIQUE-GRAMMAIRE DU GREC MODERNE
17
Références Anastassiadis-Syméonidis, Anna. 1994. Les composés du type AN en grec moderne. Lingua Franca 1, Schena Editore. Anastassiadis-Syméonidis, Anna; Elsa Sklavounou. 1997. Le Dictionnaire Inverse électronique du grec moderne. In Langue grecque et terminologie, Actes du 1er Colloque. Athènes: ELETO. Anastassiadis-Syméonidis, Anna (sous presse). Dictionnaire Inverse du grec moderne. Thessaloniki: Institut d'Études Néohelléniques. Anastassiadis-Syméonidis, Anna; Tita Kyriacopoulou; Elsa Sklavounou; Iasonas Thilikos; Rania Voskaki. 2000. A System for analysing texts in Modern Greek: Representing and solving ambiguities. Computational Lexicography and Multi media Dictionaries, COMPLEX 2000, Patras: Université de Patras. Antoniou, Jeanne. 1984. Syntaxe et métaphore des verbes psychologiques en grec. Thèse de doctorat de 3e cycle, Université Paris 7. Buvet Pierre-Andre; Xavier Blanco; Gavriilidou Zoé. 1999. Analyse comparée des modifieurs figés en grec moderne, fran9ais, espagnol. Vers un dictionnaire électronique. Studies in Greek Linguistics 20, Thessaloniki. Fotopoulou, Aggeliki. 1985. Les expressions figées en grec moderne. D.E.A., Université Paris 7. Fotopoulou, Aggeliki. 1989a. Classification des phrases figées en grec moderne: analyse morphosyntaxique des expressions á un complément. Studies in Greek Linguistics 9, Thessaloniki: Kyriakidis. Fotopoulou, Aggeliki. 1989b. Étude comparative des extensions aspectuelles des verbes supports 'avoir/eho' 'être/eimai Prép' et 'faire/kano' en français et en grec moderne. Mémoires du CERIL 4, Université Paris 7. Fotopoulou, Aggeliki. 1990a. Classification des phrases figées ayant un complé ment libre. Problèmes liés aux compléments 'datifs'. Studies in Greek Linguistics 10, Supplement, Thessaloniki: Kyriakidis. Fotopoulou, Aggeliki. 1990b. Lexique-Grammaire du grec moderne. Classifica tion des phrases simples à arguments figés: le cas des compléments prépositionnels. AILA '90-Grèce, Proceedings. Fotopoulou, Aggeliki. 1991. Compléments prépositionnels figés - adverbes figés: critères de distinction, Mémoires du CERIL, Université Paris 7. Fotopoulou, Aggeliki. 1992. Dictionnaires électroniques des phrases figées; traitement d'un cas particulier: phrases figées-phrases a Vsup. Complex '92 -Papers in Computational Lexicography, Budapest. Fotopoulou, Aggeliki. 1993a. Une classification des phrases ä compléments figés en grec moderne - Etude morphosyntaxique des phrases figées. Thèse de Doc torat, 2 vol., Université Paris 8. Fotopoulou, Aggeliki. 1993b. Analyse des constituants des phrases figées. Remar ques concernant leur classement. Studies in Greek Linguistics 14. Thessaloniki. Fotopoulou, Aggeliki. 1993c. Traitement du cas génitif dans une classification des
18
ANNA ANASTASSIADIS-SYMEONIDIS
phrases á compléments figés du grec moderne. Lingvisticœ Investigationes XVII: 2, Amsterdam: Benjamins. Fotopoulou, Aggeliki. 1997. L'ordre des mots dans les phrases figées a un com plément libre en grec moderne. La locution: entre lexique, syntaxe et pragmatique, Paris: Klincksieck. Fotopoulou, Aggeliki. (a paraître). Une première approche des constructions datives en grec moderne: la nature du génitif-datif. Lingvisticce Investigationes XXIV, Amsterdam: Benjamins. Gavriilidou, Zoé. 1994a. Les noms composés du type NN en grec moderne. Mémoire de maîtrise. Paris: LLI, Université Paris 13. Gavriilidou, Zoé. 1994b. Les locutions conjonctives finales en grec moderne. Rapport interne. Paris: LLI, Université Paris 13. Gavriilidou, Zoé. 1994c. Les composés du type NN au même cas. Studies in Greek Linguistics 15, Thessaloniki. Gavriilidou, Zoé. 1995a. Remarques syntaxiques et sémantiques sur la formation néologique des suites métaphoriques du type NN au même cas. Studies in Greek Linguistics 16, Thessaloniki. Gavriilidou, Zoé. 1995b. Etude comparative des suites binominales NN métaphoriques en français et en grec. D.E.A, Université Paris 13. Gavriilidou, Zoé. 1996. Les composés NN à premier composant le mot komme- et femme- en grec. Studies in Greek Linguistics 17, Thessaloniki. Gavriilidou, Zoé. 1997a. Les composés NN: Dénomination et désignation. Studies in Greek Linguistics 18, Thessaloniki. Gavriilidou, Zoé. 1997b. Besoin d'une classification des suites NN. Bulletin de Linguistique Appliquée et Générale, n° spécial. Gavriilidou, Zoé. 1997c. Étude comparée des suites NN en français et en grec. Elaboration d'un lexique bilingue. Thèse de Doctorat: Université París 13, Lille: Septentrion. Gavriilidou, Zoé. 1998a. Les déterminants nominaux figés en grec moderne. Une première approche. Actes des Premières Rencontres Linguistiques Méditerranéennes - Le Figement lexical, Tunis. Gavriilidou, Zoé. 1998b. Un cas de figement: les compléments du nom intensifs en grec moderne. Etude comparée grec-français-espagnol, BULAG 23, Besançon. Gavriilidou, Zoé. 1998c. Forme d'un dictionnaire électronique des suites NN en grec. Terminologie et Traduction 1. Luxembourg: Commission Européenne. Gavriilidou, Zoé. 1999. Le dictionnaire électronique des suites NN. Actes du colloque panhellénique 'Informatique et enseignement ', Jannina. Gavriilidou, Zoé (sous presse a). L'enrichissement du vocabulaire au moyen des classes d'objets. Actes de la 3e journée d'études sur le grec. Alexandroupolis: Université de Thrace. Gavriilidou, Zoé (sous presse b). Usage du dictionnaire á Tage préscolaire. Actes de la journée d'études "Lexicographic pour enfants et usage du dictionnaire a
LE LEXIQUE-GRAMMAIRE DU GREC MODERNE
19
l 'age préscolaire ", Université de Thrace. Gavriilidou, Zoé (sous presse ). Le Lexique-Grammaire des proverbes. Actes du 4e Congrès international de linguistique grecque, Nicosie-Chypre. Gavriilidou, Zoé (sous presse d). Le droit d'utiliser la langue maternelle comme condition pour apprendre une langue seconde. Actes du Colloque panhellénique 'Le traité des droits des enfants ', Athènes: Ellinika Grammata. Gavriilidou, Zoé. (2001). Structures Dét N1 N2 et Détermination figée. In Détermination et focalisation, Lingvisticæ Investigationes Supplementa 23, Amsterdam: John Benjamins. Gavriilidou, Zoé; Angeliki Euthymiou. 1999. Enseignement des composés à la maternelle. Actes du Colloque panhellénique 'La recherche a l'enseignement préscolaire', Rethymnon: Université de Crète. Giannakopoulou, A. Le verbe support 'avoir' en grec moderne. Mémoire de D.E.A.. Paris: Université Paris 7. Kyriacopoulou, Tita. 1989a. Le Lexique-Grammaire, les verbes de mouvement et les verbes de communication. Studies in Greek Linguistics 9, Thessaloniki: Kyriakidis. Kyriacopoulou, Tita. 1989b. Lexique-Grammaire: classification générale des verbes. Mémoires du CERIL 4, Paris: Université Paris 7. Kyriacopoulou, Tita. 1989c. Conjugaison des verbes: Version 0. Mémoires du CERIL, Paris: Université Paris 7. Kyriacopoulou, Tita. 1990a. Les dictionnaires électroniques - La flexion verbale: présentation générale. Studies in Greek Linguistics 10, Thessaloniki: Kyria kidis. Kyriacopoulou, Tita. 1990b. Les dictionnaires électroniques - Morphologie et syntaxe. Le cas du grec moderne. AILA'90-Greece, Proceedings. Thessaloniki: University Studio Press. Kyriacopoulou, Tita. 1990c. La structure du verbe grec - Faits linguistiques. Stu dies in Greek Linguistics 10, Supplément, Thessaloniki: Kyriakidis. Kyriacopoulou, Tita. 1990d. Les dictionnaires électroniques - La flexion verba le en grec moderne. Thèse de Doctorat, 2 vol., Université Paris 8. Kyriacopoulou, Tita. 1991. Les dictionnaires électroniques: le phénomène de la défectivité. Mémoires du CERIL, Paris: Université Paris 7. Kyriacopoulou, Tita. 1992a. Le traitement automatique de la flexion verbale en grec. Studies in Greek Linguistics 12, Thessaloniki: Aristotle University of Thessaloniki. Kyriacopoulou, Tita. 1992b. Le traitement automatique du grec. Actes du Sympo sium International sur le grec contemporain (Sorbonne, 14-15 février 1992), Athènes: OEDV. Kyriacopoulou, Tita. 1995. Les automates traducteurs. En bons termes, Paris: La Maison du Dictionnaire. Kyriacopoulou, Tita. 1997. Traduction et Informatique. En bons termes, Paris: La Maison du Dictionnaire.
20
ANNA ANASTASSIADIS-SYMEONIDIS
Kyriacopoulou, Tita. 2000a. Problèmes de traduction en Traitement Automatique du Langage Naturel (TALN). Journées thématiques en traduction, Athènes. Kyriacopoulou, Tita. 2000b. La structuration des bases terminologiques. Actes du Colloque International 'Traduction humaine, traduction automatique, inter prétation ', Tunisie. Kyriacopoulou, Tita (sous presse). Une expérience d'enseignement par visiocentre. A ILA '99, Thessaloniki. Lamprou, Efi. 1997. Les verbes supports en frangais et en grec. D.E.A. Paris: Université Paris 13. Lamprou, Efi. 1999. La variation sémantique des verbes supports. Studies in Greek Linguistics 20, Thessaloniki: Aristotle University of Thessaloniki. Moustaki, Argyro. 1990a. Les expressions figées No eimai Prép XW en grec moderne. D.E.A., Université Paris 3. Moustaki, Argyro. 1990b. Les expressions figées en eimai Prép XW en grec moderne, Mémoires du CERIL 1, Paris: Université Paris 7. Moustaki, Argyro. 1992a. Les expressions figées prépositionnelles avec le verbe eimai (être) en grec moderne. Élements de distribution. Studies in Greek Linguistics 12, Thessaloniki: Aristotle University of Thessaloniki. Moustaki, Argyro. 1992b. Le verbe support eimai et les verbes substituís de eimai dans les phrases figées en grec moderne. Studies in Greek Linguistics 13, Thessaloniki: Aristotle University of Thessaloniki. Moustaki, Argyro. 1992c. Variantes et opérateurs de eimai/être dans les expres sions figées du grec moderne. Actes du XVe Congrès des linguistes. Québec: Université Laval. Moustaki, Argyro. 1993. Le Lexique-Grammaire des expressions idiomatiques avec le verbe eimai (être) en grec moderne. Studies in Greek Linguistics 14, Thessaloniki: Aristotle University of Thessaloniki. Moustaki, Argyro. 1995a. Le Lexique-Grammaire des adverbes figés du grec moderne. Actes du 14e Colloque 'Grammaires et Lexiques Comparés', TelAviv. Moustaki, Argyro. 1995b. Adverbe de verbe et adverbe de phrase. La théorie de coréférence. Studies in Greek Linguistics 15, Thessaloniki: Aristotle University of Thessaloniki. Moustaki, Argyro. 1997a. Expressions prépositionnelles de distribution libre avec l'auxiliaire eimai. Etude contrastive du grec et du français. Studies in Greek Linguistics 18, Thessaloniki: Aristotle University of Thessaloniki. Moustaki, Argyro. 1997b. Étude contrastive des expressions être Prép X en grec moderne et en français. Lingvisticœ Investigationes XXI:2, Amsterdam: Benjamins. Moustaki, Argyro. 1998. Les expressions figées eimai/être Prép en grec moder ne. Thèse de Doctorat: Université Paris 8, Lille: Septentrion. Moustaki, Argyro. 1999. Synonymie et classes d'objets. Étude contrastive des verbes dino/donner, pairno/prendre, kano/faire en grec et en français. Studies
LE LEXIQUE-GRAMMAIRE DU GREC MODERNE
21
in Greek Linguistics 19, Thessaloniki: Aristotle University of Thessaloniki. Moustaki, Argyro (sous presse a). Enseignement/apprentissage du français de spécialités. La théorie des classes d'objets. Actes du Se Congrès des professeurs de français, Université d'Athènes. Moustaki, Argyro (sous presse b). Un lexique-grammaire du football. Étude contrastive du grec moderne et du fran9ais. Lingvisticœ Investigationes, Amsterdam: John Benjamins. Panayotopoulou, Stella. 1992. Les noms composés du type Adjectif+Nom (AN) en grec moderne. D.E.A., Paris: Université Paris 8. Panayotopoulou, Stella. 1993. Les noms composés du type Adjectif+Nom (AN) en grec moderne. Mémoires du CERIL, Paris 7. Pantazara, Andromaque-Virginie. 1994. Les expressions de temps en grec moder ne. Mémoire de Maîtrise, Université Paris 8. Pantazara, Andromaque-Virginie. 1995. Les expressions de temps en grec moder ne. Les conjonctions temporelles. D.E.A., Université Paris 8. Pantazara, Andromaque-Virginie (sous presse). Les verbes intransitifs a un com plément prépositionnel du grec moderne. Première approche: les verbes symétriques. Studies in Greek Linguistics 21, Thessaloniki: Aristotle Univer sity of Thessaloniki. Sklavounou, Elsa. 1993. Un Lexique-Grammaire trilingue de noms composés (grec-franqais-anglais) - Application au vocabulaire spécialisé du tennis D.E.A., 2 vol., Paris: Université Paris 8. Sklavounou, Elsa. 1994a. Nominalisation d'adjectifs en grec moderne et en français. Constructions a sujet phrastique. Actes du 13e Colloque 'Grammaires et Lexiques Comparés', La Londe-les-Maures (France). Sklavounou, Elsa. 1994b. Lexicon-Grammar of Compound nouns: Support nouns - Application on the special lexicon of tennis. Proceedings of the 1st Interna tional Conference on Greek Linguistics, University of Reading. Sklavounou, Elsa. 1994c. Les verbes supports du vocabulaire spécialisé du tennis. D.E.A., Université de Thessaloniki. Sklavounou, Elsa. 1995a. Adjectival Constructions with appropriate Nouns, NO=:Nhum. Proceedings of the 2nd International Conference on Greek Linguistics, University of Salzburg. Sklavounou, Elsa. 1995b. Un exemple de représentation lexicale et d'élaboration ä l'aide des automates finis. Studies in Greek Linguistics 15, Thessaloniki: Aristotle University of Thessaloniki. Sklavounou, Elsa. 1996. Les constructions adjectivales ä Noms Appropriés en grec moderne, N0=:N-hum. Studies in Greek Linguistics 16, Thessaloniki: Aristotle University of Thessaloniki. Sklavounou, Elsa. 1997a. Classification syntaxique des constructions de la nominalisation de l'adjectif. Studies in Greek Linguistics 17, Thessaloniki: Aristotle University of Thessaloniki. Sklavounou, Elsa. 1997b. Les classes de déclinaison des noms et des adjectifs en
22
ANNA ANASTASSIADIS-SYMEONIDIS
grec moderne. Actes du 16e Colloque 'Grammaires et le Lexiques Comparés', Louvain-la-Neuve. Sklavounou, Elsa. 1997c. Étude comparée de la nominalisation d'adjectifs en grec moderne et en frangais, Thèse de Doctorat: Université Paris 8. Sklavounou, Elsa. 1997d. La grammaire d'un lexique spécialisé. Langue grecque et terminologie - Actes du 1er Colloque, Athènes: ELETO. Sklavounou, Elsa. 1998. Une construction adjectivale porteuse de modalité en grec moderne. Studies in Greek Linguistics 18, Thessaloniki: Aristotle University of Thessaloniki. Sklavounou, Elsa. 1999a. Les Constructions adjectivales a sujet phrastique en grec moderne et en français. Langages 133, Paris: Larousse. Sklavounou, Elsa. 1999b. Les adjectifs du grec moderne en -menos. Studies in Greek Linguistics 20, Thessaloniki: Aristotle University of Thessaloniki. Sklavounou, Elsa. 1999c. Le dictionnaire morphologique électronique des noms et adjectifs en grec moderne. Studies in Greek Linguistics 19, Thessaloniki: Aristotle University of Thessaloniki. Théodorou, S. 1992. Le verbe support kano (faire) en grec moderne. D.E.A., Université Paris 13. Thilikos, Iasonas. 2000. Un Systeme d'analyse de textes grecs. Représentation et désambiguïsation. D.E.A., Université Aristote de Thessaloniki. Summary This text is a survey of works elaborated in the theoretical framework of the LexiconGrammar regarding Modern Greek. These works, numerous and varied, concern inflec tional morphology, compounds, fixed expressions, functional verbs and other classes like adverbs, conjunctive sentences, determiners or proverbs. The electronic dictionary of Greek is not ready yet, but it is quite far advanced. Mor phology is very well covered (12,000 verbs, 53,800 nouns and 35,500 adjectives) as well as the inverse dictionary (180,000 entries). These works regarding not only the general language but also languages for special purposes have a theoretical and also a practical interest for automatic translation and teaching of Greek as a mother or/and as a foreign language.
LEXIQUE-GRAMMAIRE ET EXTENSIONS LEXICALES NOTE SUR LE SEMI-FIGEMENT
ANTOINETTE BALIBAR-MRABTI Université de Picardie et LADL
Cette note1 est une rapide esquisse des problèmes qui se posent, a l'intérieur de la théorie du lexique-grammaire, lorsqu'on veut énumérer, dans les modèles, des unités lexicales dont le statut relève des notions encore largement programmatiques d'extension ou de variante. Le traitement des adjectifs en français, dont l'étude reste souvent difficile jour, nous fournira des exemples qui peuvent être éclairants.
1. Lexique-grammaire des adjectifs et dérivation des adverbes en -ment Quel est le traitement syntaxique de Paffixe adverbial -ment dans le lexiquegrammaire? Les descriptions par tables syntaxiques s'appuient sur la notion de nom opérateur approprié de phrase ou Ns, reprise ä Z. Harris (1976). En termes d'operateurs et d'arguments, le Ns agit entre un adjectif, Adj, et la phrase P à laquelle il s'applique. Ce qu'on peut représenter en notations préfixées par: (1)
((P) N) Adj
pour Ns =:fagon + manière
L'analyse repose sur des équivalences entre formes observables (constructions verbales et constructions adjectivales) du français (A. Balibar-Mrabti 1980, 1987) telles que: (2)
Léo répond sèchement Léo répond d'une (fagon + maniere) sèche La façon de répondre de Léo est sèche [Restruc] Léo est sec dans sa fagon de répondre La réponse de Léo est sèche [Restruc] Léo est sec dans sa réponse
auxquelles on ajoutera des phrases en avoir telles que:
Je remercie Christian Leclère etÉricLaporte pour leurs remarques amicales.
ANTOINETTE BALIBAR-MRABTI
24 (3)
Léo a une façon de répondre qui est sèche Léo a une réponse sèche
Façon, manière font partie des sujets phrastiques dans les constructions adjectivales. La formation de l'affixe, attestée en diachronie, est localisée a l'intérieur des groupes nominaux adverbiaux de manière des constructions verbales associées. En synchronie, -ment est la forme réduite des Ns, par supplétion de mente. A. Meunier (1981) montre que les Ns façon, manière interviennent dans la classification syntaxique des dérivations adjectif-nom au niveau le plus général: dans la répartition des sujets en sujets phrastiques et/ou sujets humains. Une conclusion: beaucoup de phrases simples supposent des phrases complexes.
2. Extensions lexicales des Nsfçn,manière Il existe des extensions lexicales des Ns façon, manière. On rattachera au bloc d'exemples (2)-(3) des phrases équivalentes telles que: (4)
Léo répond (de + sur + avec) un ton sec Le ton de (E + la réponse de) Léo est sec(he)
M. Gross (1977) et J. Giry-Schneider (1978) ont circonscrit cette notion dans les dérivations verbe-nom par verbes supports: (5)
Léo ressemble ä Luc Léo (a + accuse + présente) une ressemblance avec Luc Léo espère voyager Léo (a + berce) l'espoir de voyager
Avec les verbes supports (ou Vsup) et leurs extensions, on dispose d'une base syntaxique générale pour le traitement des substantifs prédicatifs. Les noms Sup portés indépendants de dérivations morphologiques observables, sont nombreux (G. Gross &R. Vivès 1986): (6)
Léo a une certaine (influence + emprise) sur Luc Léo (influence + *emprise) Luc
Même situation pour les formes en -ment, quand on considère les groupes nomi naux adverbiaux qui sont les formes généralisées des adverbes. Dans les correspondances, il existe des trous lexicaux, dans les deux sens. Ce sont des groupes nominaux adverbiaux de manière (désormais Advm) sans adverbe en -ment associé: (7)
Léo nous écoute d'une (façon + oreille) (attentive + inquiète) Léo nous écoute (attentivement + *inquiètement)
ou, inversement, des adverbes en -ment isolés: (8)
Léo a vendu chèrement sa vie * Léo a vendu sa vie d'une (façon + vente) chère
NOTE SUR LE SEMI-FIGEMENT
(9)
25
Léo a carrément mentí à Luc Léo a mentí ä Luc (*d'une façon carrée + * d'un mensonge carré)
Dans l'étude des constructions de manière, ces trous lexicaux font partie de la caractérisation des degrés de figement. Dans (8), chèrement appartient a une phrase entièrement figée. Dans (9), comme dans (7) ou dans (4), les Advm et leurs adverbes en -ment équivalents sont appliqués à des phrases libres. Les Advm formés avec des extensions sont très contraints. En particulier, les extensions, a la différence de façon, manière ne se construisent pas avec le verbe a la forme infinitive: (10)
* Le ton de répondre de Léo est sec * L 'oreille d'écouter de Léo est attentive
3. Le sens des extensions lexicales La notion d'extension lexicale ouvre la liste des Vsup à des verbes non vides qui jouent un rôle aspectuel dans l'interprétation des formes équivalentes en jeu. Avoir un espoir, comme forme équivalente du verbe espérer, est plus neutre que bercer un espoir, qui introduit une nuance durative. Qu'en est-il exactement a propos des Advm construits avec des extensions de Ns ? Ici, la recherche de régulantés de sens concerne la qualité du procès. L'élément d'interprétation le plus général pourrait être le haut degré, ce que I. l'uk (1992) a circonscrit avec sa fonction lexicale magnus. Les extensions de Vsup, comme celles de Ns, mettent en jeu des mécanismes métaphoriques. Par glissement de sens, du concret vers l'abstrait, on contrastera bercer un enfant avec bercer un espoir. Dans la construction verbale considérée, une combinaison verbe-nom ordinaire est étendue, par métaphore, a une combinaison plus contrainte, qui a le naturel d'un cliché. De façon similaire, pour les Advm, considérons les phrases: (11)
L 'oreille de Léo est rouge Léo a l'oreille rouge
Elles peuvent être mises en contraste avec les phrases suivantes: (12)
Léo a l'oreille attentive L 'oreille de Léo est attentive
qui interprètent la construction de manière donnée en (7): Léo nous écoute d'une oreille attentive Dans cet exemple, le nom oreille, combiné avec l'adjectif rouge, pris dans son sens concret d'adjectif de couleur, entre dans des phrases libres ordinaires. Combiné avec attentif, il fait cliché dans une interprétation psychologique abstraite. L'extension du Ns est un nom de partie du corps (ou Npc). Une discussion plus approfondie des relations entre métaphores et métonymies serait nécessaire pour
ANTOINETTE BALIBAR-MRABTI
26
justifier les choix terminologiques adoptés ici. Nous ne l'aborderons pas dans le cadre de cette note. Nous revenons sur métaphore, hypallage et figement au §5.
4. Listages et degré de figement Un en de préciser les extensions lexicales de façon, manière, consiste a partir du figement et a lister les combinaisons verbe-nom-adjectif en jeu. Ces listages sont une approche initiale qui demande a être raffinée. Les combinaisons, onl'vu, ont divers degrés de liberté, ce qui les place dans un continuum entre formes libres et figées. Considérons, de ce point de vue, VAdvm lexicalisé (de + avec) une voix blanche. On remarquera qu'il entre dans le bloc d'exemples suivants, qui sont des possibilités de variations pour (4) (e.g. au §2): (13)
Léo répond d'un(e) (manière +fagon + ton + voix) (sèc(he) + cordial(e) + dur(e)...) Léo répond (de + avec) sa (manière + voix) sèche (habituelle + qu 'on lui connaît bien...) Léo répond d' une voix blanche
Les variations observées mettent en jeu des dépendances entre déterminants et modifieurs qui ont été décrites dans les groupes nominaux a modifieurs d'unicité. Sous l'angle des distributions, ces Advm sont traditionnellement circonscrits par la notion de complément interne. On peut aussi remarquer que la cooccurrence joue a l'intérieur de champs lexicaux, ou domaines sémantiques délimités a posteriori: Npc, gestes et attitudes, instruments et outils. Nous avons affaire à un semi-figement.
5. Règles formelles et règles rhétoriques Façon, manière et leurs extensions, comme ton, voix, oreille sont des noms pivots des adverbations par relativation (S. Y. Kuroda 1968, M. Gross 1986). Pour cerner les régulantés dans le calcul du sens, on resserre la notion de nom approprié (ou Napp) dans les constructions de manière au moyen de règles rhétoriques qui rendent compte des ellipses et de la vraisemblance d'occurrence des items effaçables dont la fréquence d'occurrence est basse. Elles accompagnent les règles formelles de syntaxe et de morphologie: métonymies dans les restructurations des construc tions adjectivales (A. Guillet & Leclère 1981, E . Laporte 1997, M. Meydan 1999); hypallages et métaphores (A. Balibar-Mrabti 1987) dans les adverbations. Nous avons déja donné des exemples de métonymie (exemple (2) du §1). Par la notion d'hypallage, on circonscrit des relations entre formes et sens dans des phrases qui ne sont ni tout a fait libres ni tout à fait figées. Reprenons les deux phrases données en (7):
NOTE SUR LE SEMI-FIGEMENT
27
Léo nous écoute d'une oreille attentive Léo nous écoute d'une oreille inquiete et examinons la portée des adjectifs épithètes. L'emploi de l'adjectif inquiet est un cas d'hypallage sur la base des phrases interprétatives suivantes: (14) a. Léo est inquiet b. *? L 'oreille de Léo est inquiète On voit que l'adjectif porte sur le sujet humain du verbe écouter: on peut l'employer comme attribut de ce nom en formant (14a). Mais il est diffïcilement accepté comme attribut du Npc oreille, comme le montre (14b). En outre, comme épithète du Npc, il est difficilement acceptable autrement que dans la construction adverbiale initiale. Analysé comme épithète ou comme attribut dans: (14) *? Léo a l'oreille inquiète il reste d'une acceptabilité douteuse. C'est ce transferí de prédication a l'intérieur d'un Advm fïgé qui constitue ici l'hypallage. L'emploi de l'adjectif attentif est un cas différent, sur la base de phrases inter prétatives, voisines des précédentes, dont on peut juger autrement. Formons avec les phrases interprétatives données en (12) le bloc d'exemples suivant: (15) a. b. c.
Léo est attentif L 'oreille de Léo est attentive Léo a l'oreille attentive
et comparons l'acceptabilité des constructions de (15) a celles de l'exemple (14) qui précède. Pour le Npc oreille, on peut estimer qu'on peut forcer 1'acceptabilité de la construction attributive de (15b). D'ailleurs, l'emploi de l'adjectif comme épithète ou comme attribut dans (15c) est beaucoup plus naturel qu'il ne l'est dans (14c) et c'est la raison pour laquelle nous avons parlé de clichés et traité cet exemple comme un cas d'emploi métaphorique de l'adjectif au §3. Dans les groupes nominaux adverbiaux, les exemples d'adjectifs uniquement épithètes sont nombreux. Tous s'analysent avec des décalages entre syntaxe et sémantique ou s'observe une imbrication entre règles formelles et règles rhétoriques. Pour une présentation récente des propriétés syntaxiques en jeu nous renvoyons à J. Giry-Schneider (1997).
6. Le semi-figement Quand les phrases ont des propriétés de formes libres, les mécanismes syntaxiques envisagés sont ouverts; des mots pleins du lexique assurent le role d'extensions, comme ici les noms ton, voix, oreille, qui équivalent aux noms généraux fagon, manière dans les groupes nominaux adverbiaux. Les métaphores, vues comme des schémas introduisant de nouvelles relations de sélection, sont un cas classique de
28
ANTOINETTE BALIBAR-MRABTI
mécanismes productifs. Quand les phrases ont des propriétés de formes figées, les items lexicaux en jeu s'énumèrent dans des inventaires clos regroupés en variantes. La notion de formes stylistiquement marquées ou enrichies rapportées a un invariant sémantique de référence (J. Labelle 1995) est une approche classique des figements; c'est le cas de clichés comme
d 'une plume féroce ou <dessiner> d'un crayon habile, qui sont des équivalents spécifiques des adverbes férocement, habilement. Réfléchir sur le semi-figement, c'est considérer que les mécanismes syntaxiques sont à la fois ouverts et fermés. L'intuition de cliché correspond bien a cette pers pective bipolaire. Les approches sont mixtes. Pour cerner les équivalences syn taxiques et sémantiques, on combine les propriétés définies dans les tables syntaxiques existantes avec les listages d'items lexicaux que permettent les grammaires locales. Il faut mettre en évidence les bornes entre lesquelles joue la sélection et il faut être clair sur les conditions d'échange entre extensions et va riantes. Dès qu'il y a possibilité d'equivalences a l'intérieur des schèmes syntaxiques, les combinatoires tendent ä apparaitre sous Tangle des distributions. Quand les intuitions vont dans le sens d'une combinatoire des mots, d'apparence accidentelle, donc idiosyncratique, fixer ces bornes relève de décisions a prendre au coup par coup et explicitement, à l'intérieur de la langue ordinaire, par exemple celle des journaux, ou a l'intérieur de textes spécialisés. Avec Paffinement des procédures d'investigation sur corpus grace aux dictionnaires électroniques (B. Courtois & M. Silberztein 1990) par les moyens automatiques d'INTEX (Silberztein 1993), qui nous permettent de disposer de concordanciers, la recherche systématique de formes attestées retrouve une place comparable a celle qu'elle occupe dans la tradition philologique. Parmi les élé ments lexicaux qui sont possibles et parmi ceux qui sont atiestés, quels sont ceux qui auront le statut de variantes? Quels sont ceux qui auront le statut d' innovations? Quelles formes prend la répétition? Comment la fixer et la prévoir?
Références Balibar-Mrabti, Antoinette. 1980. Une liste d'extensions lexicales pour les opera teurs manière et façon. Lingvisticœ Investigationes IV:1, Amsterdam/Phila delphia: John Benjamins. Balibar-Mrabti, Antoinette. 1987. Règies formelles et règles rhétoriques sur un cas d'analyse d'adverbes. Lingvisticce Investigationes XI:1, Amsterdam/Philadel phia: John Benjamins. Balibar-Mrabti, Antoinette. 1997. Synonymie abstraite et synonymie concrète en syntaxe. Langages 128, Paris: Larousse. Courtois, Blandine; Max Silberztein (eds.). 1990. Dictionnaires électroniques du français. Langue frangaise 87, Paris: Larousse.
NOTE SUR LE SEMI-FIGEMENT
29
Giry-Schneider, Jacqueline. 1978. Interpretation aspectuelle des constructions ver bales à double analyse. Lingvisticœ Investigationes II:1, Amsterdam/ Philadel phia: John Benjamins. Giry-Schneider, Jacqueline. 1997. Sur quoi peut porter un adjectif épithète ? L'expression du temps et de l'aspect dans les groupes nominaux. Langages 126, Paris: Larousse. Gross, Gaston; Robert Vivès. 1986. Les constructions nominales et l'elaboration d'un Lexique-grammaire. Langue frangaise 69, Paris: Larousse. Gross, Maurice. 1977. Grammaire transformationnelle du frangais: syntaxe du , Paris: Larousse. Gross, Maurice. 1986. Grammaire transformationnelle du frangais: syntaxe de l'adverbe. Malakoff: Cantilène. Guillet, Alain; Christian, Leclère. 1981. Restructuration du groupe nominal. Lan gages 63, Paris: Larousse. Harris, Zellig S. 1976. Notes du cours de syntaxe. Paris: Le Seuil. Kuroda, S.-Y. 1968. English Relativization and Certain Related Problems. Lan guage 44:2, Baltimore: The Waverly Press. Labelle, Jacques. 1995. Lexique-grammaire et variation en fran9ais. In Lexiquesgrammaires comparés en frangais, J. Labelle, . Leclère (eds.), Lingvisticæ Investigationes Supplementa 17, Amsterdam/Philadelphia: John Benjamins. Laporte, Eric. 1997. L'analyse de phrases adjectivales par rétablissement de noms appropriés. Langages 126, Paris: Larousse. Meunier, Annie. 1981. Nominalisations d'adjectifs par verbes supports. Thèse de 3 ème cycle, LADL, Université Paris 7. Mel'cuk, Igor. 1992. Dictionnaire explicatif et combinatoire du frangais contem porain, recherches sémantiques, vol.33, Montréal: Les Presses de l'Université de Montréal. Meydan, Métiyé. 1999. La restructuration du sujet dans les phrases adjectivales a substantif approprié. Langages 133, Paris: Larousse. Silberztein, Max, 1993. Dictionnaires électroniques et analyse automatique de textes. Le système INTEX, Paris: Masson. Summary One can find in French expressions which are equivalent to adverbs ending in -ment, e.g. écouter d'une oreille attentive /distraite as compared to écouter attentivement /distraitement, or dessiner d'une main habile / dessiner d'un crayon habile as compared to dessiner habilement. These expressions, which are considered to be relatively fixed, or semi-compositional, are being studied with ever-increasing precision by linguists and lexicographers. This paper sets out the criteria which define these expressions in LexiconGrammar Theory.
INSTRUMENT NOUNS AND FUSION PREDICATIVE NOUNS DESIGNATING VIOLENT ACTIONS 1
JORGE BAPTISTA Universidade do Algarve, Centro de Automática da UTL - LabEL2
Introduction Among predicative nouns entering converse constructions (G. Gross 1989) with support-verbs (Vsup3) dar (to give) and levar (to take) in Portuguese (J. Baptista 1997a), there is an interesting set designating violent actions. It is possible to distinguish two main subsets:4 a) a small set of nouns selecting human nouns (Nhurn) both to subject and object position (class DL2): (1)
. = b.
João deu uma tareia ao Pedro (John gave a spanking to Peter) Pedro levou uma tareia do Joäo (Peter took a spanking from John)
These nouns do not allow a locative complement filled with body-part nouns (Nbp) in the standard (or active-like) sentence with Vsup dar:
1
3
This paper was presented in 1998 in a Seminar of LADL at Université Paris 7 - Denis Diderot. I acknowledge the audience, especially M. Salkoff and E. Laporte, for their valuable comments. I also thank Ann Henshall for helping me with the English version of this paper. 2 Laboratório de Engenharia da Linguagem, Centro de Automática da Universidade Técnica de Lisboa, Instituto Superior Técnico, Lisboa, Portugal. Notations used in this paper are those developed by M. Gross (1975, 1981) and used by resear chers at LADL (Laboratoire d'Automatique Documentaire et Linguistique, Univ. Paris 7- Denis Diderot) and associated research centers of the RELEX network. A word-by-word translation of Portuguese examples is provided. Expressions inside brackets and separated by '+' may commute in that syntactic position. The symbol 'E' designates the empty string. Not all of the nouns of classes DL2 designate violent actions and several subsets can be defined in this class. DL3, however, is remarkably homogeneous, since only 14 in 78 (e.g. penteadela, hairdo) can not be described as violence-related nouns.
JORGE BAPTISTA
32
* Joäo deu urna tareia (ao + no) corpo do Pedro (John gave a spanking to/in the body of Peter) These nouns will not be discussed here. b) nouns admitting both a Nhum object and a locative complement with Nbp (class DL3): (2)
.
Joäo deu um pontapé {ao Pedro + na perna do Pedro) (John gave a kick to Peter / in the leg of Peter)
Usually, the noun phrase Nbp de Nhum cannot be introduced by Prep =: a. * Joäo deu um pontapé à perna do Pedro (John gave a kick to the leg of Peter) The prepositional phrase em Nbp de Nhum may undergo Dative Restructuring (Ch. Leclère 1995) giving two complements: a Nhum in Nbp; this operation does not change the (metonymic) coreference relation between Nbp and Nhum: b.
Joäo deu um pontapé ao Pedro na perna (John gave a kick to Peter in the leg)
The Nhum can also be introduced by preposition (Prep) em (in), but then the locative em Nbp becomes unacceptable: c.
João deu um pontapé no Pedro (E + *na perna) (John gave a kick in Peter in the leg)
This has led me (J. Baptista 1997b) to consider that the prepositional phrase em Nhum results from the metonymic reduction of the Nbp in (2a). The Nbp may be present as a (facultative) locative complement in the converse (or passive-like) sentence with Vsup levar: d.
Pedro levou urn pontapé do Joäo (E + na perna) (Peter took a kick from John in the leg)
but it cannot undergo Conversion: * A perna do Pedro levou urn pontapé do Joäo (The leg of Peter took a kick from John) for this transformation only holds between the two Nhum. Unlike pontapé (kick), a significant number of predicative nouns of class DL3 are morphologically formed from concrete nouns, e.g. faca (knife) plus the suffix -ada5. They present the same overall properties referred to in (b), above: 5
Only four nouns of this kind, presenting suffix -dela, were found: aguilhoadela (sting-dela), espetadela (sting-dela), picadela (sting-dela), and bisnagadela (water-pistol-dela).
INSTRUMENT NOUNS AND FUSION
(3)
.
b. c. d.
33
Joäo deu uma facada (ao Pedro + na perna do Pedro) (John gave a knife-ada, i.e. a stabbing, to Peter/in the leg of Peter) * João deu uma facada à perna do Pedro (John gave a knife-ada to the leg of Peter) Joäo deu uma facada ao Pedro na perna (John gave a knife-ada to Peter in the leg) João deu umafacada no Pedro (E + * na perna) (John gave a knife-ada in Peter in the leg) Pedro levou umafacada do Joäo (E + na perna) (Peter took a knife-ada from John in the leg) * A perna do Pedro levou umafacada do Joäo (The leg of Peter took a knife-ada from John)
These sentences can be systematically related to a paraphrase with verb ferir (hurt) - and in some cases bater (hit) - involving an instrumental: (4)
João (feriu) ( Pedro + a perna do Pedro) com uma faca (John hurt Peter/ the leg of Peter with a knife)
In the following paragraphs, I will discuss the relation between (3) and (4). I will try to show that these nominal constructions could be derived by Fusion (M. Gross 1981:45-48) of verbs such as ferir (hurt) and bater (hit) with their ins trumental.
1. Derivational productivity and constraints. The process of forming predicative nouns from concrete nouns that can be used as instruments to hit or to hurt someone seems to be (or to have been) a productive process, since it is possible to 'coin new words' imitating those that are already registered in dictionaries: (5)
João deu urna (cinzeirada + sapatada + cadeirada + ...) ao Pedro (John gave a/an ashtray-ada/shoe-ada/chair-ada to Peter)
The sentences above are immediately interpreted as equivalent to: (6)
Joäo bateu no Pedro (um cinzeiro + um sapato + urna cadeira + ...) (John hit Peter with a/an ashtray/shoe/chair)
The -ada suffix, however, is also used in a different derivational process, to form quantifying nominal determinants (M. Gross 1977) from concrete nouns designating 'containers': (7)
João comeu urna (colher + colherada) de sopa (John ate a spoon/spoon-ada of soup)
JORGE BAPTISTA
34
The nominal determinant usually means the quantity that can be carried by the 'container'6. When the determinant already exists in the lexicon, the formation of the violent action noun is blocked. This could explain, in some cases, the use of suffix -dela instead of-ada, to designate the violent action: (8)
João deu urna (espetadela +*≠espetada) ao Pedro (John gave a stick-dela/stick-ada to Peter)
since the noun espetada already exists in the lexicon, meaning both a grilling stick (usually for meat) and the corresponding quantity of food. However, in other (rare) cases, both suffixes can be used to form the violent action noun: (9)
João deu urna {picada + picadela) ao Pedro (John gave a sting-dela/sting-ada to Peter)
Usually, nouns formed with the -ada suffix are unambiguous, for they have only one meaning and construction: either a predicative violent action noun, or a nominal quantifier. Still, there are some nouns presenting both constructions: (10)
(11)
Joäo deu uma pazada ao Pedro (= João bateu no Pedro com uma pá) (John gave a shovel-ada to Peter) (i.e., John hit Peter with a shovel) João lanqou urna pazada de terra para o buraco (John threw a shovel-ada of dirt to the hole)
As is often the case, one can observe some derivational regularity (most of the Violent actions' nouns are formed with the -ada suffix) but this is frequently shattered by the lexicon idiosyncrasies.
2. Instruments In sentences with predicative nouns formed from an instrument noun {Ninstrum) plus the -ada suffix it is not usually possible to insert an instrumental complement with that same Ninstrum, for it yields a highly redundant sentence: (12)
* Joäo deu uma facada ao Pedro com uma faca (John gave a knife-ada to Peter with a knife)
This sentence could become acceptable if the Ninstrum received some particularizing determination:7 In other cases, an augmentative effect can be observed, as in sentence: João comeu uma pratada de sopa (John ate a dish-ada of soup) where the noun pratada means not only the quantity of soup any dish can carry, but a rather large or a full dish. This seems to be the same phenomenon already seen with verbs with an internal object (Boons, Guillet and Leclère 1976a:64-66), e.g. to dream (*a dream + a weird dream).
INSTRUMENT NOUNS AND FUSION
(13)
35
Joäo deu uma facada ao Pedro com(afaca do Paulo + uma faca de cozinha) (John gave a knife-ada to Peter with Paul's knife/a kitchen knife)
When the Ninstrum is not exactly the same, but of the same type, the sentence still remains unacceptable: (14)
* João deu uma facada ao Pedro com {urn punhal + urn canivete + urna navalha) (John gave a knife-ada to Peter with a dagger + penknife)
The fact that the (bare, unmodified) instrumental is unacceptable in the nominal sentence shows a close relation between them. Some nouns, however, allow an Ninstrum different from the one on which the predicative noun is formed, but reject an Ninstrum if this is the same on which it is formed for its high redundancy: (15)
Joäo deu urna cacetada ao Pedro com (*um cacete + um pau) (John gave a lub-ada to Peter with a club/stick)
In this case, one can consider that the semantic relation between the predicative noun cacetada (club-ada) and the Ninstrum cacete (club) has become weaker. This can be confirmed by some predicative nouns (e.g. arrochada, blow) formed on Ninstrum (e.g. arrocho, beating-stick, for animals) that have virtually no use today or, else, subsist only in regional/non-urban dialects: (16)
Joäo deu urna arrochada ao Pedro com (*um arrocho + um pau) (John gave a beating-stick-ada to Peter with a beating-stick/stick)
3. Fusion Both the morphological relation between the predicative nouns and the Ninstrum, and the restrictions to the insertion of the instrumental in the nominal sentence, led us to consider that there is a relation between the paraphrase with verbs hater (hit) or ferir (hurt) plus the instrumental complement and the sentence with the predicative noun formed on that Ninstrum. This relation is analogous to the Fusion operation proposed by M. Gross (1981: 45-48), defined as "a process of combining sentences that can change the number of arguments of a verb. This process combines two verbs, or a verb and one of its arguments, and one of those elements disappears, hence the term fusion!" (idem: 45). In fact, one of the examples given by M. Gross involves instrumental comple ments: to reproduce a document by photocopy = to photocopy a document Among violent action predicates, there are some verbs formed by the fusion of
JORGE BAPTISTA
36
the verb bater(rferir) with a Ninstrum; the nominalization of such verbs yields the sentence with the predicative noun formed on the Ninstrum plus the suffix -ada: (17) . b. c.
Joäo baten no Pedro com urn chicote (John hit Peter with a whip) Joäo chicoteou o Pedro (John whipped Peter) Joäo deu urna chicotada ao Pedro (John gave a whip-ada to Peter)
Both the verb and the predicative noun do not accept the insertion of the instru mental for its high redundancy: * João chicoteou Pedro com urn chicote (John whipped Peter with a whip) * Joäo deu urna chicotada ao Pedro com urn chicote (John gave a whip-ada to Peter with a whip) Sentences (17 a-b) correspond to the definition of fusion given by M. Gross. The concept of fusion can be extended to the corresponding nominalizations (i.e. dar urna chicotada, to give a whip-ada) of such verbs (e.g. chicotear, to whip). There are also many autonomous predicative nouns, that is, nouns unrelated to verbs, to which the same analysis could apply: (18) . b. c.
Joäo bateu no Pedro com urna bengala (John hit Peter with a cane) * Joäo bengalou Pedro (John cane-ed Peter) Joäo deu urna bengalada ao Pedro (John gave a cane-ada to Peter)
Although there is no such verb as *bengalar (to strike with a cane) - at least not yet - one can consider that to be only a morphological hole in the lexicon, due to de idiosyncrasies of its history. This verb could still be created and its meaning then would only be that of a violent action, thus showing the pertinence and adequacy of the fusion transformation. In spite of non-existence of this verb, the Fusion operation can adequately describe the relation between (18a) and (18c), for the paraphrase of bater plus the Ninstrum =: bengala holds the same relationship with the nominal sentence, as in sentences (17a-c). High redundancy also blocks the insertion in (18c) of an instru mental complement with the same Ninstrum as the one that originated the predicative noun: * João deu urna bengalada ao Pedro com urna bengala (John gave a cane-ada to Peter with a cane)
INSTRUMENT NOUNS AND FUSION
37
4. Body-part nouns There is also a small set of predicative nouns formed on body-part nouns (Nbp) which can be analyzed in the same way as the Ninstrum-related predicative nouns. These Nbp can also be used as instruments in a violent action and so enter the paraphrase with verb bater. In most cases, however, there is no verb associated with the nominal sentence:8 (19) . b. c.
João batu Pedro com a cabega (John hit Peter with the=his head) * João cabeçou o Pedro (John head-ed Peter) João deu urna cabegada ao Pedro (John gave a head-ada to Peter)
However, unlike the list of predicative nouns formed on Ninstrum, which can still be extended by creating new entries, the nouns formed on Nbp constitute a closed set.
Conclusion The idea that the meaning of some verbs can be decomposed on simpler elements is not new in linguistics. The M. Gross (1981) concept of Fusion, however, provi des a syntactic framework to firmly establish a transformational relation between those analytical paraphrases and the corresponding, semantically more complex verbs. These verbs present syntactic properties that can be better described on grounds of their relationship with such paraphrases. Initially, Fusion was mostly applied to describe verbal constructions. However, as usually happens to fruitful insights in science, the concept can also be applied to other parts of speech (M. Gross 1981: 48): "All these syntactic relations show that differences attached to parts of speech tend to disappear from the moment one tries to bring together related sentences by transformation."
There are several verbs morphologically related to the noun cabega (head) but they present no syntactic or semantic relation with the predicative noun cabegada (head-ada), e.g. encabeçar um motim (to head a mutiny) or cabecear (to nod, to shake one's head).
38
JORGE BAPTISTA
References Baptista, Jorge. 1997a. Sermão, tareia e facada: Uma classificação das construções conversas dar-levar. Seminários de Linguística 1:5-37, Faro: Universidade do Algarve. Baptista, Jorge. 1997b. Conversão, nomes parte-do-corpo e restrutura9äo dativa. In Actas do XIII Encontro da Associagäo Portuguesa de Linguística (Braga, 1996), I. Castro (ed.), 51-59, Lisboa: APL. Boons, Jean-Paul; Alain Guillet; Christian Leclère. 1976. La structure des phrases simples en français: 1 - Les constructions intransitives. Genève/Paris: Droz. Gross, Maurice. 1975. Méthodes en syntaxe. Paris: Hermann. Gross, Maurice. 1977. Grammaire transformationnelle dufrançais. 2 - Syntaxe du . (2 éd., 1986), Paris: Cantilène. Gross, Maurice. 1981. Les bases empiriques de la notion de prédicat sémantique. Langages 63: 7-52, Paris: Larousse. Gross, Gaston. 1989. Les construction converses enfrangais. Genève/Paris: Droz. Leclère, Christian. 1995. Sur une restructuration dative. In Language Research 311: 79-198, National University of Seoul: Seoul (South Korea).
Summary Many predicative nouns selecting the support verb dar (to give) in Portuguese allow Conversion, a passive-like transformation, with the support verb levar (to take, to get). Among these, a significant number are related with concrete instrument nouns and expresses violent action predicates. These sentences present a paraphrase with the verbs bater (to hit) or ferir (to hurt) with an instrument complement. Most of these predicative nouns are formed with a common suffix {-ada). Several restrictions can be observed in the choice of the instrument complements that can be inserted in the nominal sentences. High redundancy blocks the insertion of an instrumental complement if the instrument is the same noun as the one to which the predicative nouns is morphologically related. We analyse these nominal sentences by Fusion, a transformational relation proposed by M. Gross (1981), which merges the verbs bater ox ferir with the instrument noun to form both the predicative noun and (more rarely) its associated verb.
INSTRUMENT NOUNS AND FUSION
+ + -
+ + + + + + + + + + + + + + + + + + + _ + + + + -
+ + + ? ? ? -
aguilhoada aguilhoadela agulhada alfinetada bastonada bengalada biqueirada bisnagada bisnagadela bordoada cacetada cachaporrada cajadada chibatada chicotada chindada entilada espadeirada espetadela esporada estocada facada lanqada lancetada machadada marretada martelada mocada navalhada
N0VN1
+ - - - + - - - + - - - + - - - - + + + - + + + - + + - -
+ + + + + + + + + +
+ + + + + + + + + + -
+ + + + + + + + + + -
+ + + + + + -
chicotear espetar esporear esfaquear lancetar marretar (?) martelar mocar anavalhar
NO dar Ninstrum-n a N1 com Ninstrum (Ninstrum-n =/= Ninstrum)
Npred
NO ferir N1 com Ninstrum NO bater em N1 com Ninstrum Vsup =: receber Vsup -: comer
NO -: N-hum Vsup =: pregar Vsup =: atirar
|
ANNEX Extract of predicative nouns related to instrument nouns (class DL31)
+ + + + + + + + + -
Ninstrum
aguilhão (sting, goad) aguilhão (sting, goad) agulha (needle) alfinete (pin) bastão (club, staff) bengala (cane) biqueira (toe cap) bisnaga (water-pistol) bisnaga (water-pistol) bordão (staff) cacete (club) cachaporra (club) cajado (staff) chibata (switch, rod) chicote (whip) chínelo (slipper) cutelo (cutlass) espada (sword) espeto (spit, lath) espora (spur) estoque (rapier, tuck) faca (knife) langa (lance) lanceta (lancet) machado (axe) marreta (hammer) martelo (hammer) moca (club) navalha (pocket knife)
+ + -
pancada! paulada paulitada pazada pedrada picada picadela porrada! punhalada ripada sapatada tacada tamancada trancada traulitada varada vassourada! vergastada
+ + + + + + + + + + + + + + +
+ + + -
+ + + + + + + + + + + + + + +
N0VN1
- - - + + - + - - - apedrejar - - picar - - picar - - - apunhalar - + ripar (?) + + - - - + + + _ + + - - ?varar - - + - vergastar
NO dar Ninstrum-n a N1 com Ninstrum (Ninstrum-n =/= Ninstrum)
+ + + + + -
Vsup =: comer
Npred
NO ferir N1 com Ninstram NO bater em N1 com Ninstrum Vsup =: receber
Vsup -: atirar
JORGE BAPTISTA
NO -: N-hum Vsup =: pregar
40
+ + 4-
+ + + + + + + -
Ninstrum
panca (wooden lever) pau (stick) pau, paulito (stick) pá (shovel) pedra (stone) pico (thorn) pico (thorn) porra (club) punhal (dagger) ripa (lath) sapato (shoe) taco (club, cue) tamanco (clog) tranca (bar) traulito (stick) vara (rod, wand) vassoura (broom) vergasta (switch)
LA CONSTITUTION D'UNE CONCORDANCE DE VERBES DE L'ANCIEN FRANÇAIS HAVA BAT-ZEEV SHYLDKROT Université de Tel-Aviv
Introduction Cet article se propose de décrire et d'expliquer les différents volets d'une concor dance des verbes de ancien français et de présenter la méthode adoptée pour sa constitution et sa structure. On évoquera également certaines des difficultés survenues lors de l'établissement de cet outil. 1. Exposition du projet1 Les langues anciennes et les langues de minorités présentent un intérêt qui semble s'accroître de façon régulière depuis près d'une vingtaine d'années. L'apprentissage de ces langues, ainsi que les recherches consacrées à leur développement, ont fait l'objet d'un essor important dans les grands centres linguistiques et littéraires du monde entier. Cette 'renaissance' découle vraisemblablement d'un mouvement universel qui se traduit dans différents domaines cultureis et artistiques et notamment dans celui des langues anciennes. L'ancien français, indépendamment de cette tendance, a toujours éveillé un intérêt particulier. Cet intérêt s'est manifesté tout aussi bien dans le domaine littéraire, ou l'étude des textes littéraires a suscité et continue á susciter une énorme curiosité, que dans le domaine linguistique, ù l'interprétation des formes et leur codage sont constamment analysés. Certains centres linguistiques, aussi bien en France qu'à l'étranger, en particulier celui de l'école Normale Supérieure Fontenay/St-Cloud 1
L'élaboration de ce projet a commencé lors d'une année sabbatique passée au LADL (Laboratoire d'Automatique Documentaire et Linguistique ( CNRS), dirigé par Maurice Gross) et de fréquents séjours effectués par la suite. Je tiens à remercier tous mes collègues-amis du LADL qui m'ont aidée à réaliser ce travail et en particulier Maurice Gross, sans qui je n'aurais jamais eu l'idée de l'entreprendre, et Blandine Courtois. Christian Leclère, Annie Meunier et Max Silberztein m'ont tous été d'une aide précieuse.
42
HAVA BAT-ZEEV SHYLDKROT
dirigé par Chistiane Marchello-Nizia, celui de l'université Laval et celui de l'université Catholique de Louvain, pour n'en mentionner que quelques-uns, développent et enrichissent de façon considérable le domaine. Le centre de TENS possède un grand nombre de textes dont au moins vingt-huit, allant du XIe au XVIe, ont déja été déchiffrés.2 Toutefois, les outils qui sont a la disposition des chercheurs et des lecteurs s'avèrent encore limités et lacunaires. La difficulté d'emploi des grands dictionnaires de Panden français, sans pour autant contester ou mettre en doute leur importance inestimable, a déja été évoquée (Bat-Zeev Shyldkrot 1996, et voir plus loin). On se réfère en particulier au Grand Godefroy, au Tobler-Lommatzsch et au FEW {Französisches Etymologisches Wörterbuch), ainsi qu'aux grands dictionnaires étymologiques. L'usage de tous ces dictionnaires exige un certain savoir et une certaine connaissance préalable, en l'absence desquels le lecteur n'en pourra tirer qu'un bénéfice partiel. En outre, il n'existe pas, a ma connaissance, de dictionnaires spécialisés ou techniques de cette langue tels qu'un dictionnaire des synonymes, un dictionnaire analogique ou un dictionnaire des verbes. De façon controversable, ce manque d'outils a contribué a ce que la démarche traditionnelle pour la recherche et l'apprentissage de l'ancien français soit dominante et que le développement des méthodes plus récentes soit retardé. Le recours actuel a une approche basée essentiellement sur l'application du traitement automatique permet d'envisager un progrès certain et rapide de l'analyse de cette langue.3
2. Méthode employée Le fait que les grammaires de l'ancien français ne fournissent pas toujours les formes conjuguées ni non plus les possibilités distributionnelles, nous a incitée a entamer cette entreprise dont le but est d'élaborer une concordance des verbes de l'ancien français suivie d'un dictionnaire des verbes.4 Par concordance des verbes, on entend la liste des verbes relevés dans un corpus déterminé, suivie de la forme infinitive dans ses diverses variantes orthographiques, accompagnée chaque fois de tous les contextes ou le verbe a été repéré (voir Annexe 1). Cette liste inclura aussi bien des verbes qui ont dispara de la langue que des verbes qui continuent à 2
Je remercie ces trois centres pour avoir mis a ma disposition un certain nombre de textes codés, ce qui m'a permis d'entamer le travail. Tout particulièrement Christiane Marchello-Nizia, Fernande Dupuis, Willy Van Hoecke et Michèle Goyens. 3 On trouvera toutefois dans la grammaire historique de L. Kukenheim (1967) la conjugaison des principaux verbes irréguliers. Kukenheim y signale néanmoins qu'il se contente de mentionner les formes les plus courantes, étant donné que ces formes varient en fonction du dialecte, de l'époque et même de la forme graphique. Il renvoie à P. Fouché (1931). 4 La nécessité du développement de méthodes informatiques pour l'apprentissage des langues semble actuellement admise par tous. La nouvelle grammaire de Tangíais, utilisant ces méthodes, constitue un excellent exemple de ce qui peut être réalisé de cette façon.
CONCORDANCE DE VERBES DE L'ANCIEN FRANÇAIS
43
exister. Ainsi, on trouvera á côté d'abbatre la variante abatre; pour apercevoir, on notera les variantes aparcevoir et appercevoir; les variantes de penser sont pariser et pensser etc. Par la suite, une tentative de catégoriser ces formes verbales, conjuguées ou sous leurs formes nominales, en les analysant en un complexe de traits, sera réalisée. Chaque entrée lexicale sera éventuellement marquée par: a) une forme conjuguée ou un infinitif; b) la forme canonique (le lemme); c) l'analyse de la forme conjuguée et l'attribution des traits mode, temps, nombre et personne. Pour la description de ces formes, on a adopté le code déja en usage au LADL (Annexe 2). Le dictionnaire des verbes, en revanche, présente un tableau récapitulatif des distributions des verbes cités dans la concordance, a l'instar des nombreuses tables élaborées dans le cadre du LADL.5 En l'occurrence, la réalisation de ce projet met en jeu 1'aspect morphologique pour le décodage, l'analyse et l'emploi des divers lemmes, et Paspect syntaxique pour la distribution de ces verbes. Le programme INTEX a été utilisé pour enregistrer et déchiffrer les formes verbales de notre corpus, étant donné qu'il n'existe que très peu d'outils informatiques pour le décodage de Pancien français et qu'un grand nombre de formes de Pancien français subsiste en français moderne. Les formes non retrouvées ont été examinées ponctuellement.
3. Délimitation du corpus Les difficultés rencontrées lors de Pélaboration d'un corpus représentatif des textes de Pancien français semblent bien connues (cf. Bat-Zeev Shyldkrot 1996, Habert et al 1998). Il est clair que la délimitation du corpus constitue Pun des problèmes fondamentaux d'un tel projet. Vu que le Système linguistique de Pancien français est constamment modifié, le choix des textes a inclure dans une concordance déterminera en grande partie la forme de la langue décrite. L'exis tence d'un nombre considérable de variantes orthographiques et dialectales, et la recherche d'une manière appropriée de les décrire, est un autre aspect important du problème. Les variations dialectales ne se limitent pas a des formes orthographi ques différentes. Van Reenen et Schøsler (1991) ont montré par exemple que, dans des dialectes distincts, la syntaxe des verbes, notamment leur distribution et le choix des prépositions qui les introduisent et qui les suivent, varient selon les régions.
Pour un exemple de cette méthode, on consultera les ouvrages de M. Gross (1975, 1989) et Parti ele de . Courtois (1990).
44
HAVA BAT-ZEEV SHYLDKROT
Textes dépouillés Les trois centres linguistiques mentionnés plus haut ont bien voulu mettre á ma disposition un certain nombre de textes ou fragments de textes informatisés, qui datent du XIIe-XIVe siècles, dont voici la liste:6 a) Ami et Amile, anonyme, douzième siècle (éd. P.F. Dembowski, Paris: Champion, 1969); b) Tristan, Beroul, douzième siècle (éd. L.M. Defourques, Paris: Champion, 1947); c) La rencontre de Marc Tulles Cyceron, traduit par Jean d'Antioche (1282), d) La Chastelaine de Vergy, quatorzième siècle (éd. G. Raynaud de Lage, Paris: Champion, 1992); e) Le Roman dAuberon, anonyme, quatorzième siècle; f) La passion de Palatinus, Mystère du quatorzième siècle; g) La vie de St-Augustin, Jean de Vignay, a partir du manuscrit, quatorzième siècle; h) Berinus, Roman en prose du quatorzième siècle, anonyme; i) Les miracles de Notre-Dame par personnages, anonyme, quatorzième siècle. j) Melusine, Jean d'Arras, quatorzième siècle; ) La vie de Saint Louis, Jehan de Joinville, quatorzième siècle; l) L 'estoire de Griseldis, en rimes et par personnages, anonyme, quatorzième siècle.
4. Avantages du traitement automatique La composition d'une telle concordance présente un certain nombre d'avantages. 1) Tous les verbes relevés sont cités avec le contexte dans lequel ils apparaissent. La présence du contexte permet de relever les homonymes et de les distinguer des polysèmes du même verbe, quelle que soit leur forme orthographique. 2) Nous avons signalé précédemment (1996), en comparant la démarche utilisée par les grands dictionnaires du vieux français et les dictionnaires étymologiques a celle préconisée par la méthode informatisée, que malgré tous les atouts que présentent ces ouvrages, on leur trouve un certain nombre d'imperfections. Le principal inconvénient provient de leur complexité lors de la consultation. Qu'il s'agisse du FEW, où les entrées sont groupées par étymon (de ce fait, la recherche exige une expertise considérable), ou du Grand Godefroy, ou il est ä chaque fois nécessaire de consulter les deux volumes pour relever les mots déjà disparus de la 6
Les données indiquées, en ce qui concerne la date de composition et l'auteur du texte, sont fournies, bien entendu, sous réserve.
CONCORDANCE DE VERBES DE L'ANCIEN FRANÇAIS
45
langue à cóté de ceux qui y ont subsisté. Le traitement informatique permet, par sa simplicité et son efficacité, de remédier a ces imperfections.
5. Conclusion Le bénéfice acquis par la constitution des concordances informatisées de verbes de l'ancien français est double. D'une part, un tel projet permet de découvrir l'état de la langue ä une période déterminée, d'autre part, il trace son évolution. Un seul outil s'avère donc utile tant pour la perspective synchronique que pour la perspective diachronique. D'un point de vue synchronique, les concordances nous fournissent une information d'ordre phonétique et morphologique. Notamment elles dressent une liste assez importante des variantes orthographiques et dialec tales d'un verbe. D'un point de vue diachronique, elles fournissent une informa tion de nature morphologique, syntaxique et même sémantique. Elles font ressortir de nombreux changements de construction et de distribution. Ainsi, elles rendent compte de changements de transitivité sous forme d'apparition/disparition de préposition, de changements de construction d'un syntagme sous forme d'apparition d'article, et même de changements sémantiques que l'on repère en en étudiant le contexte. L'importance de la constitution des concordances est donc évidente. Elles contribuent a la compréhension et la connaissance du vieux français et des faits diachroniques, autrefois voilés.
Références Andrieux, N.; E. Baumgartner. 1983. Systèmes morphologiques de l'ancien frangais. Bordeaux: Sobodi. Bourciez, Edouard. 1967. Éléments de linguistique romane. Paris: Klincksieck. Bat-Zeev Shyldkrot, Hava 1996. Analyse lexicale de l'ancien fran9ais. Linx 34/35, Nanterre: Université Paris X. Bat-Zeev Shyldkrot, Hava; Blandine Courtois. 2000. Concordances de verbes de l'ancien français. Paris: LADL (manuscrit). Biber, D. et al 1999. A Grammar of Spoken and Written English. Longman: London. Courtois, Blandine; Max Silberztein. 1990. Dictionnaires électroniques du fran9ais. Langue frangaise 87, Paris: Larousse. Courtois, Blandine. 1990. Un Système de dictionnaires électroniques pour les mots simples du français. Langue frangaise 87, Paris: Larousse. Dees, Antoni. et al. 1987. Atlas des formes linguistiques des textes littéraires de l'ancien français. Tubingen: Niemeyer.
46
HAVA BAT-ZEEV SHYLDKROT
Dubois, Jean; Françoise Dubois-Charlier, F. 1990. Incompatibilité des dictionnaires. Langue frangaise 87, Paris: Larousse. Fouché, Pierre. 1931. Le verbe français. Étude rnorphologique. Paris: Klincksieck. Foulet, Lucien. 1967. Petite syntaxe de l'ancien français. Paris: Champion. Godefroy, Frédéric. 1937-1969. Dictionnaire de Vancienne langue frangaise et de tous ses dialectes. Paris: Librairie des sciences et des arts; New York/Nendeln: Kraus Repr. Greimas, A.J. 1968. Dictionnaire de l'ancien français. Paris: Larousse. Gross, Maurice. 1975. Méthodes en syntaxe. Paris: Hermann. Gross, Maurice. 1989. La construction de dictionnaires électroniques. Annales des télécommunications 44:1-2. Habert, Benoit et ál. 1998. De l'écrit au numérique: constituer, normaliser, exploiter les corpus électroniques. Paris: InterEditions/Masson. Kukenheim, Louis. 1967. Grammaire historique de la langue frangaise. Les parties du discours. Leiden: Presses universitaires. Leclère, Christian. 1990. Organisation du lexique-grammaire des verbes français. Langue frangaise 87, Paris: Larousse. Mathieu-Colas, Michel. 1990. Orthographe et informatique: établissement d'un dictionnaire électronique des variantes graphiques. Langue frangaise 87, Paris: Larousse. Reenen, Peter van; Lene Schøsler. 1991. Les indices d'infinitif complément d'objet en ancien français. Working papers in Linguistics, Amsterdam: Vrje Universiteit. Silberztein, Max. 1993. Dictionnaires électroniques et analyse automatique de textes. Le Systeme INTEX. Paris: Masson. Tobler, A.; E. Lommatzsch. 1969. Altfranzösisches Wörterbuch. Wiesbadesn: Franz Steiner. Wartburg, Walter von. 1958. Französisches Etymologisches Wörterbuch. Tübin gen: J.C.B. Mohr.
Summary This paper presents a project which consists of the implementation of electronic concordances and dictionaries of Old French. As compared to other dictionaries, electro nic dictionaries present several advantages. We outline those advantages and describe the method used for this purpose. The choice of the corpus as well as the delimitation of the period are also discussed. The two first parts of the concordances are illustrated by various examples.
ediffier edefier,ediffier | au roy, et lui requerrez qu'il vous doint une place pour | lecon. Mes il ne deveoit point a ceulz qui vouloient | baye de Royaumont porte l'onneur et la hautesce. Il fist | on royaume tenir et il se sot aparcevoir, il commença a effraer | té me puet donner."/ Et dist li angres: "Garde ne t' embelir | e exemplaire, tresdoulce vierge debonnaire, a tout cuer embler I arderons, et si nus i vient des gloutons qui delez nous | sent garder le cors et de jour et de nuit que nus hons embracier | or amendé./ La filie Charle ne voz chaut a amer/ Ne embraser | t fist sa gent desbareter, Con l'endemain les mors fist emparler | la vit en si grant effroy, si la commença doulcement a empetrer | ni. Tant conme je puis je vous pri, doulce gent, pour | us noble et plus d'avoir: Si en a envoié a Romme Pour emploier | que j'ay tort Et tu as bon droit et raison. Si vueil emporter | re part De douaire, dont conforter Me vuels que le doye | s contrains De ceste fille vous oster Et d'icelle o moy encerchier | il qu'il a tant chier/ Voldra avant moult tres bien | on palais plenier,/ Ainz volt moult bien enquerre et enchanter | rie, pour ce n'eschaperés vous mie. Mout saverez de enchasser | faulx traitre et ses complices firent a mon pere pour lui enchasser, preingne son filz Olivier et un de ses plus prouchain/14
enchanter, se vous m'i poez eschaper. [uns Juis] Tu diz voir/14
encerchier, / S'il est preus d'armes contre autre chevalier/12 encerchier / De Lubias qui ja fu sa moilliers/ Com se cont/12
emporter, Quelle elle est assez je le voy. Tu scez bien qua/14 emporter, Pour faire et acomplir briefment Du marquis le com/14
emploier ma saison A estre bergier amoureux, Que mieux vault/14
empetrer grace du doulx Jhesu, que chascun face et die par d/14 empetrer du pape comme Il puist prendre autre et vous laissie/14
emparler et lui dist: « Gentilz damoiselle, n'aiez paour, car/14
embraser." Or voel", fait il, " a vous tous demander " De me/14
embracier ses flans ne ses costéz, / Car puis que fame fait/12
embler le veille et li uns de nous les acueille il les vous /14 embler ne le puit. [Annas] Par ma loy, ce est bien affaire. /14
embelir et plaire Doit qu'il vous serve nuit et jour, tresdo/14
effraer. / Demain iert feste que on doit celebrer,/ Li diem/12
ediffier *page=melusine /6 la Adventures. Par foy, dist U/14 edefier. se il ne leur veist faire trop des atrempeement. I1/14 edefier pluseurs mesons-dieu, la mesondieu de Paris, celle de Po/14 edefier moustiers et pluseurs mesons de religion. Entre lesquiex/14
CONCORDANCE DE VERBES DE L'ANCIEN FRANCAIS 47
ANNEXE 1 : Concordance de verbes de l'ancien français
encontrer / Demain en la bataille.7 "Je te chastoi, b/12 encontrer ; / Ainz, pus li soir qu' il en issirent/ Tresque l'e/12
penser tensa ; / Prent s' entente, si tendi arc/ Enquiert no/12 penser, Dusqu'a.I. jour que vous dire m'orés Que Huelins 1/14 pensser, quant je nel veoie ! / Ha! amis, dont est ce venu ?/ Que/12 penser me couvendra Pour l'estat ma femme et de moy, Et mon /14 panser, / Nel verra mais la damme./ Li compaingnon pa/12 pensser / ce que li dus veut demander,/ de riens fors de cele /12 penser ; et parla a Aigre en telle maniere : « Aigre » , dist e/14 penser, car jamais n'eussent cuidié que telle puissance de crest/14 panser. / Par cel apostre cui Dex donna bon gré,/ Se ne me /12 pensser / nis une eure ne jor ne nuit!/ Quar c' ert ma joie e/12 pensser et croire. / Mes de ce savoir ne me chaut,/ que j ' ai p/12 penser sout a la roïne. / Un poi aval, lez une espine,/ Torne a/12 penser de lui Et la garder treschierement. Nourrice, il con/14
penser panser,penser pensser,penser | bendez."/ Tristran estent, si apensa,/ Oiez! en son | li le covint demourer, Tristre et dolente et plaine de |, c' ert mes confers./ Comment a lui me contenoie/ de | age=griseldi/14 Penser et paine me sourdra, Que trop | ar tans retorner./ Mais moult grant chose remest de son | e ce dont li dus se prent garde,/ ne torment ne le lest | e de la tres plus belle damoiselle que l'en peüst dire ne | eurent si grant navire venir vers eulx, si ne scorent que | ier plus esgarder."/ Et dist la fausse: "Moult avéz fol | nt/ comme riens peüst autre amer,/ qu' aillors ne pooie | onté,/ fet ele, mençonge et arvoire,/ qu' il vous a fet | rt pas coarde,/ De l'uel li guigne, si l'esgarde;/ Le | t saint Gile, Plus bel enfant pieça ne vi. Si convendra
encommencier ! [enfers] Li roy, li conte et li princier, li a/14
encombrer. [Jhesu] De pooté as tu mout poy, bien le saches/14 encombrier / De faim morir, qu'il n'avra que mengier,/ /12 encombrier / et cest meschief por ce avint/ qu' au chevalier/12 enconbrier / Et Governal, son escuier./ Qant il le vit, es le /12 encombrier, / Ne volt monter en son palais plenier,/ Ainz v/12
encliner et soubzmettre A ma voulenté, sanz demettre, Par tel/14
encliner I tafranchevoulenté, Le corage as entalenté Et vuelz encombrer encombrier,encombrer enconbrier,encombrer | Juïs? J'ai pooir de toy delivrer, et, se je veil, de t' | mis en un celier./ Or croist au conte et painne et | si devint ilueques Templier./ Ha! Dieus! trestout cest | Au roi eelestre, quant qu' il pot,/ Tristran defende d' | i dui conte proisié./ Li cuens Amis, cui Dex gart d' encommencier | tricherie. Va sus, lierre! Ne t'esmoier, vré deauble, encontrer | cui Dex donna bon gré,/ Mors est Amiles, se gel puis | D' Iseut n' estuet pas demander/ S' ele out poor d' eus
48 HAYA BAT-ZEEV SHYLDKROT
| ez. PREMIER BERGIER. Ne suis pas ainsi conseilliez. Penser ne vueil a chose tele. J'aimme mieux amer Marotele, Et /14 | ussy, Et des que j'avray fait c*page=griseldi/14 Penser et paine me sourdra, Que trop penser me couvendra Pour /14 percevoir parcevoir,percevoir percevoir. LE QUINT CHEVALIER. Chier sire, il vous faulsist /14 | di/20 Et tele, si com je le pense, Qu'on s'en devera | et fu moult longuement en paumoisons. Or puet il bien parcevoir que Fortune a grant pouoir, car elle lui a moult tost /14 perir perir. Si que par la cause de li soit fait. ce que je di ou ve/14 | chamberiere c'est joieuseté qui s'efforce souvent de perir. / Il vos mescroit de moi forment,/ Et j ' en tendrai le /12 | don;/ Je ne vuel pas encore morir/ Ne moi du tot en tot perir ! / Tel gent vos tienent entre mains,/ De ce soient il t/12 | gure,/ Con deüstes por moi morir/ Et je redui por vos peser peser. Judas respont: " Bien m'i voel acorder," Puis qu'il v/14 | voist lor terres conquester. O lui iront qui qu'en doie pesoier pesoier, / Cuida ce fust Charlemainne au vis fier/ Qui fust/12 | et poindre et eslaissier,/ Parmi ces rues ces lances plaidier | as prouchain, que tu m'y feras mener, je t'aprendray si a plaidier que tuit cil a qui tu as a faire seront convaincu et ma/14 plaire plaire Qu'a moy doye ou puisse desplaire, Et ce j'ay en mon /14 | sanz trouver en tes diz gloses, Nulle chose ne te puet plaire nous doit. Le roy C'est bien voir. Quelle qu'el/14 | e *page=miracles/19 Puis qu'autre ne voulez avoir, plaire Doit qu'il vous serve nuit et jour, tresdoulce vier/14 | e, tresdoulce vierge debonnaire, a tout cuer embelir et plaire au saint Et que l'eglise fust faite la ou il voudroit./14 | nt augustin a pourseoir a touzjours. Car le roy vouloit plaire, Car simple semble et sanz orgueil. LE MARQUIS a son /14 | ueille en bonté parfaire, Et tant qu'elle puisse a Dieu plaire ; / A la Croiz Roge, anmi la lande,/ Pende le brief, si/12 | Un autre brief reface faire,/ S' i face escrire tot son Plaire vous doit, puis que Diu vient en gré." Quant Morgue l'ot,/14 | e a souspiré. "Dame", dist il, si me doinst Dix santé! " pleurer plorer,pleurer plourer,pleurer plorer / Et de pitié doucement souzpirer./ Grans fu la joie/12 | part le sanc cler."/ Celle parole fist mainte gent plorer. / Iluec ot ploré mainte lerme,/ et si oï prendre le t/12 | rendre,/ et oï forment souspirer/ et au congié prendre plorer, / Forment l'en poise, sel prent a conforter :/ "Biax/12 | sera halaigres./ Li cuens Amiles si voit Ami plorer : " Belle ", dist il," laissiés vo duel ester. " O moy/14 | ========= *page=auberon/l 12 Et la pucelle commença a plorer. / Girars li baise et la bouche et le nés./ "Fiz, d/12 | a el palais mené./ Li cuens l'entent, si conmence a | couchie/jouste le duc, a souspirer/ commença et puis a plorer. / Et li dus errant li demande/ que ' est qu' ele a, /12
CONCORDANCE DE VERBES DE L'ANCIEN FRANÇAIS 49
50
HAVA BAT-ZEEV SHYLDKROT
ANNEXE 2 : Liste de verbes Forme conjuguée (ou infinitif) aprendrai aprendras aprendrez aprendrïez aresta aresterent arestez arrivent asenblé asieent assaillent assailli assenble assenblé assenblerent assis atendant atendra atorna atorner atornez avois avoit avra avrai avrons avront
Forme canonique aprendre aprendre aprendre aprendre arester arester arester arriver asenbler asseoir assaillir assaillir assenbier assenbier assenbier asseoir atendre atendre atorner atorner atorner aveir aveir aveir aveir aveir aveir
Analyse de la forme _ _
V:F2s V:F2p V:C2p V:J3s V:J3p V:P2p:Y2p V:P3p:S3p V:Kms V:P3p V:P3p:S3p V:Kms V:Pls:P3s:Sls:S3s:Y2s V:Ks V:J3p V:Kms:Kmp V:G V:F3s V:J2s V:W V:P2p:Y2p V:I2s V:I3s V:F3s V:Fls V:Flp V:F3p
LES ADJECTIFS DÉRIVÉS DE NOMS DE PARTIES DU CORPS (Npc) DANS LES TEXTES MÉDICAUX ANDRÉE BORILLO Université de Toulouse - Le Mirail, ERSS - UMR 56-10
Dans une analyse de corpus de textes spécialisés visant a l'extraction des informa tions, il est assez courant qu'on veuille identifier différents modes d'expression recouvrant des contenus informationnels assez proches, pour ramener cette diversité langagière à une même forme condensée. Généralement, l'objectif n'est pas de reconnaïtre et de traiter des énoncés complets mais plutót de repérer des structures locales telles que des syntagmes nominaux, simples ou complexes, ou des struc tures prédicatives élémentaires. Il va de soi qu'établir une certaine équivalence sémantique entre des structures différentes contenues dans un texte implique d'une part de pouvoir identifier ces structures, d'autre part, de donner á chaque familie l'interprétation qui lui revient. On pourrait de la même façon se placer dans une perspective non plus d'analyse mais de production. Dans ce cas, l'objectif serait de générer des énoncés ou des fragments d'énoncés sous une forme qui rende compte du mode d'expression le plus approprié selon le domaine auquel ils se réfèrent. Pour cela, il faudrait pou voir forger les bonnes expressions, i.e. les énoncés constitués des termes et des structures convenant au genre de discours que l'on veut produire. C'est là une autre façon d'adapter la forme au contenu, mais nous en resterons ici au point de vue de l'analyse.
1. Les Adjectifs ''parties du corps humain" ou Apc Un exemple de cette recherche d'information sera donné a partir d'une familie syntactico-sémantique d'adjectifs dont on peut constater l'usage massif dans les discours médicaux plus ou moins spécialisés, les adjectifs qui se réfèrent aux parties du corps humain (en abrégé Apc). Le terme "parties du corps" a ici une acception plus large que celle qui a cours habituellement en linguistique, car cette classe Apc ne se limite pas aux adjectifs qui se rapportent aux parties le plus couramment évoquées dans des discours non-spécialisés, i.e. les parties externes, visibles, ou les organes internes majeurs du corps humain, mais recouvre Ten-
52
ANDRÉE BORILLO
semble des termes qui entrent dans la description détaillée de l'appareil anatomique et physiologique, dans son état normal ou pathologique, c'est-á-dire qui en globe, en plus des organes, les substances liquides, les fluides, les terminaisons nerveuses, les glandes, les sécrétions, etc. Sans faire appel a un savoir médical très spécialisé, il est assez facile de réunir pour le français plus de 200 adjectifs dont les non-spécialistes ont plus ou moins la compétence, ne serait-ce qu'une compé tence passive. C'est a cet ensemble que cette étude sera limitée (par exemple dentaire, cutané, frontal, sanguin, osseux, cränien, articulaire, pulmonaire, etc.). L'intérêt de ces adjectifs est qu'ils sont très présents dans les divers types de textes relevant du domaine médical. On peut même dire que leur emploi est spécifiquement lié a ce domaine et qu'ils constituent Tune des données lexicales qui connotent tout particulièrement ce genre de discours. Qui plus est, sur le plan pra tique, il est extrêmement facile de trouver de très nombreuses occurrences de ces adjectifs dans un corpus de textes médicaux oraux ou écrits, et de les mettre en correspondance avec des noms se référant a toutes sortes de parties du corps humain, sous-parties, organes, éléments d'organes, etc. Pour ce qui est de leur emploi, ces adjectifs Apc sont utilisés très régulièrement, et même de manière stéréotypée, dans des SN ils remplissent auprès du nom une fonction d'épithète [N1 c] . Généralement, ils figurent seuls a droite du N: cloison nasale, muscle cardiaque, anévrisme cérébral, ulcère gastrique mais on peut également les trouver associés à un second adjectif. Si ce dernier est un adjectif de la même classe Apc, tous deux peuvent se constituer en une seule forme composée ou se présenter indépendamment, l'un a la suite de l'autre: intubation naso-trachéale, fistule gastro-intestinale, ulcère gastro-duodénal, thrombose veineuse cérébrale, ganglion lymphatique abdominal Mais le couplage peut également se faire avec un adjectif d'une classe différente, lui aussi modifieur du nom, avec lequel l'ordre peut être variable selon la nature de la relation établie avec le nom: infection virale intestinale; douleur thoracique respiratoire; substance grise cérébrale Sur le plan syntaxique et sémantique, les adjectifs Apc appartiennent a la grande classe des Adjectifs de relation, dits également "pseudo-adjectifs", qui ont donné lieu à de nombreuses études très détaillées (par exemple J. Pichon 1980,1. Bartning 1976, A. Monceaux 1993). Mais, tout en les rattachant a cette classe, il faut en même temps les regrouper dans la catégorie morpho-sémantique, elle aussi très générale, des Adjectifs dénominaux. Les noms auxquels il faut rattacher les adjectifs Apc sont précisément les noms, simples ou composés, qui réfèrent a l'ensemble des éléments constitutifs du corps humain (parties du corps pris ici au sens très large) que nous désignerons par l'abréviation Npc. Ces noms Npc interviennent de diverses manières dans la formation des Apc:
ADJECTIFS DÉRIVÉS DE NOMS DE PARTIES DU CORPS
53
- soit la dérivation se fait directement par la simple adjonction d'un suffixe: veine/veineuse; intestin/intestinal; os/osseux Mais il est assez courant qu'elle soit accompagnée d'une variation morpho-phonétique de la base nominale: muscle/musculaire, tendon/tendineux - soit il faut établir une équivalence lexico-sémantique entre des bases nominales qui se différencient par leur forme et leur étymologie. La base sur laquelle est formé l'adjectif est le plus souvent empruntée au latin ou au grec (formation dite savante). Elle peut avoir une certaine ressemblance morphologique avec le nom sémantiquement apparenté existant en français si celui-ci a été forgé sur cette même base, mais il n'est pas rare que nom et adjectif proviennent de sources différentes: cœur/cardiaque, cerveau/cérébral, bouche/buccal, poumon/pulmonaire; peau/cutané, foie/hépatique, estomac/gastrique, rate/splénique, sein/mammaire Il peut arriver que deux formes adjectivales différentes, dont les emplois ne se recouvrent pas, dérivent d'un même Npc. Généralement, Tun des adjectifs est plus spécialisé que l'autre, parfois même réserve au domaine médical, alors que le second fait partie du vocabulaire courant et peut recouvrir un sens très différent, qui ne conserve qu'une relation lointaine avec l'anatomie du corps humain ou qui ne peut être exploité sur un plan médical. Dans les faits, cette deuxième forme est d'ailleurs absente des textes médicaux: pédieux/pédestre, sourcilier/sourcilleux, musculaire/musclé D'une manière plus large, au-delá de ce phénomène de doublet, sont également absents un certain nombre d'adjectifs qui, bien qu'appartenant de droit ä la classe Apc parce que formés sur des noms Npc, n'ont que peu ä voir, sémantiquement, avec le domaine médical: manuel, coudé, denté, ventru, fessu, têtu Par ailleurs, des phénomènes d'homographie peuvent se manifester, soit que l'adjectif et le nom apparenté figurent sous le même vocable: muqueuse: muqueuse nasale/secretion muqueuse, soit, à l'inverse, qu'un même adjectif dérive de deux noms différents: auriculaire: qui a rapport ä Voreille; qui a rapport aux oreillettes du œur
2. L'interprétation de l'adjectif dans la structure [N1 Apc] Étant donné qu'un Apc est un adjectif dénominal, il faut voir, dans une première étape, comment son sens se rattache á celui d'un Npc existant ou d'un Npc recons-
54
ANDRÉE BORILLO
truit auquel il est lié soit par une relation stricte (dérivation morpho-sémantique), soit par une filiation plus lache (formation savante). 2.1. Définitions des Apc dans les dictionnaires La manière dont ces adjectifs sont définis dans les dictionnaires reste très vague. Le plus souvent, la définition se résume a des formulations comme qui est relatif à..., qui appartient à..., qui a rapport à..., qui concerne ..., etc. Par exemple: nasal: qui concerne le nez, cutané: qui appartient à la peau, crânien: qui a rapport au crane, musculaire: relatif aux muscles Parfois, la définition est dédoublée, mais sans plus de précision: pulmonaire: qui appartient au poumon, qui affecte le poumon; cérébral: qui appartient au cerveau, qui concerne le cerveau Or, dans les textes spécialisés qui ont pu être soumis a 1'analyse, cette paraphrase n'est pratiquement jamais attestée. Et d'ailleurs, il n'est pas sur que ce soit dans ce sens très général qu'on puisse interpréter les syntagmes de forme [Nl Apc] pré sents dans un texte. Un sens beaucoup plus spécifique semble devoir être accordé a la relation, et c'est ce que Ton fait effectivement si Ton prend en compte les propriétés syntactico-sémantiques du nom N1 que modifie Apc. 2.2. Substitution de Apc par Npc Une solution peut être de remplacer directement l'adjectif, dans le syntagme nomi nal [N1 Apc], par le Npc correspondant. Et de fait, on rencontre couramment dans les textes médicaux des syntagmes ou Npc apparaït dans une fonction de complé ment de nom: la paroi abdominale / la paroi de l'abdomen, une prolifération cellulaire / une prolifération des cellules, une affection cutanée / une affection de la peau Il parait donc intéressant de faire jouer le lien paraphrastique qui existe entre [N1 Apc] et [Nl de Npc], mais, a vrai dire, sur le plan de l'nterpretation, cette mise en correspondance ne fait guère avancer les choses car dans [Nl de Npc], la préposi tion de reste a un niveau trop abstrait et ne fournit pas véritablement le sens précis de la relation qui lie les deux noms. De toute manière, on ne peut pas s'en contenter, car si cette structure offre une paraphrase possible, elle est loin d'être la seule a laquelle on puisse rapporter [N1 Apc]. Les différentes relations que ce simple syn tagme peut recouvrir trouvent dans les textes médicaux des équivalences dans des formulations de nature très diverse, le plus souvent dans des phrases construites avec un verbe support. C'est précisément cette diversité qu'il s'agit de retrouver et d'exploiter; tout d'abord en établissant les liens sémantiques que les différentes structures phrastiques entretiennent entre elles, mais aussi, et c'est l'objectif final, les liens qui par des biais différents les rattachent á la structure [Nl Apc].
ADJECTIFS DÉRIVÉS DE NOMS DE PARTIES DU CORPS
55
2.3. Autres structures que [N1 de Npc] Si, dans le role de modifieur d'un nom, on désire substituer á l'adjectif Apc le nom correspondant Npc, d'autres structures que [N1 de Npc] donnent une expression plus précise et plus explicite du role sémantique dévolu a Npc et donc, indirectement, fournissent une paraphrase plus consistante du sens de l'adjectif dérivé dans le couplage [N1 Apc]. On renvoie ici aux nombreuses recherches effectuées sur les adjectifs dénominaux, et tout particulièrement aux travaux de J. Labelle (1974), I. Bartning (1976), M. Gross (1977), J. Van Baardewijk (1983), M. Hietbrink (1985), . Monceaux (1993). Dans ces études, menées selon des approches assez différentes, des prédictions sont faites sur 1e sens de la relation qui lie l'adjectif dénominal (An) au nom avec lequel il entre en construction [N1 An], à partir des diverses paraphrases fournies par la construction du nom auquel il se rattache (ex.: autorité paternelle: autorité exercée par le père), que Ton peut faire remonter a [père exercer autorité]. Ce type de démarche peut être adopté ici pour les Apc qui se présentent comme une sous-classe particulière des adjectifs dénominaux: dysfonctionnement cardiaque / dysfonctionnement du cœur Leœrprésente un dysfonctionnement / Le cceur souffre d'un dysfonctionne ment Dysfonctionnement est a définir comme un nom prédicatif dont la structure com porte un seul argument, assurant la fonction sujet. Comme il n'est pas directement formé sur un verbe, qui n'existe pas en français a la forme négative, on ne peut pas remonter a un verbe comme on le ferait par exemple pour atrophie ou altération (s'atrophier, s'altérer). Mais ceci ne le prive pas de la possibilité d'utiliser les mêmes verbes supports, présenter ou souffrir de. En effet, tous ces noms appartenant á la même classe peuvent se construire avec le verbe support avoir ou, s'agissant d'un être humain ou d'un animal, avec des variantes telles que présenter, manifester et même souffrir de, puisque dans leur sémantisme intervient un facteur négatif. Ainsi, si l'on étudie le fonctionnement des adjectifs Apc dans la structure [N1 Apc], on peut voir que la relation qu'entretiennent le nom et l'adjectif épithète s'interprète de manière relativement stable et précise si l'on prend en compte la nature lexico-sémantique du N1 qu'il modifie. Par sa nature, le nom Nl impose en quelque sorte un type précis de relation, que ce soit avec le Apc lui-même ou avec le Npc dont l'adjectif est dérivé. Même si cette relation peut être matérialisée de façon très économique par seule adjonction de l'adjectif, ou par l'emploi de la pré position de s'il s'agit de Npc, le lecteur sait l'interpréter d'une manière beaucoup plus spécifique s'il sait reconnaitre les propriétés syntactico-sémantiques du nom N1 auquel le modifieur s'applique. L'objectif est donc d'établir un certain nombre de classes pour les noms N1 susceptibles de se construire avec un adjectif Apc et de voir, pour chaque classe, si un type relativement précis de relation ne peut être induit de ce couplage.
56
ANDRÉE BORILLO
3. Nature lexico-sémantique de N1 dans la structure [N1 Apc] 3.1. N1 est un concret référant à une portie ou un élément constitutif d'un organe a) Il peut s'agir d'une relation partie-tout. Le nom Npc correspondant à Apc entretient avec N1 une relation sémantique de type méronymique, qui le plus souvent se trouve également exprimée de manière assez vague par [N1 de Npc], mais qui dans les deux cas est a interpréter comme "N1 est une portie de Npc", "Npc a un N1": voûte palatine, cloison nasale, valves aortiques, muqueuse buccale, muscle cardiaque, globe oculaire, col fémoral lobe pulmonaire; le lobe du poumon, le col du fémur, la muqueuse de la bouche, la cloison du nez Peu importe si N1 désigne une composante solide ou au contraire un vide ou un creux correspondant á un espace intérieur d'un organe ou d'une région du corps. Cet espace intérieur fonctionne comme une partie constitutive même si, prise au sens strict, la relation est de type topologique: cavité thoracique, cavité ventriculaire, fosse nasale Cependant, si l'on examine tous les syntagmes qui expriment cette relation partietout, on constate que beaucoup d'entre eux se comportent comme des formes composées fïgées, qu'il n'est pas possible de paraphraser et de mettre en concur rence avec des formes construites avec le Npc correspondant, qui d'ailleurs, pour certains, n'existe pas.I1n'y a donc pas a chercher de mise en équivalence pour ces structures [N1 Apc] dans les textes médicaux: cage thoracique, boîte cranienne, os iliaque, moelle épinière, cordon ombilical b) Dans d'autres cas, la relation est plutot a prendre comme une relation de localisation spatiale. - une relation contenu/contenant. N1 renvoie à un élément systémique (système circulatoire, respiratoire, etc.) entretenant une relation de localisation spatiale avec un organe ou une région anatomique désignée par le Npc dont dérive l'adjectif. Autrement dit, il s'agit de constituants organiques distribués dans tout le corps mais dont des sous-ensembles peuvent être spécifiés par la désignation de zones dans lesquelles ils apparaissent. Cette relation spatiale est généralement a inter préter comme une inclusion du premier élément (N1) dans le second (Npc repré senté par son dérivé Apc) ou, plus largement, comme une proximité permettant de situer le premier par rapport au second: veine fémorale, glandes surrénales, nerf crânien, artère pulmonaire, liquide pleural
ADJECTIFS DÉRIVÉS DE NOMS DE PARTIES DU CORPS
57
Dans ce cas, on trouve des paraphrases a cette relation si l'on remonte au nom correspondant, Npc, et si l'on fait appel a des expressions comme contenu dans, dans la région de , au niveau du, du cöté de. (On peut voir que la distance n'est pas très grande entre la relation partie-tout et la relation spatiale de localisation. On pourrait par exemple traiter les cavités, les espaces vides, en termes de relation spatiale et non en termes de relation partie-tout comme il a été suggéré ci-dessus.) - une relation contenant/contenu. Plus rarement, la relation de localisation entre N1 et Npc (et son dérivé Apc) peut se trouver inversée lorsque N1 désigne un organe dans lequel se trouvent ou se déplacent des subtances liquides auxquelles réfère Npc: vaisseaux lymphatiques, vaisseaux sanguins, vésicule biliaire Pour vraiment expliciter la relation, on peut utiliser des expressions telles "contenant", "où circule", mais de fait, dans les textes, on ne trouve guère que la version adjectivale. 3.2. N1 est un nom concret désignant la marque matérielle d'une affection ou d'une pathologie Appartiennent également a la classe des noms concrets quantité de noms présents dans les textes qui renvoient a la matérialisation de pathologies ou de dysfonctionnements, sous forme de manifestations physiques observables (i.e. se manifestant comme des sortes d'objets): lésion, blessure, abcès, hernie, kyste, polype, grosseur, calcul, tache, tumeur, etc. Du fait de ce caractère concret, matériel, N1 peut fonctionner comme complé ment d'objet de verbes de perception (voir, observer, déceler) ou comme sujet de verbes de localisation tels que se trouver, être dans, être sur ou leur variante il : taches cutanées, polype nasal, tumeur hépatique, hernie abdominale, abcès dentaire; On observe des taches sur la peau. lI y a un polype dans le nez Les verbes avoir, présenter ou même souffrir de sont employés lorsque le nom sujet désigne le patient lui-même et non l'organe directement concerné: Le patient a une tumeur aufoie On pourrait donc penser a assimiler ces N1 á des noms d'état désignant des affections (cf. 3.3 infra), mais la préposition généralement utilisée dans ce cas est une préposition de lieu: sur, dans, a et non de comme pour les véritables noms d'état, avec lesquels il est rare que Ton trouve ces prépositions: un décollement ä la rétine, une atrophie au cerveau
ANDRÉE BORILLO
58
3.3. N1 est un nom d'état désignant affections, atteintes, maladies, pathologies Le deuxième type de nom qui apparaït fréquemment dans un texte médical, couplé a un Apc, est un nom d'état appartenant ä la classe sémantique assez bien circonscrite des 'Affections', 'Atteintes', 'Maladies', 'Pathologies'. Très souvent, il s'agit de Nprédicatifs dérivés d'un adjectif ou d'un participe passé de sens résultatif, mais ceci n'est pas une condition nécessaire (ex. trouble, affection, anomalie,...): Nadj
raideur, opacité, rigidité, insuffisance, acidité, anomalie: raideur articulaire, rigidité pupillaire, insuffisance cardiaque
Nvppassé hypertrophic paralysie, occlusion, atteinte, malformation, épaississement, rétrécissement, irritation, décollement, infection, inflam mation, perturbation: paralysie facíale, décollement rétinien, malformation cardiaque Les verbes support qui fonctionnent avec cette classe de noms sont des verbes d'état comme avoir, manifester, présenter, subir, être affecté de, être atteint de, souffrir de (cf. Labelle 1974). Dans la construction la plus courante, le sujet, dans le role sémantique de Patient, est rempli par le Npc dont dérive l'adjectif (rigidité pupillaire, atrophie cérébrale): La pupille manifeste une certaine rigidité Le cerveau est atteint d'atrophic Le cerveau présente une atrophie Certains de ces verbes, comme affecter, atteindre, peuvent être utilisés a la forme active, et sont très proches alors de verbes décrivant une activité ou un processus (cf. 3.5 infra) tels que gagner, s'emparer de, s'étendre ä, etc. Dans ce cas, les noms Npc n'opèrent plus avec la fonction sujet mais avec la fonction objet: La paralysie atteint le cerveau. 3.4. N1 est un nom d'action 3.4.1. Noms d'action supposant un agent humain L'action s'applique a la partie du corps représentée par Apc: examen, auscultation, exploration, opération, diagnostic, massage, transfusion, transplantation: examen pulmonaire, greffe oculaire, échographie cardiaque, transplantation rénale Dans des structures de phrase attestées dans des textes médicaux, ce type de nom se construit avec un verbe agentif transitif direct: faire, effectuer, pratiquer, pro céder à, opérer, etc.: On procède a un examen pulmonaire / des poumons. On pratique une greffe oculaire / des yeux Dans un certain nombre de cas, si N1 est un déverbal (examen, prélèvement,
ADJECTIFS DÉRIVÉS DE NOMS DE PARTIES DU CORPS
59
irradiation, etc.), on peut avoir recours directement au verbe lui-même, celui-ci pouvant fonctionner a la forme active ou passive. Mais alors, du fait de la disparition de N1, le deuxième terme de la relation ne peut être Apc, mais uniquement Npc, devenu argument du verbe: On a examiné les poumons. Les poumons ont été examinés La substitution de N1 par le verbe correspondant révéle parfois Tambiguïté de certains de ces noms, qui peuvent être utilisés soit comme noms d'état, soit comme noms d'action, soit encore comme Noms de procès. C'est le cas par exemple de dilatation pupillaire, que l'on peut interpréter dans le sens de "On a dilaté la pupillen ou de "la pupille se dilate", mais ces cas restent assez rares. L'emploi de Tadjectif recouvre assez souvent des constructions elliptiques. Par exemple, avec un N1 nom d'action de type transitif, Tadjeetif peut correspondre a un complément de lieu et non au complément d'objet qui normalement constitue un argument de N1: injection cardiaque, prélèvement veineux. Le complément d'objet peut rester implicite soit parce ce qu'il est facilement recouvrable, soit parce qu'il n'est pas jugé nécessaire pour Tinformation a transmettre: prélèvement veineux, injection cardiaque On prélève (du sang) dans les veines. On injecte (un produit) dans le cœur 3.4.2. Noms de techniques, de procédés ou de mode de reproduction Ceux-ci fonctionnent a la manière des noms d'action, même si, pour la plupart, ils ne dérivent pas de verbes: biopsie, radio, scanner, cliché, endoscopic Pour cer tains, le même terme recouvre le procédé et le résultat, i.e l'objet concret matériel produit á Tissue de l'opération effectuée (c'est le cas de radio, cliché, etc.): scanner abdominal, radio thoracique, biopsie pulmonaire Fonctionnant comme des noms d'action, ils se construisent comme eux avec un verbe agentif transitif direct de type faire, pratiquer, effectuer, employé éventuellement a la forme passive: On a effectué une biopsie pulmonaire. Un scanner de l'abdomen a été pratiqué 3.4.3. Par extension, on peut ajouter un certain nombre de noms concrets désignant des instruments ou des appareils, pour lesquels le verbe support exprimant l'action n'est pas faire mais placer, appliquer, introduire, etc. ou leur correspon dant converse: enlever, retirer, ôter, etc.: sonde nasale, drain pleural, cathéter artériel La sonde nasale a été retirée. Un cathéter a été placé dans l'artère Les prépositions de lieu sur, dans, utilisées avec le Npc correspondant lorsque Taction est effective, peuvent laisser la place à pour si le lieu, i.e. la destination potentielle, devient une caractérisation pour la catégorisation de Tinstrument.
60
ANDRÉE BORILLO
Cette variation montre que l'adjectif peut être soit un adjectif localisant, soit un adjectif catégorisant: sonde nasale, sonde trachéale, sonde vésicale, sonde auriculaire Une sonde est placée dans le nez. Une sonde pour le nez 3.5. N1 est un d'activité ou de procès N1 exprime une activité ou un processus (plus précisément un déplacement) s'il s'agit de fluides (sang, humeurs, urine, etc.). Pour certains d'entre eux, il n'existe pas de correspondance verbale, ou du moins celle-ci n'a pas lieu d'être sollicitée pour l'usage qui est le leur dans le domaine médical. C'est le cas par exemple pour atteinte, défalliance, occlusion, réaction, déformation, dégénérescence. En revan che, pour d'autres, une correspondance avec des verbes intransitifs ou pronominaux (se V) se trouve largement attestée dans les textes: calcification, circu lation, sécrétion, écoulement, absorption, amélioration, multiplication, proli fération, etc. Qu'il s'agisse du nom lui-même ou du verbe apparenté, l'adjectif Apc peut être substitué par le Npc correspondant affecté de fonctions différentes par rapport au verbe: - Npc avec la fonction de sujet: N1 entre en construction avec un verbe support renvoyant ä un processus qui met en cause l'organe désigné par Npc: manifester, avoir, présenter, être soumis ä, etc.: calcification aortique, déformation thoracique, occlusion artérielle L'aorte subit une calcification. Le thorax présente une déformation Parfois, N1 peut laisser la place au verbe apparenté qui lui-même s'analyse comme un processus: amélioration respiratoire, prolifération cellulaire, fibrillation auriculaire La respiration s'améliore. Les cellules prolifèrent - Npc avec la fonction de complément de lieu: si Ton s'en tient au fonctionnement de N1, sans remonter au verbe dont il dérive, l'adjectif Apc peut laisser la place au Npc correspondant, devenu complément de lieu grace aux prépositions dans, en provenance de ,par ou à travers: circulation cérébrale, fermentation intestinale, absorption cutanée, inspiration nasale circulation (du sang) dans le cerveau, fermentation (...) dans Vintestin, inpiration (...) par le nez Comme pour les noms d'action (cf. 3.4 supra), il est clair que Ton a affaire ici, avec les verbes d'activité ou de procès, a une structure elliptique dans laquelle l'adjectif Apc représente le complément de lieu et non le complément d'objet qu'il n'est pas nécessaire d'exprimer. Ce raccourci que permet la structure [N1 Apc] est très couramment adoptée dans les textes médicaux.
ADJECTIFS DÉRIVÉS DE NOMS DE PARTIES DU CORPS
61
Conclusion Le sens très général qui est habituellement donné aux adjectifs Apc: qui est relatif ä Npc, qui concerne Npc, etc. explique sans doute qu'ils puissent être utilisés pour exprimer des relations très nettement différenciées. Parce qu'ils représentent une forme d'expression très condensée, leur emploi en fonction épithétique s'avère a la fois très flexible et très économique. Ils surpassent en cela les Npc auxquels ils se rapportent, tout d'abord sur le plan de la condensation puisque ceux-ci ont quand même besoin, pour leur construction, de l'ajout d'une préposition, mais également sur le plan de la flexibilité puisque leur fonction d'épithète recouvre a la fois la fonction de complément de nom et de complément de lieu, fonctions qui restent formellement différenciées pour le nom. Cette sous-détermination, ainsi que la possibilité qu'ils ont de constituer avec N1 des structures elliptiques réalisant l'économie d'un argument, leur donne un avantage certain par rapport au nom. C'est peut-être ce qui explique leur présence massive dans certains domaines techniques spécialisés comme le domaine médical et la propension qu'ils ont a former avec les noms qu'ils modifient de véritables formes composées. Maintenant, si l'on veut expliciter les divers sens qu'un Apc peut prendre en fonction épithétique [N1 Apc], on n'arrive a dormer une interprétation précise de la relation qui le lie a N1 que si l'on examine très précisément les propriétés sémantiques que ce nom possède et si Ton combine ces propriétés avec celles que l'adjectif Apc tient du nom Npc correspondant. C'est a partir de ces propriétés qu'on peut établir le sens de la relation qui les lie et que l'on sera capable de retrouver l'ensemble des paraphrases susceptibles d'apparaître par ailleurs dans les textes médicaux, paraphrases qui, regroupées en families, pourront être ramenées a une même forme canonique choisie comme la plus représentative de l'information commune véhiculée.
Références Bartning, I. 1976. Remarques sur la syntaxe et la sémantique des pseudo-adjectifs dénominaux en français. Thèse de doctorat, Université de Stockholm. Gross, M. 1977. Grammaire transformationnelle du français. Syntaxe du nom. Paris: Larousse. Hietbrink, M. 1985. A propos du statut exceptionnel des adjectifs dénominaux. Langue française 66, Paris: Larousse. Labelle, J. 1974. Étude de constructions avec operateur Avoir. Thèse de 3ème cycle, Université Paris 7. Monceaux, A. 1993. La formation des mots composés de structure Nom Adjectif. Thèse de Doctorat, Université Paris 7. Pinchon, J. 1980. Syntagme prépositionnel et adjectif de relation. Cahiers de lexicologie 37-2.
62
ANDRÉE BORILLO
Van Baardewijk-Rességuier, J. 1983. La non-alternance entre syntagme prépositionnel et adjectif de relation. Cahiers de lexicologie 43-2.
Summary Among the large category of Adjectives, we selected an interesting subset of denominal adjectives issued from nouns referring to parts and regions of the human body - external parts as well as internal organs - called "Noms de parties du corps" (Npc). These adjectives are so massively used in medical discourse that they could be taken as a lexical parameter for this register identification They are generally used with an attri butive function [SN [N Apc]], but the head noun they modify may belong to different categories. It can be nouns with a referential content (parts of the body or material objets) but also nouns most generally derived from verbs or adjectives, representing states, actions or processes ("predicative nouns"). According to the category of the head noun, the relation expressed by the Apc can be interpreted in different ways: as a partwhole relation when the head noun denotes itself a body part, as a locative relation with nouns referring to physical objets of all sorts, but when it is coupled with a predicative noun, the adjective Ape is to be taken exactly as the nominal base (the noun from which it derives) would be, that is it has to be considered as an argument within the verbal structure defined by an agentive verb such as faire, pratiquer, provoquer (to make, to cause) or by a stative verb such as avoir (to have), présenter, manifester (to exhibit).
Á PROPOS DES PHRASES TRANSITIVES EN ARABE SUR QUELQUES CRITÈRES DE RECONNAISSANCE DES OBJETS DIRECTS
MOHAMED CHAD Université de Fès
Présentation Nous présentons ici d'une façon synthétique les critères de reconnaissance des objets directs en arabe. Les constructions syntaxiques considérées sont régulières et ont la structure V No W. Une telle formulation comporte différentes implications que nous ne saurions traiter dans les limites de cet article; nous précisons cependant que, si la partie V No de la structure considérée est d'une grande généralité, la variable (W) couvrant tous les compléments pose, par contre, de nombreuses difficultés. D'abord, les séquences compléments présents dans une phrase sont traditionnellement divisées en compléments d'objet essentiels et en compléments circons tanciels qu'on peut toujours omettre. Les compléments peuvent être des groupes nominaux (directs ou prépositionnels) ou bien ce sont des propositions (complétives objets ou subordonnées circonstancielles). Il a été démontré que cette ana lyse manque parfois de précision et qu'il existe de nombreuses ambiguïtés qui rendent difficile la reconnaissance des divers types de compléments.1 Ensuite, les divergences terminologiques, d'une langue a l'autre et d'un modèle conceptuel a l'autre, ajoutent ä la confusion.2 Nous n'insisterons pas ici sur le caractère insaisissable de l'objet, caractère qu'il partage avec d'autres instruments de base de l'arsenal linguistique; notre objectif est de mettre en évidence quelques difficultés liées l'étude des objets directs notamment en ce qui concerne les critères qui permettent de les distinguer des autres compléments, car nous pensons que la fonction d'objet, malgré son caractère fuyant pour cause d'imprecision et d'ambiguïtés inhérentes, permet pa-
1 2
M. Gross (1994). Ce sont ces impréeisions qui offrent un fondement au jugement péremptoire, bien connu, de M. Gross, selon qui le complément d'objet n'a pas de définition opératoire (M. Gross 1969, D. Willems et L. Melis 1997).
64
MOHAMED CHAD
radoxalement d'expliquer plusieurs phénomènes syntaxiques.3 Dans ce qui suit, nous donnerons un aperçu des différentes propriétés reconnues par la tradition indo-européenne pour définir un complément d'objet, et ce, en vue de mesurer leur degré d'adequation en arabe.
1. Permutations internes et externes Selon Blinckenberg (1960:67) la permutation est "le meilleur critère pour déter miner de façon adéquate les limites de la transitivité des verbes dans le français moderne". Cette proposition se trouve justifiée dans la mesure ou la variation de l'ordre des mots permet de tester le degré de cohésion qui existe entre les constituants d'une phrase. En arabe, l'ordre des mots dans une phrase verbale est généralement V N0 N1, suivant cet ordre, et, s'agissant de l'objet direct, deux variations sont possibles: V N1 N0 et N1 V N0. La première forme est dite permutation interne, puisque le complément concerné se situe entre le verbe (V) et le sujet (No); la seconde, soit N1 VN0, est dite permutation externe: le complément occupe la position tête même s'il reste casuellement régi par le verbe (cf. Chad 1988). Les compléments se placent directement après le verbe et son sujet dans une configuration du type V No W,oùWjoue le role d'une variante recouvrant tous les compléments, qu'ils soient des objets directs ou des compléments circonstanciels ou absolus (mes masdars =: V-n). L'application du test de la permutation sur ces compléments nous donne un résultat similaire. Observons les phrases suivantes:4 V N0 N1 [N Loc]
=:
V N0 N1 [N Temps] =: V N0 N1 [O. direct] =: V N0 N1 [V-n]N2
=:
(1)
daxala zaydun l-madinata Entra Zayd la ville (2) na:ma zaydun l-laylata Dormit Zayd la nuit (3) 'akala zaydun tamaran Mangea Zayd des dattes (4) mafa: zaydun mafyata l-junu:d Marcha Zayd la marche des soldats
Les noms se terminant par -a (ou -an) sont respectivement des compléments de lieu, de temps, d'objet direct et absolu. En procédant a la permutation interne nous obtenons: V N1 [N Loc]
3
N0
=:
(1a)
daxala l-madinata zaydun Entra en ville Zayd
Parmi ces phénomènes, nous citons: l'apparition du de négatif, l'alternanee passive, la realisa tion directe ou indirecte du premier argument dans la construction causative, le fonctionnement du Substitut en. 4 Voir le Système de transcription en annexe.
PHRASES TRANSITIVES EN ARABE
V N1 [N Temps] N0 =:
(2a)
V N1 [O. direct] N0 =:
(3a)
V N1 [V-n]N2
(4a)
N0
=:
65
na: ma l-laylata zaydun Dormit la nuit Zayd 'akala tamaran zaydun Mangea des dattes Zayd mafa: mafyata l-junu:di zaydun Marcha la marche des soldats Zayd
Il paraît ainsi que le test de la permutation ne permet d'écarter aucun des com pléments qui s'identifient de par leur position et leur marque casuelle au complé ment d'objet direct et reste, pour ainsi dire, un critère non opérationnel pour le cas de l'arabe. La même constatation est valable dans le cas de la permutation externe, excep tion faite toutefois de la phrase a complément de lieu qui, semble-t-il, n'admet pas ce type de variation: N1 [N Loc] V
N0
=:
N1 [N Temps] V N0 = ' N1 [O. direct] V N0 =: N1 [V-n] N2 V
N0
=
:
(1b) ? * l-madi: nata daxala zaydun La ville entra Zayd (2b) l-laylata na:ma zaydun La nuit dormit Zayd (3b) tamaran akala zaydun Des dattes mangea Zayd (4b) mafyata l-junu:di mafa zaydun La marche des soldats marcha Zayd
A la suite de ces observations, nous concluons que la permutation, sous ses deux formes, ne saurait constituer un critère formel suffisant pour reconnaïtre un objet direct en arabe.
2. Relativisation La relativisation est une autre propriété généralement admise par la tradition grammaticale pour définir les objets directs. En arabe, l'application de cette opé ration est impossible pour la simple raison qu'on ne dispose pas d'un pronom relatif formé ä partir d'un objet direct. Par ailleurs, un pronom relatif de type lladi (qui, que) peut entretenir un rapport de coréférence avec tous les arguments d'une même construction. Les phrases suivantes rendent compte de cette situation: V N0 Prép N1 N2 N0 lladi V N2 Prép N1 N2 lladi VN0Prép N1
=: (5)
Sana&a zaydun li-bnihi Sundu:qan Zayd fabriqua une caisse ä son fils =: (5a) zaydun lladi Sana&a li-bnhi Sundu:qan Zayd qui fabriqua à son fils une caisse =: (5b) S-Sundu.qu lladi Sana&a zaydun li-bnhi La caisse que Zayd fabriqua a son fils
66
MOHAMED CHAD
N1i lladi V Prép-proi N0 N2 =: (5c) /- 'ibnu lladi Sana&a lahu zaydun Sundu:qan Le fils qui fabriqua a lui Zayd une caisse
3. Pronominalisation Tout pronom personnel rattaché directement au verbe se réfère obligatoirement au complément d'objet direct initial, constituant pour ainsi dire le test formel de la transitivité. C'est déja la position d'Ibn Malik (1273) qui affirme que "l'indice d'un verbe transitif est d'accepter un pronom (h) directement rattaché à lui, et se référant a un complément non confondu avec le masdar". Soit l'exemple: V
N0N1
=:
(6) xa:Tatfa: Timatu l-kiswata A confectionné Fatima la robe
Après pronominalisation du complément l-kiswata (la robe), nous obtenons: N V Pps (ha) N0 =:
(6a) l-kiswatu xa:Tat-hafa:Timatu La robe a confectionné-la Fatima Le complément d'objet, tête de phrase, prend le cas du nominatif (u) et devient en même temps le référent du pronom (hú).5 Cette règle permet de dissocier les phrases du type (7) et (8) dont le complément est identique: (7) (8)
ma.ta zaydun yawma &a: fura:' Est mort Zayd le jour de l'achoura yu&azzimu f-fi:&atu yawma &a: fura:' Vénèrent les chiites le jours de l'achoura
Après pronominalisation du complément yawma &a: fura:' (le jour de l'achou ra), la phrase prendra la forme: (7a) (8a)
yawma &a: fura:' ma.ta fihi zaydun Le jour de l'achoura est mort dans-lui Zayd yawma &a: fura:' yu&azzimuhu f-fi:&atu Le jour de l'achoura vénèrent-le les chiites
En (7) le complément considéré remplit la fonction d'un circonstanciel de temps et l'application de la pronominalisation (7a) fait apparaitre une forme prépositionnelle rattachée au pronom fi-ha (dans-lui) comme pour marquer la nature Notons que le masdar pronominalisé peut avoir le même comportement qu'un objet direct; V NO masdar =: 'inTalaqa zaydun 'inTilaqan ha'ilan (Commença Zayd d'un commencement prodigieux); la pronominalisation donnerait une phrase comme: masdar Adj V PpsNO =: 'al-inTilaqu l-ha'ilu inTalaqahu zaydun (Le commencement prodigieux Zayd le commença); mais le masdar entretient avec le verbe une relation morphologique qui permet de l'isoler sans trop de difficulté.
PHRASES TRANSITIVES EN ARABE
67
du complément. En (8) et (8a) par contre, le pronom est directement lié au verbe, signe de la transitivité de ce dernier. Toutefois nous précisons que le comportement des constructions transitives et intransitives vis-á-vis de la pronominalisation n'est pas toujours aussi régulier qu'on le pense. En effet, nous avons relevé le cas particulier des phrases a com plément de temps qui admettent les deux formes de pronominalisation (directe et indirecte): (9)
Sa:ma zaydun ramaDa:na Jeûna Zayd le ramadan Sa: zaydun fi ramaDa:na Jeûna Zayd dans le ramadan
= (9a)
Cette possibilité, nous semble-t-il, est liée au fait qu'à l'origine le locatif est réductible: Loc = 0, d'où: (10) (10a)
ramaDa:nu Sa:ma fi:hi zaydun Ramadan jeüna dans-lui Zayd ramaDa:nu Sa:ma-hu zaydun Ramadan jeüna-le Zayd
Dans ce sens, nous suggérons de completer la règle proposée par Ibn Malik de la manière suivante: Est classée comme intransitive toute construction a complément direct en -a, dans laquelle les deux formes de pronominalisation sont confirmées d'où la relation d'équivalence: N¡ V-pro (-hu) = V Prép-pro (-hu) N0. Force est de constater que cette proposition omet le cas du masdar (V-n). Ce der nier est toujours marqué par la désinence -a, quelle que soit la structure des phrases où il apparaït; d'autre part, il s'adapte facilement aux deux formes de pronominalisation, comme le montre aisément l'exemple (11): (11)
V NO V-n (=masdar)
qa:la zaydun qawlan A dit Zayd un dire ↔ V-n V-pro (-hu) N0 al-qawlu qa:lahu Zaydun Le dire a dit-le Zayd ↔ V-n V Prép-pro (-hu) N0 'al-qawlu qa:la bi-hi Zaydun Le dire a dit en-lui Zayd
Nous devons donc reformuier notre proposition de la manière suivante: Tout complément non confondu avec le masdar (V-n) de la même construction est complément d'objet direct si, après pronominalisation de ce dernier, le pro nom se rattache obligatoirement au verbe.6 Sans nier la validité d'un tel procédé, ni son caractère opérationnel certain, la défi6
Notons l'existence d'emplois à la fois transitifs et intransitifs.
68
MOHAMED CHAD
nition d'Ibn Malik présente certaine lacune. En effet, s'il est facile de démontrer qu'un circonstanciel du type masa: 'an (soir) ne peut être confondu avec un objet direct même si, en surface, il occupe la même position que ce dernier, la définition proposée par l'auteur ne s'applique pas toujours avec la même régularité. Dans la phrase: (12)
'akalazaydun masa: 'an Mangea Zayd soir
le complément circonstanciel de temps masa: 'an (soir) porte la même marque casuelle (-a) que l'objet direct et sa pronominalisation donne une phrase du type: (12a)
'al-masa:'u 'akala fi-hi zaydun Le soir mangea dans-lui Zayd
et non pas: * 'al-masa: 'u 'akala-hu zaydun Le soir mangea-le Zayd Le résultat est donc différent de celui observé avec le complément de temps ramaDan dans (9).
4. La question Le test de la question est une propriété formelle qui a été utilisée par les grammairiens arabes pour reconnaitre un objet direct. En fait, la distinction des deux classes verbales, les transitifs et les intransitifs, repose sur cette même propriété. C'est déja la position que nous retrouvons chez Ibn Ya&i:f (1245) lorsqu'il écrit: "Sache que les verbes sont de deux sortes: transitifs et intransitifs. Est transitif le verbe dont l'existence appelle une place autre que celle du sujet, c'est la place de l'objet (direct) qui peut bien être la réponse à la question biman fa&alta ? (De qui as-tu fait ?)"; l'auteur poursuit: "Ne vois-tu pas que les verbes comme daraba (frapper) et qatala (tuer) nécessitent un frappé, un tué... Ne voistu pas que qa:ma (se lever) et dhaba (partir) ne dépassent guère leur sujet ?". L'une des premières constatations qu'on pourrait faire est que la question en biman fa&alta n'est pas le fait des seuls objets directs. Considérons les construc tions suivantes: (13) (14) (15)
qatala zaydun &amran Zayd a tué Amr ra 'afa zaydun bi fa: Timata Zayd a eu pitié de Fatima tawaqqafa zaydun Zayd s'est arrêté
PHRASES TRANSITIVES EN ARABE
69
Á la même question correspondent aussi bien des compléments d'objet (directs ou indirects) que des sujets. Les questions-réponses suivantes illustrent respectivement cette situation: (13a) - bimanfa&alta l-qatla ? De qui as-tu fait la mort ? - bi &amrin Avec Amr (14a) - biman fa &alta r-ra'fata ? De qui as-tu fait pitié ? - bi fa.Timata Avec Fatima (15a) - bimanfa&alta t-tawaqqafa ? De qui as-tu fait l'arrêt ? - bi zaynin Avec Zayd La propriété de la question n'est donc pas suffisante pour reconnaïtre un complé ment d'objet direct. Dans la suite de l'exposé, nous verrons qu'une reformulation de la dite propriété est nécessaire. Dans Chad (1981), nous avons suggéré de définir la construction transitive comme étant celle qui comporte un complément pouvant répondre à la question en mada dans une structure du type: mada V N0 (Qu V N0). Nous augmenterons ici cette même structure d'un autre pronom interrogatif, a savoir le pronom man, et nous la reformulerons comme suit: mada, man V N0 ? que, qui V N0? Le choix des pronoms est lié a la nature lexicale des compléments. Ainsi, le pronom interrogatif man correspond a tout complément dont la propriété distributionnelle est de type [+hum]; le pronom ma:da, par contre, concerne essentiellement les compléments de type [-hum]. L'examen des phrases (16) et (17) apporte une illustration a cette situation: (16)
yuHibbu zaydun (l-laymu:na + l-qira: 'ata) Zayd aime (les oranges + la lecture)
La question la plus naturelle serait: - ma:da yuHibbu zaydun ? Qu'est-ce que Zayd aime ? Avec un complément de type [+hum] comme dans: (17)
yuHibbu zaydun fa: Timata Zayd aime Fatima
la question serait:
70
MOHAMED CHAD
- man yuHibbu zaydun ? Qui aime-t-il ? L'application du test de la question permet de distinguer les compléments qui, en portant la même marque qu'un objet direct, se confondent avec lui. Si nous considérons des phrases comme: (18) (19) (20)
balaga l-fayaDa:nu l-qaryata Les inondations ont atteint le village balaga l-xabaru zaydan La nouvelle parvint à Zayd balagat fa: Timatu sinna z-zawa:ji Fatima a atteint Tage du mariage
Sur le plan sémantique, les compléments sont des destinations du verbe balaga (atteindre). Pourtant, chaque phrase met en jeu une structure interrogative qui lui est particulière. Considérons les phrases suivantes: (18a) (19a) (20a)
'ayna balaga l-fayaDa.nu ? Ou arriva Pinondation ? liman balaga l-xabaru ? Á qui parvint la nouvelle ? :da balagatfa: Timatu ? Qu'a atteint Fatima ?
En (18a) la destination est un locatif, ce qui est conforme a l'utilisation du pronom 'ayna (où); en (19a), l'apparition de la forme prépositionnelle li (a) pose la question de la relation d'équivalence entre les structures directes de la forme: V N0 Prép N1 ↔ V N0 N1. Pour la phrase (20a), le morphème interrogatif ma:da (que) est l'indice d'un emploi transitif, même si le complément sinna z-zawa:ji (l'âge du mariage) fait fonction de circonstanciel de temps. Ces quelques remarques conduisent á une seule conclusion: Poccurrence de tel ou tel pronom interrogatif n'est pas seulementliéá la nature distributionnelle des compléments, mais semble dépendre de la combinaison particulière verbecomplément.
5. Participe passif L'essentiel de cette propriété se résume dans la relation d'équivalence du type V N0 N1 ↔ N1 Vpp où le N1 devient sujet du participe passif. Les exemples suivants illustrent cette relation: V N0 N1 =: (21)
'aHabba zaydun fa:Timata Zayd a aimé Fatima
PHRASES TRANSITIVES EN ARABE
N1 Vpp
71
=: (21a) fa:Timatu maHbubatun Fatima est aimée
Certains compléments circonstanciels donnent lieu a une confusion avec les compléments directs, dans la mesure ou ils peuvent occuper la même position syntaxique qu'un objet, i.e. directement après le sujet; d'autre part, ils sont susceptibles de recevoir la même marque casuelle qu'un objet. Les séquences suivantes constituent un exemple de la situation a décrire: (22)
daxala zaydun l-madi:nata Zayd entra en ville ya 'kulu zaydun s-sa: &ta Zayd mange à cette heure
(23)
Si nous pronominalisons les deux circonstanciels, à savoir l-madi:nata (la ville) dans (22) et s-sa:&ta (l'heure) dans (23), nous aboutissons aux formes: (22a) (23a)
l-madi.natu madxu:iun 'ilayha: s-sa:&tu ma 'kulunfi:ha:
alors que la relation d'equivalence proposée au début de cette section donne des formes agrammaticales: * l-madi:natu madxu:latun * s-sa:&tu ma 'kulatun Les N1 l-madi:natu (la ville) et s-sa:&tu (l'heure) ne sont donc pas des complé ments d'objet direct puisqu'ils n'entrent pas dans la relation: V N0 N1 ↔ N1 Vpp mais plutôt dans V N0 N1 ↔ N1 Vpp Loc Pps, où un complément prépositionnel (préposition locative rattachée a un pronom personnel) suit obligatoirement le participe passif. Cette contrainte fait toute la différence entre l'objet direct et les autres compléments et a été adoptée par plusieurs auteurs, notamment RADI (1 285 environ), selon qui: "la définition la plus immédiate de l'objet direct serait de dire que c'est le nom qui peut être désigné par un participe passif non suivi obligatoirement par un complément prépositionnel". La question qui se pose maintenant est de savoir pourquoi mettre en relation l'objet direct d'une transitive et le sujet du participe passif alors que, dans 1'esprit des grammairiens arabes, celui-ci devrait être plutot en relation avec le sujet de la construction verbale passive, car au sujet du participe passif correspond l'objet du participe actif: V
N0
N1
↔ Vpassif
N1
(24)
'akala zaydun tuffa:Han Zayd mangea des pommes (24a) 'ukila t-tuffa:Hu Des pommes furent mangées
72
MOHAMED CHAD
No Vp actif N1 (25) ↔ N1 Vp passif
zaydun 'a:kilun tuffa:Han Zayd mangeant des pommes (25a) t-tuffa:Hu ma'kuilun Des pommes mangées
La relation V N0 N1 ↔ N1 Vpp que nous sommes en train de décrire peut être motivée par au moins deux arguments. D'une part, les auteurs qui ont traité de la question ont essayé de donner un fondement formel a la notion de complément d'objet direct; il était alors plus difficile de le redéfmir comme le sujet de la phrase passive car cette dernière peut admettre un sujet qui ne serait pas forcément l'objet de la phrase active correspondante. D'autre part, en définissant l'objet direct comme étant le sujet de tout participe passif non suivi obligatoirement d'un complément prépositionnel, on a réussi ä l'isoler formellement des autres compléments. Il existe cependant, des cas qui vont a contre-courant de la relation décrite cidessus. Il s'agit d'une classe de verbes transitifs qui se construisent obligatoirement avec des compléments prépositionnels. En effet, une phrase comme: (26)
fa:ba zaydun l-ma 'a bi s-sukkari Zayd mélangea l'eau avec du sucre
Serait inacceptable en l'absence du complément d'objet: (27) * fa:ba zaydun l-ma 'a Zayd mélangea 1'eau Dans ces conditions, seule une construction ä participe passif serait possible, et l'objet direct l-ma'a (l'eau) désigné par le participe passif, se trouve contraint par un complément prépositionnel s-sukkari (avec le sucre): (28)
'alma ' mafubun bi s-sukkari L'eau est mélangée au sucre
La relation entre V N0 N1 et N1 Vpp n'est pas systématique et les difficultés observées sont de deux types. La première correspond aux contre-exemples de la relation en question et regroupe des verbes comme 'a:xada (reprocher), 'ana: (charger quelqu'un de quelque chose), da:na (devoir a quelqu'un), daraHa (mélanger), fa:ba (mélanger), fagufa (enticher), karrasa (consacrer), mazaja (mélanger)7. Le second cas concerne les verbes dont on ne peut prédire si leur complément est obligatoire.
7
Ces cas ne sont pas nombreux; voir les tables de Chad (1981).
PHRASES TRANSITIVES EN ARABE
73
6. Objet direct et prepositions redundantes Ce sont des phrases comme: (29)
sami&a zaydun &amran entendit Zayd Amr ↔ sami&a zaydun bi &amrin entendit Zayd de Amr
qui sont a l'origine de notre investigation. Elles font apparaître des verbes qui s'emploient dans des structures ä objet aussi bien direct qu'indirect, d'où l'equi valence V N0 N1 ↔ V N0 Prép N1.8 Les données dont nous disposons montrent que les prépositions concernées par la relation présentée ci-dessus sont en nombre limité et correspondent aux formes li (á), min (de), fi (dans) et bi (avec) illustrées respectivement par les exemples (30), (31) et (32): (30)
fakara zaydun &amran Remercia Zayd Amr ↔ fakara zaydun li &amrin Remercia Zayd a Amr (31) na: la 1-maraDu zaydan Éprouva la maladie Zayd ↔ na:la 1-maraDu min zaydin Éprouva la maladie de Zayd (32) baHata zaydun l-qaDiyyata Examina Zayd l'affaire ↔ baHata zaydun fi l-qaDiyyati Examina Zayd dans l'affaire
Les deux premières phrases ont des emplois liés aux verbes du type fakara (remercier), naSaHa (conseiller) et na:la (éprouver). L'occurrence des formes ƒi (dans) et bi (avec) s'accompagne par contre d'un certain nombre de contraintes. En effet, nous avons relevé des cas où l'effacement de la préposition conduit a des phrases douteuses ou agrammaticales. Par exemple, pour une phrase comme: (33)
baHata &amrun qaDiyyata zaydin ma&a kari:min Examina Amr l'affaire (de) Zayd avec Karim
on pourrait établir une relation avec la structure à complément prépositionnel Prép N1: ↔ baHata &amrunfi qaDiyyati zaydin ma&a kari.min Examina Amr dans l'affaire (de) Zayd avec Karim 8
Les grammairiens arabes classent ces verbes parmi les transitifs et considèrent les préposition en jeu comme syntaxiquement redondantes.
74
MOHAMED CHAD
Cette possibilité n'est cependant pas sans incidence sur la nature interprétative des phrases. Ainsi, la réduction des prépositions peut produire des phrases douteuses comme dans (34): (34)
baHata fi &aynayha: &ani l-Hubbi Il chercha dans ses yeux de l'amour ↔ ? baHata &aynayha: &ani l-Hubbi Il chercha ses yeux de l'amour
ou encore des phrases non synonymes comme dans (35): (35)
sami&tu zaydan J'ai entendu Zayd ≠ sami&tu bi zaydan J'ai entendu (parier) de Zayd
La relation entre la structure á objet direct (N1) et la structure correspondante a complément prépositionnel (Prép N1) s'accompagne donc d'une contrainte d'ordre sémantique: les deux structures doivent être synonymes. En dehors des idiosyncrasies sémantiques qui peuvent se produire entre les deux structures, il existe des cas de blocages. En effet, on peut établir une relation entre par exemple: (36)
V N0 Dét N1 rnasaHa zaydun l-jabima Essuya Zayd le front
(37)
V N0Prép Dét N1 masaHa zaydun bi l-jabi:ni Essuya Zayd du front
et
Mais cette relation n'est plus possible a construire si Ton fait intervenir une autre séquence de complément du type instrumental: V N0 bi Dét N1 bi Dét N2 [Instr] * ? masaHa zaydun bi l-jabi:ni bi l-mindi:li Essuya Zayd du front avec une serviette La redondance de la préposition bi (avec) peut expliquer ce blocage, car pour obtenir une phrase correcte et limpide, seule la préposition ä complément instru mental est de mise: (38)
V N0 Dét N1 bi Dét N2 [Instr] masaHa zaydun l-jabi:na bi l-mindi:li Essuya Zayd le front avec une serviette.
Les verbes du type &alima (savoir), &arafa (connaitre), dara: (savoir), jahila (ignorer) admettent les deux structures a condition que l'objet soit un masdar. D'où la relation: V N0 bi N1 [masdar] ↔ VNo (bi) 'anna P (QUE P), illustrée par
PHRASES TRANSITIVES EN ARABE
75
(39) et (40): (39) ↔ (40)
&alimtu bi maji: 'i zaydin J'ai appris de l'arrivée (de) Zayd &alimtu (bi) 'anna zaydan ja: 'a J'ai appris (de) que Zayd est arrivé
Dans le cas où le complément est Zayd, au lieu du masdar maji' (arrivée), le com plément introduit par la forme prépositionnelle bi (de) n'est plus possible: (41)
&araftu zaydan J'ai connu Zayd (42) * &araftu bi zaydin J'ai connu de Zayd L'emploi du verbe na:la (toucher) dans les structures (43)-(44) fait apparaitre la préposition min (de): (43)
(44)
V N0N1 na:la zaydun naSi:bahu Toucha Zayd sa part VN0minN 1 na:la zaydun min naSi:bahi Toucha Zayd de sa part.
Mais la distribution des compléments des N1 et Prep N1 conduit a deux phrases différentes sémantiquement. Par ailleurs, l'introduction d'un quantifieur du type kullihi (entier) entrame le blocage de la possibilité N¡ = Prép N1: * na:la zaydun min naSibihi kullihi Toucha Zayd de sa part entière
Conclusion L'étude présentée dans cet article montre que les opérations de permutation et de relativisation ne permettent pas de préciser syntaxiquement la notion de complé ment d'objet direct. Ce dernier prend des formes particulières dont le statut fonctionnel n'est pas toujours clair. Néanmoins, nous avons pu montrer que les tests de l'interrogation et de la pronominalisation, tout en étant des critères de la transitivité, ne sont pas aussi réguliers que le passif. Références 'azzabidiyyu, murtaDa:. Ta:ju l-&arusi, Kowait, 1965/1978. Blinckenberg, A. 1960. Le probleme de la transitivité en frangais moderne. Copenhague: Munksgard.
76
MOHAMED CHAD
Boons, J-P; A.Guillet; Ch. Leclère. 1976. La structure des phrases simples en frangais: constructions transitives. Rapport de recherche n°6, Paris: LADL. Chad, M. 1981. Les constructions intransitives de l'árabe classique. Thèse de 3 ème cycle, Université Paris 7. Chad, M. 1988. Le système verbal arabe: régime des constructions transitives. Thèse d'État, Université Paris 7. Gross, Maurice. 1969. Remarques sur la notion d'objet direct en français. La syntaxe, R. Lagane et J. Pinchon (eds.), Langue Franqaise 1, Paris: Larousse. Gross, M. 1994. La structure d'argument des phrases élémentaires. Lingua Franca 1, Fasamo: Schena Editor, pp. 7-17. Ibn Ya&if; muwaffaqu ddini. farHu l-mufa&&ali. Le Caire (sans date). Willems, D. et L. Melis (eds.). 1997. Les objets: relations grammaticales et roles sémantiques. Travaux de Linguistique 35, Gembloux: Duculot.
Summary This paper concerns the treatment of the "object" in Arabic. Our aim is to determine the criteria for its recognition, in terms of the differences that obtain between it and other complements.
PHRASES TRANSITIVES EN ARABE
ANNEXE: Sytème de transcription
A.P.I b m f
Symboles utilisés
Graphie arabe
b m f
θθ δδ t t d d' n 1 r s
t T d D n 1 r s
§
S
z
z
ƒ
ƒ
3
j
k
k
J q
q
X
X
w h
w h
?
&
g ? h
g ' h
Voyelles brèves: a, u, i Voyelles longues: a:, u:, i: Remarques: - D n'est distinctif qu'en arabe classique et n'a pas d'équivalent en A. P. I. - Les consonnes dédoublées sont des géminées.
ÉTUDE DISTRIBUTIONNELLE DES CONSTRUCTIONS EN BA EN CHINOIS CHENG TING-AU City University of Hong Kong
Introduction Cette étude vise à formaliser les données systématiquement reeueillies concemant les constructions en ba en chinois mandarin afin de préparer le terrain pour une description exhaustive en la matière. En effet, la possibilité de placer L'"objet" d'une action entre le N0 et le V, au moyen de la préposition ba, est l'une des ques tions les plus délicates de la syntaxe chinoise. Abondamment discuté et passionnément controversé, ce phénomène d'antéposition d'objet n'a jusqu'a maintenant pas connu d'analyses qui soient susceptibles de rendre compte d'une façon satisfaisante de ses propriétés distributionnelles. Pour nous, nous nous fondons sur les théories et principes opérationnels du lexique-grammaire, initiés par M. Gross (1975), en particulier sur le concept d'exhaustivité (Gross, 1975:21)1. Il va sans dire que nous adhérons a ce que dit R. Vivès (1993:7): "Le dispositif théorique général est celui de Z.S. Harris et le principe fondamental argumenté ici est qu'il est impossible d'étudier la syntaxe autrement que dans le cadre de la phrase simple (...)• Le second principe de base, proposé par M. Gross en 1968, après qu'il eüt constaté l'impossibilité d'étayer valablement une règle syntaxique quelconque sur un échantillon d'exemples, est que la description doit prendre en compte, dans l'ensemble du lexique, la totalité des éléments qu'on veut décrire: d'où le nom de lexiquegrammaire du français donné a ces études". Au sens large du terme, nous désignons par "construction en ba" toute structure qui a son N1 formellement placé en position préverbale, introduit qu'il est par la préposition ba. Nous nous intéressons exclusivement á celles qui font figure de phrase élémentaire.2 Notre objectif est de présenter ici les résultais de notre analyse, 1
Voir M. Gross (1975:21): "Notre intention a été d'aboutir a une description exhaustive du français par rapport aux propriétés que nous avons choisies et par rapport ä un lexique donné". Voir aussi M. Gross (1994a:216): "A useful description (...) should have, facing each entry, all its constructions". 2 Voir M. Gross (1994b:2195): "Lexicon-grammar is a model of syntax limited to the elementary sentences of a natural language".
80
CHENG TING-AU
limitée il est vrai, qui diffère des analyses proposées jusqu'à présent, et de faire entrevoir de nouvelles approches pour, dans un premier temps, mieux cerner les problèmes.
1. Les travaux antérieurs Nous n'avons pas l'intention de recenser ici, encore moins de résumer, l'ahondante littérature linguistique que ba a suscitée; nous ne faisons que nous en tenir à l'essentiel, qui peut se résumer sur un triple volet. Typologiquement parlant, les langues européennes ne connaissent certes pas ce genre d'antéposition d'objet marquée par une préposition, mais G. Lazard, dans son article "Le ra persan et le ba chinois" (1994) avait su argumenter contre la thèse de F. F. Tsao (1987) qui disait que "The ba construction in Chinese is probably unique as no similar construction has been found in any other language in the world". Ce qui pourrait suggérer une comparaison heureuse entre les langues perses et le chinois mandarin, qui porte des éléments altaïques en son sein. Sémantiquement parlant, la discussion s'ouvre sur un double plan. Premièrement, l'emploi de ba a tendance a être assimilé a la notion de "disposition" ("disposal form" en anglais), qui présuppose que quelque chose arrive á l'entité désignée par le N1 introduit par ba. Mais ce terme de "disposition" a été souvent critiqué, voire abandonné, car il présente l'inconvénient d'être fondé sur une intuition sémantique qui est loin de recouvrir tous les emplois de ba. Deuxièmement, a cette notion de disposition vient s'associer celle de transitivité, quand M.-Cl. Paris (1988) écrit: "En chinois, plus l'objet (i.e. N1) se place sur l'échelle des neuf paramètres que Hopp et Thompson (1980) proposent pour définir la transitivité, plus la construction en ba est acceptable". Le moins qu'on puisse dire à cet égard, 'est que ce genre de considérations probabilistes, qui supposent un continuum, n'est pas d'une grande aide dans les cas particuliers. Enfin, syntaxiquement, la discussion s'ouvre sur un double plan, la aussi. Sur le plan intra-phrastique, on ne peut manquer de s'apercevoir, lorsqu'on examine les différentes explications des constructions en ba, que toutes reproduisent, de façon plus ou moins heureuse et plus ou moins complète, des explications-types, comme: a) il faut que le V agisse sur le N1, ce qui exclut les verbes de sensation / de sentiment; b) il faut que le N1 soit défini, explicitement ou implicitement; c) le verbe doit normalement être suivi d'autres éléments. Eu égard a l'état de nos connaissances d'aujourd'hui, les deux premières hypo thèses s'avèrent inappropriées, les conditions posées étant trop rigides. Reste la troisième, ou gît, en effet, une part essentielle du sens de la phrase. La nécessité impérative, dans les constructions en ba, d'avoir un ensemble d'éléments postverbaux, aussi hétéroclites soient-ils, constitue l'un des traits les plus remarquables,
CONSTRUCTIONS EN BA EN CHINOIS
81
et les plus remarqués, de ce type de construction. La, le concept d'exhaustivité aidera ä satisfaire aux exigences de cette complexité que représente le poids de la complémentation verbale. Nous verrons cela plus loin. Passons maintenant au plan extraphrastique. Il s'agit du statut des constructions en ba dans la classification des phrases simples en chinois. Autrement dit, estce une structure a part entière, ou simplement une sous-structure ? S. Thompson (1973), ainsi que H. Chappell (1992), laissent entendre qu'on a affaire seulement à une sorte de sous-structure, quand le premier écrit: "The ba construction (...) seems to me only an alternative of the dominant S-V-0 order in Modern Chinese" et que le second affirme que la séquence S-V-0 traduit "a neutral movement, done without any further purpose in mind", contrairement a la séquence S-ba O-V, porteuse d'une certaine subjectivité ou affectivité. Tout ceci revient ä poser l'existence préalable d'une phrase S-V-0 a côté de S-ba O-V, ce qui suggère une hiérarchie trompeuse entre les deux sortes de phrases. Il importe donc de remettre en cause l'explication mécaniste de ba, au sens (i) il existe des phrases construites avec ba qui pourraient l'être sans; (ii) il existe des phrases ù la place de l'objet est prise et qui ne peuvent pas pour autant se construire avec ba.
2. Procédés d'investigation Notons, pour commencer, que: (i) la formulation canonique de la construction en ba est la suivante: #N0 ba-N1 VW# ù W est une variable couvrant tous les compléments. (ii) les phrases sur lesquelles nous allons travailler sont par définition structuralement complètes, c'est-a-dire qu'elles comportent le plus de compléments pertinents (Wi). S'agissant des constructions en ba, nous avons donc: # N0 (W0) ba-N1 (W1) V(W2) # ù W0 s'insère devant le syntagme ba-N1, W1 devant le V et W2 après le V. Dans les paragraphes suivants, nous allons procéder par ordre de disposition des éléments constituants. Le test de l'acceptabilité syntaxique étant au centre de nos préoc cupations, nous ne présenterons que les conditions a remplir en matière de distribution. 2.1. Le cas de N0 L'acceptabilité n'est constatée qu'avec le trait [+humain] pour le N0. Par exemple, avec le verbe la (oublier):
CHENG TING-AU
82
Cheng ba yusan la zai qiche shang Cheng ba parapluie oublier dans voiture (Cheng a oublié son parapluie dans la voiture) L'acceptabilité n'est constatée qu'avec le trait [- humain] pour le N0. Par exemple avec le verbe bie (étouffer): Xiayutian ba women bie zai wuli kan dianshi Le jour de pluie ba nous enfermer dans la maison regarder télé (Le jour de pluie nous a obligés ä rester devant la télé a la maison) 2.2. Le cas de Wo L'acceptabilité n'est constatée qu'avec l'ajout d'un verbe auxiliaire devant le syntagme en ba dans des énoncés dont Taction reste a accomplir: * Cheng ba zhetiao yijian quxiao Cheng jianyi ba zhetiao yijian quxiao Cheng suggérer ba CL observation retirer (Cheng suggère qu'on retire cette observation) où le verbe auxiliaire jianyi (suggérer), au même titre que tongyi (accepter) et xiwang (espérer) vient suppléer le caractère non-accompli du verbe principal. L'acceptabilité n'est constatée qu'avec l'ajout d'un adverbe de manière, dont la suppression rendra le sens de l'énoncé incomplet: * Cheng Cheng buhaoyiside Cheng par délicatesse (Cheng par délicatesse
ba tou dile xialai ba tou dile xialai ba tête baisser ASP (ASP: marqueur aspectuel) a baissé la tête)
L'adverbe de modalité qui porte sur le sens de tout un énoncé peut aussi affecter l'acceptabilité: Zhe duanlu ba wo zou lei le Zhe duanlu ke ba wo zou lei le Ce bout de chemin MOD ba moi marcher fatigue ASP (Je suis épuisé de fatigue en effectuant ce parcours) Certains verbes, par exemple bai (comparer), ne s'emploient dans des construc tions en ba qu'à la forme négative: * Ni ba wo gen ta bai Ni buneng ba wo gen ta bai Vous ne pouvoir ba moi avec lui comparer (Vous ne pouvez me mettre sur le même pied que lui)
CONSTRUCTIONS EN BA EN CHINOIS
83
Parfois, la forme négative ne tient pas toute seule, faute du support d'un autre * Cheng bu ba zuotian de shi shuo chulai Cheng pian bu ba zuotian de shi shuo chulai Cheng intentionnellement NEG ba hier PAR chose révéler ASP (C'est ä dessein que Cheng a refusé de révéler ce qui s'est passé hier) Ces quelques exemples aident a mettre en évidence la validité de la thèse selon laquelle "the linguistic unit of meaning is the elementary sentence" (Gross 1994: 213). Trop souvent on a négligé, voire ignoré, les contraintes du W0 sur l'acceptabilité des constructions en ba, si l'on se réfère au compte rendu fait par F.H. Liu (1997:55) sur les propriétés distributionnelles de ba. 2.3. Le cas de N1 Le choix de N1 comme argument peut affecter la grammaticalité de l'énoncé. Comparons: a. Cheng ba haoshi gei jiao le Cheng ba belle affaire RYT perturber ASP (Cheng a tout gaché) où N1 =: haoshi (belle affaire) et ou gei fonctionne comme un support rythmique (marqué RYT) a: b. * Cheng ba gongshi gei jiao Cheng ba affaire publique RYT perturber
le ASP
, pour rendre énoncé acceptable, il faut faire intervenir d'autres éléments, comme dans: b'. Cheng ba gongshi jiao sai sishi litou le Cheng ba affaire publique mélanger dans affaire personnelle ASP (Cheng n'arrive pas a traiter les affaires publiques en toute impartialité) L'acceptabilité n'est constatée qu'avec l'ajout d'une spécification devant le N1: Cheng zao ba jitianqian de jiaoxun wang ge ganjing Cheng déjà ba quelques jours avant DET leçon oublier complètement (Cheng a déja complètement oublié la 1çn qu'il en a tirée il y a qq. jours) où la suppression de jitianqian (il y a quelques jours) rendra Fénoncé inacceptable. En effet, la spécificité de N1 doit être explicite pour éviter une généralisation inutile, parce que trop vague. Il y a des cas ou N1 peut s'assimiler á un agent ou a un patient, mais les propriétés distributionnelles, surtout au niveau de iVo, diffèrent d'un cas a l'autre, par exemple avec le verbe he (boire):
CHENG TING-AU
84
Cheng hen kuai de ba tang he wan le (N0 Cheng très vite ba soupe boire finir ASP (Cheng a fini la soupe en moins de ríen)
=: N+hurn)
Zilaishui ba women he bing le (No =: N-hum) Eau du robinet ba nous boire malade ASP (L'eau du robinet nous a rendus malades) le N1, dans le premier exemple, se laisse interpréter comme un patient et, dans le second, comme un agent. Il y a des cas ou l'évaluation agent/patient s'avère difficile, le N\ en jeu étant une partie inaliénable du corps: Cheng ba shou shuai teng le Cheng ba main tomber avoir mal ASP (Cheng, en tombant, s'est fait mal a la main) 2.4. Le cas de W1 L'ajout d'un Adv est exigé pour rendre acceptable l'énoncé suivant: Cheng ba gongzuofu shijin cuoxi Cheng ba blouse de travail ADV frotter en lavant (Cheng a bien frotté sa blouse de travail en la lavant) A remarquer la corrélation d'une série d'Adv dans: Cheng yikouqi ba suoyou wenjian dou qianshu le Cheng ADV1 ba tout document ADV2 signer ASP (D'un seul trait, Cheng a signé tous les documents) Wo k zhenshi ba shitang gei chi gou le Moi ADV1 ADV2 ba cantine ADV3 manger assez ASP (J'en ai vraiment marre de manger á la cantine) la présence de trois adverbes, dont la fonction première est de renforcer la modalité, n'en a pas moins un caractère obligatoire sur le plan syntaxique. Nous avons aussi la combinaison d'Adv avec par exemple Prép N, comme dans: Cheng xunsude ba yizi wang houbian Cheng ADV ba chaise Prép N déplacer (Cheng a rapidement poussé les chaises vers le fond) Presque toute la littérature portant sur les constructions en ba s'accorde a dire que, systématiquement, la place du marqueur de négation se retrouve en position de W0, ce qui n'est pourtant pas vrai. Il y a des cas ou il peut se placer soit en position de W0, soit en position de W1, sans qu'intervienne aucune altération de sens. Par exemple:
CONSTRUCTIONS EN BA EN CHINOIS
85
Cheng bu (Wo) ba qian dang qian Cheng ba qian bu (W1) dang qian qui veut dire que Cheng se moque de l'argent. Mais il y a aussi des cas ù la disposition différente du marqueur de négation peut se traduire en un sémantisme différent. Par exemple: Cheng bu (Wo) xiang ba qian huan gei wo Cheng xiang ba qian bu (W1) huan gei wo ù Ton s'aperfoit que, dans le premier exemple, Cheng refuse de me rendre de l'argent et que, dans le second exemple, Cheng veut bien rendre de l'argent a d'autres, mais pas a moi. 2.5. Le cas de V On lisait dans R. Iljie (1987):"[...] l'emploi de ba est soumis a certaines conditions sémantiques. On a soutenu que le verbe doit indiquer que le sujet/agent "dispose" de l'objet (...). Cette condition exclurait des verbes n'exprimant pas des actions qui "traitent" réellement l'objet d'une manière ou d'une autre, c'est-a-dire des verbes tels que "détester (une personne), gravir (une pente), manquer (une occasion)" et dans . Zou (1993): (a) "stative verbs cannot appear in the Ba construction; (b) perception and psychological verbs cannot appear in the Ba construction". Or ces explications ne rendent pas compte a notre avis de la réalité linguistique. Les contre-exemples abondent et nous n'allons pas ignorer ou marginaliser ce type d'exemples, quelle qu'en soit la fréquence statistique. S'agissant du V, donc, nous allons en présenter quatre types, qui incluent: a) des verbes intransitifs, i.e. psychologiques, de perception, statiques et généralisants. La s'impose une mise au point: si nous nous référons a une définition sémantique, c'est pour démontrer qu'elle n'avance a rien dans nos observations des faits de langue, contrairement á ce qu'ont préconisé les deux auteurs précités, parmi tant d'autres d'ailleurs; b) des verbes construits avec une préposition; c) des verbes supports; d) des verbes faisant partie d'une tournure figée. Considérons: Ta yizhi ba wo xian2xian2 de xiang nu'er yiyang ke'ai Elle toujours ba moi imaginer PAR comme fille adorable (Elle m'imagine toujours comme sa filie adorable) Ni ba yisi xiang fan le Vous ba pensée interpréter à contresens (Vous interprétez a contresens ce que je pense réellement)
CHENG TING-AU
86
Ni ba shengzi zhan zhi, rang wo Hang yi Hang Toi ba corps se tenir debout tout droit, laisser moi mesurer CL mesurer (Tiens-toi tout droit, que je te mesure la taille) Cheng ba Jin de shou dou nong chu xue le Cheng ba Jin PAR main ADV faire saigner ASP (Cheng a blessé la main de Jin jusqu'au sang) Dans les exemples des verbes construits avec préposition, c'estjyw qui est en cause: Ni buneng ba bieren suo zuo de gongzuo guigongyu ziji Vous ne pouvoir ba autre personne achever PAR travail attribuer vousmême (Vous ne pouvez vous attribuer ce à quoi vous n'avez en ríen contribué) En chinois, les verbes supports les plus usuels sont jinxing et jiayi. Nous avons: (i) toupiao (voter) (ii) zonghe (synthétiser)
= jinxing toupiao (procéder au vote) = jiayi zonghe (faire la synthèse)
Pourtant, leur emploi semble être conditionné par des considérations distributionnelles; dans des cas précis, leur absence est interdite: Cheng jianyi ba ti 'an jinxing bujiming toupiao * Cheng jianyi ba ti 'an bujiming toupiao Cheng proposer ba motion (Vsup) secret vote (Cheng a proposé qu'on procède a un vote secret pour la motion) Cheng zai huishang ba qingkuang jiayi zonghe yi xia * Cheng zai huishangba qingkuang zonghe yi xia Cheng dans réunion ba état des choses (Vsup) synthèse CL (Cheng a fait la synthèse de la situation à la réunion) Citons enfin un exemple d'expression verbale figée, comme dai lumaozi (porter chapeau vert = être cocu): Ni ye zhineng ba zheding lumaozi daixiaqu le Vous ADV ne pouvoir que ba CL chapeau vert porter ASP (Vous ne pouvez qu'accepter d'être cocu) 2.6. Le cas de W2 Ici nous croyons bon de faire deux mises au point, s'agissant des constructions en ba, à savoir: a) la nécessité d'une complémentation du verbe est impérative; b) cette complémentation correspond à un ensemble d'éléments post-verbaux apparemment très hétéroclites, qui se traduisent comme autant de marqueurs essentiels pour la bonne formation de l'énoncé.
CONSTRUCTIONS EN BA EN CHINOIS
87
Cependant, on se presse d'indiquer que le strict minimum au niveau de W2 est le perfectif le. Par exemple, F.H. Liu (1997:58) en citant K. Mei disait: "Mei (1978) is the first study to propose aspect as a condition on the ba predicate. He notices that ba sentences are often presented in the perfective aspect, marked by -le. He then classifies verbs according to whether they take -le. If a verb cannot be marked by -le, then the ba sentence is not possible".3 Et C.F. Sun (1995:162) d'ajouter que "it is also common knowledge that the ba-construction occurs frequently with the aspect marker le, even though it is not always so". La question se pose donc de savoir dans quel contexte le seul le, comme marqueur aspectuel (ASP), peut suffire et dans quel autre il ne suffira pas. Dans les lignes qui suivent, nous nous penchons exclusivement sur ce point. En effet, nous avons: Cheng ba an jie le Cheng ba cigarette s'en passer ASP (Cheng cesse de fumer)
(N0 ba N1 V ASP)
Cheng ba xingli xie le Cheng ba bagages décharger ASP (Cheng a déchargé les bagages)
(No ba N1 V ASP)
Cependant, nous avons relevé des exemples d'interdictions, comme: a. b. d.
* Cheng ba zhi roucheng le (V=: froisser) * Cheng ba huati zhuan le (V=: changer) * Cheng ba Jin zhuang le (V=: heurter * Cheng ba Jin qi le (V=: fâcher)
ce qui nous confirme le parallélisme des séquences où le W2 se laisse réduire a un seul le et des séquences ù le W2 se caractérise par le besoin d'être complet d'une manière plus adéquate. En effet, par rapport a (a-d), nous avons enregistré quatre types formels, a savoir: (i) (ii) (iii) (iv)
W2 =: N2 W2=: Prép N2 W2 =: GE N2 (GE faisant fonction de support rythmique) W2 =: DE N2 (DE faisant fonction de support structural)
et nous avons donc:
3
Cheng man bujingxinde ba zhi roucheng le tuan Cheng négligemment ba papier froisser ASP boule (Cheng a négligemment froissé le papier en boule)
(N2)
Cheng ba huati zhuan dao ta xuvaode fangmian lai Cheng ba sujet changer vers lui souhaiter domaine (Cheng a dirigé la discussion vers la ù il souhaitait)
(Prép N7)
Voir K. Mei (1978) Ba zi ju [Ba-sentences], Wenshi Zhexue Bao, 27, 145-180.
CHENG TING-AU
88
Cheng ba Jin zhuang le ge gentou Cheng ba Jin heurter ASP GE culbute (Cheng a fait tomber Jin a la renverse)
(GE N2)
de shou zhi fachan Cheng ba Jin qi Cheng ba Jin fächer DE main sans arrêt trembler (Jin tremble de rage a cause de Cheng)
(DE N2)
où N2 s'assimile a une proposition (i.e. main - sans arrêt - trembler). Jusqu'ici, nous pouvons conclure que la présence du marqueur aspectuel dans W2 est une condition nécessaire dans certains cas, mais pas une condition suffisante pour rendre compte de la grammaticalité des constructions en ba. En effet, sans une systématisation des données déja accumulées, sans une étude exhaustive de toutes les possibilités combinatoires et sans une couverture lexicale qui soit significative comme base empirique de l'observation, on est condamné a continuer d'émettre autant d'hypothèses gratuites sur cet aspect crucial de la syntaxe chinoise.
Références Chappel, H. 1992. Causativity and the Ba Construction in Chinese. In H. Seiler & W. Premper (eds.), Partizipation: Das sprachliche Erfassen von Sachverhalten, Tübingen: Gunter Narr. Cheng, .-. 1998. Xiandai Hanyu baziju gongzuodande sheji: yuanze yu shijian (Automatic treatment of ba-sentences in Modern Chinese: theory and practice). In Yuan Y.L. & Guo R. (eds.), Studies on Valency Grammar of Modern Chinese, Peking University Press, vol 2, 1-17. Cheng, T.-A. 1999. Cihui yufa lilun yu hanyu jufa yanjiu (Lexicon-Grammar and Chinese Syntax). Beijing: University of Foreign Studies Press. Gross, M. 1975. Méthodes en syntaxe - Régime des constructions complétives. Paris: Hermann. Gross, M. 1994a. Constructing Lexicon-Grammar. In B.T.S. Atkins & A. Zampolli (eds.), Computational Approaches to the Lexicon, Oxford University Press, 213-263. Gross, M. 1994b. Lexicon-Grammar: application to French language. In R.E. Asher (ed.), The Encyclopedia of Language and Linguistics, Pergamon Press, vol. 4, 2195-2205. Iljic, R. 1987. Ä propos de to ba ge fuqin si-le. Cahiers de Linguistique AsieOrientale, 16, 237-257. Lazard, G. 1994. Le ra persan et le ba chinois. Cahiers de Linguistique AsieOrientale 23, 169-176. Liu, F.H. 1997. An aspectual analysis of ba. Journal of East Asian Linguistics 6, 51-99. Paris, M.-Cl. 1988. L'expression de la durée en mandarin. In Temps et aspects
CONSTRUCTIONS EN BA EN CHINOIS
89
(Actes du Colloque CNRS, Paris, 24-25 octobre 1985), Paris: Peeters/ SELAF (NSP 19), 163-177. Sun, C R 1995. Transitivity, the B-construction and its history. Journal of Chinese Linguistics 23, 159-195. Thompson, S. 1973. Transitivity and the Ba-construction in Mandarin Chinese. Journal of Chinese Linguistics 1, 208-221. Tsao, F.F. 1987. A topic-comment approach to the Ba-construction. Journal of Chinese Linguistics 15, 1-54. Vivès, R. 1993. Le lexique-grammaire du français: Présentation. Paris: L'Informa tion Grammaticale 59, 7. Zou, . 1993. The syntax of the Chinese BA construction. Linguistics 31, 715-736.
Summary The objective of this paper is to explore the applicability of Gross's theory of Lexicon-Grammar to the study of Chinese syntax. The paper is concerned with the ba-construction in Chinese. It aims to show that the very concept of exhaustivity is crucial in an area of study which has been badly in need of new ideas. To highlight the complexity requirement of the ba-construction, we have examined respectively all the relevant cons tituents within a canonical sentential framework, i.e.#N0V0W0ba-N1W1V W2# and it is found that previous accounts of the ba-construction cannot adequately characterize all its syntac tic properties. Hence a much more thorough study will be needed if we bear in mind to provide a sound, verifiable, empirical support for constructing a viable model for Chinese syntax.
PRINCIPES D'ANALYSE AUTOMATIQUE DES PROVERBES 1 MIRELLA CONENNA Université de Bari
AZILE :... Chérubin ! Chérubin ! Vous lui causerez des chagrins ! Tant va la cruche à l'eau !... FIGARO : Ah ! Voilà notre imbécile avec ses vieux proverbes ! Et bien, pédant, que dit la sagesse des nations ? Tant va la cruche l'eau, qu 'ä la fin... Elle s'emplit BAZILE : FIGARO, en s 'en allant: Pas si bête, pourtant, pas si bête ! Beaumarchais, La folie journée ou Le manage de Figaro, 1784, Acte I, Scène 2.
1. Automates de proverbes La présence des proverbes dans les textes, compris certains textes techniques, n'est pas négligeable, ce qui soulève le problème de leur reconnaissance et de leur traduction. C'est dans cette optique que nous avons construit, pour quelques types de proverbes français et italiens, des dictionnaires électroniques et des bibliothèques d'automates finis (M. Conenna 1998b, 2000a, 2000b), tous gérés par le système INTEX (M. Silberztein 1993, 1996). Nous présentons ici les automates et les transducteurs de traduction concernant les proverbes français appartenant aux classes syntaxiques en Qui et Il faut: (1) (2)
Qui dort dîne Il faut de tout pour faire un monde
et leurs correspondants italiens en Chi et Bisogna: (3) (4)
1
Chi ama teme Qui aime craint Bisogna dar tempo al tempo Il faut dormer du temps au temps
Nous remercions Éric Laporte pour ses remarques et ses suggestions pertinentes.
MIRELLA CONENNA
92
Nous avons aussi mis au point des automates aptes á tenir compte des formules standard qui introduisent le proverbe dans le discours ou en constituent un commentaire conclusif, ou encore peuvent le couper, sous forme d'incise. Par exemple: Comme le dit le proverbe, Qui va a la chasse perd sa place Qui va ä la chasse - 'est bien connu -perd sa place Qui va ä la chasse perd sa place, comme tout le monde le sait Secondo il proverbio, Chi va con lo zoppo impara a zoppicare Chi va con lo zoppo - si sa - impara a zoppicare Chi va con lo zoppo impara a zoppicare, diceva mia nonna Selon le proverbe, Qui va avec le boiteux apprend ä boiter Qui va avec le boiteux - on le sait - apprend ä boiter Qui va avec le boiteux apprend a boiter, disait ma grand-mère Les exemples qui suivent se veulent une illustration de la typologie de notre bibliothèque d'automates de proverbes. 1.1. Automates prédictifs Nous séparons les automates contenant les proverbes attestés et les automates, que nous nommons prédictifs, ou certaines formes lexicales et syntaxiques sont insérées par analogie avec les formes réellement repérées, ce qui peut se révéler utile dans l'analyse automatique des textes. Par exemple, si on considère le pro verbe: (5)
Qui casse les verres les paye
on remarque que l'automate de la Fig. 1 contient sa forme attestée:
Fig. 1 Dans l'automate prédictif (Fig. 2), nous écrivons les verbes a l'infinitif, entre chevrons; cela indique que l'automate reconnait les formes fléchies; nous prenons aussi en compte l'absence éventuelle du pronom.
ANALYSE AUTOMATIQUE DES PROVERBES
93
Autrement dit, on peut envisager des variantes de proverbes telles que: (5) a. Qui cassera les verves les paiera b. Qui casse les verves paie variantes qui n'auraient pas été répertoriées dans le corpus, ou bien qui relèveraient d'effets stylistiques. Voici un exemple d'automate (Fig. 3) contenant quatre variantes d'un proverbe italien: (6) (7) (8) (9)
Chi non sa fare avte sevva bottega Chi l'avte non safave bottega sevva Chi non sa l 'avte ferri la bottega Chi non safave il suo mestieve chiuda bottega
Fig.3 Ce proverbe signifie: Qui ne connaît pas son métiev fevme sa boutique (littéralement: qui ne sait pas faire un art, ferme sa boutique), autrement dit "un artisan qui n'est pas habile n'a pas de succès dans les affaires". L'interpretation métaphorique: "Il ne faut pas entreprendre ce qu'on ne maîtrise pas, car les conséquences seront forcément négatives" permet un emploi plus large de ce proverbe. La variante (9) contient les formes lexicales les plus fréquentes: le substantif mestieve et le verbe chiudeve (fermer), tandis que, dans les autres variantes, il y a leurs synonymes plus rares et recherchés (voire d'emploi typiquement toscan), le subs tantif arte et les verbes ferrare et sevvave. Vu la présence des subjonctifs chiuda et fevvi, nous pouvons, par analogie, établir un automate prédictif (Fig. 4) avec la possibilité de conjugaison ou de substitution des verbes: par exemple, on peut envisager des formes éventuelles au futur et au subjonctif, ou le remplacement de sapev fare par conosceve.
MIRELLA CONENNA
94
Fig. 4 Tous les proverbes de nos corpus peuvent être reproduits sous forme d'automates et d'automates prédictifs. Il est évident qu'il faut établir ces derniers; les premiers, en revanche, peuvent être générés automatiquement par le système INTEX, a partir de nos dictionnaires électroniques (par la fonction: COMPRESS INTO FST). La représentation des proverbes par automates prédictifs peut être plus com plexe et couvrir une description fine de certains phénomènes linguistiques, comme par exemple des analogies concernant les classes syntaxiques. Parmi les structures proverbiales, il existe des formes récurrentes et des sortes de para phrases. A cet égard, nous avons mis en évidence les affinités qui rapprochent, diachroniquement, les structures des proverbes commençant par Qui, par Il faut et par On (M. Conenna 2000c). Souvent, des proverbes sémantiquement équivalents présentent des structures différentes. 'est le cas des proverbes synonymes suivants: (10) Qui ne sait obéir ne sait commander (11) Il faut apprendre ä obéir pour savoir commander Or, un automate prédictif peut "fusionner" ces deux formes et en prévoir une troisième ayant la structure en On, du type: (12) On doit toujours apprendre ä obéir pour savoir commander Outre ces trois structures proverbiales, il y aurait par ailleurs d'autres analogies plus ponctuelles (verbes, adverbes, etc.), comme celles que nous avons montrées pour les exemples précédents. 1.2. Transducteurs Lorsque nous connaissons le proverbe équivalent dans l'autre langue, nous construisons un transducteur de traduction, c'est-á-dire un automate qui non seulement reconnaït la séquence, mais est aussi capable d'en générer une autre, en la remplaçant dans le texte (par la fonction REPLACE). En partant de nos dictionnaires, le français et l'italien sont, tour a tour, langue de départ et langue d'arrivée, car on peut chercher des proverbes dans des textes en italien et les traduire en français, et vice versa. Il est évident que, si Ton dispose de proverbes équivalents dans d'au-
ANALYSE AUTOMATIQUE DES PROVERBES
95
tres langues, il est simple de former de nouvelles paires. Voici (Fig. 5) un exemple de transducteur présentant trois variantes d'un proverbe italien: (13) Chi bella vuole apparire qualcosa deve soffrire (14) Chi bella vuol comparir e dolor deve patire (15) Chi bella vuol sembrare pene e guai deve patire Qui veut paraître belle doit souffrir (quelque chose + des douleurs + des peines et des malheurs) ainsi que la forme équivalente en français: (16) Il faut souffrir pour être belle
Fig. 5 Nos transducteurs, comme les automates simples, peuvent avoir une fonction prédictive. Les différents cas de figure prévus concernent, naturellement, le pro verbe objet de l'analyse automatique, celui de la langue de départ, car la forme remplacée, étant unique, ne peut être que celle du proverbe réellement existant en langue d'arrivée. Ce procédé, capable de trouver un niveau de structuration prédictif, se révèle particulièrement efficace, en analyse automatique, dans les cas de défigement, si fréquents dans les textes et notamment dans la presse. Nous avons montré ailleurs (M. Conenna 1998a, 2000b) la possibilité de repérage rapide, grace application de nos dictionnaires électroniques et de nos bibliothèques d'automates, de formes proverbiales transformées pour des raisons stylistiques et ludiques. Or, on peut avoir à traduire ces faux proverbes. Et Ton sait que, dans le domaine fort com plexe de la traduction des proverbes (M. Conenna 1994 et a paraitre), le cas limite est certes celui de la traduction du proverbe défigé: "...dicho fenómeno presenta problemas de traducción poco menos que insolubles..." (A. Zuluaga 1999:541). L'application d'un transducteur se révèle alors utile parce que, paradoxalement, le proverbe "déguisé" peut être reconnu plus facilement par l'automate que par le traducteur humain ! Ce sera néanmoins a ce dernier, une fois la structure identifiée, d'interpréter le jeu qu'implique le défigement, ainsi que d'opérer ce choix qui est le fondement même de toute opération de traduction. En l'occurrence, il pourra décider de se servir du transducteur et de lui faire substituer le "vrai" pro-
MIRELLA CONENNA
96
verbe attesté en langue d'arrivée (en modifiant ainsi la cohérence du texte de départ), ou bien de re-créer lui-même un nouveau "faux" proverbe en langue d'arrivée, sur la base des transformations lexicales présentes en langue de départ.
2. Insertions On sait que les proverbes sont normalement insérés dans le discours grace a une série de formules qui marquent la distance établie par l'énonciateur et qu'ils fonctionnent donc comme des citations. Cet expédient, qui permet de les identifier facilement, constitue, en même temps, l'obstacle principal pour leur reconnais sance automatique. Nous présentons un modèle d'analyseur de proverbes, constitué par une série d'automates imbriqués. Nous nous limitons ici a un exemple concernant les pro verbes français; l'application analogue sur les proverbes italiens fait l'objet d'une autre étude. L'automate MOD-INS (Fig. 6) montre un schéma de base où un proverbe type: (17) Qui va ä la chasse perd sa place
Fig. 6 est précédé, suivi, voire coupé par une insertion. Ce dernier cas est, évidemment, le plus complexe du point de vue de l'analyse automatique. Nous avons réuni un nombre représentatif de ces formules qui relient le proverbe au texte dans deux automates, enchassés dans l'automate MOD-INS: l'automate PERFORM (Fig. 7) et Pautomate INS (Fig. 8). Dans le premier, il y a ces énoncés performatifs qui
ANALYSE AUTOMATIQUE DES PROVERBES
97
"présentent", généralement, un proverbe, auquel il sont connectés par la conjonction que, comme, par exemple, on dit que, l'adage dit que, etc.
Fig. 7 Dans le second automate (Fig. 8), il y a une série d'insertions possibles dans un proverbe. Il est clair que ces formules ne sont pas les mêmes selon que l'insertion se situe en début, au milieu ou a la fin du proverbe; nous les regroupons néanmoins dans un seul automate. Nous avons privilégié les insertions qui, coupant le proverbe, peuvent réellement représenter un problème d'analyse automatique. La liste des formules peut être mise a jour systématiquement; pourtant, celle des formules initiales et finales nous paraït difficile a délimiter, car elle est lié aux effets stylistiques; par ailleurs, elle ne constitue pas forcément un obstacle ä la reconnaissance du proverbe. Nous tenons a mentionner le cas, fréquent, de for mules initiales, voire finales, avec un verbe au participe présent, du genre: "citant un vieux proverbe africain, parodiant le proverbe chinois, s'inspirant d'un pro verbe chinois" (exemples extraits du journal Le Monde 1993). Nous pourrions intégrer ces formules dans l'automate, représentées par le symbole V:G.
98
MIRELLA CONENNA
ANALYSE AUTOMATIQUE DES PROVEREES
99
L'automate INS en contient d'autres, indiqués par des boîtes en grisé. Par exemple, on peut appeler, a partir de l'automate INS, l'automate MEMBRESFAMILLE (Fig. 9) qui permet de compléter la formule "comme (le dit + disait) (mon grand-père + ma grand-mère, etc.)", en prévoyant d'autres parents éventuels ayant l'habitude de citer des proverbes.
Fig. 9 Pour d'autres listes, on peut avoir recours aux automates établis dans le cadre du réseau RELEX. Par exemple on retrouve les noms de pays, nations, îles parmi les automates de M. Garrigues (1995), et, en l'occurrence, pour la reconnaissance des proverbes, il est important d'utiliser la riche bibliothèque d'automates d'incises de . Fairon (2000). Pour ce qui est de la possibilité d'accéder a ces différents automates, voir les travaux de M. Constant (a paraître). Dans l'automate MOD-INS, nous prévoyons la présence de marques de ponc tuation insérées dans un proverbe qui peuvent perturber sa reconnaissance: virgule, point d'exclamation, points de suspension, deux points (dans la figure, ceux-ci sont précédés par un " /", car il s'agit de symboles protégés dans le pro gramme INTEX). Une autre possibilité représentée dans l'automate MOD-INS est la citation partielle du proverbe:
MIRELLA CONENNA
100 Qui va a la chasse...
qui se produit très fréquemment dans le discours. En effet, il arrive souvent qu'on fasse allusion a un proverbe que l'interlocuteur connaît et peut reconstituer. Il s'agit d'un trait distinctif des proverbes dont il faut tenir compte quand on envisa ge un analyseur automatique. Dans le modèle que nous montrons ici, nous avons coupé le proverbe a différents endroits. Nous avons en effet constaté que la coupe est généralement syntagmatique et coincide partiellement avec la mise en évi dence des constituants. Ceux-ci, ä leur tour, coincident partiellement avec des unités accentuelles: Les bons comptes... font les bons amis Une hirondelle... ne fait pas le printemps A bon entendeur... salut et aussi: Les bons comptes font... les bons amis Une hirondelle ne fait pas ... le printemps Le découpage du proverbe dans le discours reflète ainsi ces éléments rythmiques qui en sont un autre trait distinctif (J.-C. Anscombre 1999, 2000b). Il faut iden tifier la césure principale pour la reconnaissance du proverbe, soit qu'il s'agisse de son découpage discursif (fonction allusive), soit qu'il agisse de son déguisement burlesque (fonction ludique). Autrement dit, la césure principale est significative même dans le mécanisme de création des proverbes. C'est elle, en quelque sorte, le pivot de la productivité. On en trouve de nombreux exemples dans le domaine de la publicité, pour la fabrication de slogans. Le critère principal est celui de la fréquence et de la vitalité du proverbe dans la langue. La reconnaissance implique, cela va de soi, la connaissance du proverbe. On pourra difficilement citer, détourner, couper un proverbe que Ton connaît a peine. Le test est simple avec un grand nombre de proverbes tombés en désuétude et difficilement réactualisables qui laissent la place, même pour une manipulation informatique, aux proverbes contemporains.
Conclusion L'analyse automatique des proverbes, problème certes méconnu, met en jeu non seulement des aspects techniques significatifs mais aussi des éléments de ré flexion linguistique. En effet, la recherche d'un degré de formalisation apte a la réalisation informatique nous a amenée a focaliser certains traits distinctifs des proverbes que nous étudions, notamment leur structure syntaxique, rythmique et prosodique, mais aussi leur emploi et leur traduction. Si nous observons, par exemple, le simple découpage du proverbe pour tenir compte des insertions, nous constatons que cela demande la prise en considération
ANALYSE AUTOMATIQUE DES PROVERBES
101
de plusieurs facteurs et favorise l'approfondissement de données théoriques. Et tout d'abord, par la mise en évidence extrêmement détaillée des constituants structuraux, nous parvenons, en quelque sorte, à accomplir l'étude formelle des proverbes (M. Conenna 1988) que nous avons préalablement effectuée dans le cadre du lexique-grammaire (M. Gross 1975, J.-P. Boons, A. Guillet, . Leclère 1976). Cela ne fait que confirmer la nécessité d'un classement syntaxique systématique des proverbes, car, pour envisager des analyseurs, il faut disposer de corpus importants. En second lieu, nous apportons notre contribution a ce domaine d'études récentes qui prend le nom de parémiologie linguistique (J.-C. Anscombre 2000a, G. Kleiber 1989, 2000). En l'occurrence, nous fournissons des données sur le cadre énonciatif du proverbe, sur sa vitalité dans le discours, sur sa fréquence dans les textes. En outre, en nous posant des questions sur la possibilité de citation (intégrale ou partielle), nous focalisons la notion de proverbe contemporain. En dernier lieu, enfin, nous passons de la parémiologie contrastive du français et de l'italien a un niveau traductologique d'ordre général. Nos transducteurs se révèlent ainsi un outil performant d'aide a la traduction. Il est a noter, en effet, qu'en remplaçant un proverbe complet, on évite les risques d'une traduction mot a mot tout en sauvegardant l'identité du proverbe en tant qu'unité de traduction, ce qui est particulièrement appréciable. Pour conclure, nous espérons avoir défini, grace à notre bibliothèque d' auto mates de proverbes, un modèle exploitable, dans plusieurs langues, en informatique documentaire.
Références Anscombre, Jean-Claude. 1999. Estructura métrica y función semántica de los refranes. Paremia 8, Madrid: Asociación Cultural Independiente, 25-36. Anscombre, Jean-Claude (ed.). 2000a. La parole proverbiale, Langages 139, Paris: Larousse. Anscombre, Jean-Claude. 2000b. Parole proverbiale et structures métriques. Lan gages 139, París: Larousse, 6-26. Boons, Jean-Paul; Alain Guillet; Christian Leclère. 1976. La structure de la phrase simple en français. Constructions intransitives. Genève: Droz. Conenna, Mirella. 1988. Sur un lexique-grammaire comparé de proverbes. Lan gages 90, Paris: Larousse, 99-116. Conenna, Mirella. 1994. Considerazioni traduttologiche sul lessico-grammatica. Lingua Franca 1, Fasano: Schena, 19-35. Conenna, Mirella. 1998a. Analyse automatique des textes. Méthodes et pers pectives. In Studi di linguistica francese in Italia. 1960-1996. Atti del Convegno Internazionale su "Studi di Linguistica francese in Italia". Brescia: La Scuola, 97-117.
102
MIRELLA CONENNA
Conenna, Mirella. 1998b. Le proverbe, degré ultime de figement ? In Le figement lexical, S. Mejri, G. Gross, A. Clas, . Baccouche (eds.), Tunis: Actes des Premières Rencontres Linguistiques Méditerranéennes, 361-371. Conenna, Mirella. 2000a. Dictionnaire électronique de proverbes français et italiens. In Actes du XXIIe Congrès International de Linguistique et de Philologie romanes, Bruxelles (23-29 juillet 1998), A. Englebert, M. Pierrard, L. Rosier et D. Van Raemdonck (eds.), vol. IV, Des Mots aux dictionnaires, Tübingen: Max Niemeyer Verlag, 137-145. Conenna, Mirella. 2000b. Classement et traitement automatique des proverbes franfais et italiens. In Lexique, syntaxe et sémantique, BULAG, Numéro hors série, Mélanges offerts ä Gaston Gross ä l'occasion de son soixantième anniversaire, P.-A. Buvet, D. Le Pesant et M. Mathieu-Colas (eds.), 285-294. Conenna, Mirella. 2000c. Structure syntaxique des proverbes franfais et italiens, Langages 139, Paris: Larousse, 27-38. Conenna, Mirella (a paraïtre). Problèmes de parémiologie contrastive (françaisitalien). Actas del IV Congreso Internacional de Lingüística Francesa (Santia go de Compostela, 23-25 de septiembre de 1999). Constant, Matthieu (a paraitre). Conception d'un serveur de grammaires locales, Communication présentée aux Quatrièmes Journées INTEX, Bordeaux, 11-12 juin 2001. Courtois, Blandine; Max Silberztein (eds). 1990. Dictionnaires électroniques du franqais. Langue franqaise 87, Paris: Larousse. Fairon, Cédrick. 2000. Structures non-connexes. Grammaire des incises en fran qais: description linguistique et outils informatiques. Thèse de Doctorat en Informatique Fondamentale et Applications, Université Paris 7. Garrigues, Mylène. 1995. Prepositions and the Names of the Countries and Islands: A Local Grammar for the Automatics Analysis of Texts. Language Research, Seoul: Language Research Institute, 309-334. Gross, Gaston. 1996. Les expressions figées en franqais. Paris: Ophrys. Gross, Maurice. 1975. Méthodes en syntaxe. Paris: Hermann. Gross, Maurice. 1982. Une classification des phrases 'figées' du français. Revue Québécoise de Linguistique 2, Montréal: Université du Québec á Montréal, 151-185. Gross, Maurice. 1988. Les limites de la phrase figée. Langages 90, Paris: La rousse, 7-22. Guillet, Alain; Christian Leclère. 1992. La structure des phrases simples en fran qais. Constructions transitives locatives. Genève: Droz. Harris, Zellig S. 1976. Notes du cours de syntaxe. Paris: Le Seuil. Kleiber, Georges. 1989. Sur la définition du proverbe. Recherches germaniques 2, 233-252. Kleiber, Georges. 2000. Sur le sens des proverbes. Langages 139, Paris: Larousse, 39-58.
ANALYSE AUTOMATIQUE DES PROVERBES
103
Silberztein, Max. 1993. Dictionnaires électroniques et analyse automatique des textes. Le Système INTEX. Paris: Masson. Silberztein, Max. 1996. Expérience d'étiquetage avec levée d'ambiguïtés, Actes des Premières Journées INTEX (21-22 mars 1996). Zuluaga, Alberto. 1999. Traductología y fraseología, Paremia 8, Madrid: Asocia ción Cultural Independiente, 537-549.
Summary We present software tools capable of identifying a proverb automatically in a text and of generating a translation for it. They include a library of finite state automata administered by the INTEX system (developed by M. Silberztein 1993). We have constructed a series of automata and transducers relating to certain syntactic classes of French and Italian proverbs. We differentiate between the automata containing attested proverbs and automata that we call "predictive", particular lexical and syntactic forms that are inserted by analogy with the actual forms retrieved, which could prove useful in the automatic analysis of texts. Wherever we know the equivalent form in the other language, we establish a trans ducer. We present a detailed model of the analyser, made up of a network of automata, which takes account of the formulations that link the proverb to the discourse: "as the proverb says, according to folk wisdom, as grandmother used to say, etc". These phrases can sometimes be inserted into the proverb itself, as a kind of interpolation, and can present an obstacle for automatic recognition process.
SUR LA VALEUR DE L'« INCISE » ET SA POSTPOSITION SIGNE MÏMIQUE ET « STYLE INDIRECT LIBRE »1
BENOÎT DE CORNULIER CALD-CEM, Maison des Sciences de l'Homme Ange Guépin (Nantes)
1. Signifier que P en le mimant On peut, il suffit d'en convenir, attribuer ä un objet une valeur de désignation de quelque chose á quoi il est supposé ressembler ou être analogue.2 En particulier, une occurrence de forme linguistique peut servir ä désigner (donc comme nomi nale) tout objet linguistique semblable, par exemple une occurrence particulière de cette forme, ou tel mot en général dont c'est la forme, etc.; ainsi roses, nominal, neutre quant au genre et nombre (masculin, singulier), peut servir a désigner le mot féminin pluriel roses, ou telle occurrence de ce mot, ou la forme graphique de ce mot, etc., comme dans Roses est féminin pluriel (et non Roses sont féminines plurielles) ou il est masculin singulier. On peut attribuer a une action qu'on est en train de faire une valeur de signi fication d'un événement a quoi elle est supposée ressemblante ou analogue. Par exemple, en réponse à la question Où est Pierre ?, on peut signifier en écartant la main, par analogie avec un mouvement de départ, que Pierre est parti; on peut encore le signifier en faisant le bruit Frrrt supposé présenter quelque ressemblance ou analogie avec un bruit de fuite, cas particulier où l'action supposée imitative est verbale ou du moins orale; en émettant les sons de Il pleut, on peut signifier que quelqu'un a émis des sons semblables ou produit le signe qu'ils peuvent constituer, ou produit un signe de valeur sémantique voisine (il a signifié qu'il pleuvait), etc.: on peut mimer que X a été prononcé en prononçant X. En 1
2
C'est initialement avec l'intention de travailler avec Maurice Gross qu'en accord avec Jean Stéfanini (Directeur de Recherche) j'ai étudié les incises (Considérations illustrees de quelques arbres et enrichies de plus de mille exemples sur les incises en frangais contemporain, Thèse de troisième cycle, Université de Provence, 1973), même si la difficulté de réaliser une table binaire des verbes d'incises (Cornulier 1978) m'a rapidement entrainé dans une direction différente. La présente contribution reformule un peu mon analyse générale et modifie mon analyse de la position des "incises". Je remercie François Recanati et Marcel Vuillaume, avec qui j'ai eu depuis longtemps de nombreuses discussions sur ces sujets, en sorte que j'ai pu emprunter ou dénaturer des idées a eux sans m'en apercevoir. Sur l'application de cette possibilité au discours mimique comparé aux onomatopées événementielles, voir Cornulier (1980:21-22).
106
BENOIT DE CORNULIER
faisant le geste symbolique d'embrasser (sans réellement embrasser), on peut signifier qu'on embrasse, ou qu'on accomplit l'acte de signifier quelque chose que ce geste peut signifier.3 Ci-dessous, j'appelle mime ou qualifie comme mimique une action visant a signifier que P en le mimant. (Ce mode mimique de signification n'a qu'un rapport lointain avec le jeu d'acteur dans une fiction: en disant sur la scène Je ne te hais point ä Luc, Lucette ne signifie pas qu'une Chimène distincte d'elle a dit ça à un Cid autre que Luc; mais, plutöt, elle procure au spectateur la possibilité de s'imaginer témoin du fait même: il imagine voir Chimène dire ça au Cid; dans cette vision codée, l'action est prise pour elle-même, pas pour représentation.)
2. L'incise comme greffon sur un support mimique Si Pierre dit: Zut, dit Luc, le Zut de Pierre suffit virtuellement a signifier qu'il (ou a eu...) une émission du bruit ou du message Zut; du reste, quand le contexte suffit, on se passe souvent d'incise. Le greffon linguistique dit Luc n'est pas res ponsable de Fespèce d'assertion suivant laquelle ce Zut a été émis, il ne fait que préciser Finformation apportée par le Zut mimique (par exemple il précise le locuteur de l'énonciation qu'on mime), d'ou la possibilité d'y inverser un sujet clitique (dit-il)4; il s'adjoint á ce support comme une espèce de circonstant (com plément périphérique); le support peut jouer le rôle de complément d'objet direct du greffon si, comme ici, la greife se fait par un verbe transitif sans son complé ment (c'est par le verbe (muni ou non de clitiques) que le greffon s'attache au support).5 Cette analyse rend compte de sévères contraintes pragmatiques sur les incises, et par exemple de la bizarrerie de Zut, n'a pas dit Luc, où Fincise irait a Fencontre de Finformation nécessairement positive apportée par le mime.6 Une tendance naturelle, plus ou moins forte selon la langue et le style, a homogénéiser le message global Mime + Incise dans le contexte de la communication linguistique, en lui dormant une apparence verbale continue, a pour effet de privilégier, voire de sélectionner rigoureusement en cette combinaison, des mimes linguistiques d'actions linguistiques ou du moins d'événements sémiotiques ou cognitifs. En fran9ais, il n'est pas très fréquent que le support soit la transposition verbale d'un signe non verbal, comme dans Oui, fait-elle de la tete (type banal en anglais), ou Obstruction, semble avoir signalé un juge de touche (entendu dans un reportage télévisé de match de foot, où Obstruction rend un signal gestuel ä dis3
4
5
6
Auquel cas, si c'est pris autoréférentiellement, c'est sujet á détachement du sens (Cornulier 1980) et on embrasse sémantiquement. Dans dit-il, la postposition du clitique sujet sígnale que ce verbe n'est pas asserté de manière autonome (la postposition du sujet non-clitique dans dit Luc n'a pas cette valeur modale). Dans *Zut, hier m'a dit luc, le noyau verbal m'a serait séparé du mime par hier, qui n'est pas clitique de a. Cornulier (1978). On ne peut pas mimer qu'un événement n'a pas eu lieu, ou a peut-être eu lieu (les incises du type Zut, a peut-être répondu Pierre, sont pour le moins rares).
SUR LA VALEUR DE L'INCISE
107
tance); mais on ne trouve guère de cas où, comme il semble arriver plus facilement en allemand, le support d'une incise mime (en onomatopée) un événement qui n'est pas un signe, comme dans Rack! - stößt er an den Tisch (Crac, cogne-t-il contre la table).7 En conversation gestuelle-orale, je n'ai jamais remarqué de cas ù la base d'une incise serait un geste nullement verbalisé, comme si, sur un geste mimant un coup de pied au football, on pouvait greffer: a fait Platini.
3. L'incise et le "style indirect libre" Il est tentant de considérer, a première vue, Charloti était Napoléon, prétendaitili, comme une simple variante sémantique, voire syntaxique, de Charloti prétendait qu'ili était Napoléon, parce que Luc, qui nous parle ainsi de Chariot, n'a pas l'air de prétendre lui-même que Chariot était Napoléon. Suivant cette analyse paraphrasant l'incise par un verbe recteur, la non-subordination apparente de Chariot était Napoléon serait illusoire. Mais la constatation de l'existence de ce qu'on appelle souvent le discours ou style indirect "libre" (non-subordonné) montre qu'une autre analyse est possible: dans Chariot se fâcha en révélant son grand secret: non, il n'était pas celui pour qui on le prenait, il était Napoléon, etc., l'autonomie phrastique des propositions exprimant la pensée de Chariot est manifeste; dans Chariot, ä Ven croire, était Napoléon, la réduction au discours subordonné requerrait une chirurgie lourde.8 Il est donc utile de fournir du style indirect libre une analyse analogue, sinon semblable, à celle qu'on a fournie du discours rapporté de manière mimique. Comme ce qui est ici en jeu est un problème de mode de signification débordant largement le domaine de la langue, en voici d'abord un analogue dans un domaine sémiologique non linguistique. Supposez trois personnes assises autour d'une table (pas question de se décoller de sa chaise, on dîne); Norbert, tourné vers le nord, Suzanne, tournée vers le sud, et l'intellectuel de la bande qui demande d'abord ä Suzanne de lui montrer dans quelle direction est le sud. Réponse A de Suzanne: Suzanne tend le bras vers sud (donc devant elle), pour montrer par ù est le sud. Puis, pour être sûr de bien comprendre, l'intellectuel demande a Norbert ce qu'a fait Suzanne comme réponse. On peut imaginer notamment deux types de réponse de Norbert: Réponse B1 de Norbert: Norbert tend le bras devant lui (donc vers le nord) pour montrer que Suzanne a tendu le bras devant elle (donc vers le sud). Réponse B2 de Norbert: Norbert tend le bras vers le sud (donc derrière lui, petit effort de souplesse) pour montrer que Suzanne a tendu le bras vers le sud (ça suppose qu'elle tendu devant elle). 7 8
Wilhelm Busch, Die fromme Helene, 18 (exemple du à Marcel Vuillaume). Voir aussi la thèse signalée en note 1.
108
BENOÎT DE CORNULIER
Pour les comprendre, il faut distinguer ce qui est mimiquement pertinent dans chacune de ces réponses gestuelles. Dans B1, c'est uniquement Fomentation d'une partie [bras] de chaque corps par rapport au reste de ce corps lui-même (chacun a son avant et sa droite propres); dans B2, c'est d'abord l'orientation de la même partie du corps (bras droit) par rapport a une orientation externe et commune (indépendante de la disposition interne de chaque corps) et pertinente pour le message. Parce qu'il est collé sur sa chaise, Norbert ne peut pas reproduire á la fois l'orientation externe (vers le sud) et interne (devant soi) du geste de Suzanne et son choix aboutit selon le choix des paramètres au geste B1 ou B2. Á la source de ce choix sémantique se trouve une opposition plus générale applicable a des phénomènes non sémantiques; car, même si Norbert faisait le geste B1 ou B2 sans prétendre signifier ou imiter quoi que ce soit, nous pourrions dire qu'il a un geste analogue a celui de Suzanne, soit quant a un certain type d'orientation interne (57), soit quant ä un certain type d'orientation externe (B2). Revenons au choix de deux formes de rapport linguistique: Cl Je suis Napoléon, prétendait Chariot en 1940 C2 Charioti était Napoléon, prétendait-ili en 1940
(dit par Luc en 2000) (dit par Luc en 2000)
Dans l'un et l'autre cas, dans le support de l'incise, la parole de Luc est mimique, mais a des niveaux différents. Le temps verbal présent ou imparfait (suis, était), le choix ou non de la première personne (je, il ou Chariot), ont une valeur différente selon qu'ils sont employés (sans être cités) par Chariot en 1940 ou Luc en 2000: ce sont des réflexifs d'énonciation. Dans Cl, en émettant certains mots sans les adapter à sa propre perspective (au moins quant aux formes verbales et personnelles), Luc signifie mimiquement que Chariot les a prononcés. Dans C2, en disant que P (que Chariot était Napoléon), Luc signifie mimiquement que Chariot a signifié que P: il ne mime plus les mots, mais l'acte de signification par un acte de signification, en adaptant notamment a sa perspective propre les paramètres des réflexifs mentionnés. L'incise confirme ou précise, si besoin est, la valeur mimique autonome du support, elle ne la crée pas.9 Dans cette analyse, en C2, Luc dit (asserte) bel et bien que Chariot était Napoléon; mais il le dit pour signifier mimiquement que Chariot Fa dit; et cette fonction ultime de son action peut rétrospectivement en annuler la valeur première en la relativisant ainsi: si Luc a dit que P pour signifier que Chariot le disait, Fassertion que P de Luc est par la même assez fortement motivée, et dès lors il n'est pas nécessaire de la prendre au sérieux en elle-même: sa pertinence en tant qu'assertion de Luc peut être nulle (ce n'est pas a dire qu'elle le soit nécessairement: une double valeur directe et mimique n'est pas à exclure). C'est bien pourtant, au premier stade de l'analyse, une assertion de Luc; car, sinon, elle ne pourrait pas mimiquement exprimer une assertion de Chariot. Dans cette analyse, la non-subordination du discours rapporté n'est pas une illusion, et ce qui est en jeu est moins un fait de syntaxe qu'un fait de mode de signification. 9
L'incise ressemble à un cas de décrochage énonciatif, notion que j'ai utilisée pour des cas différents dans Effets de sens (Éditions de Minuit, 1985).
SUR LA VALEUR DE L'INCISE
109
Si le phénomène en jeu ne concemait toujours que du "discours rapporté", on pourrait dire que la distinction du "style" ou "discours direct" et du "discours" ou "style indirect libre" est celle de la parole mimique selon qu'on mime rémission verbale ou Facte de de signification linguistique en tant que tel. Mais nous avons déjà vu que le mime "direct" s'étend, hors des incises, ä des phénomènes non linguistiques; et le "style indirect libre" traditionnellement reconnu dans des cas du type C2 (sans incise) correspond a un phénomène débordant la mimique du discours. Pour ne donner qu'un type d'exemple, dans Il pleuvait, semblait-ü (dit par Luc), c'est une apparence ou une impression cognitive non linguistique que Luc reproduit: dès lors qu'on comprend que l'énonciateur mime l'information d'une apparence, on est en quelque sorte dispensé de comprendre qu'il affirme sérieusement qu'il pleuvait. (Que les propos produisent des apparences - si on dit que P, c'est apparemment que P: la rumeur en est un indice - est bien reflété en français par l'expression il paraît comme dans Chariot, paraît-il, est en ce moment ä Nice. Ainsi une assertion que P peut mimer (a sa façon) une apparence que P.)
4. Position et portée du greffon para-mimique Le nom traditionnel d'incise (= insérée) implique comme une évidence que dans une phrase telle que J'ai, dit le cheval, une verrue, le support est indivisiblement J'ai une verrue et que le greffon s'insère au milieu. Il pourrait cependant se placer a la fin (J'ai une verrue, dit le cheval), mais pas au début (*Dit le cheval, j'ai une verrue). A première vue, la notion d'incise semble donc simplifier celle d'inciseou-postposée. Or, comme l'observent Grevisse (Maurice aussi) & Goosse (1993: 615, §374), "la portée d'une sous-phrase incise n'est pas nécessairement limitée a une seule phrase. Mais maintenant c'est une autre affaire, ajouta-t-il en se levant d'un air résolu. Il faut que faille donner quelques ordres (Gracq)". Cette observation est révélatrice en ce qu'elle découple position et portée: le greffon est ici inséré dans une phrase, et il porte sur une suite de phrases dont celle-ci n'est que la première. Dans la biographie suivante, on pourrait placer une incise portant sur Tensemble telle que écrit Luc en diverses positions, mais pas n'importe ou; comparez: (1)
(2)
(3)
"Paul Broca, écrit Luc, est né en 1824. En 1841 il découvrit la bosse des mathématiques. En 1849 il fut élu Chirurgien. En 1870 il fonda l'école française de physiognomonie. Il mourut en 1880." "Paul Broca est né en 1824. En 1841 il découvrit la bosse des mathématiques, écrit Luc. En 1849 il fut élu Chirurgien. En 1870 il fonda l'école fran9aise de physiognomonie. Il mourut en 1880." "Paul Broca est né en 1824. En 1841 il découvrit la bosse des mathé matiques. En 1849 il fut élu Chirurgien. En 1870 il fonda l'école française de physiognomonie. Il mourut en 1880, écrit Luc"
110
BENOÎT DE CORNULIER
Le caractère moins naturel de la position 2 - ni initiale ni terminale - suggère que l'indication fournie par le greffon peut valoir non seulement pour son support, mais pour un discours plus étendu dont ce support exact puisse être un représen tant naturel. La chaîne d'énoncés peut être représentée par son énoncé initial (cas 1), voire final (cas 3, si du moins, en ce cas, le greffon n'est pas postposé au conte entier), mais difficilement par un énoncé quelconque (cas 2, au milieu). Le gref fon peut ainsi porter indirectement sur une chaïne plus longue que l'élément sur lequel il est strictement greffé en postposition . Étendons cette analyse à la phrase. Dans J'ai, dit le cheval, une verrue, ou J'ai une verrue est un mime et J'ai un segment initial de ce mime, dit le cheval est syntaxiquement attaché (en postposition) au segment J'ai qui lui sert de support; et si l'indication qu'il comporte vaut de la totalité du mime, c'est par une extension naturelle de sa valeur: le segment initial est naturellement représentatif du tout, et en indiquant que le cheval est le locuteur du segment initial, en l'absence d'indi cation contraire, on indique pratiquement qu'il est l'auteur de ce tout.10 Un rapport quelque peu analogue est bien connu dans les langues où des clitiques peuvent porter sur une suite sur Félément initial de laquelle ils sont greffés. C'est ici la notion de représentation (d'un tout par un élément représentatif de ce tout) qui est déterminante. Dans un domaine non temporei, on peut comparer cette possibilité au cas où, en montrant une partie représentative d'un tableau (par exemple, la tête dans un portrait), quelqu'un dirait que "c'est de tel peintre" en signifiant par le fait même que le tableau entier, non le seul détail sélectionné, est de ce peintre. Il est plausible que la relation de représentation se prête a une analyse hiérarchique, et que par exemple une "incise" postposée au strict début d'une énonciation puisse porter, 1) sur l'énonciation entière, puis 2) sur une suite d'énoncia tions dont celle-ci n'est que la première. Il est donc vraisemblable que, malgré une première apparence, les prétendues incises ne sont pas incises, ni même incises-ou-postposées, mais bien postposées. Comme il s'agit de greife d'un élément linguistique sur un signe mimique autonome (cas de décrochage énonciatif), même si ce signe est d'allure verbale, les "incises" du type dit-il sont donc plutot des greffons métalinguistiques postposés. 10
Pour quelque chose de l'ordre du style indirect libre, comparons ce passage du Discours sur Homére de La Motte (préface a sa traduction de l'Iliade, 1714, p. xij sv.): "Homére, à recueillir les traits de ceux qui l'ont loüé, étoit un homme divin. Telle fut la force de son génie, qu'il inventa l'art et le perfectionna. Personne avant lui qu'il pût imiter; nul autre après lui qui ait pü le suivre [...]. A suivre d'autres mémoires, Homére n'étoit qu'un homme ; loin qu'on lui doive la loüange de l'invention, il ne mérite que le reproche de l'avoir voulu usurper, en supprimant les Auteurs qui avoient travaillé avant lui. Il chargea sa mémoire de toutes les folies opinions de son temps [...]. A quoi s'en tenir ? Il y a apparence qu'aucun de ces deux portraits ne ressemble bien. L'admiration et le mépris auront peut-être également exagéré." J'abrège ici deux longs portraits de plusieurs alinéas chacun. Dans chacun, que le point de vue développé est celui des admirateurs ou des détracteurs d'Homère, et non de l'auteur, n'est indiqué que par un circonstant adjoint a l'énonciation initiale.
SUR LA VALEUR DE L'INCISE
111
Nous pouvons donc schématiser comme suit l'énonciation complexe de Oui, a dit Pierrette, je reviendrai: [ [ Oui ] m i m e , a dit Pierrette ]phrase, [ je reviendrai ] c o n t i n u a t i o n du
mime
ou Oui constitue un signe mimique, Oui, a dit Pierrette, l'énonciation d'une phrase incluant le mime et sémantiquement convergente avec lui, et je reviendrai une continuation du mime. Dès lors la phrase Oui, a dit Pierrette, peut s'analyser en parallèle a Ainsi a dit Pierrette : la rapture prosodique ou la virgule après le mime (après Oui) pourrait faire croire que le mime et l'incise sont syntaxiquement disjoints, mais elle assez justifiée par le décalage, au sein de la phrase, entre la partie mimique et la partie non mimique.11 Corrélativement, au niveau de la phrase, la position du mime dans Oui, a dit Pierrette apparaït comme analogue a celle d'Ainsi dans Ainsi a fait Pierrette : c'est une antéposition au verbe. Dans ces deux exemples, on peut voir un casdepermutation, à l'intérieur d'une proposition, autour du verbe, d'un complément (non sujet) placé en position préverbale à la place ordinairement dédiée à l'éventuel syntagme (non clitique) sujet, et de ce syntagme sujet qui est alors relégué en position postverbale.12
Références Cornulier, Benoît de. 1978. L'incise, la classe des verbes parenthétiques et le signe mimique. Cahier de linguistique n° 8, Syntaxe et Sémantique du Français, Presses de l'Université du Québec, p. 53-95. Cornulier, Benoït de. 1980. Meaning Detachement. Collection Pragmatics and Beyond, Amsterdam: John Benjamins. Grevisse, Maurice & André Goosse. 1993. L'Usage bon, 12éme éd. refondue par André Goosse, Louvain-la-Neuve : Duculot. Recanati, François. 2000. Oratio recta, oratio obliqua, an essay on metarepresentations, M.I.T. Press. Summary In Please, she said, comme in, the parenthetical she said is rather postponed to Please than inserterted in the middle of Please,[...],come in. It is not responsible for the fact that the occurrence Please, (come in) means that these words have been uttered; this meaning fundamentally belongs to the "mimic" (rather than plainly linguistic) use of Please, come in. In She was tired, it seemed, the assertion of She was tired doesn't reproduce the fact that these words were uttered, but that (apparently) she was tired. 11
12
C'est ainsi qu'on peut signaler par deux points le passage á un niveau de mime (ou de mention) devant le complément direct ä l'intérieur même de la phrase : Elle a dit: Oui, sans ce complé ment soit pour si peu syntaxiquement détaché du verbe. La postposition en incise du sujet clitique (non syntagme) comme dans a-t-elle dit a été évoquée plus haut, en note.
DICTIONNAIRES ÉLECTRONIQUES DELAF ANGLAIS ET FRANÇAIS BLANDINE COURTOIS LADL, CNRS
Introduction Les ressources linguistiques du Laboratoire d'Automatique Documentaire et Linguistique sont organisées en un système appelé DELA: Système des Dictionnaires électroniques du LADL. Ce système de représentation formalisée des langues, mis en oeuvre sous l'impulsion du professeur Maurice Gross dans les années '60, est structuré en modules représentant chacun un aspect de la langue. En particulier, la syntaxe est décrite dans des tables informatisées et désignées sous le terme de "lexique-grammaire". Á cöté de ces tables, le vocabulaire et la morphologie sont pris en compte dans les dictionnaires DELAS, contenant les mots simples, et DELAC, contenant les mots composés. Á partir de ces deux ensembles, les for mes fléchies sont engendrées automatiquement par programme et rassemblées dans les dictionnaires DELAF de formes simples et DELACF de formes composées. Ces derniers dictionnaires sont intégrés au cœur du logiciel INTEX d'analyse des textes en langage naturel. L'exposé qui suit est basé sur la comparaison entre deux DELAF construits au LADL pour Tangíais et le français. Il décrit en premier lieu la structure des articles qui les composent, puis les données codifiées qui caractérisent chaque mot d'entrée. Il montre ensuite, à partir du DELAF français, comment les codifications sont réparties en trois niveaux hiérarchisés, auxquels correspondent trois états du dictionnaire. Il s'aehève enfin sur une brève description des données linguistiques contenues dans chaque état de dictionnaire.
1. Présentation générale des DELAF De prime abord, l'analyse automatique des textes suppose que chaque mot formel simple rencontré puisse être trouvé dans un dictionnaire afin d'être identifié sur le plan grammatical. Par exemple, nations devra être un mot d'entrée du dictionnaire, et y être reconnu comme une forme plurielle du nom féminin nation. Ainsi un mot
BLANDINE COURTOIS
114
formel comme nations est caractérisé par son lemme: "nation", sa catégorie gram maticale: "nom", son identification grammaticale: "feminin pluriel". Ce sont là les informations minimales à rassembler dans un dictionnaire de formes. Elles sont donc systématiquement codées dans toute entrée de DELAF. 1.1. Structure des articles de dictionnaire Un enregistrement du DELAF est constitué de cinq zones - ou "champs" - indi qués dans le tableau ci-après. Le format est le même pour les enregistrements du dictionnaire de formes composées fléchies DELACF. Structure d'un article de DELAF 1 - Forme d'entrée: mot simple d'un point de vue formel 2 - Lemme: mot de base (forme canonique) 3 - Informations caractéristiques du mot de base 4 - Identification grammaticale de la forme d'entrée 5 - Compléments (facultatifs) pour le lecteur humain
Chacun des champs sera détaillé ultérieurement. Indiquons cependant que certains d'entre eux peuvent être absents: - le deuxième champ est vide quand lemme et forme d'entree sont identiques; - le champ d'identification grammaticale n'a pas lieu d'être pour les mots inva riables; - le dernier champ est rempli seulement quand la forme d'entrée est une unité constituante de mot composé. Les exemples ci-dessous illustrent la structure la plus simple des articles des DELAF anglais et français: bodies,body.N:s sent, send. V:Ils:I2s:I3s:Ilp:I2p:I3p angry,.A actually,.ADV
corps,.N:ms:mp envoyait, envoyer,. V:I3s coléreuses, coléreux.A:fp réellement,.ADV
1.2. Mots d'entrée et lemmes Les mots d'entrée sont des unités formellement simples de la langue écrite, c'est-àdire toute séquence alphabétique figurant dans les textes et comprise entre deux séparateurs comme le trait d'union, l'espace blanc, l'apostrophe, les signes de ponctuation et autres caractères spéciaux. Cette définition formelle a mené a introduire dans le DELAF des parties de mots telles que parce (terme de parce
DICTIONNAIRES ÉLECTRONIQUES DELAF
115
que), ou gooders (venant de do-gooders). La présence de cette sorte d'unités est nécessaire pour les traitements par ordinateur. Ainsi, toutes les formes simples possibles d'une langue sont inscrites dans un dictionnaire DELAF. Á chaque mot d'entrée est associée une forme de référence, appelée forme canonique ou lemme. C'est la forme traditionnelle d'introduetion des mots dans les dictionnaires; en français: infinitif des verbes, masculin (ou féminin) singulier des noms et adjectifs. Lorsque le mot d'entrée est lui-même une forme canonique, il n'est pas nécessaire d'indiquer le lemme. Par contre, lorsqu'il s'agit d'une forme fléchie ou conjuguée, alors le lemme est noté "en clair". Ainsi, dès qu'une forme est trouvée dans le DELAF, le lemme est immédiatement lisible sans avoir a effectuer aucun calcul ni aucune procédure pour l'obtenir. Inversement, on peut extraire facilement du dictionnaire toutes les formes rattachées a un même lemme. 1.3. Caractérisation grammaticale Sur le plan grammatical, une forme du DELAF est caractérisée par deux éléments: - la partie du discours, qui s'applique a toutes les formes d'un mot; - l'identification grammaticale, qui est caractéristique d'une forme. 1.3.1. Parties du discours Comme le montrent les exemples précédents, le champ des données codifiées après le lemme comporte au minimum un code représentatif de la catégorie gram maticale du mot d'entrée. Les catégories codifiées dans le DELAF sont calquées sur les parties du discours de la grammaire traditionnelle. Nous en donnons ici la liste avec leurs codes: verbe .V, nom .N, adjectif .A, adverbe .ADV, déterminant .DET, pronom .PRO, conjonction .CONJ, préposition .PREP, interjection .INTJ et préfixe .PFX. A cette liste s'ajoutent pour le français trois codes non standard: .PREPDET {du, des, au, aux), .PREPPRO (duquel, desquels, desquelles, auquel, auxquels, auxquelles) et .PREPADJ (dudit, desdits, desdites, audit, auxdits, auxdites). En outre, les codes .XI et .X servent á désigner des formes inclassables comme les parties simples non autonomes de mots composés. Le code .XI s'applique a des constituants invariables, tels aujourd et hui, tandis que .X s'applique a des constituants de forme variable, par exemple épic, partie de porc-epic (pluriel porcs-epics), ou ager, partie de teen-ager (pluriel teen-agers). 1.3.2. Identification grammaticale La codification des parties du discours est identique en anglais et en français. Il n'en va pas de même pour l'identification grammaticale. Cette dernière dépend de la catégorie de la forme d'entrée et de la langue décrite.
116
BLANDINE COURTOIS
a) Formes nominales Les noms français sont identifiés en genre (masculin ou féminin) et nombre (sin gulier ou pluriel), alors qu'en anglais ils sont spécifiés uniquement par le nombre. Exemples: thief, .N+Hum+zl :s thieves, thief. N+Hum +zl :p
voleur, .N+Hum+zl :ms voleuse, voleur. N+Hum +zl :fs voleurs,voleur .N+Hum+zl :mp voleuses,voleur .N+Hum+zl :fp
ou :m et :ƒ désignent respectivement le masculin et le féminin, :s et :p le singulier et le pluriel, et +zl indique la première des couches lexicales suivantes : zl = couche des mots les plus usuels z2 = vocabulaire moins courant z3 = termes techniques et/ou rares Habituellement, le genre n'est pas codé dans les dictionnaires anglais. Certains noms humains tel actor, actress pourraient l'être. En cas de marquage du genre, il faudrait d'ailleurs prévoir trois cas: masculin humain (pronom he), féminin humain (pronom she) et neutre (pronom it), b) Formes adjectivales et adverbiales En français, les formes adjectivales du DELAF sont identifiées par les codes de genre et nombre. Quant aux adverbes, ils sont invariables. En anglais, les varia tions de forme concernent un certain nombre d'adjectifs et d'adverbes (a une ou deux syllabes, parfois trois) pour lesquels le comparatif et le superlatif se construisent par flexion de la forme neutre {angry, angrier, angriest). Les formes adjectivales et adverbiales ont donc une codification différente en anglais et en français: deep, .A+zl deeper, deep.A +z1: deepest, deep.A+z1:S soon, .AD V+z1 sooner, soon. AD V+z1: soonest,soon.ADV+zl :S
profond, .A+zl :ms: mp profonde,profond .A+z1:fs profonds,profond .A+z1:mp profondes,profond .A +zl :fp tot, .AD V+zl
ù : et :S désignent respectivement le comparatif et le superlatif. c) Formes verbales L'identification des formes verbales anglaises et françaises est semblable dans les deux langues. Elle est représentée par des codes de: - mode-temps pour l'infinitif, le participe présent et le participe passé anglais; - mode-temps, genre et nombre, pour le participe passé français; - mode-temps, personne et nombre, pour les temps personnels.
DICTIONNAIRES ÉLECTRONIQUES DELAF
117
Exemples: see,. V+z1: W:Pls:P2s:Plp:P2p:P3p seeing, see. V+z1: G seen, see. V+zl :K sees, see. V+zl :P3s saw, see. V+zl :Ils:I2s:I3s:Ilp:I2p:I3p
voir,. V+z1: W voyant, voir. V+z1:G vu, voir. V+zl :Kms vue, voir. V+zl :Kfs vus, voir. V+zl :Kmp vues,voir. V+zl:Kfp vois,voir. V+zl:Pls:P2s:Y2s voit,voir. V+zl:P3s voyons,voir. V+zl:Plp:Ylp voyais,voir. V+zl:Ils:I2s voyait,voir. V+zl: 13s voyions,voir. V+zl:Ilp:Slp etc.
Le prétérit anglais est assimilé a l'imparfait de l'indicatif français. Comparée a la conjugaison française (11 temps simples dont 8 temps personnels ayant chacun des formes différentes suivant la personne et le nombre), la conjugaison anglaise est fort réduite (5 temps simples dont 2 temps personnels). Au total, un verbe ré gulier comme aimer a 39 formes alors que to love en a 4 seulement (love, loves, loved, loving). Cette disparité est une des causes du volume réduit du DELAF anglais (300 000 formes) par rapport a celui du DELAF français (plus de 900 000 formes). d) Mots invariables Ils ne sont codés que par la catégorie grammaticale, tels: timorously, .AD V+zl when,. CONJS+z1 and,. CONJC+z1 among,. PREP +zl hurrah,. INTJ+zl
craintivement, .AD V+zl quand,. CONJS+z1 et,. CONJC+z1 parmi,.PREP+zl hourra,. INTJ+zl
e) Déterminants et pronoms Les déterminants et pronoms sont identifiés en anglais et en français par la catégorie grammaticale et un code de sous-catégorie, tel que Dind (déterminant indéfini) ou Pdem (pronom démonstratif). Quand ils sont variables, ils reçoivent des codes de genre et nombre. Les pronoms personnels ont en plus un numéro de personne. Exemples: a,.DET+Dind+z1:s an, a. DET+Dind+zl :s our,.DET+Poss1p+z1:s:p eight,. DET+Dnum +zl :p
un,. DET+Dind+z1: ms une, un. DET+Dind+zl :fs notre,.DET+Dposs1p+z1:ms:fs huit,.DET+Dadj+z1:mp:fp
118 I,.PRO+Nomin+zl:ls her,. PRO+Accus+zl :3fs this,. PRO+Pdem +zl :s what,.PRO+RelQ+zl
BLANDINE COURTOIS
je,.PRO+PpvIL+zl:ls la, le. PRO+PpvLE+zl :3fs ceci,. PRO+Pdem +zl :ms que,.PRO+PronQ+zl
Les pronoms personnels anglais à la troisième personne du singulier nécessitent la codification explicite du genre. Ainsi le pronom sujet he est codé masculin singu lier, she féminin singulier, et it neutre singulier.
2. Informations codifiées dans les DELAF La description de ces informations est basée sur l'exemple du dictionnaire français, parce que ce dernier comporte plus de traits codifiés que le DELAF anglais. 2.1. Niveaux de codification et états du DELAF Trois niveaux de codes d'informations sont établis dans le DELAF français, auxquels correspondent trois constructions du dictionnaire: 1) le premier niveau de codification contient le minimum de données utiles pour l'analyse grammaticale des formes. Il est suffisant pour rechercher, grace a INTEX, les emplois d'un mot sous toutes ses formes (canonique et fléchies), ou encore des structures de phrases décrites par une expression rationnelle ou un graphe. Le dictionnaire composé de ce seul premier niveau est appelé DELAF-S ("Short"). C'est le plus réduit en volume de codes; 2) le deuxième niveau de codification porte essentiellement sur les traits sémantiques des noms, tels que: humain, concret, animal, abstrait, collectif. A côté de ces traits, plusieurs codes sont introduits sur les déterminants, les pronoms et les adjectifs. Ils seront précisés plus loin. Les données codées à ce niveau sont présentes dans un dictionnaire de taille moyenne, désigné par DELAF-M ("Medium"); 3) au troisième et dernier niveau, la codification concerne les entrées verbales. Les codes mis dans ces entrées créent des liens avec les tables du lexiquegrammaire du LADL, ce qui permet d'accéder a toute l'information syntaxique figurant dans ces tables. Ces codes sont donc essentiels. Ils sont intégrés dans le DELAF français le plus complet, de nom DELAF-L ("Large"). Pour schématiser ce qui précéde, on peut comparer le DELAF a une construction à trois étages de codes, l'un grammatical, le deuxième sémantique et le troisième syntaxique. (Notons que, comme dans toute construction ä plusieurs étages, tout étage supérieur suppose la présence des étages moins élevés.) Les traits sémantiques des noms sont présents dans le DELAF-M anglais. Par contre,
DICTIONNAIRES ÉLECTRONIQUES DELAF
119
il n'existe pas de tables syntaxiques des verbes anglais, qui limite le DELAF-L a la seule langue fran9aise. 2.2. Organisation des niveawc de codes Avant d'exposer en détail les contenus de chaque étage, il est intéressant d'avoir une vue globale de la hiérarchie des niveaux de codification dans le DELAF le plus complet. Cette organisation est fixée suivant une séquence rigoureuse (voir tableau ci-après). L'identification grammaticale est toujours située en dernière zone de codes. Les compléments informatifs consignés en fin de tableau sont facultatifs et inutilisés par INTEX. Niveau de codifications
États de DELAF
1
-S, -M, -L
1
-S, -M, -L
2
-M,-L
3
-L
Verbes: liens avec les tables syntaxiques Autres catégories: voir texte
F
1
-S, -M, -L
Appartenance á une couche lexicale: +zl,+z2,+z3
F
1
-S, -M, -L
1
-S, -M, -L
Informations codifiées Forme, lemme .Categorie grammaticale Verbes: transitif+t ou intransitif+i .pronominal +p . avec auxiliaire être (français) Noms: traits sémantiques Autres catégories: voir texte
Identification grammaticale (dépendante de la partie du discours): - mode, temps, personne, nombre - genre, nombre
Langue
A+F A+F A+F F A+F
A+F
Compléments en cas d'élément de composé /*. élément existant comme mot simple /** élément non autonome {...} rappel de la composition
F
Abréviations: A = anglais, F =français,-S = Short, -M = Medium, -L = Large
La distribution des codes en trois niveaux hiérarchisés se justifie par les besoins différents des utilisateurs de DELAF, via les traitements effectués sous INTEX. De fait, les consultations des DELAF sont dépendantes des requêtes formulées. Par exemple, la plupart des interrogations et des graphes construits pour l'analyse de phrases ne font intervenir que des caractères grammaticaux. Dans ce cas, il n'est pas utile de charger le dictionnaire avec des données autres que les codes
120
BLANDINE COURTOIS
grammaticaux. Cependant, pour les recherches linguistiques avancées, les codes sémantiques et/ou syntaxiques s'avèrent indispensables. C'est donc pour répondre a la diversité des besoins qu'ont été instaurés les trois niveaux de codification. Il est important de remarquer que ces niveaux sont totalement indépendants de la répartition du dictionnaire en trois couches lexicales, que nous rappelons ici: mots usuels en couche zl, vocabulaire intermédiaire en z2, mots rares en z3. En effet ces couches délimitent des sous-ensembles du DELAF qui contiennent chacun une partie du lexique, alors que les niveaux présentés dans cet exposé corres pondent a une distribution des codes qui caractérisent chaque entrée. Ici, quel que soit le niveau de codification, toutes les formes du lexique sont présentes. Mais suivant ce niveau, il y a plus ou moins de codes informatifs en regard de chaque mot. 2.3. Contenu détaillé de chaque état du DELAF La précédente description des niveaux de codifications donne une vue d'ensemble de leur organisation hiérarchique. Cependant, la diversité des informations contenues dans chacun d'eux reste a préciser. Ici on se bornera à en dresser la liste sans entrer dans le détail des codes, ni des difficultés rencontrées pour les introduire. 1) Le DELAF-S contient les données communes a tout DELAF pour toute langue décrite selon le système DELA. Ces données sont explicitement notées dans le tableau représentant l'organisation des niveaux, et sont décrites dans le paragraphe relatif a la caractérisation grammaticale. 2) Les données contenues dans le DELAF-M correspondent au deuxième étage de codification. On peut distinguer celles qui sont introduites dans les deux DELAF, anglais et français, et celles qui sont spécifiques du français. Les premières comportent les traits sémantiques des noms, qui seront développés plus loin, et le classement des déterminants et des pronoms en sous-catégories: défini, indéfini, démonstratif, possessif, relatif. De plus, les pronoms personnels préverbaux sont codifiés quant a leur fonction: sujet, objet direct, objet indirect. En français, le DELAF-M contient des informations supplémentaires, obtenues a partir d'études diverses effectuées au LADL, notamment sur la syntaxe. Sont codifiées les données suivantes: - position de l'adjectif par rapport au nom: a droite (une douleur abdominale), à gauche (un bon déjeuner) ou a gauche en style littéraire (les verts pâturages); - appartenance de noms, déterminants, adverbes, a des tables externes (tables El, E1HC, Dadj, Dadv, Préd, Padv); - caractéristiques de verbes: impersonnel, transitif sans passif, auxiliaire être et avoir, verbe composé avec une particule antéposée (en jeter, y_ aller). Exemples:
DICTIONNAIRES ÉLECTRONIQUES DELAF
grise,gris,.A+d+zl :fs sangsue,.N21 +Hum+'ElHC'+zl craindre,. V64U+t+U+'32NM'+zl jeter,. V8+en+i+ '31Rr+ *+zl
121
Position á droite du nom: une barbe grise Table E1HC: Luc est une sangsue Emploi sans passif: ce tissu craint l'eau Particule en: sa nouvelle voiture en jette
Traits sémantiques des noms Le marquage des traits sémantiques est le principal apport de ce niveau: donnons donc quelques indications sur les codes sémantiques. En réalité, il n'est pas possi ble d'affecter une marque sémantique rigoureuse a tous les noms simples du lexique, hors de leur contexte. Néanmoins, dans beaucoup de cas, le trait sémantique n'est pas douteux. Il est alors codé. Exemples: artist, .N+Hum+zl :s woodpecker,.N+Anl+[Ornit]+zl :s lily,.N+Conc+[Veg]+zl :s guinea,.N+ Unit+[Monn]+zl :s
artiste,. N:ms:fs pivert,.N+Anl+[Ornit]+zl :ms lis,.N+Conc+[Veg]+zl :ms:mp guinée,.N+ Unit+[Monn]+z3:fs
Les marques sémantiques les plus courantes du DELAF sont les suivantes: +Hum: humain, systématiquement noté, en anglais comme en français, sur tous les noms qui désignent une personne, donc tous les noms de profession, comme architecte, chercheur, inventor, nurse, etc. +Anl: animal, code donné aux noms d'animaux, complété facultativement par une marque annexe qui indique le domaine, par exemple +[Pisc] (pisci culture) ou +[Ornit] (ornithologie). +Conc: concret, mis sur les noms qui désignent un objet matériel, palpable, concret sans aucun doute; des indications de domaine sont éventuellement ajoutées, telles que +[Veg] pour les végétaux et +[Min] pour les minéraux. +Abst: abstrait, noté quand il permet de distinguer deux mots ou deux emplois différents, comme infanticide, acte de tuer un enfant (Abst) et personne qui tue (Hum), ou punch, énergie (Abst: avoir du punch) et boisson (Conc). +Unit: unité, appliqué aux mots qui désignent des unités de mesure diverses; des sous-marques +[Monn], +[Phys], +[Meas] précisent s'il s'agit de noms de monnaies {shilling, peseta), d'unités physiques {volt, watt) ou d'unités de mesure {inch, yard). +HumColl, +AnlColl et +ConcColl: marques spécifiques de noms désignant des collectifs. La codification des collectifs est difficile, elle nécessite l'établissement de critères solides de définition, et un examen approfondi des emplois de chaque mot. Le DELAF français contient de l'ordre de 30 000 formes de trait +Hum (10 310 lemmes) tandis que le DELAF anglais en compte près de 24 800 (provenant de 12 630 lemmes).
122
BLANDINE COURTOIS
3) Le DELAF-L construit pour le français est destiné aux analyses linguistiques fines. Rappelons sa principale caractéristique, qui est la présence de codes de liens entre les verbes du DELAF et leurs constructions syntaxiques (voir plus loin). Outre ces liens, signalons: - des marques sémantiques annexes codifiées sur certains noms, comme +[Med] pour les termes de médecine, de même que sur des classes d'adjectifs, par exemple +[Topo] pour les adjectifs toponymiques; - un code d'ordre phonétique, appliqué aux mots commençant par h ou une voyelle et qui fonctionnent comme si l'initiale était une consonne. En pratique, il s'agit des cas ou le h initial est aspiré (le hibou, je hurle, il se hérisse) et de quelques mots à initiale vocalique (le vosa, le onze du mois). Avec ces mots, l'élision du déterminant ou du pronom qui précéde ne doit pas avoir lieu. Ils sont donc dotés d'un code spécial de "non-élision", dit "code consonantique" (code +c). Exemples: hérisser,. V+t+ '37M4'+c+zl: W (Max a hérissé son mur de clous) haricots, haricot.N+Conc+[Veg]+c+zl :mp ululements, ululement.Nl +c+z2:mp Liens avec les tables syntaxiques de verbes Concrètement, les liens sont introduits dans le DELAS, dictionnaire des mots simples a partir duquel sont engendrées les formes fléchies du DELAF. Tout verbe figurant dans une table du lexique-grammaire fait l'objet d'une entrée du DELAS dans laquelle le nom de table sert de code syntaxique. Un verbe qui apparait dans plusieurs tables donne autant d'entrees indépendantes du DELAS. Par exemple, le verbe camper, présent dans six tables syntaxiques différentes, a dans le DELAS les six entrées suivantes: camper ,.V3+t+'3 2 A'+zl camper,.V3+t+'32R2' +zl camper,.V3+t+'38LD'+zl camper,.V3+t+'38LH' +zl camper,.V3E+p+i+E+'35L'+zl camper,V3U+i+U+'35ST'+zl
(L'écrivain a campé ce paysage) (L'acteur campe un personnage truculent) (Luc campe son chapeau sur sa tête) (Le roi campe ses troupes dans la plaine) (Luc se campe devant moi) (Luc campe dans le Gard)
Les exemples cités entre parenthèses illustrent les différents emplois représentés dans le lexique-grammaire pour le verbe camper: transitif dans les tables 32A, 32R2, 38LD et 38LH, pronominal dans la table 35L et intransitif dans la table 35ST. Notons que ce dernier emploi est sans passif: il n'admet pas l'auxiliaire être et n'a donc qu'une forme de participe passé (code +U). L'insertion des noms de tables syntaxiques dans le DELAS entrame une augmentation notable du nombre des entrées verbales. Il s'ensuit un accroissement proportionnel du nombre des formes verbales du DELAF-L. Le nombre d'ambiguïtés a lever est augmenté d'autant. Ce niveau de dictionnaire est donc destiné
DICTIONNAIRES ÉLECTRONIQUES DELAF
123
aux seules études linguistiques qui nécessitent le recours aux tables syntaxiques du lexique-grammaire.
Conclusion La présentation en parallèle des dictionnaires électroniques DELAF anglais et français illustre la possibilité de décrire des langues différentes suivant le même formalisme. Á côté des DELAF présentés ici, les DELACF contiennent mots et formes composés. Ces dictionnaires, incorporés au système INTEX élaboré pour l'analyse automatique des textes, permettent d'explorer un grand nombre de docu ments écrits. Ainsi, les études lexicographiques et linguistiques peuvent être fondées sur des attestations précises. Les bases de données que représentent les dictionnaires électroniques constituent des ensembles linguistiques fort utiles pour suivre l'évolution d'une langue. Á l'heure de la mondialisation et de la diffusion croissante de publications sur Internet, le développement de tels dictionnaires est nécessaire non seulement pour Tangíais, langue prééminente dans les textes élec troniques, mais aussi pour les autres langues, notamment celles de la communauté européenne.
Summary This paper is based on the comparison between two electronic dictionaries (DELAF) constructed at LADL for English and French. It first describes the structure of the entries, then the formal features that have been recorded for each of them. It then shows how, in the French and English DELAFs, these codes indicate three levels of complexity of lin guistic information. We finally give a brief description of the linguistic data which are available in each part of the dictionaries.
LEXICON-GRAMMAR, ELECTRONIC DICTIONARIES AND LOCAL GRAMMARS OF ITALIAN EMILIO D'AGOSTINO ANNIBALE ELIA SIMONETTA VIETRI Dipartimento di Scienze della Comunicazione, Università di Salerno
Introduction We present the system of Italian morphological dictionaries (the DELI system), some samples of the classification tables of Lexicon-Grammar and local gram mars which have been developed at the Department of Communication Science of the University of Salerno. We will see how these dictionaries can be employed in order to index a text. Finally, we will examine the construction of local grammars which, interacting with dictionaries, allow precise tagging of sequences of words.
1. The Electronic Dictionaries The DELI system contains several electronic dictionaries of simple words and of compound words. The electronic dictionary of simple words, named DELAS, contains about 100,000 entries to which an alphanumerical code has been assigned. This code refers to the grammatical category of the word and to its inflectional paradigm. What follows is an example of the DELAS dictionary: dottore.N80 cortese.A79 amare. V3 di.PREP lentamente.AW the noun (N) dottore is given above in masculine singular canonic form. The adjective (A) cortese is in the masculine singular canonic form. Verbs (V) are lis ted in the infinitive form, as amare. Those items which do not inflect are assigned a code indicating only the grammatical category, as above shown for the preposition di and the adverb lentamente. The numerical code refers to specific
126
EMILIO D'AGUSTINO, ANNIBALE ELIA & SIMONETTA VIETRI
inflectional algorithms. For example, code 80, associated to nouns, corresponds to the endings: N80 ms fs -e -essa
mp fp -i -esse
thus indicating that all nouns as dottore, i.e. campione, professore, etc., inflect by adding to the root -e for the masculine singular (ms), -essa for the feminine sin gular (fs), 4 for the masculine plural (mp) and -esse for the feminine plural (fp). On the other hand, adjectives encoded A79, as cortese but also tribale, etc., can be described by the following inflectional model: A79 ms fs -e -e
mp -i
fp -i
in which the masculine and feminine singular (ms and fs) on one side, and the masculine and feminine plural (mp and fp) on the other, correspond to the homographic forms cortese and cortesi. The algorithm for verbs is more complicated since it has to refer to 40 forms referring to simple tenses. Therefore, verbs like amare, abbandonare, imparare, etc., are encoded as V3 which corresponds to the following endings and gramma tical values: V3 ind/pr(3o,3i,3a,3iamo,3ate,3ano) imp(3avo,3avi,3ava,3avamo,3avate,3avano) pass r(3ai,3asti,3o,3ammo,3aste,3arono) fut s(3ero,3erai,3era,3eremo,3erete,3eranno) imperat(-,3a,3i,3iamo,3ate,3ino) cong/pr(3i,3i,3i,3iamo,3iate,3ino) imp(3assi,3assi,3asse,3assimo,3aste,3assero) cond/pr(3erei,3eresti,3erebbe,3eremmo,3ereste,3erebbero) part/pr(3ante,3 anti) pass(3ato,3ata,3ati,3ate) ger/pr(3ando) For example, the first line of the list above indicates that in order to form the Indicative Present (ind/pres) of the verb amare, it is necessary to delete the last three characters of the infinitive form of the verb and to add for the first singular person, i for the second singular person, a for the third singular person, iamo for the first plural, ate for the second plural, and finally ano for the third plural. Using DELAS and its inflection codes, a software allows to automatically generate all inflected forms. The result will be the electronic dictionary of inflec-
LEXICON-GRAMMAR OF ITALIAN
127
ted forms of Italian simple words, named DELAF, which has the following struc ture: ama, amare. V3:ïmper2s ama, amare. V3:IndPres3s amai, amare. V3:IndPass1s amammo, amare. V3:IndPass1p amando, amare. V3:Ger amano, amare. V3:IndPres3p amante,amare.V3:PartPres:ms:fs amanti, amare. V3:PartPres:mp:fp amare. V3:Inf
cortese,cortese.A79:fs cortese.A79 :ms cortesi, cortese.A79:fp cortesi, cortese.A79:mp di, di. PREP dottore.N80:ms dottoressa,dottore.N80:fs dottoresse, dottore.N80:fp dottori, dottore.N80:mp lentamente, lentamente. A
The DELAS-DELAF dictionaries contain simple words which are formally defined as sequences of characters between blank spaces or separators. On the other hand, dictionaries of compound words contain those words which are for mally defined as sequences of words, they contain spaces or separators. Com pound words are constrained sequences of words which can have either a meta phorical meaning as cavallo di battaglia, which means "something at which somebody particularly excels, somebody's favourite piece" or a "neutral" or tech nical meaning as carta di credito, in English credit card. Compound words are constrained sequences of words, since the substitution of lexical elements within the sequence with synonyms most of the time produces unacceptable compounds, as the following examples show: {cavallo + *puledro) di battaglia cavallo di (battaglia + combattimento)
(carta + *tessera) di credito carta di (credito + *fido)
Furthermore, it is not possible to change the second occurrence of the noun in the plural form: * cavallo di battaglie * carta di crediti The only morphological variation can be applied to the head of the whole com pound, that is the first noun occurrence: cavalli di battaglia carte di credito The electronic dictionary of compound words, named DELAC, contains about 50,000 Italian entries to which grammatical codes have been assigned. These codes refer to the grammatical category to which the item belongs and to its inter nal structure and morphological behaviour. In the following examples of the DELAC dictionary:
128
EMILIO D'AGOSTINO, ANNIBALE ELIA & SIMONETTA VIETRI
cavallo di battaglia,N+NPN:ms-+ carta di credito,N+NPN:fs-+ pesce spada,N+NN:ms-+ casa madre,N+NN:fs-+ agente speciale,N+NA:ms++ alta carica;N+AN:fs-+ the compound items are followed by a symbol of part of speech (N); the separator "+" is followed by the internal structure of the compound. The first two items are formed by a Noun, a Preposition and a Noun (NPN); the third and fourth items are formed by two nouns (NN), the fifth item is formed by a Noun and an Adjective (NA), while the last item is formed by an Adjective and a Noun (AN). Columns are followed by the gender and number: the examples are either masculine singular (ms) or feminine singular (fs). Finally, two marks indicate above mor phological variations in gender and number. If the variations are accepted, then the mark is "+", if they are not accepted, the mark is "-". The internal structure defines the element of the compound which inflects: compounds which belong to the class NPN inflect the first noun, compounds which belong to the classes NA and AN inflect both elements, while compounds which belong to the NN class can either inflect both nouns, as lingua madre(fs) - lingue madri(fp), or only the first noun, as pesce spada(ms) - pesci spada(mp). Once we codify the morphological behaviour of compound nouns in such a way, a set of computational routines allows to automatically generate the DELACF, that is the electronic dictionaries of inflected forms of Italian compound nouns, which has the following format: agente speciale.N+NA:fs++ agente speciale.N+NA:ms++ agenti speciali, agente speciale.N+NA:fp++ agenti speciali, agente speciale.N+N:p++ alta carica.N+AN:fs-+ alte cariche,alta carica.N+AN:fp-+ carta di credito.N+NPN:fs-+ carte di credito,carta di credito.N+NPN:fp-+ casa madre.N+NN:fs-+ case madri,casa madre. N+NN:fp-+ cavalli di battaglia, cavallo di battaglia.N+NPN:mp-+ cavallo di battaglia.N+NPN:ms-+ pesce spada.N+NN:ms-+ pesci spada,pesce spada.N+NN:mp-+
LEXICON-GRAMMAR OF ITALIAN
129
2* The Lexicon-Grammar We constructed a large classification of the lexicon based on about 200 syntactical and distributional properties. We will show some samples of the tables of the sim ples and compound verbs and frozen sentences with support verb. Intransitive verbs: 1 2 3 4 5 6 7 8 9 10
V N0um V N0V N0VaN1 N0VdiN1 N0VdaN1 N0 Vmvt Loc N1 N 0 VstLocN 1 N0VSimN1 N 0 VPrepN 1
piovere dormire scoppiare sorridere brillare dipendere venire giacere divorziare sostenersi
Transitive verbs: 16 16A 17 18 19 20 201 20um 20L 20R 20RS 20ST 20SP 20NR 21 21A 22 22A 23D 23R 23ND 24 27
N 0 VN 1 plobbl N 0 luogoV N1 N 0 VN 1 PrepN 2 pl obbl N0 V N1pc (di + a) N1c N 0 VN 1 pc(di + a)N 1 c N0 V N1 apparizione N0 V V-n N 0 VN 1 um N 0 VN 1 luogo N0 V N1 ristretto N0 V N1 (a + di) Nlum N 0 VstaticoN 1 N0VN1 N0VN1 N0 V N1 ↔ N0 rendere N1 V-n N0 V N1 ↔ N0 rendere N1 V-a N0VN1N2 N0 V N 1 (da + come) N 2 N0VN1aN2um N 0 VN 1 daN 2 um N0VN1aN2um N0 V N 1 (di + con + da) N 2 N 0 VN 1 daN 2 -um
collezionare assorbire suddividere carezzare cicatrizzare costruire bailare assassinare vahcare risuolare imitare reggere fruttare fotografare colonizzare arricchire eleggere assumere dare ricevere commissionare riempire esentare
130
28 28SC 28ST 29 30 31 31A
EMILIO D'AGUSTINO, ANNIBALE ELIA & SIMONETTA VIETRI
N0 V N1 Loc N2 Destinazione N 0 V N1 Loc N 2 N0 V statico N1 Loc N2 N0 V N 1 Loc N 2 Provenienza N 0 VNi 1 LocN 2 LocN 3 N0VN1SimN2 N0 V N1 Sim N2
introdurre ambientare mantenere togliere gettare confondere negoziare
Completive verbs: 41 42 43 43A 44 44A 45 45A 46 47 47A 48 48A 49 50 51 52 53 54 54A 55 56 57 58
Ch F V N1um Ch F V Prep N1 N 0 V Ch F N 0 V il fatto Ch F N0 a che Fcong N 0 V al fatto Ch F No V (*di)Ch F N 0 V del fatto Ch F No V dal fatto Ch F N0VchFaN2 N 0 V il fatto Ch F a N 2 N0VChFPrepN2 N 0 V i l fatto Ch F Prep N 2 N0 V N 1 a che Fcong N 0 V N1 (*di) Ch F N0 V N1 dal fatto Ch F N0 V a che Fcong Prep N 2 N 0 V (*di) Ch F Prep N 2 N0 V Ch F Prep il fatto Ch F N0 V il fatto Ch F Prep il fatto Ch F Ch F V N 1 Prep N 2 N 0 V ( E + Prep)VinfW N 0 V a Vinf W N0VN1aVinf W
divertire piacere sapere sfruttare tenere credere dubitare giovarsi derivare dire addebitare apprendere Moccare aiutare assicurare difendere giocare parlare capire paragonare costituire dovere andare accompagnare
Transitive compound verbs: C0V CDEF1 CIND1 CZER1 CAN CDN C1PND
C0VW N0VDefC1 N0 V Ind1 N0 V 0 C1 N0 V C1 (a+di) N 2 N0 V C1 di N 2 N 0 VDefCiPrepN 2
Il piatto piange Alzare il gomito Uccidere un uomo morto Bottere cassa Sciogliere la lingua (a+di) N2 Prendere atto di N2 Chiudere gli occhi su N2
LEXICON-GRAMMAR OF ITALIAN
C1PNI C1PNZ C1PC2
N 0 VInd C 1 PrepN 2 N0V0C1PrepN2 N0VC1PrepC2
C1PPN
N 0 V C1 Prep C2 Prep N 2
131
Plantare una grana a N2 Gettare luce su N2 Tagliare la testa al toro Metiere i bastoni tra le ruote a
Intransitive compound verbs: PCI N 0 V Prep C1 1PC2 N 0 V N 1 Prep C2 PC1P2 N 0 V Prep C1 Prep N2 PC1PC2 N 0 V Prep C1 Prep C2 Frozen sentences with the support verb essere: E01 E0P1 EC ECA ECDC EC1PN ECP2 EAPC PECO EVCO ENP2 EPinC EPaC EPdiC EPaltreC EPDetC EPAC EPCA EPCPC
C0 Co N0 N0 N0 N0 N0 N0 N0 N0 N0 N0 N0 N0 N0 N0 N0 N0 N0
essere Agg essere Prep C1 essere C1 essere C1Agg essere (C di C)1 essere C 1 PrepN 2 essere C1 Prep C2 essere Agg Prep C2 essere Agg come C1 essere come C1 essere N1 Prep C2 essere in essere a C essere di C essere prep essere Prep Det essere Prep Agg essere Prep Agg essere Prep Prep
Correre dietro alle donne Metiere N1 nel sacco Saltare in testa a N1 Andare a letto con le galline I nervi di N essere tesi Gli occhi di N sono a mandorla Essere casa e chiesa Essere un fuoco fatuo Essere l 'avvocato del diavolo Essere l 'occhio destro di N2 Essere amici per la pelle Essere povero in canna Essere geloso come una tigre Essere come l 'acqua e il fuoco Essere in erba Essere in auge Essere a dieta Essere di malumore Essere fuori corso Essere al verde Essere di buon appetito Essere in balia delle onde Maria è al passo con i tempi
Frozen sentences with the support verbere: FC N0 fare C1 FCA N0 fare C1 Agg FCDC N0 fare (C di C)1 FCPC2 N0 fare C1 Prep C2 FCPN N0 fare C1 Prep N 2 FVCO No fare come C1
Fare cassetta Fare scena muta Fare le nozze di Pulcinella Fare il bucato in famiglia Fare la bocca a N2 Fare come gli antichi
Frozen sentences with the support verb avere: AC N0 N0
avere C1 avere C1 Agg
Avere fegato Avere torto marcio
132
EMILIO D'AGOSTINO, ANNIBALE ELIA & SIMONETTA VIETRI
ACDC ACPN ACPC ANPC
N0 N0 N0 N0
Avere la coda di paglia Avere occhi solo per N2 Avere l 'acqua alla gola Avere N1 come amico
avere ( di )1 avere C1 Prep N 2 avere C1 Prep C2 avere N1 come C1
3. The Automatic Morpho-lexical Analysis Once dictionaries of simple and compound words are built, it is possible to apply them to texts by means of the programme INTEX of morpho-lexical analysis. This software has been developed by Max Silberztein and allows to load electronic dictionaries of simple and of compound words structured in the way shown above. INTEX applies both dictionaries to a text and builds the dictionary of that text which will contain not only simple words but also all compound nouns present in the text. This step allows to recognize and highlight within a text all compounds: - Ma che cavolo dicono? - chiedo. - Io non so niente. So che quel gran pezzo di fica ha un negozio di video porno, senza l'insegna luminosa. Ma non so nemmeno dov'è. Sono cotto. La devo rivedere assolutamente. Ha delle gambe bellissime, sempre con calze a rete e gonne cortissime. Me lo spiega. E' un negozio di video giochi e programmi per il computer e sotto banco vende articoli pornografici di vario genere, compresi i video porno. Non è sulla piazza della stazione ma in una via laterale, vicino al passaggio a livello dello scalo merci. - Atiento alle sue calze a rete - mi fa - non sei certo il primo che perde la testa per le sue cosce e per i suoi tacchi a spillo e poi si ritrovafregato. and also to build a frequency list for them: 2 2 1 1 1 1
video porno calze a rete articoli pornografici gran pezzo di insegna luminosa passagio a livello
fica
1 1 1 1 1
programmi per il computer scalo merci sotto banco tacchi a spillo video giochi
Such an indexation is extremely reliable for the management of technical and scientific documentation. Technical documents contain a lot of terminology which includes mostly compound nouns. INTEX gives us the possibility of loading more than one dictionary, so, the user can build not only a DELACF for generic com pounds but also specialized dictionaries of compounds belonging to various fields such as Economy, Engineering, Computer Science, and so on. It is then possible to analyze technical texts on the base of such dictionaries. The following text in which compounds have been highlighted is an example drawn from an article of
LEXICON-GRAMMAR OF ITALIAN
133
the Italian economics newspaper il Sole 24 ore (the whole article contains 84 lines: Politica economica, anno zero. E l'assenza di impegni precisi e credibili contro l'inflazione continua a tenere in tensione i mercati. Nei mesi che hanno preceduto la svalutazione della lira e' stato ripetutamente e autorevolmente offermat che la stabilità del cambio rappresentava l'asse portante di tutta la politica economica italiana. La linea di condotta seguita nelle prime settimane dal Governo Amato era sembrata coerente con tale enunciazione: 1 il riconoscimento dell'autonomía della Banca d'Italia; 2 l'affermazione della priorità assoluta dell'obiettivo anti-inflazionistico; 3 il blocco delle contrattazioni salariali nel settore pubblico; 4 Vaccordo di fine luglio con i sindacati. A frequency list which contains terminological compound nouns give us the possibility to immediately understand the specific content of this article. Such an index provides a picture of the content of the text (the index which follows was built on the whole article): 8 5 4 4 3 3 3 3 2
politica economica finanza pubblica politica monetaria crescita monetaria priorità assoluta tassi di interesse Banca centrale asse portante valore reale
2 2 2 2 1 1 1 1
stabilitä del cambio svalutazione della lira manovra di bilancio tasso di inflazione debito pubblico abbassamento dei tassi distribuzione del reddito differenziali di interesse
4. Local Grammars Electronic dictionaries give us the possibility of recognizing within texts words and sequences of words as defined by dictionaries. INTEX allows to recognize combinations of simple and compound words, thanks to the interaction between dictionaries and grammars. INTEX contains a tool which allows to construct local grammars on the model of finite state automata. These grammars can be based not only on words but also on the non-terminal symbols contained in the dictionaries. For example, in order to identify all compound nouns followed by an adjective which agrees in gender and number with them, we construct the following grammar:
134
EMILIO D'AGUSTINO, ANNIBALE ELIA & SIMONETTA VIETRI
If we apply such a grammar to a text, INTEX will highlight all occurrences of this pattern and subsequently construct concordances for that pattern: trovare espressione sia in accresciuti differenziali di interesse reali, sia in un deprezzamen utta la politica economica italiana. La linea di condotta seguita nelle prime settimane dal Gov ppresentava l'asse portante di tutta la politica economica italiana. La linea di condotta segui anti-inflazionistica. Se questa e' la politica economica italiana si sarebbe tentati di dire zione si traducano integralmente in una spinta inflazionistica aggiuntiva. Se la crescita monet apitali); c) massimo contenimento delle spinte inflazionistiche derivanti dalla svalutazione de vi sufficientemente saldi per tollerare tassi di interesse penalizzanti a qualche asta,accompag una scelta realmente impegnativa.2. Il tasso di inflazione programmato e' stato portato dal 3, rzata dalla prospettiva di adesione all'unione monetaria europea) dalla prioritá assoluta dell'
Hence, electronic dictionaries on one side, and the possibility of constructing grammars which interact with dictionaries on the other give us the possibility of automatically analyzing large corpora, considering not only words but also sequences of words.
References D'Agostino E. 1992. Analisi del discorso. Napoli: Loffredo. De Bueriis, G., M. Monteleone. 1997. Lessicografia e dizionari elettronici. Dal dato cartaceo alle basi di dati linguistiche. In Annali dell'Università degli Studi di Basilicata, Potenza. Elia, A. 1984a. Le verbe Italien. Les complétives dans les phrases ä un complé ment. Fasano-Paris: Schena-Nizet. Elia, A. 1984b. Lessico-Grammatica dei verbi a completiva. Napoli: Liguori.
LEXICON-GRAMMAR OF ITALIAN
135
Elia, A. 1995. Per filo e per segno: la struttura degli avverbi composti. In L. D'Agostino (ed.), Tra sintassi e semantica. Descrizioni e metodi di elaborazione automatica della lingua d'uso, Napoli: ESI. Elia, A., M. Martinelli, E. D'Agostino. 1981. Lessico e strutture sintattiche. Napoli: Liguori. Gross, M. 1975. Méthodes en syntaxe, Paris: Hermann. Gross, M. 1982. Une classification des phrases figées du français. In Revue Québécoise de Linguistique, vol. 11, n° 2, Montréal: Presses de l'Université du Québec a Montréal. Gross, M. 1993. Local Grammars and their Representation by Finite Automata. In M. Hoey (ed.), Data, Description, Discourse. Papers on the English language in honour of John McH Sinclair, London: Harpers Collins. Monteleone, M. 1996. Survey and testing of Finite State Methods for the Recogni tion of Agglutinated Sequences in Italian with the Aid of Lexical Information about Possible Combinations of Verbs and Clitics. Gramlex Project - Technical Report R3C1. Silberztein, M. 1993. Dictionnaires électroniques et analyse automatique de textes. Le Système INTEX. Paris: Masson. Silberztein, M. 1997. INTEX 3.4. Reference Manual LADL, Université Paris 7. Vietri, S. 1985. Lessico e sintassi delle espressioni idiomatiche. Napoli: Liguori. Vietri, S. 1990. On some comparative frozen sentences in Italian. Lingvisticce Investigationes 14:1, Amsterdam/Philadelphia: John Benjamins. Vietri, S. 1990a. La sintassi delle frasi idiomatiche. In Studi italiani di linguistica teorica e applicata XIX:1. Vietri, S. 1992. La struttura morfologica elettronica. Rapporto tecnico n° 10 (Ricerca EU 524 - Genelex). Vietri, S. 1994. Il dizionario elettronico Genelex. Rapporto tecnico n° 7 (Ricerca EU 524 - Genelex). Vietri, S. 1995. I risultati del testing e aggiornamento del Dizionario di economía, Rapporto tecnico n° 22 (Ricerca EU 524 - Genelex). Vietri, S. 1996. The syntax of the Italian verb essere Prep. Lingvisticce Inves tigationes XX:2, Amsterdam/Philadelphia: John Benjamins. Vietri S. 2000. Navigare nei testi. Applicazioni in linguistica computazionale. Napoli: Editoriale Scientifica Italiana.
Summary In this paper we will show how Italian electronic dictionaries have been built within the methodological framework of Lexicon-grammar. We will see the structure of electronic dictionaries of simple and compound words, and we will show how to analyse texts employing these linguistic tools within INTEX, a morphological analyser. INTEX con tains a tool which allows to construct local grammars on the model of finite state auto-
136
EMILIO D'AGOSTINO, ANNIBALE ELIA & SIMONETTA VIETRI
mata. These grammars can be based not only on words but also on the non-terminal symbols contained in the dictionaries. Finally, we will show how electronic grammars (built with INTEX) interact with dictionaries and allow recognition of sequences of simple and compound words.
CORÉFÉRENCE ÉVÉNEMENTIELLE ENTRE DEUX PHRASES
1
LAURENCE DANLOS LATTICE, Université de Paris 7
Introduction Les travaux sur les relations temporelles entre deux éventualités e1 ete2examinent exclusivement si une des éventualités précède, incluí ou chevauche l'autre (Moens et Steedman 1988, Asher 1993, Pustejovsky 1995). Toutes ces relations tempo relles supposent quee1≠e2.Nous nous concentrerons sur les cas où e1 = e2, c'esta-dire sur la coréférence événementielle. A l'inverse de la coréférence entre objets, la coréférence entre événements n'a guère été étudiée en détail, excepté pour un groupe (pro)nominal référant a un événement, voir parmi d'autres (Webber 1988, Asher 1993). Néanmoins, il existe bien d'autres cas de coréférence événementielle puisque la description d'un événe ment e peut être de trois types: c'est soit un groupe (pro)nominal, soit une phrase, soit une abstraction qui n'est pas linguistiquement réalisée. Ce dernier cas apparaït quand e est un sous-événement d'un événement complexe. Le nombre de cas potentiels de coréférence événementielle entre deux descriptions successives D1 et D2 du même événement e est donc 32 = 9. Cet article se concentre sur la coréfé rence événementielle pour les cas ou D1 et D2 sont toutes deux des phrases (notées Pf) comme en (1) et (2)2. Nous supposerons qu'une phrase Pi réfère a un événe ment uniquei.3Ceci signifie que nous étudierons les discours P1. P2. tels que P1 1
2
3
Je voudrais remercier Bertrand Gaiffe, qui m'a aidée dans la formalisation des données en SDRT et Michel Cosse, pour ses commentaires fructueux. Dans Danlos (2001), nous avons étudié la coréférence événementielle quand Di est une phrase et que Dj (i ≠ j) n'est pas réalisée syntaxiquement. Plus précisément, le cas ou Dj est la description abstraite du sous-événement causal de l'événement complexe décrit par un verbe causatif et P¡ la phrase décrivant la cause (voir (i) et (ii)): (i) Fred a fêlé la carafe. Il Va heurtée contre Vévier (ii) Fred a heurté la carafe contre l'évier. Il l'afêlée Ceci est une simplification. En effet, une phrase avec un argument pluriel peut référer a plusieurs événements. Par exemple, la première phrase dans (i), avec l'argument pluriel deux vêtements: (i) Fred a abîmé deux vêtements. Il a taché une chemise lundi. Il a déchiré une cravate mardi réfere en fait à deux événements qui sont décrits dans les deuxième et troisième phrases. Dans cet
LAURENCE DANLOS
138
et P2 réfèrent au même événement unique e: (1) (2)
Fred a soigné un arbre. Il a élagué un cèdre Fred a élagué un cèdre. Il a donc soigné un arbre
L'étude de la coréférence événementielle demande la définition de deux types de relation de coréférence selon la quantité d'information transmise: Deux descriptions successives D1 et D2 de la même entité x (événement ou objet) sont dans une relation de particularisation notée D 2 = PART(D1) ssi D 2 apporte au moins une information nouvelle sur x par rapport a l'information connue de D1. Deux descriptions successives D1 et D 2 de la même entité x (événement ou objet) sont dans une relation de généralisation notée D2 = GEN(D1) ssi D 2 n'apporte aucune nouvelle information sur x. Illustrons ces deux types de coréférence sur le cas bien connu ou x est un objet. D1 et D 2 sont alors des groupes (pro)nominaux. Dans (), le GN démonstratif cette New-Yorkaise = PART (une actrice). Dans (3b), le pronom elle = GEN(une actrice) et dans (3 c) le GN défini ou démonstratif la / cette artiste = GEN(une actrice) puisque artiste est un hyperonyme de actrice. (3)
a. Fred a pris un verre ave une actrice. Cette New-Yorkaise irrite Marie b. Fred a pris un verre avec une actrice. Elle irrite Marie c. Fred a pris un verre avec une actrice. La/Cette artiste irrite Marie
Dans les sections suivantes, nous montrerons que la relation de coréférence événementielle est du type particularisation dans (1), du type généralisation dans (2). Nous présenterons une étude linguistique de ces discours et formaliserons les données dans le cadre de la SDRT (Asher 1993). Notation: Le Symbole Xf avec i = 1 ou 2 dénote le prédicat ou un argument ou un modifieur dans P¡ avec le role r ; pour un argument, r = agent, patient... ; pour un modifieur, r = temps, lieu,...; pour le prédicat, r est non pertinent.
1. Discours particularisants et généralisants 1.1. Discours particularisants Une relation de coréférence événementielle de type particularisation s'observe dans des "discours particularisants" (dorénavant DP) comme (1) ou (4): article, les arguments pluriels seront laissés de coté.
CORÉFÉRENCE ÉVÉNEMENTIELLE ENTRE DEUX PHRASES
(4)
139
Fred a sali un vêtement. Il a taché une chemise
Dans (4), le même événement est décrit dans les deux phrases, avec plus d'information dans P2. P2 particularise P1 parce que son prédicat est un hyponyme du prédicat de P1 (tacher < salir) et que son objet (indéfini) est un hyponyme de l'objet (indéfini) de P1 (chemise < vêtement) (le sujet de P2 est une anaphore (pronominale) du sujet de P1)4. Le discours (4) (quand il est compris comme un discours complet) peut seulement être interprété comme un DP avec une relation de coréférence événementielle de type particularisation. En effet, si deux événements étaient impliqués, cela serait explicitement indiqué soit par un connecteur soit par deux adjoints différents: dans (5a), ensuite implique e\ < e2 ; dans (5b), aussi implique e1 ≠ e2 ; dans (5c), les deux adjoints hier et aujourd'hui impliquent e1 < e2. Nous dirons que les discours comme (5) incluent "un marqueur de non coréférentialité". (5)
a. Fred a sali un vêtement. Ensuite, il a taché une chemise b. Fred a sali un vêtement. Il a aussi taché une chemise c. Fred a sali un vêtement hier. II a taché une chemise aujourd'hui
Néanmoins I'interpretation de particularisation de (4) peut être explicitement mar quée, comme dans (6) avec le connecteur plus précisément (qui peut être appelé "un marqueur de coréférentialité"). (6)
Fred a sali un vêtement. Plus précisément, il a taché une chemise
Notons cependant qu'une troisième phrase prolongeant (4) peut changer l'interpre tation des deux premières phrases. Dans (7), avec aussi dans , aussi est sousentendu dans P2, donc P1 et P2 ne réfèrent pas au même événement. Dans le reste de cet article, seuls les discours de deux phrases considérés comme des discours complets seront étudiés. (7)
Fred a sali un vêtement. Il a taché une chemise. Il a aussi déchiré une cravate
Le DP dans (4) donne lieu a un phénomène inhabituel: les deux GN indéfinis un vêtement et une chemise sont coréférents. Ceci est inhabituel puisqu'il est généralement admis (Kamp et Reyle 1993, Corblin 1995) qu'un GN indéfini a une lecture existentielle (c'est-á-dire introduit un nouveau référent de discours) et donc que deux GN indéfinis ne sont pas coréférents5. C'est le cas en (8) dans lequel deux 4 5
Les deux phrases de (4) sont au même temps, ce qui est exigé pour la coréférence événementielle. Il existe quelques cas ù deux GN indéfinis sont coréférents, voir (i) et (ii) emprunté á Corblin (1994): (i) Un komme est arrivé.C'était un New-Yorkais (ii) Un komme, un New-Yorkais, est arrivé
140
LAURENCE DANLOS
vêtements sont en jeu, tandis qu'un seul vêtement est en jeu en (4). Nous verrons dans la Section 5 comment calculer la coréférence de deux GN indéfinis dans les DP: (8)
Fred a sali un vêtement. Joe a taché une chemise
Un discours comme (4), dans lequel au moins un élément de P2 spécifie un élément correspondant dans P1, est appelé "un DP par spécification". On observe un autre type de DP dans (9) où le modifieur pendant le dîner de P2 fournit une information temporelle sur e (les autres éléments X2r de P2 anaphorisent ou ré pètent les éléments correspondants X1r de P1). (9)
Fred a taché une chemise. II Va tachée pendant le dîner
Un discours comme (9) dans lequel au moins un élément X2r de P2 n'a aucun element correspondant X1r dans P1 est appelé "un DP par adjonction". Spécifi cation et adjonction peuvent être combinées: dans le DP (10), chemise spécifie vêtement et l'adjoint de temps dans P2 n'a aucun élément correspondant dans P1: (10)
Fred a taché un vêtement. Il a taché une chemise pendant le diner
À première vue, on obtient donc un DP basé sur des connaissances lexicales quand chaque élément X2r de P2 est un hyponyme, une anaphore ou une répétition d'un élément correspondant X1r de P1 ou bien n'a aucun élément correspondant X1r dans P1.
Des exemples plus naturels de DP sont observés quand entre en jeu de la connaissance extralinguistique (11). Ces DP sont basés sur une notion d'hyperonymie étendue, à savoir X complimenter Y > X dire à qu'Y être joli dans (1 la) et X être bilingue > X parier deux langues dans (11b). Ces relations d'hyperonymie étendue reposent sur des connaissances culturelles ou encyclopédiques. Cependant, comme notre étude n'est pas une étude de sémantique lexicale, nous n'utiliserons que des exemples artificiels de DP basés uniquement sur des connaissances lexicales, évitant ainsi le bruit qui serait introduit par des discussions sur la notion d'hyperonymie étendue: (11) a. Fred a complimenté Sue. Il lui a dit qu'elle est jolie b. Fred est bilingue. Il parle français et chinois Notre étude linguistique n'est donc pas basée sur un corpus. Néanmoins il est facile de trouver des exemples réels de DP, tels que les exemples de (12) extraits du journal Le Monde (27/11/01):
Cependant, les exemples présentés ici avec deux GN indéfinis coréférents n'ont pas été décrits dans la littérature à notre connaissance.
CORÉFÉRENCE ÉVÉNEMENTIELLE ENTRE DEUX PHRASES
141
(12) a. Bill Clinton est, depuis le début de Vannée, un homme privé. Il est un simple citoyen américain qui a élu domicile ä New York (...) b. X s'est rendu en visite offlcielle au pays Y.Ila visité ce pays, supposé être la plaque tournante de z, pour (...) Pour récapituler, en compréhension de texte, il doit être calculé qu'il y a un seul vêtement et un seul événement décrit dans (4)6. En génération de textes, il doit être déterminé dans quelles conditions un discours comme (4) peut être énoncé et quelles formes linguistiques doivent être produites (Roussarie 2000). 1.2. Discours généralisants Une relation de coréférence événementielle de type généralisation s'observe dans des "discours généralisants" (dorénavant DG) comme (13): (13) a. Fred a taché une chemise. Il a donc sali un vêtement b. Fred a assassiné Sue. Il a donc commis un crime Alors qu'un DP se situe principalement au niveau informationnel, un DG se situe principalement au niveau intentionnel: la première phrase dans (13a) ou (13b) décrit ce que le locuteur veut que l'interlocuteur sache d'un événement e, la deuxième étant une reformulation de e. Par définition, une reformulation ne peut pas apporter d'information nouvelle, mais elle peut présenter un événement sous un jour nouveau, par exemple, si le locuteur a l'intention de forger des liens avec d'autres données (14): (14)
Fred a assassiné Sue. Il a donc commis un crime pour lequel il sera jugé aux assises
(13a) est obtenu a partir de (4) en inversant l'ordre des phrases (et les relations anaphoriques) et en introduisant un connecteur comme donc avec une valeur épistémique (Rossari et Jayez 1996). P2 generalise P1 parce que salir et vêtement sont respectivement des hyperonymes des éléments correspondants de P1. Dans (13b), P2 généralise P1 parce que le prédicat complexe commettre un crime est un hyperonyme de assassiner. À première vue, on obtient donc un DG basé sur des connaissances lexicales quand chaque element X2r de P2 est un hyperonyme, une anaphore ou une répéti tion d'un élément correspondant X 1 r de P1. Comme pour les DP, des exemples plus naturels de DG sont observés quand la notion d'hyperonymie étendue est en jeu, (15). Cependant, nous n'utiliserons que des DG basés sur des connaissances purement lexicales: 6
Voir aussi Humphreys et alii pour la coréférence événementielle dans un système d'extraction d'informations.
142
LAURENCE DANLOS
(15) a. Fred a dit ä Marie qu'elle est jolie. Il l'a donc complimentée b. Fred a la grippe. Il est donc malade 1.3. Discours P1. P2 ave une coréférence événementielle Dans le reste de cet article, tout discours qui n'implique pas de relation de coréférence événementielle sera marqué avec le signe #, qu'il soit incohérent (ininterprétable) ou qu'il ait une interprétation sans coréférence événementielle. Dans les DP et DG, chaque élément X2r de P2 qui a un élement correspondant X1r de P1 est dans une relation lexico-sémantique (hyponymie, hyperonymie, anaphore, identité ou synonymie7) avec cet élément. Ce sont les deux seuls types de discours P1. P2. dans lesquels les deux phrases référent au même événement. - En premier lieu, si un (ou plusieurs) élément(s) de P2 avec un élément corres pondant dans P1 n'est pas dans une relation lexico-sémantique avec cet élément, les deux phrases ne peuvent pas référer au même événement: c'est le cas pour (16a) avec les deux prédicats tacher et déchirer, pour (16b) avec les deux objets une chemise et une cravate et pour (16c) avec les deux adjoints de temps hier et aujourd'hui. (16) a. # Fred a taché une chemise. Il Va déchirée b. # Fred a taché une chemise. Il a taché une cravate c. # Fred a embrassé Sue hier. Il Va embrassée aujourd'hui - Deuxièmement, si chaque élément de P2 est dans une relation lexico-sémantique avec un élément correspondant de P1, mais si un élément est dans la relation hyponymique tandis qu'un autre est dans la relation hyperonymique, les deux phrases ne peuvent pas référer au même événement. Dans (17a) ou (17b), dans lesquels le prédicat de P2 est un hyponyme du prédicat de P1, tacher < salir, tandis que l'objet (indéfini) de P2 est un hyperonyme de l'objet (indéfini) de P 1 , vêtement > chemise, aucune coréférence événementielle n'est en jeu. Cependant, nous verrons dans la Section 4.2 que certains DP incluent et des hyperonymes et des hyponymes dans (17) a. # Fred a sali une chemise. Il a taché un vêtement b. # Fred a sali une chemise. Il a donc taché un vëtement - Finalement, les deux phrases ne doivent pas apporter la même quantité d'infor7
Les exemples de DP et de DG qui impliquent une relation de synonymie ne seront pas illustrés dans cet article. Le lecteur vérifiera que nos conclusions restent valables pour ces exemples, même avec les paires converses de synonymes (recevoir et donner) (i) et (ii): (i) Marie reçuun cadeau de Fred.Illui a donné un collier (ii) Fred a donné un collier ä Marie. Elle a donc reçu un cadeau de lui
CORÉFÉRENCE ÉVÉNEMENTIELLE ENTRE DEUX PHRASES
143
mation ou le même point de vue sur l'information transmise. La répétition pure et simple dans P2 de l'information transmise dans P1 donne lieu a un discours inco hérent, (18a) ou (18b). Deux directions sont donc disponibles: ou bien apporter de l'information nouvelle, ce qui est le role des DP, ou bien présenter l'information en des termes plus généraux afin de forger des l'ens avec d'autres données, ce qui est le rôle des DG. (18) a. # Fred a taché une chemise. Il Va tachée b. # Fred a taché une chemise. Il Va donc tachée 1.4. Hypothèse A partir de ces observations, l'hypothèse suivante peut être avancée: une relation de coréférence événementielle s'observe dans un discours P1. P2. seulement si: - chaque élément dans P2 est un hyponyme, une anaphore ou la répétition d'un élément correspondant dans P1 (s'il existe) (une relation de particularisation est alors en jeu), - ou si chaque élément dans P2 (comportant un connecteur comme donc) est un hyperonyme, une anaphore ou la répétition d'un élément correspondant dans P1 (une relation de généralisation est alors en jeu). On peut traduire cette hypothèse en termes "d'implication": - dans un DP, P2 "implique" P1: d'une façon informelle, tacher une chemise implique salir un vêtement, donc Fred a taché une chemise implique Fred a sali un vêtement dans (4); - dans un DG, P1 "implique" P2: d'une façon informelle, dans (13a) Fred a taché une chemise implique Fred a sali un vêtement. Dans la section suivante, nous allons présenter, dans le cadre de la DRT (Kamp et Reyle 1993), une définition formelle de cette notion "d'implication" entre deux DRS. Dans la Section 3, nous montrerons que les conditions pour observer un DG composé de deux phrases sont basées sur une relation d'implication entre les DRS associés aux deux phrases. Par contre, nous verrons dans la Section 4 que la ques tion est plus complexe pour les DP.
2. Implication entre deux DRS En termes logiques, une relation d'hyponymie entre noms comme cèdre < arbre se traduit en: Vx cèdre(x) arbre(x)
LAURENCE DANLOS
144
Donc, ¡'implication suivante est valable: x cèdre(x) y arbre(y) De la même façon, une relation d'hyponymie entre verbes comme élaguer < soigner donne: u,vex
élaguer (ex,u,v) e2 soigner(e2,u,v)
et une relation d'hyponymie (étendue) entre adverbiaux comme ce matin < aujourd'hui (ce matin = aujourd'hui dans la matinée) donne: e1 ce - matin(e1) aujourd'hui(e1) Nous employons aussi l'implication suivante qui est toujours vraie: x P(X) ^ Q(X) P(x) Par exemple: e1 élaguer(e1,f, x) ^ amoureusement(e1) ex élaguer(e1, f, x) Finalement, pour traiter les anaphores, nous employons des schémas d'implication comme: x Fred(x) y humain(y) ^ mâle(y) A partir de ces implications logiques, nous pouvons definir une relation d'impli cation entre deux DRS, notée , quand les prédicats lexicaux dans les conditions des DRS sont dans des relations d'hyponymie. Sans entrer dans les détails formeis, cette relation d'implication est illustrée dans l'exemple suivant dans lequel k\ correspond a Fred a amoureusement élagué un cèdre ce matin et k'1 Ila soigné un arbre aujourd'hui.
Notons que les conditions comme = ? dansK'1sont ignorées. Evidemment, deux DRS qui diffèrent seulement par les noms de leurs variables liées sont considérés comme identiques (cette relation d'identité est notée ).
CORÉFÉRENCE ÉVÉNEMENTIELLE ENTRE DEUX PHRASES
145
3. Conditions pour observer un DG Nous allons montrer que les conditions pour observer un DG composé de deux phrases sont les suivantes (cet ensemble de conditions est noté CGD): Un discours composé de deux phrases est un DG ssi (i) P 2 inclut éventuellement un connecteur épistémique comme donc8 et (ii) les DRS k1 et k2 associées respectivement á P1 et P2 sont telles que k1 →k1' avec k1' k2 ( et¬k1 = k2 ). CGD est évidemment respecté dans un exemple de base de DG, (2) répété en (19). (19)
Fred a élagué un cèdre. Il a donc soigné un arbre
La condition—k1 = k2 est nécessaire pour exclure des exemples tels que (18b) ou (20), dans lesquels P2 répète l'information transmise dans P1. Pour de tels cas, (20) # Fred a élagué un cèdre. Il l'a done élagué Dans des exemples comme (17b) et (21), qui ne sont pas des DG, CGD n'est pas respecté parce que le verbe de P2 est un hyponyme du verbe de P1 (élaguer < soigner). (21) # Fred a soigné un cèdre. Il a donc élagué un arbre Considérons maintenant l'adjonction de modifieurs. Dans (19), il est possible d'insérer n'importe quel modifieur dans P1 tout en maintenant l'nterpretation de généralisation. (22a) avec hier dans P1 est un DG. k1, la DRS pour la première phrase de (22a), inclut la condition hier(e1) qui n'a pas d'équivalent dans k2Donc, CGD est respecté dans (22a)9. De la même façon, (22b) avec un modifieur évaluatif dans P1 (amoureusement) et aucun modifieur dans P2 est aussi un DG pour lequel CGD est respecté. (22) a. Fred a élagué un cèdre hier. Il a done soigné un arbre b. Fred a amoureusement élagué un cèdre. Il a donc soigné un arbre Il n'est possible d'insérer un adjoint dans P2 que s'il généralise un adjoint dans P1. (23a), avec ce matin dans P1 et aujourdfhui dans P2, est un DG. Comme ce matin peut être vu comme un hyponyme de aujourd'hui, CGD est respecté dans (23a). Par contre, (23b) avec hier dans P2 et aucun adjoint de temps dans P1 n'est pas un DG 8
9
La présence de donc n'est pas obligatoire: (i), emprunté à Corblin (1995), présente une relation de coréférence événementielle de type généralisation: (i) Fred a consulté le docteur Larsen. Il a consulté un docteur parce qu'il se sentait fatigué Dans k2, La condition e2< n pourrait être réécrite PASSÉ(e2). Il suffit alors de considérer hier comme un hyponyme de PASSÉ pour voir que CGD est respecté dans (22a).
146
LAURENCE DANLOS
et CGD n'est pas respecté dans (23b). (23) a.
Fred a élagué un cèdre ce matin. Il a donc soigné un arbre aujourd'hui b. # Fred a élagué un cèdre. Il a donc soigné un arbre hier
Le lecteur vérifiera que les DG basés sur des relations d'hyponymie étendue, (15), sont tels que CGD est respecté.
4. Conditions pour observer un DP Nous allons d'abord examiner les DP avec un DG correspondant, c'est-a-dire les DP tels qu'un DG peut être créé en inversant l'ordre des phrases et les relations anaphoriques (et en introduisant éventuellement un connecteur comme donc). Les conditions pour observer de tels DP, à savoir CPD, sont symétriques de CGD et sont donc basées sur la notion d'implications entre les DRS représentant les deux phrases. Ensuite, nous examinerons les DP sans DG correspondant, pour lesquels il n'y a pas d'implication entre les DRS des deux phrases. 4.1. DP avec un DG correspondant Les conditions pour observer un DP avec un DG correspondant sont les suivantes (cet ensemble de conditions est noté CPD): Un discours composé de deux phrases est un DP ssi (i) P2 n'inclut aucun marqueur de non coréférentialité (voir Section 1.1) mais incluí éventuellement un marqueur de coréférentialité et (ii) les DRS k1 et k2 associées respectivement a P1 et P 2 sont telles que k2 → k2' avec k'2 = k1 (et—k1= k2). Les exemples de (24) sont tous des DP avec un DG correspondant, respectivement (19), (22a), (22b) et (23a). CPD est respecté pour ces discours comme CGD est respecté pour le DG correspondant. (24) a. b. c. d.
Fred a soigné un arbre. Il a élagué un cèdre Fred a soigné un arbre. Il a élagué un cèdre hier Fred a soigné un arbre. Il a amoureusement élagué un cèdre Fred a soigné un arbre aujourd'hui. Il a élagué un cèdre ce matin
4.2. DP sans DG correspondant Le premier type d'exemples de DP sans DG correspondant est illustré dans (25a): (25a) est un DP (les deux phrases réfèrent au même événement avec plus d'information dans P2), tandis que le discours obtenu en inversant l'ordre des phrases et
CORÉFÉRENCE ÉVÉNEMENTIELLE ENTRE DEUX PHRASES
147
les relations anaphoriques, à savoir (23b) répété dans (25b), n'est pas un DG. CPD n'est pas respecté dans (25a) de la même manière que CGD n'est pas respecté dans (25b): (25) a. Fred a soigné un arbre hier. Il a élagué un cèdre b. # Fred a élagué un cèdre. Il a donc soigné un arbre hier P1 dans (25a) inclut un adjoint de temps (hier) qui n'est pas répété dans P2, bien qu'il soit compris que l'événement d'élagage a eu lieu hier et que c'est le même événement que celui de soigner. Cela signifie que la deuxième phrase d'un DP doit apporter au moins une information nouvelle, mais ne doit pas nécessairement répéter toute l'information transmise dans la première phrase. Par contre, la deu xième phrase d'un DG ne peut apporter aucune information nouvelle. Le deuxième type d'exemples de DP sans DG correspondant est illustré dans (26a): (26a) est un DP bien que le verbe de P2 soit un hyperonyme du verbe de P1. Il n'a aucun DG correspondant - (26b) n'est pas un DG - et CPD n'est pas res pecté. (26a) est paraphrasé par (26c) avec la forme anaphorique faire cela: (26) a. Fred a élagué un cèdre. Il Va soigné (s'en est occupé) aujourd'hui b. # Fred a soigné (s'est occupé d') un cèdre aujourd'hui. Il l' donc élagué c. Fred a élagué un cèdre. Il a fait cela aujourd'hui Dans (26a) ou (26c), la nouvelle information dans P2 vient de l'adverbe aujour d'hui qui ne peut pas être omis: les discours (27) sans un tel adverbe sont inacceptables: (27) a. # Fred a élagué un cèdre. Il l'a soigné b. # Fred a élagué un cèdre. Il l'a fait Dans (26a), les arguments de P2 sont des anaphores des arguments correspondants de P1. Considérons les exemples (28) qui sont identiques ä (26a) sauf qu'un argu ment (le patient) n'est pas une anaphore du patient dans P1: Axg2Patient est respectivement une répétition, un hyperonyme et un hyponyme d'Arg1Patient dans (28a), (28b) et (28c). Ces exemples ne sont pas clairement interprétés avec une relation de coréférence événementielle, bien que cette interprétation ne soit pas exclue (avec une prosodie spécifique, par exemple accent sur aujourd'hui dans (28a) et (28b), sur cèdre dans (28c)), d'ou le signe ? les précédant. L'interprétation coréférentielle est plus facilement accessible avec le marqueur de coréférentialité plus précisément (28d): (28) a. ? Fred a élagué un cèdre. Il a soigné un cèdre aujourd'hui b. ? Fred a élagué un cèdre. Il a soigné un arbre aujourd'hui ? Fred a élagué un arbre. Il a soigné un cèdre (aujourd'hui) d. Fred a élagué un arbre. Plus précisément, il a soigné un cèdre
148
LAURENCE DANLOS
Etant donné ces exemples de DP sans DG correspondant, on pourrait penser que la condition pour observer un DP se réduise á ce que chaque élément X2r de P2 soit dans une relation lexico-sémantique avec l'élément correspondant X1r de P1 (s'il existe), quelle que soit cette relation (hyperonymie aussi bien qu'hyponymie, anaphore, identité ou synonymie). Une telle condition peut être intuitivement formulée en termes "d'unification" entre les deux DRS associées. Par exemple, dans (28c), l'unification des DRS des deux phrases est possible et débouche sur la DRS correspondant ä Fred a élagué un cèdre rassemblant les hyponymes de l'une ou l'autre phrase. Une condition basée sur l'unification suppose que l'ordre des phrases n'est pas pertinent si tant est que P2 apporte au moins une information nouvelle comparée a l'information transmise dans P1. Et de fait, il existe des exemples de DP dans lesquels l'ordre des phrases peut être inversé: (29a) et (29b), qui diffèrent uniquement par l'ordre des phrases (et des relations anaphoriques), sont tous les deux des DP tout a fait naturels avec marcher < aller. (29a) est un DP dans lequel P2 apporte l'information que Fred a marché jusqu'a la gare et que cette marche a pris une heure. (29b) est un DP dans lequel P2 apporte l'information que la marche de Fred mené a la gare:10 (29) a. Fred est allé ä la gare. Il a marché pendant une heure b. Fred a marché pendant une heure. Il est allé ä la gare Néanmoins, une condition basée sur l'unification pour observer un DP n'est pas adéquate: (17a) ou (30a), dans lequel Pred2 est un hyponyme de Predi ( élaguer < soigner), tandis qu'Axg2Pattent est un hyperonyme d'Aig1Patient (arbre > cèdre), n'est définitivement pas un DP: il ne peut être compris comme mettant en jeu un unique événement (et un unique arbre). L'insertion d'un marqueur de coréférentialité n'aide pas: (30b) avec plus précisément est incohérent. Or, dans (30a), l'unification des DRS des deux phrases est possible et débouche sur la DRS associée à Fred a élagué un cèdre (aujourd'hui), comme c'est le cas pour (28c). Le contraste entre (28c) et (30a) demande a être expliqué. (30) a. # Fred a soigné un cèdre. Il a élagué un arbre (aujourd'hui) b. # Fred a soigné un cèdre. Plus précisément, il a élagué un arbre Pour conclure, CPD est limité aux DP avec un DG correspondant. Il existe d'autres DP sans DG correspondant pour lesquels CPD n'est pas respecté. Dans ces DP, P2 peut inclure un hyperonyme d'un élément correspondant de P1. Cependant, la pré sence d'hyperonymes dans P2 est contrainte. Par conséquent, une condition basée sur Funification est trop faible. Il doit au moins être postulé qu'un argument indé10
Dans (29), l'événement de marche et l'événement "(Taller" sont compris comme coréférents bien que le premier soit atélique tandis que le second est télique. L'unification des deux phrases en une seule phrase donne Fred a marché ä la gare en une heure qui est télique avec l'adjoint en une heure (et non pendant une heure).
CORÉFÉRENCE ÉVÉNEMENTIELLE ENTRE DEUX PHRASES
149
fini dans P2 ne peut pas être un hyperonyme de l'argument correspondant dans P1 quand Pred2 est un hyponyme de Predi (afin d'exclure (30)). En tout cas, il est clair que les conditions pour observer un DP sont basées sur des connaissances linguistiques. Nous notons rt cet ensemble de conditions. Avant de conclure cette section sur les DP, une remarque sur la notion "de nouvelle information" à propos des GN démonstratifs. 4.3. GN démonstratifs dans les DP Dans tous les exemples que nous avons présentés jusqu'ici, Arg2Patient (si présent) était une anaphore pronominale d'Arg1Patient ou un GN indéfini (comme dans (31a)). Nous allons maintenant examiner les cas ou Arg2Patient est un GN défini, (31b), ou un GN démonstratif, (31c). (31b) est un DP acceptable seulement dans un contexte ou il existe un unique cèdre. (31c) est un DP acceptable seulement dans une utilisation déictique du GN. Dans une utilisation non déictique, (31c) n'est pas un DP et est incohérent. Dorénavant, l'utilisation déictique des GN démonstratifs est mise de coté, seule l'utilisation anaphorique est considérée. (31) a. Fred a élagué un arbre. Il a élagué un cèdre b. Fred a élagué un arbre. Il a élagué le cèdre # Fred a élagué un arbre. Il a élagué ce cèdre Les discours (32), ou Arg2Patient est un GN démonstratif, sont tous des DP acceptables dans lesquels la nouvelle information dans P2 vient de hier. (32) a. b.
Fred a élagué un cèdre. Il a élagué cet arbre hier Fred a élagué un arbre. Il a élagué cet arbre, qui est très vieux, hier Fred a élagué un arbre. Il a élagué ce cèdre hier
La coréférence entre les deux patients est de type généralisation dans (32a) puisque arbre est un hyperonyme de cèdre (cet arbre = GEN(un cèdre)). Par contre, elle est de type particularisation dans (32b) et dans (32c). Dans (32b), la relative explicative apporte une information nouvelle (cet arbre, qui est très vieux, = PART(un cèdre)). Dans (32c), le nom principal d'Arg2Patient étant un hyponyme du nom principal de Arg1Patient apporte une information nouvelle (ce cèdre = PART(un arbre)).11 Mais quel que soit le type de coréférence entre les deux patients (généralisation ou particularisation), la présence de hier est obligatoire dans tous les exemples de (32) (voir le contraste entre (32c) et (31c)). Cela revient a dire que même quand un GN démonstratif anaphorique apporte une information 11
(32c) exige une accomodation (Van Der Sandt 1992): quand P2 est énoncé, l'interlocuteur apprend soudain que l'arbre impliqué dans P¡ est en fait un cèdre. Cet exemple n'est pas très heureux et doit être évité dans un système de génération de texte (Roussarie 2000). Cependant, nous le considérerons comme acceptable ici.
LAURENCE DANLOS
150
nouvelle sur l'entité à laquelle il réfère, il n'apporte pasd'informationnouvelle sur l'événement en jeu. Cette situation contraste avec celle observée pour les GN indéfinis: dans (31a), un cèdre apporte une information nouvelle sur l'arbre concerné et cette information est considérée comme nouvelle par rapport a l'événement d'élagage. De même pour les GN définis, (31b). En résumé, une distinction doit être faite entre information nouvelle sur une entité x en soi et information nouvelle sur une entité x en tant que participant à une éventualité.
5. Relations de Discours Il est probable que tout chercheur travaillant sur les relations de discours poserait que la relation de discours entre les deux phrases d'un DP est Élaboration. Cependant, nous allons montrer qu'il est nécessaire de postuler l'existenee d'une nouvelle relation de discours, appelée "Particularisation", qui implique une rela tion de coréférence événementielle. Auparavant, une remarque terminologique: "particularisation" (abrégé en PART) désigne un type de coréférence défini dans l'Introduction; "Particularisation" (avec une majuscule) désigne une relation de discours entre deux phrases. Ces deux notions sont liées en SDRT (Asher 1993) de la façon suivante ou πi est l'étiquette pour le DRS kireprésentant la phrase Pi: k2 = PART (k1) Particularisation(π1, π2) La relation de discours Élaboration est définie de façons diverses (Hobbs 1979, Mann et Thompson 1988, Asher et Lascarides 1995), mais quelle que soit sa défi nition, cette relation de discours n'implique pas de coréférence événementielle. Illustrons ce point avec un exemple "classique" d'Élaboration, (33a) ou sa version plus courte, (33b). La première phrase dénote un événement e1 qui est "élaboré" dans la (les) phrase(s) suivantes qui apporte(nt) une information nouvelle sur une ou plusieurs phases (sous-événements) de e1. Aucune coréférence événementielle n'est en jeu: un voyage en avion ne se réduit pas a un décollage et un atterrissage et encore moins a un simple décollage. Il existe beaucoup d'autres phases du voyage qui ne sont décrites ni dans (33a) ni dans (33b): (33) a. Nicholas est allé en avion d'Austin a Paris. Il a décollé 6h. Il atterri ä 14h b. Nicholas est allé en avion d'Austin ä Paris. Il a décollé ä 6h Il est toutefois nécessaire de postuler l'existence d'une relation de discours (Parti cularisation) qui implique une relation de coréférence événementielle. Dans le cadre de la SDRT, la conséquence indéfaisable de Particularisation se traduit de la façon suivante: Particularisation(π1 π2) → Main- event(π1) = Main - event(π2)
CORÉFÉRENCE ÉVÉNEMENTIELLE ENTRE DEUX PHRASES
151
En effet, seule une telle relation de discours permet de préserver les connaissances bien établies sur les référents de discours. L'argumentation est la suivante: les exemples comme (1) ou (4) sont des contre-exemples productifs au principe de la lecture existentielle d'un GN indéfini (qui entraîne que deux GN indéfinis ne sont pas coréférents). D'ou deux solutions vis-á-vis de ce principe. - Au vu de ces contre-exemples productifs, ce principe est abandonné et une lecture anaphorique des GN indéfinis est mise en place pour permettre la coréférence de deux GN indéfinis. Cette solution ne semble pas appropriée puisque ce principe est toujours vrai sauf dans les DP (et les DG et les quelques exceptions bien connues mentionnées dans la note 5). - Ce principe n'est pas abandonné. Les deux GN indéfinis de (1) reçoivent une lecture existentielle: deux référents de discours x et y avec des conditions complètes arbre(x) et cèdre(y)sont introduits. La relation de coréférence x = est établie grace a la relation de discours Particularisation. Cette relation de discours implique une relation de coréférence événementielle qui implique a son tour que les arguments avec le même role thématique sont coréférents. Autrement dit, c'est parce que Particularisation est établie entre les deux phrases de (1) que Ton sait que les deux phrases référent au même événement et que donc les deux patients un arbre et un cèdre sont coréférents, c'est-à-dire x=y. Cette seconde solution semble nettement plus adéquate. Elle soulève immédiatement la question suivante: comment établir que la relation de discours dans (l) est Particularisation (ce qui revient à établir que (1) est un DP) ? La réponse a cette question repose sur des connaissances linguistiques: les deux phrases d'un DP respectent des contraintes linguistiques fortes qui ont été décrites dans la Section 4. Cet ensemble de contraintes, noté Cpart, permet de calculer que la relation de discours est Particularisation. En SDRT, la règle est la suivante (où > est le symbole pour l'implication par défaut): (τ, π1 π2,) ^ Cpart > Particularisation (π1, π2) En résumé, il est nécessaire de postuler l'existence d'une nouvelle relation de dis cours, Particularisation, qui implique une relation de coréférence événementielle entre l'événement e1 décrit dans la première phrase et l'événement e2 décrit dans la seconde. Cette relation de discours diffère d'Élaboration pour laquelle seule(s) une ou quelques phases (sous-événements) de e1 sont spécifiées. Néanmoins, on peut voir Particularisation comme un cas particulier d'Élaboration. Dans le même ordre d'idées, il est nécessaire pour les DG de postuler l'existence d'une nouvelle relation de discours, Généralisation, qui implique une relation de coréférence événemen tielle et que Ton peut voir comme un cas particulier de Reformulation.
152
LAURENCE DANLOS
Conclusion À la différence de la coréférence entre objets, la coréférence événementielle est une question qui n'a pas été vraiment examinée (a part pour les groupes (pro)nominaux anaphorisant une phrase). Cependant, la coréférence événementielle est une notion centrale pour plusieurs types de discours. Cet article porte sur les discours généralisants et particularisants. Dans Danlos (2001), Danlos et Gaiffe (2000), nous avons montré qu'une relation de coréférence événementielle de type particularisation est en jeu dans des discours causaux analysés avec la relation de discours "Explication", tandis que la généralisation est en jeu dans des discours causaux analysés avec "Résultat". La coréférence événementielle est donc une question de cohésion (Halliday et Hasan 1976), qui s'avère être cruciale pour une question de cohérence (établissement de relations de discours). Nous avons montré que la coréférence événementielle dans les DP exige une nouvelle relation de discours, Particularisation, plus spécifique qu'Élaboration qui est généralement employée pour analyser des discours comme (1). Particula risation (et sa relation duale Généralisation) est établie sur la base de contraintes linguistiques fortes (contraintes lexico-sémantiques entre éléments avec le même rôle). Elle permet d'établir une relation de coréférence événementielle bien que les événements dénotés par les phrases soient quantifiés existentiellement. Cette rela tion de coréférence événementielle implique la coréférence de participants ayant le même role thématique, même s'ils sont quantifiés existentiellement. Références Asher, N. 1993. Reference to Abstract Objects in Discourse. Dordrecht: Kluwer. Asher, N. and A. Lascarides. 1995. Lexical disambiguation in a discourse context. Journal of Semantics 12:12, 69-108. Corblin, F. 1994. La condition de nouveauté comme défaut. Faits de langues 4, 147-160, Presses Universitaires de France. Corblin, F. 1995. Les formes de reprise dans le discours, Anaphores et chaînes de référence. Rennes: Presses Universitaires de Rennes. Danlos, L. 2001. Event coreference in causal discourses. In P. Bouillon and F. Busa (eds.), Meaning of Word, Cambridge University Press. Danlos, L. and B. Gaiffe. 2000. Coréférence événementielle et relations de discours. In Actes de la conférence Traitement automatique des Langues Naturelles (TALN'00), Lausanne. Halliday, M. A. K. and R. Hasan. 1976. Cohesion in English. London: Longman. Hobbs, J. 1979. Coherence and coreference. Cognitive Science 3, 67-90. Humphreys, ., R. Gaizauskas, and S. Azzam. 1997. Event coreference for information extraction. In Proceedings of the Workshop on Operational
CORÉFÉRENCE ÉVÉNEMENTIELLE ENTRE DEUX PHRASES
153
Factors in Pratical, Robust Anaphora Resolution for Unrestricted Texts, 35th Meeting of ACL, Madrid. Kamp, H. and U. Reyle. 1993. From Discourse to Logic, Introduction to Modeltheoretic Semantics of Natural Language, Formal Logic and Discourse Representation Theory. Dordrecht: Kluwer Academic Publishers. Mann, W. C. and S.A. Thompson. 1988. Rhetorical structure theory: Toward a functional theory of text organization. Text: An Interdisciplinary Journal for the Study of Text 8:2. Moens, M. and M. Steedman. 1988. Temporal ontology and temporal reference. Computational Linguistics 14,15-28. Pustejovsky, J. 1995. The generative Lexicon. The MIT Press. Rossari, and J. Jayez. 1996. Donc et les consécutifs. Des systèmes de contraba tes différentiels. Lingvistics Investigationes XX:1, 117-143. Roussarie, L. 2000. Un modèle théorique d'inferences de structures sémantiques dans le cadre de la génération automatique de textes. Thèse, Université Denis Diderot, Paris 7. Van Der Sandt, R. 1992. Projection as anaphora resolution. Journal of Semantics 9, 333-377. Webber, B. 1988. Discourse deixis: Reference to discourse segments. In Procee dings of ACL'1988, 113-123, Buffalo, NY.
Summary Works on temporal relations between two eventualities e1 and e2 always suppose thate1≠ e2. We will concentrate on cases where e1 = e2, i.e. on event coreference. Unlike object coreference, event coreference has rarely been studied in detail, except for (pro)nominal phrases referring to an event. We focus here on event coreference between two senten ces. This study will put forward unusual linguistic phenomena, e.g. coreference between existentially quantified elements. These phenomena, which question well-established myths, have to be taken into account in text understanding and text generation. They will lead us to introduce and define new discourse relations which will be discussed in the framework of SDRT.
STRINGS, LISTS AND INTONATION IN GARDEN PATH SENTENCES: CAN IT, PLAN IT, OR PLANET? 1 RAY . DOUGHERTY New York University
The most interesting thing to emerge from the 2000 presidential election is the ambiguous sentence (1), which lacking punctuation, has two interpretations, two intonation patterns, and two ways to pronounce can, see (2-3). I have lost the reference, but I believe it emerged from the droning palaver of an intonationally rich but semantically vacuous debate that intended to persuade voters but not to show anything. (1)
If it makes money, do it, if it does not, can it
(2)
If it makes money, do it, if it does not, can it? Where can it bears question intonation, and can rhymes with flan and ban.2 Can it? means can it make money? The string can it rhymes with planet.
(3)
If it makes money, do it, if it does not can it! Where can it bears imperative intonation, and can rhymes with pan and tan. Can it! means put it in the garbage can. The string can it rhymes with plan it.
If a normal intelligent native speaker of English reads sentence (1) as written (with no question, imperative, or period), is it possible to guess or infer what is going on inside their head as they process the words? We assume that the reader, 1
This paper draws heavily on the research done by Lisbeth Dyer (1999, 2000) and Franca FerrariBridgers (2000). The reader should refer to their NYU research papers for full details of the analyses. I thank Lisbeth Dyer for providing an abundance of lexical data and much insight into the relevance of these sentences in choosing between afinitestate and a phrase structure model. All questions concerning INTEX should be addressed to Max Silberztein, IBM Hawthorne Research Center. Copies of the INTEX program that run on an IBM PC may be obtained by contacting Max Silberztein. INTEX is an extremely powerful parser, but still remains easy to learn, use, and modify for your own lexicons. 2 Intonation and pronunciation reflect standard King's English, more specifically King's County English. This is spoken by millions in Brooklyn, N.Y., who had the good fortune to be born in Kings County Hospital.
156
RAY C. DOUGHERTY
somewhat like a Turing machine, reads the string from left to right and inputs one word at a time. We draw few conclusions about the processes inside the infor mant's head, but we do suggest that sentences like (1-3) might bear on the data structures assigned to sentences during processing, such as: constituent structures versus intonation phrases, strings versus lists, and so on. We believe the correct data structure is a finite state graph, as discussed for the past 30 years by Maurice Gross and implemented in INTEX, see Silberztein (1999) and Fairon (1998-1999, 2000). Quite possibly FS graphs correlate with intonation patterns.
What are the data structures used to chunk sentences? A garden path sentence contains an element (a lexical item, usually) that can be assigned more than one category (N, V, Modal, etc.) or representation (pronun ciation, intonation, etc.). This ambiguous element occurs before a disambiguating element (a lexical item, prepositional phrase, particle, tag question, punctuation mark, etc.) that fixes the interpretation of the sentence (semantically and pho netically) by restricting the ambiguous element to a single category value, pronunciation, semantic reading, and intonation pattern. We usually represent the ambiguous element in boldface and the disambiguating element with an underline. Our definitions follow those of Marcus (1980), Hicock (1993), Fodor and Inoue (1998), and Gibson (1998). Maintaining a Luddite simplicity in experimental design, assume we have the sentence written on a sheet of paper. A second sheet has a small hole in it through which the informant can see one or more words. The English informant's sensory apparatus interacts with the objective information in sentence (1) through the hole in the sheet. Appropriate shaping, sizing, and positioning of the hole in the sheet will guarantee that the informant is able to more or less appreciate the information piecemeal without becoming overwhelmed and saturated with the full sentence. This prophylactic experimental stratagem prohibits the informant's glancing at the forbidden information to the right before he has adequately assimilated what has been exposed to him. We assume that the informants tightly grip a steel ball that they drop onto a tin plate when they sense they understand the sentence or intuit they can pronounce it. Digital machinery can measure the time between when the informant obtains his first sensory impressions of the sentence through the hole in the sheet until the steel ball chimes on the tin plate. This rude experimental configuration is com patible with our studies, most of which proceed only by considering intuitions that have yet to be tested in real world performance situations. We are not directly investigating how (i.e., by what processes) the informant grapples with sentences like (1). We focus all attention on the data structure that the processing mecha nisms, whatever they may be, are manipulating.
STRINGS, LISTS AND INTONATION IN GARDEN PATH SENTENCES
157
Our English informant might read sentence (1) two ways: aloud, so that others might share the wisdom; silently, with no discernible movement of the lips, tongue, glottis, and slippery innards. Sentence (1) and the two possible ways to read it awakens a realm of possibilities in the speculative mind of the compu tational linguist reflecting on a human being's semiotic capacity to maintain and manipulate symbolic representations. Our single minded attention to data struc tures differs from most other studies, the majority of which have focused on processing mechanisms, see the insightful analyses in Bader (1998), Church (1980), Ferreira and Henderson (1993), Fodor and Ferreira (1998), Fodor and Inoue (1998), Gibson (1998), Gorrell (1998), Hicock (1993), Kondo and Mazuka (1996), Lewis (1995, 1998), Prichett (1991) and Weinberg (1993). Our semiotic concern is: what type of symbolic representations does a human assign as structure to garden path sentences? What types of data structures characterize the shape and size of the morsels chewed and digested by the parser? We focus on the what. We do not directly focus on the parser's teeth and tongue, that is, the buffer structures and mechanisms (the how) that actually bite off pieces of the string, store them, and move them around. Consider an analogy. If we could examine only the contents taken from the stomachs of a cow, a lion, and a snake, we could speculate about what follows in the digestive tract as the churning chunky gooey mess gets squooshed into the intestine and absorbed into the systems. We could presumably also speculate about the earlier processing tools (teeth: incisors, fangs, molars, bony gums) that divided up and that shuffled (tongue) the elements that were input to the animal's mouth. The ragged zebra chunks rubbing together in a lion's stomach suggest a different segmenting process (mouth processor) than does the still pulsating mouse on its way towards the snake's tail - the morphologically intact mouse having slid past the fangs in the toothless mouth between the unhinged jaws. We follow the 'firstness, secondness, and thirdness' semiotic and pragmatic strategy of Charles Sanders Peirce.3 First, we study the 'symbols' needed to pragmatically characterize the data structures of garden path sentences, 1st-ness. We speculate about semiotic data structures from which we may - perhaps as a logically second step - be able to make abductions about the processing mechanisms, 2nd-ness. As a third step, we might ask what sort of mechanisms give rise to these symbolic representations, 3rd -ness. I hope to show that sentences like (1-3) can suggest experiments - beyond the restrictions imposed in our Luddite laboratory - to choose between the data struc tures (strings vs phrase markers vs finite state graphs vs intonation patterns) that must be postulated to understand how humans process ambiguous sentences. A physicist or engineer examining a new phenomenon might decide whether the 3
See the methodological and semiotic studies of Aquiles Este (to appear) which focus directly on Peirce's ideas about the expression of ideas relating to perception, particularly before deductive theories can be formulated to describe or explain the perceptions as manifestations of some abductively generated cognition.
158
RAY C. DOUGHERTY
information structure underlying observable data patterns was exponential, sinusoidal polynomial, or linear before beginning to postulate descriptive or explanatory mechanisms that would force the data into these information struc tures. We will try to decide whether the data patterns of garden path sentences that require two references to the lexicon to obtain the final sentence interpretation are best matched by the discrete information structures string, list, fs graph, etc. before suggesting computational processes, pattern recognition devices, and memory structures in a processor that would give rise to such data patterns and information structures. We are working in Peirceian 'Firstness' and trying to find a semiotic system. In (1), a final '?' asserts can is a modal, and can it, which rhymes with planet, has a question intonation and interpretation. A final '!' asserts can is a verb, and can it, which rhymes with plan it, has an imperative intonation and interpretation. The final punctuation mark ('V for imperative, '?' for question) would be a disambiguator in that the sign would be compatible with only one set of phonolo gical, intonational, semantic, and syntactic representations. When a left-right processor encounters a disambiguator - glimpses it through the hole in the sheet the informant eliminates all possible structural assignments to a string except for one. If sentence (1) terminated in appropriate punctuation, any informant is expec ted to drop the ball bearing onto the plate at the punctuation mark. Consider first the informant reading the sentence silently. It is quite possible that the reader assigns only syntactic and semantic properties to the words, but no particular sounds or intonations. The possibility exists that the informant maintains all possible pronunciations, intonation patterns, and semantic interpre tations simultaneously in the mind as they approach the non-existing final punc tuation mark. The informant manipulates the words as though they were soundless symbols, more like numbers in a Platonic mind (like 2 + VI = 100) than phonetic words in phrases {two plus six is eight). Gibson (1998) offers a system in which the reader maintains all possible inter pretations simultaneously in memory (although one of them may be favored and be 'maintained' while others fade over time). When the reader encounters an ambiguous element, all possible lexical information is used to construct as many structures as can logically be deduced from the grammar. These structures are carried along (in parallel) in assorted memory buffers until some disambiguating information appears that can choose between the simultaneous structural representations. Upon reaching disambiguating material, the representations contradicted are discarded the memory buffers are flushed. We agree with many aspects of Gibson's analysis, but differ on two fundamentals.4 4
The work of Gibson seems completely in accord with a system that would, with respect to data structures: (a) utilize INTEXfinitestate graphs as the lexical data structures, (b) use Gross' idea that the parser first constructs the 'maximum' graph for the sentence, and (c) use INTEX lexicons and specific grammars reduce the 'maximum' graph in accordance with 'new' words introduced by the left-right parser; and with respect to processes assume (d) all structures were
STRINGS, LISTS AND INTONATION IN GARDEN PATH SENTENCES
159
First, we assume that the competence grammar is a finite state grammar and that problem in parsing models is to account for why any center embedded structure below a certain level of embedding is acceptable at all. Gibson assumes the competence model generates (recognizes) all center embedded structures and offers reasons for why they are all bad above a certain level. Gibson, as well as Lewis (1995, 1998), assume center embeddings are grammatical, but unacceptable above very small levels of recursion. We assume that - with a few, mainly lexically based, exceptions - all center embeddings are ungrammatical, but acceptable at very low levels of recursion. See Dyer (1999, 2000) for discussion of a correlation. If a center embedded construction using three verbal elements (verb particle, idioms, etc.) is deviant, then a coordination of those three elements is quite acceptable. If a center embedded construction with three verbals is relatively acceptable, then the coordination of those three elements is somewhat deviant. This leads to a classification of verbals containing 'separable' elements {look up, give X one's word, etc.) with respect to 'degree of similarity,' where this degree of similarity predicts that center embedded and coordinate constructions with the same verbal elements - will vary inversely in acceptability. Second, Gibson's analysis, and that of Lewis, are based on processing by devices that take time to operate to build structures and store them. We assume that all processing and reshuffling is done virtually instantaneously by massively parallel processors that are attempting to satisfy logical constraint based systems. It is beyond our space limitations to discuss, but if there is any 'time' dimension associated with anything in processing, we assume with Fodor and Inoue (1998) that it is the 'recognition time' to abductively come up with a good guess as to a modified structure, and perhaps, to access the lexicon. Deduction (assignment of defined or 'licensed' by logical constraint based systems, as onefindsin computer languages like Prolog. These assumptions would rank recursive structures for complexity. Finite state graphs would exclude center embeddings as ungrammatical, differentiating them qualitatively from other constructions. Constraint based unification parsers (Prolog-like systems) would find leftbranching quantitatively more complex than right branching. The basic operation {unification) of Prolog, the command append, might serve as a 'complexity metric' in Gibson's system. Processing load is how many open appends the processor has at any state, where the ingestion of an item in the string moves the parser to a new state. However, if we assume the competence model isfinitestate (INTEX), it would be essential to consider center-embedded structures as not the most complex of syntactic structures, bur rather to realize that they are not syntactic structures in the competence model. Center embed ding, viewed from Gibson's perspective, seems like the hardest of constructions, much like the whale, viewed from a distance, looks like the biggest fish. But examined more closely from an INTEX finite state perspective, center embeddings are not part of the competence model, just as the whale is not part of thefishworld. It might be that INTEX, implemented in a logical constraint based language (Prolog) on a com puter with specific limited memory and computational capacities (perhaps a parallel processor), can provide a direct way to model Gibson's concepts of computational complexity and processor load. It is essential to realize, however, that center embeddings do not differ quantitatively, but qualitatively,fromother constructions discussed by Gibson. Center embeddings differ catego ricallyfromleft embeddings and right embeddings.
160
RAY C. DOUGHERTY
structures) takes almost no time in a parallel processor, but the abduction of a structure or 'tagging' may. Consider an analogy. In recognizing two views of an ambiguous figure (the picture of a young woman and an older woman, for example), it may take seconds to 'see' the other picture given you see one, but it takes zero seconds to identify the parts of the picture (nose, eye, chin, etc.) and see how they are arranged and aligned with respect to each other. Bader (1998) offers an extremely interesting analysis about silent readers who actually hear a little voice in their heads - sort of reading the materials aloud to them(self/selves) silently in private - when they read. I do not see how to incorpo rate his observations into our model directly to yield any empirically testable consequences. Unquestionably, consideration of this 'internal speech' is crucial to an understanding of the problems discussed in this paper. It would go beyond our analysis here, but that concept of a 'little voice' was crucial in the ideas surroun ding the linguistic views of Descartes, Pascal, Arnauld and their mentor, St. Augustine (see Brown 1969). Usually it surfaced in discussions of prayer. Pascal felt that one should move the lips while praying. St. Augustine argued against moving the lips. I believe Descartes followed St. Augustine's ideas and developed this position to its extreme limit, basically denying that there even were lips (or a body) involved in prayer. See St. Augustine, The Interior Master. Although the idea strikes modern ears as somewhat 'off the wall,' it was the focus on this 'internal voice' that gave rise to Cartesian linguistic theories.
Reading sentence (1) aloud and silently Suppose a silent reader, who hears no voice in his head, reads sentence (1). Lacking any final punctuation to serve as a disambiguator, the silent reader is left in a state of limbo. It is not clear if the informant would release the ball to bonk on the plate since an informant in limbo does not understand how to pronounce the words or intone the phrase, nor how to interpret the can it, or whether to tag can as a verb or modal. Assume the informant holds a penny in the other hand, and in the 'limbo state', the informant releases the cent to rattle on the plate yielding a ricocheting sound distinct from the ball bearing's bonk. We treat these issues in a paper in progress.5 Consider the informant reading sentence (1) aloud. For any number or reasons that might be investigated (frequency of occurrence, semantic and pragmatic 5
Ferrari-Bridgers (2000) feels that possibly the reader will not be left hanging in the 'limbo' state with a silent reading. It might be that at the end of the reading, for extralinguistic factors, he will choose one reading over the other without hesitating. The difference is this: With reading aloud the reader has to commit himself immediately to one of the two readings. With silent reading the reader can postpone the commitment to the end of the reading or forever. Ferrari-Bridgers suspects that measuring the eye-fixation in both types of readings might help to find out whether there is a difference in the ways readers 'perform' these sentences under the two different performance conditions.
STRINGS, LISTS AND INTONATION IN GARDEN PATH SENTENCES
161
sensibilities, context, identity of the speaker, knowledge of the audience, and so on) an English informant reading (1) aloud might be expected to make a choice between (2) and (3). Current research at New York University by Ferrari-Bridgers is investigating precisely what happens when an informant tries to read sentences, like (1), aloud - both when there is no punctuational disambiguator and when there is. In this thought experiment, we might expect the informant, when reading silently, would drop the penny upon reaching the non-existent punctuation mark in (1) thereby exposing the internal limbo state to empirical observation. When reading aloud, however, the informant presumably has made decisions as to part of speech for can, pronunciation, intonation, and so on, hence, we should only hear the clunk of the steel pellet and never the ricocheting penny. Upon reaching the end of the string, the silent reader has an internal state marked by uncertainty between two different phonetic, syntactic, and semantic representations with no hope of any resolution in sight (through the hole in the sheet) - and drops the penny. The aloud reader has an internal state marked by a selected representation and perhaps a suspicion (conscious or not) that there was another alternative passed along the way - and drops the ball. We are also concerned with sentences like (4-5) where a person might read the sentence with a question intonation (which seems to be the unmarked favorite), but realizes given later materials, that in fact the imperative intonation is the only one permitted. One could also imagine 'tag question' disambiguators: ... can it, or can't it? 6 (4) If it makes money, do it, if it does not, can it, just like we stuffed all the other ideas in the trash can. Can it rhymes with plan it, and can is a verb. (5) If it makes money, do it, if it does not, can it ever be expected to make money, and if it can, then do it with an eye to the future profitability. Can it rhymes with planet, and can is a modal. Sentences like (1-5) - which involve a string of elements can it that is ambi guous in phonetic pronunciation, intonation contours, stress patterns, syntactic categories, and meanings - are at the fringes of our research. Fortunately, the 'can it: plan it or planet' problem need not be tackled as an unanalyzable composite but can be broken into smaller components. Let us focus on only one aspect. I will attempt to clarify the issues by suggesting an experiment to choose between two possible data structures and computational processes that might be active in the cognitive processing of our English informant. Let us abandon intonation contours 6
There are variants of 'minimal pairs' that might be used for performance studies to decide on the data structures used by an informant to grapple with incoming word streams. We have examined sentences like: If it makes money, why can it? where can can be a modal or a verb. If you think it might make money, you must answer 'why can it?' or 'can it!'. Ifyou think it might make money you must answer 'why can it?' or 'can't it?'. There are examples of can it which differ in pronunciation but have the same question intonation.
162
RAY C. DOUGHERTY
over multi-element strings and focus on ambiguities involving phonetic and syn tactic variations of single words.
Simple phonetic and semantic ambiguities without intonation variation English contains a number of words (6) that have two stress patterns. The verb has the stress on one syllable, the noun on another. Helping to make English even harder for the second language learner, there are words (7) that have two pronun ciations - they differ usually in vowel quality - depending on whether they are nouns or verbs.7 (6) Words with N/V stress pattern change: contrast, conscript, implant, per mit, protest, segment, combat, compound, conduct, conserve, contest, con vert, digest, increase, pervert, rebel, recount, suspect, conflict, consort, insert, implant, progress, recall, reject... (7) Words exhibiting vocalic change: affiliate, conglomerate, deviate, syndi cate, aggregate, degenerate, duplicate, confederate, delegate, predicate... Our research currently focuses on words like (6-7) which change pronunciation (stress and/or vowel) depending on whether they are nouns or verbs. Can changes pronunciation depending on whether it is a modal or a verb. Many, perhaps most, words do not change in pronunciation if they are nouns or verbs, e.g., look, talk, and so on. Some words change in pronunciation and morphology from one tense to the other, e.g., read in present tense rhymes with reed, in past tense read rhymes with red. Some words, e.g., put, have the same form and pronunciation from present to past tense. If an aloud reader pronounced read as reed and later encountered a past tense adverb, we would expect him to 'backtrack' and repronounce read as red. But, if the reader encounters put, and later a present or past tense adverbial, we would expect no backtracking at all. Words with phonological variants for V/Modal, N/V or past/present alterna tions require a second access to the lexicon, words like put do not. We have worked a little with words, like desert and graduate, which differ in pronun ciation, syntax, and semantics between the noun and verb. Our full experimental design will involve an assortment of these verbs. Needless to say, words like either and economics that have alternative pronunciations with no modification of syntax or semantics never call for backtracking under any circumstances. We have cases of 'semantic' incongruity which parallel the cases of 'phonetic' incongruity discussed in this paper. These sometimes require backtracking (and a second lexical access) to get the 'other' meaning of a word, just as our examples 7
I thank Lisbeth Dyer for providing me with these examples. The lists are not exacting since vowel changes and stress changes interact. But stress versus vowel quality is a pragmatically useful bifurcation.
STRINGS, LISTS AND INTONATION IN GARDEN PATH SENTENCES
163
require backtracking (and a second lexical access) to get the 'other' pronunciation. These involve sentences (usually with coordination or relatives) such as: John returned from Germany with new contacts in his address book and his eyes. See Dyer (1999, 2000) for discuss of sentences like Mary took a picture, up the issues, and offense at Bill. My mother neither put up raspberry jam nor the cat out. Cédrick Fairon is examining cases of 'ambiguous' semantic readings in verb versus verb particle constructions that occur with examples like pan and pan out. My theory of cognition panned out. This implies that my theory had some success and is a positive statement. The critic panned my theory of cognition. This implies that my theory had a setback and is a negative statement. For some, The play panned in London, means that it failed, while The play panned out in London means that it was successful. One could imagine examples involving ...pan... which would have a 'negative' interpretation until an ...out... was encountered, whereupon ...pan...out...would be given a 'positive' interpretation.8 If pan is negative and pan out is positive, then out has the opposite effect with wash. The noun washout usually means 'failed' as in: Our complicated financial plans were a washout. But wash can mean 'succeed' or 'come out even' as in: Our compli catedfinancial plans were a wash As a verb, wash is 'positive' implying success, as in: Your financial plans will wash. Wash out is 'negative' implying failure, as in: Your financial plans will wash out. A left-right parser assigning semantic interpretations must 'change' its semantic interpretation for pan and wash just as it must change its pronunciation for record and rebel. It worked and it worked out are both positive implying success. It flunked (out) and it punked (out) are all negative suggesting failure. Fairon is using INTEX to examine the occurrences of pan, pan out, wash, washout, and wash out in the New York Times, Wall Street Journal, and several other papers to study the possible ambiguities and specific interpretations in actual samples. INTEX has parsed the past two years of these newspapers. Preliminary research having native and non-native English speakers semantically tag texts suggests that non-native speakers of English - who are unaware of the meaning reversal in these verbs - misunderstand passages in leading newspapers. One must speak excellent native English to understand financial and political discussions in newspapers. Non-native speakers sometimes think a financial failure (pan, washout, wash out) is a success (pan out, wash). If Fairon's research pans out, it will wash, but if it pans, it will wash out and be panned as a washout. See Fairon and Dougherty (forthcoming). Let us illustrate one narrow focus of our research using examples from (6).
8
I have been told that ...pan... was neutral (meaning 'read casually') and perhaps negative until 1849, when the phrase ...pan...out...was used by the California gold rush English speakers to mean 'find gold.' If true, it is odd that wash out has a negative interpretation implying failure, since ... pan out the gold... and ...wash out the gold... seem pretty close in meaning and imply success in getting the gold.
164
RAY C. DOUGHERTY
There are two ways to read sentence (8) and (9).9 (8)
The FBI even discovered some record in the California CIA archive library a. The FBI discovered some kind of a REcord ... b. The FBI discovered that some spies reCORD ...
(9)
The historian knew some rebel a. The historian knew a REbel b. The historian knew that some (rebellious types) reBEL
Here we outline the design of an experiment. Work must be done to select the correct sentences, to design the correct contextual basis for presenting the sen tences, and so on, see Ferrari-Bridgers (2000). These sentences can be read with two different senses: (10) The FBI even discovered some record in the California CIA archive library secretly (11) The minister of the Treasury has discovered some duplicate banknotes in the California mint illegally What is the range of possible pronunciations for record and duplicate in (1011)? If some record is (NP (det some) (N record)), then REcord, if it is (S (NP some) (VP record)), then reCORD. If some duplicate is (NP (det some) (N dupli cate)), then Duplicate, but if (S (NP some) (VP duplicate)), then dupliCATE. The word some is syntactically ambiguous between Determiner and Noun, but always has the same pronunciation. The silent reader, exposed to sentences (10-11), should drop the penny onto the plate upon reaching the terminal period of the sentence. The internal mental state (limbo) of the silent reader includes two strings with different stress and cate gories assigned to the boldface words. The aloud reader, exposed to (10-11), should drop the ball bearing onto the plate since he has made all relevant decisions (for better or worse) and has only a gnawing suspicion (conscious or unconscious) that he passed on an alternative. One could imagine designing sentences to force the adverb to pair with record and duplicate, such as: (12) The FBI secretly discovered some record in the Californian CIA archive library secretly (13) The minister of the Treasury has illegally discovered some duplicate banknotes in the California mint illegally We are now closing in on the nut we wish to crack. In (12-13) the bold word is lexically ambiguous both syntactically (N/V) and phonetically (location of 9
These, like many examples in this paper, are simplified versions of the sentences in FerrariBridgers (2000).
STRINGS, LISTS AND INTONATION IN GARDEN PATH SENTENCES
165
stress). Similar considerations would apply to sentences using words exhibiting vocalic change, as in (7). The underlined words, adverbs, in (12-13) are disambiguaters, much like the missing punctuation marks in sentence (1). If the adverb is present, then the only possible grammatical structure for the sentence has the bold faced word as a V, it cannot be an N. Glimpsing the words in (12-13) sequentially through the hole in the sheet, both the silent and the aloud reader should drop their ball bearings upon reaching the underlined adverb. Up to the adverb, the silent reader may have been releasing his grip on the penny as two distinctly different representations floating in his mind forced his intuitions into a limbo state. But by the underlined adverb, the mental state is certain unambiguous choice of one structural alternative. According to Gibson, upon encountering the underlined adverb, the 'processing load' of the silent reader is relieved and irrelevantly buffered materials are discharged. It may be possible to design an experiment to examine what types of data structures English informant manipulates when asked to read sentences like (1-13) aloud. Since we assume that the processing mechanism of the reader is essentially a massively parallel processor computer with a shared memory space running a logical constraint based (non-procedural) program, it is not clear how we can incorporate timing experiments into our work. We seek to answer two specific questions concerning the data structures available to the reader. The disambiguator question: at what point does the informant's parser realize that something is (or may be) wrong - and, at least, a word has been mispronounced? This is somewhat difficult to analyze since if the disambiguator is small (a punctuation mark, a tag question, or a one syllable adverb), the aloud reader often says the word or gives the sentence the intonation required by the mark ('!', '?', etc.). If the disambiguator is large, e.g., a prepositional phrase or a multi-syllabic adverb, e.g., unintentionally, in the most modest way possible, etc., then the aloud reader may backtrack and re-pronounce the offending word before finishing pronouncing the disambiguator word or phrase. The backtrack back-to-X question: if the aloud reader realizes an error has been made, do they go back and re-read aloud some portion of the sentence? There are at least four alternatives: (a) the informant does nothing; (b) the informant goes back to the lexical item and rereads the mispronounced word and words to its right correctly in the new revised context, i.e., back to record or duplicate; (c) the informant goes back farther than the mispronounced word and rereads the entire syntactic phrase including the mispronounced word and words to its left, i.e., back to some. (d) The informant goes back to the intonation boundary that includes the mispronounced word and rereads the string correctly from that point.
166
RAY C. DOUGHERTY
(14) I secretly discovered some record in the library (15) I secretly discovered some record in the library secretly 1 2 3 4 5 6 7 8 9 (16) I secretly discovered some cook in the library secretly 1 2 3 4 5 6 7 8 9 We assume that the L-R parser (our aloud reader) inputs one word at a time, and after each word, assigns categories and structure to the string via its grammatical and lexical knowledge base. Suppose we know - owing to frequency of occurrence data or because we have presented the sentence in a contrived paragraph - that the informant will interpret record as a noun (N REcord) and by accessing the lexicon find that the stress falls on the first syllable. When the reader gets to word 9, secretly, this word can only be paired with a verb. What will happen? If the readers backtrack and reread part of the sentence, how far back will they go? Our experimental design must consider sentences like (16) in which cook as a V or N does not require a 'second look' into the lexicon to get the 'new' pronunciation. In this sketch, we ignore words like cook with only one pronunciation. Such words, requiring no, or minimal, second lexical access are 'controls.' We could guess at - and perhaps even attain some degree of explanation by predicting - possible outcomes of our experiment. We could base our predictions on the types of 'data structures' that the readers might be using. Here we consider a string (of words), a list (perhaps a syntactic PM or labeled bracketing), and an intonation pattern. If the reader goes back only to the mispronounced word 5, record, and by accessing the lexicon finds it is a verb with stress on the last syllable, then one might say that the 'error correction' or 'recovery from error' is based on strings and a string analysis of the sentence. The reader goes back to the single lexical item that was mis-categorized and mispronounced, reaccesses the lexicon, and continues from the 'error point'. Re-reading commences with(VreCORD)after (N REcord) is dumped. If the reader goes back further than the mispronounced word to a word that is part of the phrase containing the mispronounced word, to word 4, some, then one might say that the 'error correction' or 'recovery' is based on lists and a syntactic phrase analysis of the sentence. The backtracking is to (NP (DET some)(N record)), which becomes (S (NP some) (V record)). Preliminary research suggests that in fact many readers go back even farther. They go back beyond the erroneously pronounced word, and beyond the syntactic phrase, and restart reading from the boundary of the intonation phrase containing the mispronounced word. Intuitively, they seem to want to recapture the 'swing' and 'melody' of the sentence. In our examples, the intonation boundary corresponds to the syntactic phrase boundary, but this need not be the case. Simple examples are hard to find, but one
STRINGS, LISTS AND INTONATION IN GARDEN PATH SENTENCES
167
can imagine sentences like: The newspapers found out some record secretly. The newspapers found some record out secretly. The newspapers found out some record. The newspapers found some record out. They figured out some record. They figured some record out. Consider a more complex case: They figured out some record in the library, but I doubt it. Perhaps this can mean 'I doubt the record,' but the most normal interpretation is that it refers back to the sentence some reCORD, and the interpretation is 'I doubt that some record'. Very odd are: They figured out some REcord in the library, but I doubt it. And: They figured some record in the library out, but I doubt it. The sentence * They figured out some crossword puzzle in the library, but I doubt it is deviant. They may have figured out some crossword puzzle in the library, but I doubt it is fine with it referring to the main sentence They figured...out, minus the may. Sentences like these are the 'semantic' correlates (using lexical meaning and reference) of our 'phonetic' examples involving lexical phonetics and intonation. These sentences are ambiguous: The newspapers found some record secretly. The newspapers found some record on a computer. The newspapers found some record. But this sentence is unambiguous: The newspapers found some record out, while this one is ambiguous: The newspapers found out some record. Admit tedly these examples hardly fall from the tongue with natural intonation patterns and hardly seem natural with no context, but suitably contrived examples chime in many ears as exhibiting euphonious intonation patterns and strike even hardened semanticists as models of clarity. One can also imagine ambiguities involving the string for some record that can be either a complementizer sentence or a preposition noun phrase, each with its own intonation pattern. Our plan might be exposed to the newspapers, for some record at the meeting (may have leaked out, record → N/secretly, record → V)). Intonation patterns can disambiguate strings like this: The professor said the student was a genius. "The professor, " said the student, "was a genius. " And The professor said that the student was a genius. Intonation patterns arise clearly in direct and indirect quotations and are frequently in English marked by assorted punctuations. Quotations within quotations can yield extraordinary tonal shifts.10 Cases in which to is a preposition or a complementizer can yield cases in which the intonation patterns may not match the syntactic assignment of phrases, e.g., The Cannibal Bank Company is known to affiliate banks ... can be the compound (N affiliate banks) object of the preposition to or the (VP affiliate (NP banks)) complement of the Infl to. Ferrari-Bridgers (2000) offers an insightful analysis of compound (lexical) nouns (N N N) that can be reanalyzed as (VP V NP) constructions, such as: Upon entering the Italian restaurant, we were surprised to see Chinese snap peas carefully with both hands. (N snap peas) versus (VP (V 10
See Fairon (1998-1999, 2000) for a discussion of the application of INTEX finite state graphs to analyze citations, quotations, and indirect quotations.
168
RAY C. DOUGHERTY
snap) (NP peas)). Contrast the sentence with both eyes, with one eye and with one hand instead of with both hands, or terminating with rotting, rotting quickly, or quickly rotting. In general, readers seem to select the interpretation (and intona tion pattern) as a lexical compound noun on the initial reading and only opt for the V NP reading on the 'second pass/ presumably after a second lexical access triggered by a disambiguator.
Out with the old, in with the new: The Millennium Model, INTEX, and digital audio/video Here a bit of history. In the Fall of 1999, the entire team at NYU was about to embark on an experimental research project to study problems posed by data like those above. We had our $6/hour informants hunkering behind their sheets and raring to read. Our cassette tapes with batteries fully charged were rewound, paused, and ready to record. But while making New Year's resolutions, we revi sed our fundamental assumptions, thereby postponing our hands on, dirt-underthe-fingernails data collection. The first methodological revision caused for a fundamental rethinking of our experimental situation. Most of our research is on massively parallel processor machines using shared memory to execute logical constraint based programs, usually in Prolog. We are not directly concerned with anything relating to 'time' but are only concerned to discover what types of data structures we need in order to make sense of how our readers hack up the strings in order to read them aloud. Our informants seldom severed word strings at the syntactic or semantic joints defined by phrase markers or logical forms. Our goal was to find where cuts were made, and perhaps to ask 'why there?' We do not particularly care how the informant gains data about the 'input' sentence. Hence, at the stroke of midnight on December 31, 1999 we decided to throw out the sheet with a hole in it, the ball bearing, and the penny and move the informant into our Millennium Methodology. This methodology for competence-performance studies is part of a greater system, called the Millennium Model, which merges the work done at NYU with the INTEX research of the University of Paris VII and at IBM. Since Jan.l, 2000, we have assumed our informant will either be seated or stand erect on a sound-stage and read aloud from a typewritten page, where the sentences may be presented in a list or in contrived paragraphs to force interpre tations. The informant will perform au naturel in front of multi-track digital video and audio recorders.11 Our main focus is: how does the reader recover from a 11
Here we will try to follow the ethological guidelines for studying animal communication developed by Konrad Lorenz. Lorenz once said that a monkey in a cage is not a monkey. We will attempt to have the informant read aloud in a non-experimental situation, perhaps asking them to help correct our rough drafts. The audio-visual recording equipment is similar to that used for sign language research.
STRINGS, LISTS AND INTONATION IN GARDEN PATH SENTENCES
169
fumble? By seeing how far back a reader goes, can we decide the nature of the data structures - the shape and size of the puzzle pieces - that are shuffling around inside of the head? Since we eliminated the hole in the sheet, we cannot speculate about timings of specific inputs. But with every noise and gesture of the informant recorded on multi-track digital audio-visual, we can see clearly where the fumbles occur, and perhaps gain insight into how far back the informant goes to re-read the passage and recover the ball. The second major decision made as the bells and champagne glasses chimed in the new millennium was to abandon the computationally narrow thinking that restricted us to contrasting only strings with lists. Thinking in terms of strings, we had been thinking that the reader will at least go back to the word that had to be repronounced. Owing to a misunderstanding on our part, we assumed that this meant that the informant's actions indicated they were operating in terms of strings, with only 'lexical reaccess' as the principle governing backtracking. If the informant went back to the word some, then they were backtracking in terms of lists (or phrase markers), since there was no reason to assume that the some changes in pronunciation. Our pre-Millennial error: we were contrasting only the data structures of Awk and SED (strings) as opposed to Lisp and Prolog (lists). At the stroke of midnight along with the sheet we threw away these horse-blinders. We must consider finite state data structures, FS graphs. If we assume that the data structures being manipulated by the readersarefinite state (FS) graphs - as one finds in the INTEX grammar, and as have widely been discussed by Maurice Gross for the past thirty years - then the basic data structure is neither a string nor a list. If we assume that the lexicon is not simply a list of words, but a series of finite state graphs, then the reader - when backtracking will call up the entire finite state graph containing the mispronounced word. The data structures of the lexicon are identical to the data structures that affect higher levels of combinations, in short, it is all finite state graphs at every level of syntactic analysis. Here we can only speculate. We will design our experiments to try to decide if the reader bases 'recovery from fumble' on the basis of strings, lists, orfinitestate graphs (INTEX).12 In most analyses based on list structures, usually phrase markers, there is a notion of 'head' of a phrase that plays a major role. In the finite state graph, there is no obvious notion of 'head' anywhere. In many cases, there is no notion of 'phrase' present. The FS graph expresses 'local relations,' such as one finds between eke and out, make and headway, and assert and categorically. The main (perhaps only) reason that grammars contain the theoretical notion 'head' is that this enables the grammar to associate a specific lexical item (the head) with a grammatical rule of some sort (structure building, selectional, etc.). 12
The INTEX parser currently offers FS graphs for French, Spanish, Italian, English, German, and other languages. Many of these have lexicons constructed and tested on databases the size of the past ten years of the Wall Street Journal, Le Monde, and so on. Fortunately, a graphics interface to the underlying formalisms makes the INTEX grammar easy to learn, use, modify, and extend.
170
RAY C. DOUGHERTY
The finite state graph theory (INTEX) eliminates this entire way of thinking by making every lexical entry an entire graph, sometimes including variables. There is no concept 'head' required to associate a lexical item with a rule since every lexical item is a 'rule,' since we can think of an INTEX graph as a rule to build structure or a logical constraint on structures already built. In the INTEX lexicon, there is no clear distinction between a 'normal word' and an 'idiom'.13 Quite possibly the concept 'head' is not a property of human language but a property of the conceptual tools and data structures (based on phrase markers) that have been used since the 1950s. If the FS graph is the correct data structure, then we may come to regard 'head' in linguistics much as 'chromatic aberration' is regarded in astronomy. 'Head' and 'chromatic aberration' reflect properties of the observational instrument and not anything real in the cranial or celestial vaults respectively. Having speculated as to the design and results of our experiment, now let me indulge in guessing. I strongly suspect that the FS graphs - which form the main data structures in INTEX - correlate directly with intonation patterns. They do not necessarily directly correlate with syntactic phrase markers, although INTEX can associate phrase markers with sentences. As the new millennium unfolds, we intend to analyze the data in our experiment according to the INTEX grammar of English, which has been constructed quite independent of any concerns with our experiment or intonation. It is an empirical question to see if the FS graphs developed for English at Paris VII and IBM based on the analysis of huge text corpora of machine readable data in fact provide insights into the dimensions of the backtracking domains and into intonation patterns. Intuitively, it would be natural that finite state graphs would correlate with intonation patterns since a FS graph seems suited to represent the Markovian character of acoustic patterns. An intonation pattern is a relatively 'local' pheno menon and rarely involves 'discontinuous strings.' This suggests that intonation patterns are determined by elements relatively adjacent in a string and not by any 'global' string operations. If you put your thumb on a word in a string and worry about how it is pronounced or fits into an intonation pattern, words decrease in
13
One might think as follows. A lexical entry is a finite state graph, as defined mathematically by Maurice Gross and given a particular implementation by Max Silberztein in the INTEX parser. One could construct a concordance of the finite state graphs, where the concordance would be of the words, morphemes, etc. that are nodes in the graphs. This concordance of words would point each word to one or more graphs. A parser would utilize the word concordance to 'pull up' graphs. Clever strategies might be utilized in parsing sentences containing collocations, such as ...make ... headway ..., or ... eke ... out..., or ...deny ... categorically... Ignoring the concept of 'head,' we might structure the concordance-to-graph relation to call up graphs using headway but not make, eke but not out, and categorically but not deny. Essential in this is the idea that some words (elements in the string) are more 'salient' than others. The concordance must mark headway and eke as high in salience, where salience is defined as 'calling up the least number of finite state graphs'.
STRINGS, LISTS AND INTONATION IN GARDEN PATH SENTENCES
171
relevance as they are farther from your thumb. This suggests a finite state data structure. The Millennium Model predicts two things: first, backtracking that requires a second lexical access will access the entire INTEX FS graph containing the word that has been mispronounced. Hence, the reader might be expected to reread any fragment of the sentence to the left of the re-pronounced word that is covered by the graph. This, in general, may not correspond to concepts of phrase markers and heads that were rendered popular by projecting the data structures of phrase structure grammars onto human languages. Collocation relations (and functional grammar relations) are perhaps more important than phrasal relations. Second, in analyzing strings INTEX accesses the lexicon to match FS graphs to the words of the string. Any concepts of 'computational complexity' one asso ciates with the processing of a string (number of processes done in parallel, memory load, etc.) must be defined in terms of INTEX data structures (FS graphs) and not heads, phrases, and so on. A string that is 'chunked' as three INTEX graphs may or may not be chunked as two, three, or four phrase structure nodes, containing two, three, or four heads. INTEX FS graph to phrase structure corre lations are not simple, and in fact, may not be necessary to analyzed data like those discussed in this paper.
Millennium Prophecies Having speculated and guessed about the results of our as yet unconducted experiment, I feel it is time to prophesize. The early work by Chomsky and Miller (Chomsky & Miller 1958, 1963; Chomsky 1963; Miller & Chomsky 1963) which is assumed to show that the syntax of human language cannot be finite state but must be described by more powerful (phrase structure) mechanisms - must be reconsidered and reevaluated. Their analysis is not incorrect, rather, it is mis leading and places the cart before the horse. To make a long story short, every thing Chomsky and Miller show is compatible with the view that the competence model of human language is in fact a finite state grammar and the performance model is a phrase structure grammar. In the Millennium Model: the 'grammatical core' of a language - correspon ding to our competence model - consists only of strings that can be analyzed by a finite state mechanism (like INTEX). The 'periphery' of a language - corres ponding to strings that can be assigned structure perhaps by analogy with strings in the core - is defined by a phrase structure grammar. The principles of 'analogy' that extend the core of well-defined finite state constructions are based on phrase structures. Under this analysis, we would expect languages would contain un bounded left- and right- branching structures, but not permit center-embedded structures. If there exist any center embedded structures (beyond a small level) permitted, they are only allowed by the analogies imposed by the phrase structure
172
RAY C. DOUGHERTY
mechanisms of the performance component. This, in fact, seems to be the correct generalization. Insofar as a phrase marker is a useful descriptive data structure, those PMs that describe human language structures are those that can be generated by FS mechanisms, perhaps augmented with a small amount of memory to permit center embedded recursion of low levels. Chomsky and Miller assume that competence grammars (based on PS gram mars) generate unbounded center-embeddings and performance grammars (based on FS grammars) block virtually all the generated examples. The basic assum ption underlying our Millennium Model is this: Ch. & M.'s assumptions must be reversed. The competence grammar that defines the 'grammatical core' of a language is based on FS principles. The performance grammar that defines the 'periphery' of a language is based on principles of analogy, perhaps described in the main by PS principles.14 In competence-performance research based on the C&M model, the question about center embedded sentences is this: given they are all well-formed, why are all of them universally rejected around the world in all languages for any embedding over 3 or 4? Competence-performance research based on the Millen nium Model asks: given all center embedded constructions are grammatically illformed according to the finite state competence model, why are any of them acceptable? The answer is: the finite state competence model is augmented and has a small buffer (to permit small degrees of embedding) and also there is a performance model, based on PS mechanisms, that permits some center embeddings to be interpreted by analogy to well-formed left- and right- embeddings. Work described in this brief sketch is the tip of an iceberg. In addition to new experiments we must rethink many old ones in terms of the Millennium Model. In particular, we must reexamine most of the work that has discussed the competence-performance implications of center-embedded sentences. This paper presents a call to researchers to help out by applying INTEX finite state graphs to the analysis of garden path sentences. You must work out problems and answers that point out areas that ferret out crucial issues. That is, you must work problems and answers that point areas that ferret crucial issues out out out. If you would place a competence asterisk in front of the sentence that is in front of this one - a sentence rendered intelligible perhaps by analogy and performance mechanisms you are with us. If you think center embeddings are grammatical but unacceptable, I can only wonder whether you have thought the position you are giving out over or not. If, like us, you think center embeddings violate the FS competence model but are rendered intelligible by performance models based on PS analogical principles, then you will be less inclined to brush the question whether the grammar uses FS 14
The Millennium Model's assumption that the competence model is finite state has been maintained by Maurice Gross since his early work with Zellig Harris in the 1960s at the University of Pennsylvania and perhaps earlier. This assumption goes against views normally found in recent processing models, such as those advocated by Gibson (1998) and Lewis (1995).
STRINGS, LISTS AND INTONATION IN GARDEN PATH SENTENCES
173
graphs to break strings up or not off. The problems with these sentences does not stem from sequences of similar constituents. There is nothing against long strings of prepositions occurring in sentences, since they seem natural in sentences like: Babette, please reach in the fridge and pull another bottle of champagne out from down in under next to the foie gras. Maurice Gross and I are actively investigating the syntax and semantics of sentences like this and will develop our ideas about prepositional sequencing in papers to be published shortly after the next millen nium.
References Bader, Marcus. 1998. Prosodic influences on reading syntactically ambiguous sentences. In Fodor and Ferreira (eds.), pp. 1-46. Brown, P. 1969. Augustine of Hippo: A biography. Berkeley: University of California Press. Chomsky, N. 1963. Formal properties of grammars. In Luce, R. D., Bush, R., and Galanter, E. (eds.), Handbook of Mathematical Psychology, Vol. 2, pp. 323418. New York: Wiley. Chomsky, N. and G.A. Miller. 1958. Finite-state languages. Information and Control, I, pp. 91-112. Chomsky, N. and G.A. Miller. 1963. Introduction to the formal analysis of natural languages. In R.D. Luce, R. Bush, and F. Galanter (eds.), Vol 2. pp. 269-322. Church, K. W. 1980. On memory limitations in natural language processing. Master's Thesis, MIT. Distributed by the Indiana University Linguistics Club. Dyer, L. 1999. Classifying self-embedded structures. Unpublished paper, NYU Linguistics Department. Dyer, L. 2000. Availability of alternate representations in parsing. Unpublished paper, NYU Linguistics Department. Este, Aquiles. To appear. Encyclopedia of the philosophy of . S. Peirce. Fairon, Cédrick (ed.). 1998-99. Analyse lexicale et syntaxique: Le Systeme INTEX. Lingvisticœ Investigationes (special volume) XXII, Amsterdam/ Philadelphia: John Benjamins Publishing Company. Fairon, Cédrick. 2000. Structures non-connexes. Grammaire des incises en franqais: description linguistique et outils informatiques. Thèse de doctorat: Université Paris 7. Ferarri-Bridgers, F. 2000. Escaping from the garden path. Unpublished paper, NYU Linguistics Department. Ferreira, F. and J. Henderson. 1993. Reading processes during syntactic analysis and reanalysis. In Canadian Journal of Experimental Psychology 47:2, pp. 247-275 Fodor, J. D. and F. Ferreira (eds.). 1998. Reanalysis in sentence processing. London: Kluwer Academic Publishers.
174
RAY C. DOUGHERTY
Fodor, J. D. and A. Inoue. 1998. Attach anyway. In J.D. Fodor and F. Ferreira (eds.), pp. 101-142. Gibson, E. 1998. Linguistic complexity: Locality of syntactic dependencies. Cog nition 68: pp. 1-76. Gorrell, Paul. 1998. Syntactic analysis and reanalysis in sentence processing. In Fodor, J. D. and A. Inoue (eds.), pp. 201-246. Hicock, TG. 1993. Parallel parsing: Evidence from reactivation in garden path sentences. In Journal of Psycholinguistic Research, Vol. 22:2, pp. 239-249. Kondo, T. and R. Mazuka. 1996. Prosodic planning while reading aloud: On-line examination of Japanese sentences. In Journal of Psycholinguistic Research, Vol. 25:2, pp. 357-381. Lewis, R. L. 1995. A theory of grammatical but unacceptable embeddings. Unpu blished paper, Princeton University Psychology Department. Lewis, R. L. 1998. Reanalysis and limited repair parsing: Leaping off the garden path. In J.D. Fodor and F. Ferreira (eds.), pp. 247-286. Marcus, M. 1980. A theory of syntactic recognition for natural language. Cambridge, Mass.: MIT Press. Miller, G. A. and N. Chomsky. 1963. Finitary models of language users. In R.D. Luce, R. Bush, and F. Galanter (eds.), Handbook of Mathematical Psychology, Vol II, pp. 419-491. Prichett, B. L. 1991. Head position and parsing ambiguity. In Journal of Psycho linguistic Research, Vol. 20, pp. 251-270. Silberztein, M. 1999. Finite state transducers and the processing of natural lan guages. Paris 7: LADL. Silberztein, M. 1999. INTEX: A finite state transducer toolbox. Theoretical com puter science 231:1, pp. 33-46. Silberztein, M. 1999. Text indexing with INTEX. Computers and the Humanities 33:3, Kluwer Academic Publishers, pp. 265-280. Weinberg, A. 1993. Parameters in the theory of sentence processing: Minimal commitment theory goes East. Journal of Psycholinguistic Research 22:3.
LES RELATIFS DE SURFACE JEAN DUBOIS Prof émérite, Université de Nanterre
FRANÇOISE DUBOIS-CHARLIER Université de Provence
Introduction Nous définissons la relativisation comme la réunion de deux propositions dont chacune contient une occurrence du même référent, que ce référent soit explicite dans le cas de relative définie: Il félicita sa secrétaire, qui avait fait diligence X1 avait fait diligence; il félicita X1 ou implicite dans le cas de relative indéfinie: Quiconque commettra une erreur sera disqualifié Quelqu 'un commettra une erreur; ce quelqu 'un sera disqualifié Une des deux occurrences est dans la principale, ou elle constitue l'antécédent; l'autre est dans la subordonnée, où elle est représentée par un relatif; antécédent et relatif ont chacun une fonction grammaticale dans leur proposition. Inversement, quand il n'y a pas réunion de deux propositions ayant chacune une occurrence d'un même référent en une suite comportant deux séquences verbales réunies par un relatif, nous dirons que le relatif n'est pas issu d'une relativisation: la structure est le produit d'un remaniement de la phrase.
1. Un exemple classique de remaniement d'une proposition: la structure clivée Certaines constructions impliquent un remaniement d'une seule phrase de base, a des fins de réorganisation thématique, de focalisation, de mise en relief de tel élément constitutif de la phrase (sujet, objet direct, circonstant, etc.); la suite ainsi produite a la suite de ce remaniement peut comporter l'adjonction d'un relatif, mais elle n'est pas la réunion de deux propositions et n'entre pas dans la structure de la relativisation.
176
JEAN DUBOIS & FRANÇOISE DUBOIS-CHARLIER
L'exemple classique souvent évoqué est la construction clivée. La phrase: C'est Anne qui a commis Verreur ne résulte pas de la réunion de deux propositions, dont la première C'est Anne ne signifierait rien en soi. La phrase représente le remaniement d'une seule proposition: Anne a commis Verreur Le remaniement a consisté á mettre en focus, a focaliser, le SN Anne en le faisant précéder d'une amorce, C'est, ce qui entraine l'apparition d'un marqueur derrière le constituant ainsi isolé (qui, que, etc. selon le cas): Anne a commis l 'erreur 'est Anne qui a commis l 'erreur Quand l'élément mis en position focus est le sujet de la phrase de base, dans la clivée comme dans la phrase simple, le verbe plein s'accorde avec le 'sujet', et, en anglais, un pronom sujet déplacé en position focus peut conserver sa forme de sujet: It is I who am to blame C'est 'je' qui suis fautif L'amorce, elle, est invariable en personne; elle est plus ou moins variable en nom bre en français (ce sont mes parents qui, c'est mes parents qui), et reste invariable en anglais (* it are my parents who). À l'oral, la même focalisation peut se manifester par la simple accentuation du SN en question: Anne a commis Verreur, moi je n 'y suis pour rien et Ton peut concevoir l'encadré c'est... qui comme l'équivalent écrit du coup de projecteur qu'est l'accentuation. Naturellement on peut aussi envisager la dérivation avec relativisation: Une personne a commis l'erreur + Cette personne est Anne → Cette personne qui a commis l'erreur est Anne; puis par extraposition Ce N est Anne qui a commis Verreur → C'est... . L'analyse adoptée ici, remaniement d'une seule proposition plutot que relati visation a partir de deux propositions, repose sur des arguments comme, entre autres: a) on trouve en position focus des éléments qui se prêtent mal a la relativisation, adjectifs, adverbes, etc.: Mais non, il n'est pas stupide, c'est étourdi qu'il est; 'est hier qu 'il fallait agir, etc.; b) des dérivations différentes doivent rendre compte des sens différents de 'est le
LES RELATIFS DE SURFACE
177
gardien / la personne qui m 'a ouvert dans J'avais oublié mes clés, 'est le gardien qui m 'a ouvert [clivée] et dans Qui est ce monsieur? - 'est la personne qui m 'a ouvert [relative]; c) parallélisme entre Toral et l'écrit: coup de projecteur par accentuation ou par mots ajoutés. Ce cas de la clivée étant bien établi, nous ne l'examinerons pas plus avant, notre intention n'étant pas d'étudier dans leur totalité les diverses constructions en c'est qui, dont la complexité a déja retenu de nombreuses études, mais seulement d'examiner certains autres cas, qui rappellent les phénomènes observés pour les clivées.
2. Les phrases de type ''Il y a un/des N qui..." Il s'agit du cas des phrases en français et en anglais du type: Il a quatre personnes qui veulent te parier There are four people who want to see you Le raisonnement suit l'analyse classique pour la phrase simple en il y a, avec un SN et un complément de lieu: Il a quatre personnes dans ton bureau Cette forme provient d'un remaniement a partir de: Quatre personnes sont dans ton bureau les deux constituants, quatre personnes d'une part et dans ton bureau de l'autre, gardent leur nature et leur fonction, et l'existence/localisation exprimée par être est maintenant exprimée par l'amorce il . La même analyse peut s'appliquer aux structures en il où le SN est suivi d'un relatif: Quatre personnes veulent te parier → Il a quatre personnes qui veulent te parier Si la phrase comporte un complément de lieu, son comportement n'est pas le même selon qu'il s'agit d'un complément de phrase ou d'un complément de verbe: Il y avait une personne qui attendait le médecin dans la salle d'attente Il y a des enfants qui jouent au ballon dans le jardin Le locatif complément de phrase peut indifféremment se trouver avec attendait ou il avait:
178
JEAN DUBOIS & FRANÇOISE DUBOIS-CHARLIER
Il avait dans la salle d'attente une personne qui attendait le médecin Il a dans le jardín des enfants qui jouent au ballon En revanche s'il s'agit d'un locatif complément du verbe, le changement de posi tion est agrammatical: Il y a une familie nombreuse qui habite en face de appartement *Il y a en face de appartement une familie nombreuse qui habite Il y a des conférenciers qui arriveront de Paris, tard dans la soirée * Il y a de Paris des conférenciers qui arriveront Même variation de position que dans les phrases de base, sans relatif: Une personne attendait le médecin dans le couloir / Dans le couloir une personne... Des enfants jouent au ballon dans le jardín / Dans le jardín des enfants jouent au ballon Une familie nombreuse habite en face de appartement * En face de appartement une familie nombreuse habite Ces phrases simples (avec le complément a sa place) sont grammaticalement correctes, mais assez "gauches", car elles placent en position de thème des unités qui n'ont pas été référencées précédemment, ces phrases commençant par un SN à déterminant indéfini. Pour pallier le manque de naturel des phrases commen9ant ainsi par un sujet indéfini (dont le référent n'a pas été précédemment repéré), le locuteur procède á certains remaniements "de surface"; ce fait a d'ailleurs depuis longtemps fait l'bjet d'observations. Le plus connu de ces remaniements est le passif de verbes transitifs a objet direct humain (cf. J. Dubois 1966): Des moustiques ont piqué Paul cette nuit → Paul a été piqué cette nuit par des moustiques Une flèche a blessé Paul lors du tournoi → Paul a été blessé par une flèche lors du tournoi Le sujet indéfini n'est plus en position de thème, il devient complément, d'agent ou d'instrument. Le même genre de réorganisation thématique s'applique dans le cas des phrases en il : Un château se dresse en haut du village → Il y aun château qui se dresse en haut du village L'amorce il permet de ne pas avoir un château en position de thème; le thème est ici situationnel, quelque chose comme "la situation est que, le fait est que".
LES RELATIFS DE SURFACE
179
L'analyse par relativisation á partir de deux propositions: Un chateau se dresse en haut du village + Il y a ce château. (ou Il y aun château en haut du village + Ce château se dresse) présente divers inconvénients: incomplétude de la seconde proposition, difficulté de son interprétation, d'où non-synonymie entre les propo sitions de base et la phrase avec il y a, etc. - et ne semble présenter aucun avantage par rapport a Thypothèse d'un remaniement, représentant une réorga nisation thématique, á partir de la seule proposition Un château se dresse en haut du village, L'anglais se prête plus visiblement à cette analyse, pour deux raisons (entre autres): a) l'amorce there is/are est avec be, si bien que le passage de Four people are in your office à There are four people in your office 'montre' l'addition du localisateur situationnel antéposé there (entrainant l'inversion de be); b) dans beaucoup de cas, l'équivalent anglais de il y a SN qui... ferait intervenir, non pas une 'relative', mais une forme Ving normalement associée a be: Téqui valent de Il a quatre personnes qui t'attendent est There are four people waiting for you, formellement lié a Four people are waiting for you. 3. Les phrases de type "Il est des N qui ..." Ce type de fausse relative avec il a est aussi en concurrence en français avec il est, de style littéraire: Il est des gens qui pensent que tout leur est permis Il y a des gens qui pensent que tout leur est permis L'amorce il est est plus clairement existentielle que situationnelle (absence de y), avec un il rappelant l'impersonnel de il existe, et un éventuel complément locatif indique le lieu d'existence ('dans notre monde', etc.) plutot que le lieu de Taction. Là encore, la phrase de base est simple: Des gens pensent que tout leur est permis et le caractère non-référencé, indéfini, du sujet entrame le remaniement de la phrase. Lorsque le sujet de la phrase de base est a référence définie (par exemple un nom propre): Pierre pense que tout lui est permis la phrase avec il est est agrammaticale (il ne sert a rien de poser Texistence de Pierre): *Il est Pierre qui pense que tout lui est permis
180
JEAN DUBOIS & FRANgOISE DUBOIS-CHARLIER
et la phrase avec il a prend un sens un peu différent, 'on peut/doit tenir compte du fait que': - Pourquoi ne pas sortir ? - Eh bien, d'abord, ily a Pierre qui n 'y tient pas; ensuite...
4. Les phrases de type "Il se trouve, se rencontre des N qui..." Le même raisonnement s'applique à d'autres amorces parallèles a il y a; ces cons tructions impersonnelles sont soient intransitives (il existe), soit pronominales (il se rencontre, il se trouve), et impliquent un locatif complément du verbe amorce: 77 se trouvait/rencontrait (dans le groupe/univers) des gens qui condamnaient cette attitude Il était des gens qui... La aussi, le remaniement avec une fausse relative est simultanément lié a une réorganisation thématique de l'information due au caractère indéfini du sujet (le des indiquant ici un quantitatif indéfini) et a une thématisation de type existen tielle, on pose l'existence. Un argument a l'appui de cette hypothèse est le fait que d'autres constructions peuvent apparaïtre a la place de la fausse relative: Il se trouvait/rencontrait des gens pour condamner cette attitude Il avait/ Il était des gens pour condamner cette attitude La forme avec pour et l'infinitif ne s'inscrit pas facilement dans le système des relatives. Une autre dérivation possible pour de telles constructions est 1'extraposition: SN[Des gens qui pensent que tout leur est permis] SN se rencontrent, existent. Le phénomène de 1'extraposition est lui aussi lié à une réorganisation thématique, mais s'il s'agit d'extraposition, la proposition en qui est alors une vraie relative. Une des raisons pour lesquelles nous préférons l'hypothèse du remaniement d'une unique proposition est que le remaniement permet le rapprochement entre toutes les formes examinées ici, il y a, il est, il se rencontre, j'ai, etc. (l'extraposi tion ne convient pas pour toutes), et le rapprochement entre les différents constituants qui peuvent occuper la place de la 'relative', il y a des étudiants dans le train, des étudiants manifestant dans la rue, des étudiants pour préférer l'autre solution, des étudiants qui préferent l'autre solution, etc.
LES RELATIFS DE SURFACE
181
5. Les phrases de type "J'ai un N qui ..." L'analyse esquissée pour ily a s'étend tout naturellement á certaines phrases avec avoir. La encore, on trouve des phrases simples de type: J'ai une pierre dans ma chaussure qui rappellent la forme avec il y a. A partir de la même phrase de base: Une pierre est dans ma chaussure on remanie soit en il a, soit en j 'ai selon que la réorganisation thématique est orientée sur un thème de localisation dans la situation ('la situation est que'), ou sur un thème de localisation chez la personne (' problème est que, je suis dans la situation suivante'). Une pierre est dans ma chaussure. Une tache est sur ton pull Il y a une pierre dans ma chaussure. Il y a une tache sur ton pull J'ai une pierre dans ma chaussure. Tu as une tache sur ton pull Et là encore, on trouve des phrases ou le SN est suivi d'un pronom relatif: J'ai un air qui me trotte dans la tête Tu as un bouton qui est déboutonné que, pour les mêmes raisons que précédemment, nous faisons dériver d'une seule proposition: Un air me trotte dans la tête Un de tes boutons est déboutonné par remaniement syntaxique représentant la localisation 'chez moi/toi, etc.' du fait en question, entraînant l'apparition du marqueur qu- (plus proche au fond, dans cette analyse, du marqueur de complétive que du relatif: J'ai que [une pierre est dans ma chaussure], Tu as que [une tache est sur ton pull], analogue à Il a que je ne veux pas aller, un point 'est tout). Cette analyse permet d'éliminer le problème du type de la relative dans des cas comme: J'ai un mari qui n 'aime pas les voyages Tu as ton jupon qui dépasse S'il s'agissait de vraie relativisation, d'une part la relative ne passerait ni les tests de la relative déterminative ni ceux de la relative appositive, d'autre part la 'principale' ne correspondrait pas au sens: on n'utilise pas Tu as ton jupon qui dépasse pour informer l'interlocutrice qu'elle porte son jupon, on l'utilise pour signifier qu'elle a un problème, a savoir que son jupon dépasse.
JEAN DUBOIS & FRANÇOISE DUBOIS-CHARLIER
182
6. Les phrases de type "Pierre est celui qui ..." Là, les éléments constituants sont différents puisqu'il n'est plus question de SN indéfini, d'amorce, etc. - mais on est tenté de penser que si les mécanismes de remaniement pour focalisation, rethématisation, etc. s'appliquent aux cas ci-dessus, alors il pourrait bien en être de même ici aussi. Ainsi on retrouve dans: Pierre est celui qui a été élu la même idée que le sens est celui de la phrase simple: Pierre a été élu avec focalisation sur Pierre; la même idée que la focalisation pourrait se faire par l'accentuation/intonation sur la phrase simple: Pierre a été élu la même idée de renforcement, redondance, soulignement dans la structure étoffée: Pierre est celui qui a été élu et la même motivation a distinguer deux constructions (vraie et fausse relatives) rendant compte de deux interprétations différentes pour les phrases de ce type, que les contextes font apparaître: Cyril partait gagnant, mais Pierre est celui qui a été élu Mais 'est lequel, Pierre ? - Pierre est celui qui est près de la porte Dans la première phrase, Pierre est celui qui a été élu a le même 'effet clivé' que la clivée 'est Pierre qui a été élu, donc fausse relative. Dans la seconde, Pierre est celui qui est près de la porte a le même sens que Pierre est l'homme qui est près de la porte, vraie relative.
Références Dubois, Jean. 1966. Problèmes de linguistique transformationnelle. Modèles précorrecteurs d'erreurs, Journal de Psychologie 1, pp. 29-56. Summary We have here examined some types of sentences which include a relative pronoun, for which we would like to suggest that the outwardly relative clause may not be a 'true'
LES RELATIFS DE SURFACE
183
relative clause: 'est Pierre qui m 'accompagnera a la gare Il y a des enfants qui jouent au ballon dans le jardín Il est /existe /se trouve des gens qui pensent que... J'ai une mélodie qui me trotte dans la tete Tu as ton jupon qui dépasse Cyril partait gagnant mais Pierre est celui qui a été élu All such structures are interpreted here as resulting, not from a reunion of two clauses through relativization, but from the rearrangement of a single simple clause: Son mari n 'aime pas les voyages → Elle a un mari qui n 'aime pas les voyages. This rearrangement is motivated by focalization or rethematization purposes. It involves the use of a new beginning for the sentence (to set out the focus or to indicate the new theme); as a consequence, the rest of the sentence is marked with a qu- form. We thus call the qu- clause a 'pseudo-relative'.
LES ATTRIBUTS DU COMPLÉMENT D'OBJET 1 ANDRÉ DUGAS Université de Paris XIII - Villetaneuse
Présentation Un domaine particulier de la construction du groupe nominal et de la description des verbes acceptant des attributs fait actuellement l'objet d'un regain d'intérêt.2 Il s'agit de l'étude des compléments du nom désignés plus spécifiquement comme attributs du nom, ces compléments pouvant être assimilés à des cas particuliers de l'apposition. Par exemple, M. Riegel et alii (1994:233-243) mettent en bonne place une description des constructions attributives pour décrire la fonction attribut, les attributs du sujet et les verbes attributifs concernés pour aborder ensuite les attributs du complément d'objet. Sous le thème de la prédication seconde, M. Wilmet de son cote (1997:516-525) range ainsi dans un sous-chapitre sur la Prédication seconde les objets traditionnels d'étude que sont les appositions, les épithètes détachées, les attributs du complément d'objet ou même les apostrophes. Les études d'autres linguistes, tout aussi récentes pour la plupart, témoignent de cet intérêt accra; ce sont, par exemple, I. Bartning (1993), Blanche-Benveniste (1988 et 1991), P. Cadiot (1997), D. Couquaux (1978), B. Defrancq (1996a et 1996b), C. Fuchs (1999), N. Furukawa (1996), R. Gobbe et M. Tordoir (1986), M. Gross (1968, 1975, 1990, 2000), E. Guimier (1999), . Halmoy (1998), G. Kleiber (1988), L. Kupferman (1996), D. Leeman-Bouix (1993), Muller (1998), K. Olsson (1976), K. Olsson-Jonasson (1981), M. Riegel (1985, 1991, 1996, 1997, 2000, 2002), D. Willems (1983), D. Willems et B. Defrancq (2000). C'est dire que cette production récente fournit aujourd'hui une source riche de descriptions pour un domaine d'étude longtemps négligé.
1
2
Autour de 1968, le Laboratoire d'Automatique Documentaire et Linguistique entreprenait les premiers travaux de recherche en lexique-grammaire qui ont déterminé la réputation interna tionale qu'il a acquis. Maurice et moi, alors que je dirigeais le département de linguistique de la toute nouvelle Université du Québec à Montréal, signions les premiers accords de coopération entre nos deux institutions. Notre collaboration et notre amitié datent de ces années. Une première version de ce texte a fait l'objet d'une conférence á Ericeira (Portugal), en septembre 2000.
ANDRE DUGAS
186
Dans cet article, je résumerai d'abord les emplois de l'attribut du complément d'objet, qui s'expriment de façon directe ou indirecte. Fort d'une étude exhaustive terminée sur quelque 12 000 verbes du français et leurs prépositions (A. Dugas 2000a, cf. aussi 2000b, A. Dugas et H. Manseau 1996), j'examinerai ensuite des contraintes ou des problèmes qui entourent la description des constructions attri butives directes ou indirectes. Les propriétés des verbes attributifs et de leurs compléments suivis d'un attribut sont analysées a partird'exemples tirés des dictionnaires et d'extraits de journaux ou empruntés directement l'immense base de données du lexique-grammaire.
1. La notion d'attribut d'objet On distingue les attributs d'objet directs et indirects. 1.1. Les constructions attributives directes Dans leur ouvrage La structure des phrases simples en franqais, 1 - constructions intransitives (1976), les chercheurs Boons, Guillet et Leclère (GL) présentent les constructions a compléments d'attributs et définissent les propriétés de ces constructions dans la table 39.3 La distribution typique présentée, (1)
N0 VN1 N2
est celle où l'attribut est un nom:4 (2) (3)
Il
On a elu Marie presidente a institué Léo son héritier
D'autres distributions sont possibles où l'attribut est un verbe à l'infinitif ou au participe présent, une relative ou un adjectif. Je ne vais retenir que les emplois d'adjectifs (ou de participes passés de la même fonction) dans la construction du type: (4)
N0 VN1 Adj.attribut
Par exemple: (5)
Cela rend la vie facile
La liste des verbes attributifs de ce type n'est pas fermée, témoin les exemples suivants déjà analysés pour la plupart dans les thèses ou articles d'autres linguistes: (6) 3 4
Eva boit son café tiède
Cette table contient un peu moins d'une centaine de verbes. Plusieurs de nos exemples sont repris de cette table 39.
LES ATTRIBUTS DU COMPLÉMENT D'OBJET
187
(7) Il a adopté sa filie (jeune + orpheline) (8) Pak mange son steak saignant (9) La mairie a aménagé des bureaux plus modernes (10) Il garda les yeux fixes De même que les verbes être, sembler, paraitre, devenir, rester, etc. sont essentiellement attributifs du sujet, les verbes d'autres constructions forment un groupe a part; en effet, les N0, les N1 - et les N2 quand il a lieu - de ces verbes sont des noms humains sauf dans de rares cas. Il ne peut en être autrement, dira-t-on, car ces noms dépendent majoritairement: - de verbes de (dé)nomination:5 (11)
Chantal appelle sa filie Andréane
- de verbes d'opinion ou de jugement subjectif: (12)
Léa (croit, juge, estime) son mari ennuyeux
- de verbes d'extériorisation d'opinion: (13)
Sonia a proclamé Max empereur
- de verbes de perception: (14)
Je le (vois + sens) déqu
- de verbes de connaissance: (15)
Nous le savions pauvre
- de verbes de volonté: (16)
Je le (veux + souhaite) gratuit
Voyons maintenant les constructions attributives indirectes. 1.2. Les constructions attributives indirectes En plus des attributs qui se présentent comme ci-dessus, il y a des attributs indi rects, c'est-á-dire qu'ils sont précédés d'une préposition. Les prépositions les plus fréquemment citées comme introductrices d'attributs indirects sont comme et pour. Pour chacune de ces deux prépositions, une cinquantaine de verbes leur est associée: (17) (18) (19) 5
Cet individu a été classé comme dangereux On a agréé ce médecin comme stomato Ruth donne Jean pour gagnant
La répartition fine qui suit est due á Dominique Willems quil'exposée dans une conférence donnée à Tel-Aviv en septembre 2000.
ANDRÉ DUGAS
188 (20)
Il se prend pour un Don Juan irrésistible
(21)
On a choisi Max (pour + comme) 3 joueur de la triplette
Les emplois des prépositions de et en sont plus restreints: (22) (23) (24)
On a déguisé Luc en clown Paul a (changé + transformé) sa petite sœur en statue de sel Léa a (taxé + qualifié + traité) son frère de poule mouillée
Des prépositions complexes comme (a + au) titre de, en tant que... ne sont guère associées type de construction, même si leur fonctionnement est com parable: (25) (26)
On a élu Luc en tant que vert On a élu Luc ä titre de vert
Voyons maintenant quelques remarques sur certaines propriétés des attributs.
2. Les contraintes et les problèmes Une première observation porte sur les contraintes de l'attribut de l'objet quand c'est un adjectif. Mais voyons d'abord des emplois d'attribut du sujet, notion qui nous est familière comme dans: (27)
Ce vin (est + semble + reste) bon
La fonction d'attribut du N0 peut prendre plusieurs formes, par exemple: (28) (29) (30)
Marie est (une) comédienne (nom/adjectif) Cet homme est (*un) travailleur (nom) Paul est (malade + à jeun + en santé + sans le sou (adjectif/gr. prép. adjectival) (31) Il fait un temps splendide (groupe nominal) On constate que dans cette dernière phrase, par exemple, l'attribut du nom peut résulter d'une opération d'effacement: (32) Il fait un temps splendide = il fait un temps qui est splendide même si: (33)
Il fait un sale temps
n'a pas la phrase correspondante, pour des raisons liées au figement: (34)
*Ilfait un temps qui est sale
Dans le cas de l'attribut du N1 l'adjectif n'est pas relié a une transformation d'ef facement. La phrase : (35)
Le médecin a trouvé les enfants malades
LES ATTRIBUTS DU COMPLÉMENT D'OBJET
189
a le sens de: (36)
Le médecin (a constaté + s'est rendu compte) que les enfants (étaient + semblaient) malades
Pour eette phrase, on ne peut avoir l'autre interprétation: (37)
Le médecin a (trouvé + retrouvé) les enfants malades
qu'on peut relier ä une phrase sans effacement: (38)
Le médecin a (trouvé + retrouvé) les enfants qui étaient malades
Cette distinction est importante. On constate deux phénomènes quand l'adjectif attribut de l'objet est dans une relative: soit la phrase obtenue est agrammaticale, soit la phrase est grammaticale mais le verbe a un autre sens: (39)
On répute ce médecin excellent * On répute ce médecin qui est excellent
(40)
On tient les enfants (tranquilles + sages) ≠ On tient les enfants qui sont (tranquilles + sages)
(41)
L 'institutrice a porté un élève (absent + présent + manquant) ≠ L 'institutrice a porté un élève qui est (absent + présent + manquant)
(42)
Le jury a proclamé Max innocent * Le jury a proclamé Max qui est innocent
(43)
Max code ce verbe transitif ≠ Max code ce verbe qui est transitif
(44)
Luc prononce les «s» «z» * Luc prononce les «s» qui sont «z»
Voyons un autre problème. D'une façon plus lache, on peut trouver une sousclasse d'adjectifs dans la même position, comme des adjectifs d'énumération ou de quantité: (45) N0 VN1 Adjq: (46) (47) (48)
Max cote l 'or mille francs On a immatriculé la voiture de Max 75 Max a noté cette copie 18
Ces supposés attributs d'objet font davantage penser a des adverbes. Les phrases suivantes, transformées des premières, les feraient ranger de cette façon: (49) (50) (51)
'est (a + *0) mille francs que Max cote l 'or 'est (en + *0) 75 qu 'on a immatriculé la voiture de Max 'est (? + *0) 18 que Max a noté cette copie
ANDRÉ DUGAS
190
M. Wilmet (1997) opte carrément pour la fonction adverbiale de ees adjectifs adverbiaux ou de ces adverbes adjectivaux. Une troisième observation: quand l'attribut est introduit par la préposition comme, il ne peut être confondu avec un prédicat sans attribut: (52)
Marie recrute Max comme (*un) maitre nageur
Cette distinction est plus difficile a justifier s'il y a un déterminant: (53) (54)
Luc (considère + regarde + traite) Paul comme un frère (+ attribut d'objet) Luc aime Paul comme un frère (- attribut d'objet)
Pour justifier la distinction entre ces sortes différentes de compléments, on dira que l'emploi des attributs d'objet est réserve aux verbes de perception, ce que le verbe aimer n'est pas, faut-il préciser, mais alors qu'en est-il de: (55)
employer (et ses synonymes comme engager, installer, recruter) ou intituler, propulser, saluer, signer...?
(56) (57)
Max a intitulé son livre «Reste» Max a signé ce tableau Miró
Comment intituler une sous-classe d'elements aussi disparates ? Voyons encore d'autres propriétés des attributs de la construction: (58) N0 VN1 N2 (59)
On a (élu + nommé + couronné + désigné + ...) Paul président
(60)
Jean a (appelé + nommé + prénommé + baptisé) son fils Fernand
On peut intervertir les éléments de N1 et de N2 dans leur distribution: (61)
On a (élu + nommé + couronné + désigné + ...) président Paul
(62)
Jean a (appelé + nommé + prénommé + baptisé) Fernand son fils
Quand le N1 des verbes comme élire est effacé, on obtient la phrase (63) On a (élu + nommé + couronné + désigné (un + le) président alors que les phrases de verbes comme appeler sont agrammaticales après effacement du N1: (64) * Jean a (appelé + nommé + prénommé + baptisé) Fernand Cette distinction, déjá établie par Boons, Guillet et Leclère, commande donc éta blissement de deux sous-classes des verbes de (dé)nomination. L'une des propriétés de cette construction révèle encore que l'attribut du nom a une interprétation indéfinie, et qu'il ne peut avoir de déterminant: (65) (66)
Jean a nommé Max lieutenant Jean a nommé Max (*un) lieutenant
LES ATTRIBUTS DU COMPLÉMENT D'OBJET
191
ou dans un exemple déjá cité: (52)
Marie recrute Max comme (*un) maître nageur
À titre de curiosité, il est intéressant de constater qu'en anglais, c'est exactement le contraire qui se produit: (67) (68)
John made Max (*0) lieutenant John made Max a lieutenant
Conclusion Je termine maintenant. Maurice Gross et ses chercheurs Boons, Guillet et Leclère ont été des pionniers dans l'étude des verbes attributifs entrant dans une classe distincte. Les propriétés retenues dans la table 39 constituent une base solide. Le développement de nouvelles études devrait cependant permettre la mise a jour de ces données et leur enrichissement.
Références Blanche-Benveniste, . 1988. Laissez-le tel que vous Vavez trouvé - Propositions pour l'analyse du fameux 'attribut du complément d'objet'. In L. Melis (ed.), La prédication seconde. Travaux de linguistique 17, 51-69. Blanche-Benveniste, . 1991. Deux relations de solidanté utiles pour l'analyse de l'attribut. In M. de Gaulmyn et S. Rémi-Giraud (eds.), Ä la recherche de l'at tribute Lyon: PUL, 83-91. Boons, J.-P., A. Guillet et Ch. Leclère. 1976. La structure des phrases simples en français, 1 - Constructions intransitives. Genève: Droz. Cadiot, P. 1997. Les prepositions abstraites en franqais. Paris: Colin. Couquaux, D. 1978. Sur la syntaxe des phrases prédicatives en français. Lingvisticœ Investigationes III:2, Amsterdam/Philadelphia: John Benjamins. Defrancq, B. 1996a. On the form of object complements in English, French and Dutch. Contragram 5, 5-12. Defrancq, B. 1996b. Object complements in English, French and Dutch: some observations. In A. M. Simon-Vandenbergen, J. Taeldeman et D. Sillems (eds.), Aspects of contrastive verb valency, Studia Germanica Gandensia 40, 125-145. Dugas, A. 2000a. Le verbe et ses prépositions. Montréal: Les Éditions Logiques. Dugas, A. 2000b. Quelques prépositions introduisant des compléments essentiels. In Mélanges offerts ä Gaston Gross a l'occasion de son 60e anniversaire. BULAG - Lexique, Syntaxe et Sémantique. Besançon: Université de FrancheComté, Centre Tesnière, 183-198.
192
ANDRÉ DUGAS
Dugas, A. et H. Manseau. 1996. Les verbes logiques. Montréal: Les Éditions Logiques. Fuchs, . 1999. Les tours qualifiants en *comme N': Jean travaille comme maqon. In Les opérations de détermination. Quantification/Qualification. Actes du colloque, Paris: Ophrys, 63-82. Furukawa, N. 1996. Grammaire de la prédication seconde. Gembloux: Duculot. Gobbe, R. et M. Tordoir. 1986. Grammaire franqaise. Québec: Éditions du Trécarré. Gross, M. 1968. Grammaire transformationnelle du franqais - Syntaxe du verbe. Paris: Larousse. Gross, M. 1975. Méthodes en syntaxe - Régime des constructions complétives. Paris: Hermann. Gross, M. 1990. Grammaire transformationnelle du franqais - Syntaxe de l'adverbe. Vol. 3. Paris: ASSTRIL. Gross, M. 2000. Verbes a trois compléments essentiels. In Melanges offerts ä Gaston Gross à l'occasion de son 60 anniversaire. BULAG - Lexique, Syntaxe et Sémantique. Besançon: Université de Franche-Comté, Centre Tesnière, 199211. Guimier, E. 1999. Les constructions ä prédicat de l'objet en franqais. Aspects syntaxiques, interprétatifs et formes. Thèse, Université Paris 7. Kleiber, G. 1988. Sur les relatives du type 'Je le vois qui arrive'. In L. Melis (ed.), La prédication seconde. Travaux de linguistique 17, 89-117. Kupferman, L. 1996. Les génitifs: gouvernement d'antécédent et gouvernement thématique. Langue Franqaise 109, 109-110. Leeman-Bouix, D. 1993. La grammaire ou la galère ? Des formes au sens. DRDP Midi-Pyrénées. Muller, 1998. La portée variable des constructions attributives. In Analyse lin guistique et approches de l'oral, Louvain/Paris: Orbis-Supplementa, 239-247. Olsson, K. 1976. La construction verbe + objet direct + complément prédicatif en franqais. Thèse, Université de Stockholm. Olsson-Jonasson, K. 1981. Thème, rhème, focus et la construction avec attribut de l'objet. Lingvisticœ Investigationes V:l, Amsterdam/Philadelphia: John Benja mins, 137-168. Riegel, M. 1985. L'adjectif attribut. Paris. PUF. Riegel, M. 1991. Pour ou contre la notion grammaticale d'attribut de l'objet: critères et arguments. In M. de Gaulmyn et S. Rémi-Giraud (eds.), À la recherche de l'attribut Lyon: PUL, 99-119. Riegel, M. 1996. Les constructions á élargissement attributif: double prédication ou prédicats complexes? In C. Muller (ed.), Dépendance et intégration syntaxique, Tübingen: Niemeyer, 189-197. Riegel, M. 1997. De 'Il a les yeux bleus' à 'Je n'ai pas le cinq-á-sept facile': les avatars de la construction attributive de avoir. Travaux et Recherches en lin guistique appliquée, série . 1, 99-108.
LES ATTRIBUTS DU COMPLÉMENT D'OBJET
193
Riegel, M. 2000. Conditionnements méronomiques en syntaxe: trois construc tions revisitées... et les autres. Scolia 12. Riegel, M. 2002. Les constructions a élargissement attributif de l'objet: des phrases complexes du troisième type. In Actes des Rencontres de Linguistique BeNeFri-Strasbourg de Münchenwiler, Scolia 14. Riegel, M. Pellat, J.-C. et Rioul, R., 1994. Grammaire méthodique du frangais. Paris: PUF. Willems, D. 1983. Regarde voir - Les verbes de perception visuelle et la complé mentation verbale. In E. Roegiest et L. Tasmowski (eds.), Verbe et phrase dans les langues romanes, Romanica Gandensia XX, 147-158. Willems, D. et . Defrancq, 2000. L'attribut de l'objet et les verbes de perception. Longue française 127, 6-20. Wilmet, M., 1997. Grammaire critique du frangais. Gembloux: Duculot / Paris: Hachette. Summary This paper reports on a study of the attributes associated with the direct or indirect object. These attributes are of the kind: On a élu Marie présidente Cet individu a été classé comme dangereux Je le vois déçu The list of verbs operating with this construction comesfroman exhaustive dictionary of French verbs and their properties compiled by the author, who also bases his review of this subject on the well known lexique-grammaire created under the direction of the late Professor Maurice Gross and his researchers at the Laboratoire Automatique Documen taire et Linguistique (see Table 39 in Boons, Guillet et Leclère, 1976). The main constraints and problems are briefly reviewed and a sketch of the sub-classes is given.
UNE ÉTUDE DE CORPUS POUR ÉCLAIRER LA QUESTION DU VERBE DE L'INCISE EN FRANÇAIS 1 CÉDRICK FAIRON CENTAL - Université Catholique de Louvain-la-Neuve
Introduction Les verbes susceptibles d'apparaître en incise (comme dire dans l'exemple 1) et donc d'introduire un discours rapporté font l'objet d'une terminologie riche, ils sont appelés verbes parenthétiques (notamment B. de Cornulier 1973, L. Rosier 1999), verbes de parole {verba dicendi) (M. Monville-Burston 1993) ou encore verbes héteroscopiques ou "dédoubleurs de point de vue" (J. Larochette 1980). (1)
Jean arrivera demain, dit Max
Cette classe de verbes est assez large: elle s'étend a un certain nombre de verbes a priori non-déclaratifs (par exemple: grincer, siffler, souffler, etc.) et on remarque par ailleurs un phénomène de productivité, souvent introduit par le jeu verbal.2 Ce phénomène de productivité est souligné par la plupart des auteurs: M. Grevisse & A. Goosse (1993: §407, 3°), M. Wilmet (1992, 1997: §692, Rem.2) ou encore 1
2
Cette étude a été réalisée dans le cadre de ma these de doctorat, au Laboratoire d'Automatique Documentaire et Linguistique (LADL, Université Paris 7), sous la direction du Pr. Maurice Gross (cf. . Fairon 2000a). G. Michaux (1996), dans son Cours de littérature contemporaine, montre que les incises sont utilisées d'une manière très particulière chez les auteurs du courant dit « post-moderne »tels que Christian Oster (Volley-ball 1989), Christian Costa (L'été deux fois, 1990), Jean-Philippe Toussaint (La salle de bain, 1995) ou encore Jean Echenoz (dans toute son oeuvre, de 1979 a 1989). D'une part, elles sont extrêmement fréquentes, et d'autre part, les verbes qu'elles renferment sont très diversifiés (des créations lexicales sont souvent réalisées par jeu par les auteurs. Par exemple mi-vocaliser ci-dessous. Voici à titre d'exemple quelques passages dialogués de Chero kee, roman de Jean Echenoz (Paris: Editions de Minuit, 1983): -Il a quelqu 'un, mi-vocalisa-t-il, il n 'y a personne ? (p. 49) - Oh merde, énonga-t-il malaisément [...] - Trucs sans colorants, produisit-il encore. (p.94) - 'estç,fitBock, lui casser la geule, lui casser la gueule. Peut-être que 'est . - Bien, exprima l 'autre. - J'ai u tort de m 'énerver, jugea Bock. D 'ailleurs, je crois que 'est l'heure. - Est-ce que cette rivalité, voulut dire l'homme assis. - Laissez tomber, dit , 'est l'heure. (p. 67)
196
CÉDRICK FAIRON
L. Rosier (1999:249) et sert souvent à justifier l'absence de tout recensement. Certains auteurs mettent clairement en doute la possibilité même d'établir une classe de verbes parenthétiques: B. de Cornulier (1975), par exemple, critique la notion même de parenthétique et les tentatives de description formelle du pro blème de l'incise. L'étude des incises que nous avons réalisée (. Fairon 2000a et b) avait pour objectif de produire une description linguistique de ces structures qui soit exploi table par informatique; le but final étant d'identifier automatiquement les incises dans les textes et de les analyser.3 Cet objectif d'automatisation nécessitait un re censement et une description de ces verbes. Pour ce faire, nous sommes parti des tables de verbes du lexique-grammaire (M. Gross 1975; J.-P. Boons, A. Guillet et Leclère 1976) et avons ensuite procédé à des études de corpus. Plus de 740 verbes simples et composés susceptibles d'apparaitre en incise ont été recensés. L'importance de ce nombre apparaît clairement quand on le rapproche des données recueillies lors de l'étude de corpus qui va être présentée ci-dessous. Cette étude a porté sur quatre romans (deux romans du XIX et deux du XX siècles) et deux corpus de presse: nous avons identifié 17 verbes différents en incises dans Le Rouge et le Noir (ci-après LRLN),4 31 dans Notre-Dame de Paris (NDP), 53 dans un extrait du journal Le Monde de taille équivalente a LRLN et NDP (lm94), 65 dans un extrait du journal Le Soir de taille équivalente a LRLN et NDP (ls95), 42 dans Jusqu'à preuve du contraire (JPDC) et 17 dans Oubliez Adam Weinber ger (AW); ce qui fait, tous corpus confondus, un total de 133 verbes différents. Cette étude de corpus nous a permis de jeter un regard critique sur une asser tion commune a la plupart des auteurs ayant étudié l'incise et selon laquelle le verbe le plus fréquent en incise est dire et le temps le plus usité est le passé simple. Nous allons expliquer de quelle manière les données que nous avons re cueillies contredisent cette affirmation ou tout au moins demandent qu'elle soit précisée.
1. Observations quantitatives sur les verbes L'étude quantitative que nous avons réalisée sur différents corpus avait pour but premier de rassembler des données concrètes sur la fréquence des incises et sur l'utilisation des verbes dans ces constructions. Cette étude a été réalisée semi-automatiquement: nous avons utilisé le logiciel INTEX (M. Silberztein 1993; Fairon 2000c). INTEX est un logiciel de traitement de corpus mais aussi un environnement de développement pour linguistes (il propose une série d'outils permettant la création de dictionnaires électroniques et 3
4
Le système de reconnaissance mis au point est composé d'une bibliothèque de grammaires locales (développées avec le logiciel INTEX) et de dictionnaires électroniques (principalement, les dictionnaires du LADL). Les références de ces corpus sont données dans la bibliographie.
197
VERBE DE L'INCISE EN FRANÇAIS
de bibliothèques de grammaires locales). Nous l'avons utilisé pour analyser nos corpus et relever toutes les structures dont la forme correspondait a celle de l'incise. Nous nous sommes limité aux incises du type dit-il dont l'ordre sujet-verbe est inversé (e.g.: P, a dit le ministre; P, ajouta-t-elle; P, nous a répété J. R. K.). Pour effectuer la recherche, nous avons utilisé une expression réguliére rudimen taire du type: (,+ ?+!+"+...)(E+rne+m'+te+t'+lui+nous+vous+leur+se+s') Cette expression permet de localiser toutes les occurrences des verbes (< V> dans l'expression) apparaissant directement après un signe de ponctuation (avec éventuellement un pronom entre le signe de ponctuation et le verbe). Ensuite, nous avons trié manuellement les listes constituées pour ne retenir que les cas qui correspondaient effectivement a des groupes performatifs.
2. La presse Nous avons examiné deux corpus de presse de volume égal: 1 Mo de texte extrait du journal Le Monde de 1994 (ci-dessous lm94) et 1 Mo de texte extrait du journal Le Soir de 1995 (ci-dessous ls95). Dans les deux cas, nous avons pris un extrait en tête du corpus (soit environ les 12 000 premières lignes de texte, la taille d'un corpus de presse d'une année entière dépassant la centaine de Mo). Nous pouvons donc considérer que nous avons travaillé sur des corpus de tailles ä peu près égales et que les phénomènes relevés en grand nombre sont donc des phénomènes fréquents. L'observation des deux corpus montre qu'ils sont assez semblables, du point de vue des fréquences d'utilisation des incises et de l'usage des verbes en incises:
Nombre d'incises identifiées Étendue du vocabulaire (nb. de V différents) Nombre total de verbes pour les deux corpus
lm94 345 65 91
ls95 334 68 91
Tableau 1. Nombre d'incises identifiées dans lm94 et ls95 Dans les deux cas, seuls dix verbes apparaissent plus de 10 fois chacun et sur ces dix verbes, 7 sont communs aux deux journaux (ces verbes sont présentés dans les cases grisées du tableau 2). Cette observation rejoint les conclusions que M. Monville-Burston (1993) présentait pour l'utilisation des verbes de parole dans la presse (sans distinction de structures syntaxiques). Dans son article, l'auteur constate que sur les 200 verba dicendi recensés dans un corpus composé de 120 articles issus de trois journaux différents (Le Monde, France-Soir, Les Nouvelles Calédoniennes), dix verbes se répartissent 59% des occurrences (dire, déclarer, affirmer, estimer, annoncer, expliquer, ajouter, souligner, précis er, indiquer).
CÉDRICK FAIRON
198
Le tableau 2 présente par ordre croissant de fréquence les verbes les plus utilisés en incise. La partie gauche du tableau présente les verbes les plus fré quents dans lm94 et une comparaison avec ls95. La partie droite présente un classement des verbes les plus utilisés en incise dans ls95 et une comparaison avec leur fréquence dans lm94.5 écrire estimer souligner préciser indiquer afflrmer déclarer dire expliquer ajouter
lm94 13 14 14 22 24 28 28 34 37 40
ls95 4 14 8 23 13 12 18 29 54 9
annoncer poursuivre afflrmer indiquer estimer commenter déclarer préciser dire expliquer
ls95 11 12 12 13 14 16 18 23 29 54
lm94 8 2 28 24 14 2 28 22 34 37
Tableau 2. Usage des verbes en incise dans la presse Les verbes de ce tableau sont des verbes qui permettent de rapporter le discours de manière "neutre", sans ajouter de sens particulier. Étant de ce fait applicables a un maximum de situations, il est sans doute normal qu'ils soient les plus fréquents. Des verbes comme souffler, grincer, maugréer, rétorquer, également attestés, ont un sens plus spécialisé: ils précisent la manière dont a été dit le propos (dire en Vant: soufflant, gringant) qu'ils rapportent ou le contexte dans lequel ce propos a été tenu {rétorquer = dire en réponse a, renchérir = dire encore plus). Le verbe dire n'est dans aucun des deux journaux le verbe le plus utilisé en incise, ce qui permet de nuancer l'idée reçue selon laquelle dire serait inconditionnellement le verbe le plus fréquent en incise (par exemple, L. Rosier 1999: 260). Il semble tout au moins nécessaire d'ajouter à cela que la nature des corpus est déterminante. On soulignera que L. Rosier relie justement son obser vation aux conclusions de M. Dessaintes dont le corpus était exclusivement composé d'œuvres littéraires (cf. M. Dessaintes 1960: pp. 220-221). Celui-ci avait relevé dans son corpus 3 569 occurrences du verbe dire dans des structures du genre dit-il, contre 785 occurrences pour le verbe faire qui occupait le rang deux des fréquences. 3. Romans du XIX Nous avons effectué le même comptage dans deux romans du XIX siècle: Le Rouge et le Noir (992 K, ci-dessous LRLN) et Notre-Dame de Paris (1 Mo, ci5
Pour le tableau complet des fréquences observées, cf. Annexe.
VERBE DE L'INCISE EN FRANÇAIS
199
dessous NDP). Dans ces corpus, le nombre d'incises était nettement supérieur au nombre relevé dans le corpus de presse, mais l'étendue du vocabulaire était nette ment plus limitée (35 verbes différents dans les romans contre 91 dans la presse). L'auteur unique est sans doute un des facteurs expliquant cette différence de voca bulaire (la presse étant un recueil d'articles d'auteurs et donc de styles différents).6 LRLN 1312 17 35
Nombre d'incises identifíées Etendue du vocabulaire (nb. de V différents) Nombre total de verbes pour les deux corpus
NDP 1248 31 35
Tableau 3. Nombre d'incises identifíées dans LRLN et NDP 17 verbes ont une fréquence absolue supérieure a 10 dans NDP et 8 dans LRLN. Nous les présentons dans le tableau ci-dessous.7
demander grommeler murmurer observer poursuivre repartir s'écrier crier répliquer répondre répéler continuer
LRLN 0 0 0 0 0 0 0 7 9 13 14 34
reprendre ajouter penser se dire
61 91 162 273
dire
578
NDP 45 18 22 15 27 15 64 91 13 116 23 10 148 29 18 11 547
continuer se dire répliquer observer repartir penser grommeler murmurer répéter poursuivre ajouter demander s'écrier crier répondre reprendre dire
NDP 10 11
LRLN 34 273
13 15 15 18 18 22 23 27 29 45 64 91 116 148 547
9 0 0 162 0 0 14 0 91 0 0 7 13 61 578
Tableau 4. Usage des verbes d'incise dans LRLN et NDP Les verbes communs aux deux corpus sont présentés dans les cases grisées du tableau. 6
La date de publication de ces romans pourrait être un autre facteur, mais comme le paragraphe suivant le montre, les chiffres obtenus dans l'étude des romans contemporains permettent de tirer les mêmes conclusions. 7 Pour le tableau complet desfréquencesobservées, cf. Annexe.
CÉDRICK FAIRON
200
Cette fois le verbe dire est de loin le plus fréquent et le passé simple le temps le plus employé en incise (995 verbes au passé simple sur 1 312 incises dans LRLN et 1 117 sur 1 250 dans NDP). Le deuxième temps utilisé est l'imparfait avec 312 occurrences dans LRLN et 118 dans NDP. L'usage des autres temps est occasionnel (dans LRLN: 2 Vau présent; 3 V au plus-que-parfait et dans NDP: 5 V au présent, 7 V au passé composé et 3 Vau plus-que-parfait). Remarque: une étude littéraire approfondie pourrait certainement tirer parti de ce tableau de fréquences. Comme on le sait, ces deux romans sont des "fresques sociales" qui dépeignent des paysages très différents. Il semble que cette opposi tion se traduise dans les choix lexicaux: du cótéùl'dépeint le peuple, on crie, s'écrie, grommelle et murmure et du côté ou l'on dépeint la noblesse le clergé on pense, on se dit et on ajoute... 4. Romans contemporains Les romans analysés sont Oubliez Adam Weinberger (AW) de Vincent Engel (1999) et Jusqu'à preuve du contraire (JPC) de Bérengère Deprez (1995).8
Nombre d'incises identifiées Etendue du vocabulaire (nb. de V différents) Nombre total de verbes pour les deux corpus
JPC 199 43 54
AW 64 19 54
Tableau 5. Nombre d'incises identifiées dans JPC et AW
ironiser répéter suggérer faire \ pemer
dire
JPC 3 3 5 10 17 117
AW 1 2 0 0 3 19
ajouter pemer crier répondre demander dire
AW 2 3 3 9 9 19
JPC 1 17 0 0 2 117
Tableau 6. Usage des verbes d'incises dans JPC et NDP
8
Ces deux romans nous ont été donnés par leurs auteurs sous forme électronique. C'est un plaisir de les remercier une fois encore.
YERBE DE L'INCISE EN FRANÇAIS
201
5. Remarque sur le démarquage graphique Pour des raisons d'intelligibilité, l'incise est démarquée de la phrase matrice par la ponctuation (a Toral cela se traduit généralement par une intonation particulière).9 Le plus souvent, il s'agit de virgules qui encadrent, précèdent ou suivent l'incise, selon la position que celle-ci occupe dans la phrase. Le démarquage peut éventuellement être renforcé par la présence de guillemets délimitant la phrase matrice. Nous présentons ci-dessous des exemples tirés des romans et journaux étudiés: Littérature: (2) "Mon ami, cria-t-elle ä son mari, 'est le démon ! Il devine tout..." (LRLN) (3) "Il vous perd", dit Héléneau meurtrier (LRLN) (4) Quel ! dit le prince en éclatant derire(LRLN) (5) Je vous avouerai..., dit-il a Vacadémicien, et sonœilcontinuait a interroger (LRLN) (6) Si nous étions encore au temps des lettres de cachet!... dit-il (LRLN) (7) A quoi bon le nier? dit-il enfin; je serai un lâcheä ses yeux (LRLN) (8) Tant pis! dit Julien; du moins, quand on fait des crimes, faut-il les faire avec plaisir (LRLN) (9) Bon, dis-je, j'en aurai pour plus de quinze jours à laver le plancher (NDP) (10) Sainte Vierge ! murmura Gringoire, le roi d'ici, ce doit être un bouc (NDP) (11) "Le matin ou Vaprès-midi ? ", répondl'hommeen soupirant (A W) Presse: (12) Le ciné, 'est la communion des regards et des plaisirs, dit Pierre Tchernia (ls95) (13) L'année prochaine, on ne me refera plus ce coup-lá! clamait, un déçu, Claude Fontaine (ls95) (14) 'Il faut espérer, ajoutent-ils, quecetaccord levera toutes les incertitudes" (lm95) (15) "Ce qui prime, c'est l'idée selon laquelle l'effort sera répartíde façon équi table", concluí Pierre Giacometti de BVA (lm94) On remarquera l'usage original du point-virgule dans l'exemple 7 où il marque la fin de l'incise et le retour dans la phrase matrice. Les observations que nous avons réalisées sur des corpus littéraires et des corpus de presse nous permettent de dire que le démarquage des performatifs par la ponctuation ne se fait pas de manière identique dans les journaux et dans les romans: dans les corpus de presse que nous avons étudiés, le signe de ponctuation utilisé est presque toujours une virgule: nous avons compté seulement 4 excep9
D. Delomier et M.-A. Morel (1986:142 et svt.) ont observé quatre caractéristiques intonatives générales des incises: il y a une rupture de la courbe mélodique, une accélération du débit, une intonation montante marque la fin de l'incise, et des pauses diverses apparaissent avant et surtout après l'incise.
202
CÉDRICK FAIRON
tions dans ls95 (sur 334 phrases a incise) et aucune exception dans lm94. Dans les deux romans observés (NDP, et LRLN, chacun d'une taille avoisinant 1 Mo), nous avons rencontré de très nombreuses occurrences de points d'interrogation ou de points d'exclamation ainsi que quelques occurrences de points de suspension: nous avons trouvé plus de 450 occurrences de ces trois signes confondus dans NDP et plus de 130 occurrences dans LRLN. Par ailleurs, les deux journaux observés utilisent des conventions différentes en ce qui concerne l'usage des guillemets. Presque tous les propos rapportés auxquels se rattachent les performatifs sont placés entre guillemets dans lm94 (l'exemple 16 montre une exception qui se justifie sans doute par le fait que l'incise se trouve au milieu de la phrase matrice) alors que dans ls95, c'est exceptionnel. (16) Le gouvernement de M. Balladur, a-t-on toujours affirmé au Quai d'Orsay, entendait être plus prudent (lm94) Les guillemets servent également ä démarquer les propos qui appartiennent au sujet de l'incise des propos du locuteur10 (ici le journaliste):
(17) "D'importants sites industriels" devaient aussi être la cible d'"explosions gigan tesques", a-t-il ajouté, soulignant que des "dizaines" d'islamistes ont été arrêté en possession "de Schémas des attentats, ainsi que d'armes et d'explosifs" (lm94) Il est clair que les différences soulignées entre ls95 et lm94 proviennent du fait que les deux journaux ont établi des conventions typographiques différentes. est probable que l'observation d'autres journaux permettrait de mettre en évidence d'autres pratiques. On notera cependant que si les deux journaux adoptent des con ventions différentes, ils se rapprochent tout de même par le fait que le signe de ponctuation servant a démarquer l'incise de la phrase matrice est (presque) toujours la virgule alors que dans les textes littéraires la variété est nettement plus grande (le signe démarqueur étant également utilisé pour ajouter une dimension expressive dans un dialogue).
Conclusion Nous pouvons conclure au vu de ces observations qu'il est important de prendre en considération la nature des corpus dans les études portant sur l'incise. Comme nous l'avons montré, les incises des corpus de presse et des corpus littéraires se distinguent au moins de trois manières: - l'usage de la ponctuation servant à délimiter l'incise (plus varié dans la littérature que dans la presse, cf. 1.4); - le verbe de plus haute fréquence (dire, le verbe le plus fréquent dans les textes littéraires, est concurrencé par d'autres verbes dans les textes de presse); 10
Nous appelons locuteur la personne qui prononce la phrase complète, phrase matrice et incise.
VERBE DE L'INCISE EN FRANÇAIS
203
- le temps verbal de plus haute fréquence (le passé simple dans les textes littéraires vs le passé composé et le présent dans les textes de presse). Dans les différents romans que nous avons analysés, le verbe dire est toujours apparu comme étant le plus fréquent et le passé simple, le temps le plus usité. Dans les corpus de presse par contre, les temps les plus usités sont le présent et le passé composé: environ 85% des verbes d'incises dans la presse sont conjugués á Tun de ces temps (pour plus de détails, voir les tableaux de ). Le verbe dire n'est plus le verbe de plus haute fréquence: dans les corpus de presse que nous avons étudiés, les verbes expliquer et ajouter ont une fréquence supérieure. La spécialisation de la fonction de l'incise dans ces deux types de textes explique sans doute ces différences: d'un coté elle est utilisée comme support de la narration dialogique et de l'autre comme un procédé stylistique permettant de rapporter les propos d'autrui, ce qui constitue, c'est évident, une des activités essen tielles des journalistes. Références Boons, Jean-Paul, Alain Guillet et Christian Leclère. 1976. La structure des phrases simples en frangais. Constructions intransitives. Genève: Droz. Cornulier, Benoît de. 1973. Considérations illustrées de quelques arbres et enrichies de plus de mille exemples sur les incises en français contemporain. Thèse de troisième cycle: Université de Provence. Cornulier, Benoït de. 1975. La classification "formelle" des verbes parenthétiques. In Rapport scientifique annuel du Centre de recherche en Informatique et linguistique (CRIL) à la DGRST, Université d'Aix-Marseille, pp. 51-61. Delomier, D.; M. A. Morel. 1986. Caractéristiques intonatives et syntaxiques des incises. DRLAV34-35, Paris: Université Paris-6, pp. 141-160. Dessaintes, Maurice. 1960. La construction par insertion incidente. Paris: d'Artrey. Fairon, Cédrick. 2000a. Structures non-connexes. Grammaire des incises en frangais: description linguistique et outils informatiques. Thèse de doctorat: Université Paris 7. Fairon, Cédrick. 2000b. Structures non-connexes. Grammaire des incises en français: description linguistique et outils informatiques. Résumé de thèse, in Lingvisticœ Investigationes, Amsterdam/Philadelphie: John Benjamins Publi shing Co. Fairon, Cédrick (ed.). 2000c. Analyse lexicale et syntaxique: le systeme INTEX. Lingvisticce Investigationes XXII (Volume spécial). Amsterdam/ Philadel-phia: John Benjamins Publishing. Grevisse, Maurice; André Goosse. 1993. Le Bon Usage. 13 édition, revue et augmentée. Louvain-la-Neuve: Duculot.
204
CÉDRICK FAIRON
Gross, Maurice. 1975. Méthodes en syntaxe. Régime des constructions complétives. Paris: Hermann. Larochette, Joe. 1980. Le language et la réalité. L 'emploi des formes de Vindicatif en français (2e Volume). München: W. Fink. Michaux, Ginette. 1996. Cours de littérature contemporaine. Notes d'étudiant non publiées, Louvain-la-Neuve: Université Catholique de Louvain. Monville-Burston, Monique. 1993. Les verba dicendi dans la presse d'informa tion. In Langue Franqaise 98, Paris: Larousse, pp. 48-66. Rosier, Laurence. 1999. Le discours rapporté. Histoire, théories, pratiques. Coll. Champs Linguistiques, Bruxelles: De Boeck. Silberztein, Max. 1993. Dictionnaires électroniques et analyse automatique de textes. Le Système INTEX. Paris: Masson. Wilmet, Marc. 1992. Incise et incidentes. In G. Gréciano et G.Kleiber (eds.), Systèmes interactifs. Mélanges en Vhonneur de Jean David, Metz: Université de Metz, pp. 523-532. Wilmet, Marc. 1997. Grammaire critique du français. Louvain-la-Neuve: Duculot, 670 p. Corpus littéraires Deprez, Bérengère. 1995. Jusqu'à preuve du contraire. Bastogne: Editions Delperdanche. Echenoz, Jean. 1983. Cherokee. Paris: Les Editions de Minuit. Engel, Vincent. 1999. Oubliez Adam Weinberger. Paris: Fayard. Hugo, Victor. 1831. Notre-Dame de Paris. Edition électronique de l'ABU, dispo nible à l'adresse http://cedric.cnam.fr/ABU. Stendhal. 1830. Le rouge et le Noir. Edition électronique de l'ABU, disponible a l'adresse http://cedric.cnam.fr/ABU.
Summary This paper presents a corpus-based study of the class of French verbs like dire in Jean arrivera demain, dit Max, used to introduce indirect speech. We compare literary and press corpora and show that such 'comment clauses' have a different function in the two types of corpora, characterised by the use of different verbs, tenses, and punctuation marks. Our study shows that the commonly-accepted idea that the primary reporting verb is dire, and the most frequent tense is simple past, is not accurate.
VERBE DE L'INCISE EN FRANÇAIS
205
ANNEXES: FRÉQUENCES DES VERBES DANS LES INCISES DU TYPE DIT-IL Les zones grisées signalent que le verbe en tête de ligne n'est pas représenté dans le corpus désigné au dessus de la colonne. Dans la presse
1 18 8 13 74 7 1 1
7 7 1
1 28 40 8 2
1
3 9 3 3
Total
Imparfait
Présent Passé comp.
Total
Plus-queparfait Passé simple
Imparfait
Passé comp.
Présent admettre affïrmer ajouter annoncer apprendre (on) approuver arguer argumenter asséner assurer avancer avertir avouer clamer commenter completer conclure confier eonfïrmer constater corriger couper declarer demander dénoncer déplorer dire écrire entend-on entendre estimer
Plus-queparfait passé simple
Le Soir 95 (1 Mo)
Le Monde 94(1 Mo)
2 3 5 7
5 12 9 11
1 1
1
1 1 1 3 1
1 2 1 6 2 1 1 1 1
3 1
1
2 " ■ - ,
1
1 1
3
1 2 1
6
19
3
2 11 1 4 3 7 2 1 3
28
1 2 2
1 2
1
1
8
2 1
15
2 1
2 9 12
13
1
2 1
23
2 34 13 4 1 14 13
•
2
Í
1
,
5
1 1
5
1 18
1 3 1 16 9 9 3 3 1 1 18 2 1 1 29 4 1 1 14
CÉDRICK FAIRON
30
6
6 16 1 1 1 2 2
6 1 1 1
11
1 2
1
37 41 8 2 3 1 1 1 24 2 11 1 1 1 1 1 1 2 1 3 2 1 1 1 6 1 1 2 11 1 22 16 3 1 1 2 1 1 2 1 1 1 5 8 6 4 4 2 1 1 2 2 1 1 1 3 2 2 1 2
3
Total
Imparfait
Présent
Total
Passé simple
1
54^ 3 3 2 1
2 1 1
13 0 2 1
1 3
5 1 1 1
■ <
1 11
1 2 1 1 1 5 4 2
Plus-queparfait
Imparfait
Passé comp.
Présent expliquer faire faire remarquer glisser grmcer hurler indiquer insister ironiser juger jurer lancer maintenir maugréer noter observer pense-t-on poursuivre préciser préconiser prétendre prévenir prévoir proclamer promettre proposer protester raconter rappeller rapporter rassurer rectifier regretter relever remarquer renchérir répéter répondre
Plus-queparfait passé simple
Le Soir 95 (1 Mo)
Le Monde 94 (1 Mo)
Passé comp.
206
2 2
1 1 3 1
2
12 23 1 3 2 0 1
2 2
1
8 6 2 1 0 2
1
■
1
1 2 3
VERBE DE L'INCISE EN FRANÇAIS
resumer rétorquer révéler ricaner se consoler se défendre se lamenter se plaindre se rappeler se réjouir se souvenir s'écrier s'emporter s'exclamer signaler s'indigner s'inquiéter s'interroger souffler souligner soupirer sourire vociférer
2
2 1
Total
Plus-queparfait passé simple
Imparfait
Présent 2
1
Passé comp.
Le Soir 95(1 Mo)
Total
Passé simple
Plus-queparfait
Imparfait
Présent
Passé comp.
Le Monde 94 (1 Mo)
207
3 1
i
1 1
1 1 1 1 1 1
1 1 2
3 1 1 1
2 2
2
1 1 2 8 2
6
Total 189 122
14 2 „
18
4 27
1 6 1 1 1
1 8 1 1 1
2
345 205 71 22
0 41
334
CÉDRICK FAIRON
208
Dans deux romans du XIX siècle
se demander croire faire écnre remarquer se répéter grogner souffler objecter chuchoter glapir chanter soupirer bégayer hurler répondre balbutier interrompre continuer se dire répliquer observer repartir penser grommeler ¡murmurer [répéter poursuivre ajouter demander s'écrier crier répondre |reprendre dire Total
1 1 1 2 1 7
1 1 1 2 1 7
Total
passé simple
Plus-queparfait
Imparfait
Présent
Passé comp.
Notre-Dame de Paris (1 Mo)
Total
Passé simple
Plus-queparfait
Imparfait
Présent
Passé comp.
Le rouge et le noir (992 K)
1 1 1 1 1 1 1 2 3 4
9
48
5 135 6
29 138 3
4 4
57
34 273 9
1 3
7
1 6 7 9 1
1 44
7 15
118
162
7
14
76
91
2 4 4 4 2 3
1
2 2 2 2
78 0 312
3 3
5 13 59 497 995
7 13 61 578 1312
17
4 5
17 44 7 118
1 3
13 14 15 16 14 18 19 25 25 45 62 74 116 131 498 1117
2 3 4 4 5 6 7 10 11 13 15 15 18 18 22 23 27
29 45 64 91 116 148 547 1248
VERBE DE L'INCISE EN FRANÇAIS
209
Dans deux romans du XX siècle
affirmer ajouter articuler balbutier crier croire commencer commenter conclure comprendre continuer décider demander dire émettre expirer expliquer exploser faire grogner grommeler gueuler intervenir ironiser lexpliquer suggérer Imaugréer Imenacer loser Ipenser Iplaisanter poursuivre proposer protester Iraier
1 1 1
1
1 1
Total
passé simple
Plus-queparfait
Imparfait
Passé comp.
Présent
Adam Weinberger (447 )
Total
Passé simple
Plus-queparfait
Imparfait
Passé comp.
Présent
Roman de LLN (200 )
1 1
2 2
1 3
1 3 2
2 1 1 2
1 1 2
1
1
2 1
2 1
1 13
1
2 102 1 1
2 117 1 1
6
2
1 9 11
1
8
1 10 2 2 1 1 3 1 5 1 1
1 10 2 2 1 1 3 1 5 1 1
9 1
17 1
1 1 1
1 1 11
1 9 19 1
1
1
1 3
2
3
3
CÉDRICK FAIRON
1
1 2
1 3 lililí
Total
passé simple 8
2 9
1
1
2 1
1 1 1 1 2 1 1 1 1 2
i
2 1 1
Imparfait
Présent
Total
Plus-queparfait Passé simple
Imparfait
Présent Passé comp. remarquer répéter répondre reprendre rever rigoler scander songer soupirer sourire sursauter téléphoner jricaner s'inquiéter s'indigner se demander se persuader surenchérir se troubler Total 0
Plus-queparfait
Adam Weinberger (447 )
Roman de LLN (200 K)
Passé comp.
210
2 1
1 3 1 2
27
1 1 170
1
199
42 64
LES PRÉPOSITIONS FORMENT-ELLES UNE CLASSE ? DAVID GAATONE Université de Tel-Aviv
Les prépositions sont, depuis quelque temps, devenues, ou redevenues, a la mode. De nombreuses revues leur ont consacré un numéro spécial et des études très fouillées en ont discuté divers aspects, notamment sémantiques (voir Références). Cependant, la question de la délimitation même de cette classe, comme sans doute celle de beaucoup d'autres notions linguistiques couramment utilisées dans la littérature, reste largement controversée. L'objectif de ce bref article est de cerner de plus près quelques-uns au moins des aspects problématiques de la partie du dis cours, si partie du discours il y a, appelée "prépositions". S'agissant d'une notion existant de longue date, il paraït utile, voire nécessaire, de se demander si elle est justifiée, ce qui revient a se demander s'il existe en fran9ais des phénoménes linguistiques dont il est impossible de rendre compte sans en faire usage. Autrement dit, la notion de préposition doit-elle intervenir dans la formulation des règles décrivant le fonctionnement d'une langue comme le français ? La réponse á cette question me paraît affirmative. Toute une série de faits conduisent a postuler, du moins dans l'état actuel de nos connaissances, une classe recouvrant ä peu près l'ensemble des mots assez communément reconnus de nos jours comme prépositions, c'est-à-dire quarante a cinquante éléments, si Ton s'en tient aux prépositions dites "simples". C'est le cas, par exemple, de la construction des verbes avec leur(s) complément(s). Ainsi, deux verbes tels que autoriser et permettre se construisent soit avec, soit sans un mot intermédiaire devant le complément désignant le destinataire du procès, en dépit de leur proximité, sinon de leur identité, sémantique: Maman a autorisé Maya à jouer dehors / a permis ä Maya de jouer dehors On peut comparer ainsi courtiser /faire la cour a, utiliser / se servir de, etc. D'autre part, plusieurs phénoménes ne peuvent, semble-t-il, s'expliquer qu'à partir de ce qu'on pourrait appeler une "allergie" a des mots appartenant ä la classe traditionnelle des prépositions. En voici quelques illustrations:
DAVID GAATONE
212 Extraction
Certaines constructions syntaxiques supposent l'"extraction" d'un terme hors de sa place habituelle. La présence d'une préposition peut bioquer cette extraction. 'est le cas de la mise en relief contrastive (= clivage): Nous (cherchons / réfléchissons ä) la solution de ce próbleme 'est de ce problème que nous (cherchons / *réfléchissons a) la solution Les Substituts en et dont, liés a la préposition de et supposant eux aussi une opération d'extraction, présentent le même blocage: Ce problème, nous en (cherchons / *réfléchissons a) la solution Ce problème dont nous (cherchons / *réfléchissons a) la solution Passif Le passif classique ("promotionnel") consiste à faire de l'objet d'un verbe le sujet de ce même verbe a la forme passive. Cette opération est, comme on le sait, limitée en français à l'objet direct. Autrement dit, la présence d'une préposition devant l'objet interdit sa promotion au rang de sujet. On peut opposer ainsi: Maman a autorisé Maya à jouer / Maya a été autorisée (pr maman) à jouer Maman a permis ä Maya de jouer / *Maya a été permise (pr maman) de jouer Mais cette contrainte ne joue plus lorsque la passivation du verbe á l'impersonnel laisse l'objet prépositionnel dans la même position qu'à l'actif (D. Gaatone 1998): Il a été procédé ä une enquête DE négatif Un syntagme indéfini, objet d'un verbe personnel ou expansion d'un verbe impersonnel (= "sujet réel" ou "contre-sujet") est déterminé par de, s'il se trouve dans la portée d'un mot négatif et désigne une quantité nulle. Ce de est cependant exclu si le syntagme est prépositionnel: Je n 'attends plus (de/*des) miracles /Je ne m'attends plus ä (des/*de) miracles Disjunction des quantifieurs Divers quantifieurs admettent, sous certaines conditions, l'insertion d'un verbe entre eux et le terme quantifié. Mais cette disjonction n'est possible que si le syntagme quantifié n'est pas prépositionnel: Combien de voyages avez-vous fait ? /À combien de voyages pensez-vous ? Combien avez-vous fait de voyages ? / *A combien pensez-vous de voyages ? La disjonction est obligatoire pour les exclamatifs d'intensité ou de quantité ce
LES PRÉPOSITIONS FORMENT-ELLES UNE CLASSE ?
213
que, qu 'est-ce que, généralement attribués à un niveau de langue familier, ainsi que pour le quantifieur non exclamatif ce que (D. Gaatone 1986), alors que l'exclamatif que se comporte comme les autres quantifieurs. Mais cette disjonction n'est plus autorisée dès que le quantifié est prépositionnel: Que de temps nous perdons ! / Que nous perdons de temps! * Ce que de temps nous perdons ! / Ce que nous perdons de temps! * Qu 'est-ce que de temps nous perdons ! / Qu 'est-ce que nous perdons de temps! * Nous ferons ce que de voyages il faut /Nous ferons ce qu'ilfaut de voyages * A (que/ce que/qu 'est-ce que) nous rêvons de voyages ! / *Nous ferons ce que nous rêvons (ä) de voyages Si donc postuler l'existence même d'une classe de prépositions apparaît comme indispensable, la définition en est extrêmement problématique (P. Cadiot 1997), autant, sinon plus, que celle de cette classe fourre-tout que constituent les adverbes. On n'essaiera pas ici de proposer une définition rigoureuse, ni même simplement opératoire, mais plutôt de mieux cerner les difficultés d'une telle entreprise. Il paraït d'abord évident que ni le critère de la place, ni celui de l'invariabilité, qui figurent souvent dans les définitions existantes, ne présentent de véritable intérêt. Les déterminants sont aussi "préposés" au syntagme qu'ils introduisent. Les adverbes, les conjonctions, les interjections, sont aussi invariables. Il faut alors se rabattre sur deux traits qui semblent assez généralement reconnus comme définitoires des prépositions. Celles-ci seraient des mots qui relient (V. Brøndal 1950) et subordonnent (M. Riegel et alii 1994, Hagège 1997) un terme a un autre. Une telle définition paraït assez appropriée, surtout dans le cas des syntagmes prépositionnels fonctionnant comme compléments circonstanciels: Maya joue dans le jardín Dans relie, syntaxiquement et sémantiquement, le nom jardín au verbe jouer. Le complément de lieu est subordonné au verbe, c'est-á-dire dépend de lui, en ce sens que sa présence dans la phrase suppose celle du verbe, l'inverse n'étant pas vrai. Cette optique, qui me paraït correcte, a d'ailleurs mené certains a poser une quasi-identité entre la préposition et la conjonction de subordination. Cette dernière, en effet, relie et subordonne elle aussi, mais le subordonné est une phrase enchâssée. Autrement dit, la conjonction ne serait rien d'autre qu'une "pré position de proposition". Ainsi, pour Ch. Bally (1965), les prépositions sont des "transpositeurs d'objets" (= de substantifs), les conjonctions, de procès (= de phrases), et pour M. Dessaintes (1960), il a identité fondamentale entre ces deux parties du discours. Pareille assimilation semble cependant peu conforme aux réalités et a été rejetée par beaucoup, entre autres, B. Pottier (1962), D. Gaatone (1981), Cl. Muller (1981), M. Pierrard (1984), D. Le Flem (1987). En effet, si l'on se refuse a distinguer le que des phrases enchâssées en position de sujet, du que des phrases enchâssées en position de complément, et qu'on n'aeeepte pas, par
214
DAVID GAATONE
ailleurs, de voir dans le sujet un terme dépendant, on voit mal en quoi ce que relie et subordonne: Maya attend (l'arrivée de son père / que son pere arrive) (Voire venue /que vous soyez venu) lui a fait plaisir Que gagne alors à être considéré comme un "nominalisateur", c'est-á-dire un ins trument permettant ä une phrase de fonctionner comme terme d'une autre phrase, qui la contient, a la manière d'un syntagme nominal. Mais il ne relie ni ne subor donne et n'est en rien comparable a une préposition. Cette optique est bien entendu valable aussi pour les séquences, traditionnellement appelées "locutions conjonctives de subordination". Ainsi, avant que, souvent traité comme un seul mot, n'est rien d'autre que la préposition avant, suivi de que nominalisateur: Maya partira avant (l'arrivée de ses parents / que ses parents n'arrivent) On peut étendre cette analyse aux locutions figées, ou même complètement soudées en un seul mot, telles que parce que, bien que, quoique, puisque, etc, même si le premier élément n'existe pas, ou n'existe plus, sous cette forme, en tant que préposition. En fait, on peut l'étendre aussi a des conjonctions simples, telles que quand, si, comme, ainsi que le montre, par exemple, le fait qu'elles sont reprises par que en contexte de coordination, contrairement a quand et si introduisant une subordonnée interrogative: Quand Maya reviendra et qu 'elle verra.../ Je demande quand Maya reviendra et (*qu Vquand) elle verra... Il est encore fréquent par ailleurs de rencontrer dans la littérature le terme d'"ad verbe", appliqué a des prépositions en emploi absolu (= "orphelines"), comme dans l'exemple suivant: Les parents rentreront ä midi. Maya partira avant Get emploi absolu n'est pourtant rien d'autre qu'un cas de substitution par effacement et ne justifie aucunement un changement de statut syntaxique. De toute façon, il est clair qu'un adverbe ne relie ni ne subordonne. Dans le même ordre d'idees, des adjectifs indéfinis ou qualificatifs ne deviennent pas des pronoms ou des noms, quand le terme qu'ils déterminent est supprimé en contexte de substitu tion: Un seul candidat a été regu alors que plusieurs (candidats) s 'étaient présentés De toutes ces robes, Maya préfère la (robe) bleue Cependant, l'idée même de la préposition comme relateur et subordonnant n'est pas aussi évidente qu'elle pourrait le paraïtre. Le cas de de, introducteur d'un infinitif sujet, illustre bien le problème. Manifestement, il ne relie ni ne subordonne quoi que ce soit. Il ressemble, de ce point de vue, à que nominalisa teur, auquel il est d'ailleurs souvent comparé, mais il en diffère néanmoins, ne serait-ce que par son caractère facultatif. Faut-il dès lors continuer a y voir une
LES PRÉPOSITIONS FORMENT-ELLES UNE CLASSE ?
215
préposition, ou plutôt un "índice", comme le fait, par exemple, . Togeby (1984), ou un "article" d'infinitif, comme le proposent certains ? Notons que ce de n'empêche pas son syntagme de fonctionner comme sujet de passif: (De) vous voir me fait plaisir (D') être né ä Paris doit-il être considéré comme une marque de supériorité ? On peut se poser la même question a propos du de "partitif', apparaissant devant un syntagme nominal en position d'objet ou de sujet posposé: 'est dans cette revue que paraissent pour la première fois de ses poèmes L'exemple suivant pose un problème du même genre. Comment en rendre compte en termes de relation et subordination ? De 200 a 300 millions de francs auraient été détournés entre 1992 et 1995 On notera que la encore un sujet prépositionnel n'interdit pas la passivation. Il semble en fait que cette contrainte ne joue que si Ton a affaire a une (véritable ?) préposition, conditionnée par le verbe. Ä vrai dire, même quand la préposition relie (ou sépare ?) effectivement deux termes, sa fonction de subordonnant ne va pas toujours de soi. Dans les exemples suivants, l'adjectif dépend du nominal (nom ou pronom) précédent, syntaxiquement, puisque sa présence dans le syntagme n'est possible qu'à travers celle de ce nominal, et sémantiquement, puisqu'il en décrit une propriété. C'est cette relation de dépendance unilatérale qui est responsable de l'accord de l'adjectif en genre et en nombre avec son recteur. Il devient alors difficile de dire que la préposition, absente dans le premier cas, présente dans le second, est la marque de cette dépen dance, qui existe aussi bien sans elle: Maya a dit une chose intéressante /Maya a dit quelque chose d'interessant Le problème est plus complexe encore dans le cas suivant: Maya a de nombreux amis /Maya a beaucoup d'amis La relation sémantique entre amis et nombreux est la même que celle entre amis et beaucoup. On est en droit de penser que le nom est tête de syntagme dans les deux cas et que nombreux et beaucoup sont sous sa dépendance. Mais de précéde amis. Ce de, caractéristique de tous les adverbes de quantité du français, doit-il alors toujours être classé comme préposition ? Les constructions causatives du français posent elles aussi un gros problème, quant au role de la préposition. On sait que, dans ces constructions, le terme désignant l'agent du procès exprimé par l'infinitif, ou, si Pon préfère, le destinataire du procès exprimé par le complexe verbal faire infinitif se construit directement s'il n'y a pas déja un objet direct, indirectement s'il y en un: Maya a fait manger son chat / Maya a fait manger du poisson (*son chat / a son chat)
216
DAVID GAATONE
Seule donc une contrainte formelle, en l'occurrence, l'impossibilité en français moderne d'un double accusatif, est responsable dans ce cas de la préposition, plutöt qu'une relation de dépendance syntaxique et/ou sémantique. On a, d'autre part, souvent remarqué (P. Cadiot 1997, M. Riegel et alii 1994) que le terme "relateur" impliquait une certaine symétrie entre les termes reliés par la préposition, alors que le comportement de celle-ci indiquait clairement une cohésion plus étroite avec le terme a sa droite qu'avec celui a sa gauche (E. Spang-Hanssen 1963, 1993). Ainsi, des Substituts tels que lui, leur, dont, en, renvoient a tout un syntagme prépositionnel, c'est-à-dire a la préposition accompagnée de son complément. De même, un complément qui s'antépose en phrase interrogative ou relative se déplace avec sa préposition: A quoi rêve Maya ? Les vacances auxquelles rêve Maya... On pourrait certes lier ce fait a l'impossibilité, en français, contrairement par exemple a l'anglais, d'une construction absolue de la préposition ("preposition stranding"): * Que rêve Maya a ? *Les vacances que Maya rêve a... Mais notons bien que cette contrainte ne s'applique qu'à certaines prépositions, telles que à, chez, de, malgré, par, parmi, vers. D'autres, en revanche, peuvent être "orphelines", soit avec changement de forme (dans/dedans, sous/dessous, sur/ dessus), soit sans (après, avant, avec, contre, depuis, derrière, devant, entre, pour, sans). Il est vrai que, même pour ces prépositions, l'emploi absolu n'est admis sible que suite a l'effacement du complément en contexte de substitution: Regarde cet arbre. Maya est (*sous/dessous/devant) L 'arbre (sous/devant) lequel est Maya / *L 'arbre que Maya est (dessous/ devant) Remarquons que cette dernière phrase est sans doute acceptable a un certain niveau de langue. La cohésion de la préposition avec son complément a pu faire préférer une définition faisant d'elle un mot introducteur de syntagme (D. Creissels 1995), plutôt qu'un relateur ou joncteur, ce qui faciliterait l'inclusion dans la classe des prépositions des cas mentionnés plus haut, ou aucune relation n'est décelable. C'est, par exemple, ce que pensait L. Tesnière (1966), qui voyait dans la préposi tion un "translatif", lequel "n'est pas internucléaire [...] mais intranucléaire", c'est-a-dire faisant partie du même nucléus que le terme suivant. Certaines au moins des difficultés discutées jusqu'ici découlent de ce qu'on a souvent appelé les prépositions "vides", ou encore "faibles, légères, abstraites, incolores, aplaties, grammaticales, casuelles, indices, chevilles syntaxiques, etc", qui ne seraient que de simples "joncteurs", face aux prépositions "pleines", aussi dénommées "fortes, lourdes, concrètes, colorées, lexicales, etc.", qui seraient, elles, des "relateurs", c'est-à-dire de "véritables" prépositions. Autrement dit, la
LES PRÉPOSITIONS FORMENT-ELLES UNE CLASSE ?
217
relation syntaxique que la préposition est censée établir, du moins la plupart du temps, ne semble pas toujours s'accompagner clairement d'une relation sémantique, comme dans le cas classique du complément circonstanciel. L'idée d'une préposition vide de sens ou, plus généralement, d'un mot vide de sens, est catégoriquement rejetée par certains, pour qui pareil monstre n'est pas même pensable. Il aurait toujours un sens quelconque, même s'il n'est pas facilement décelable. Malheureusement, il faut bien reconnaïtre que les partisans de cette thèse évitent la plupart du temps de faire la lumière sur le sens précis de ces prépositions que d'autres disent "vides". Notons d'abord que le problème est généralement mal posé. Il ne s'agit pas vraiment de prépositions vides, mais seulement d'emplois vides de certaines prépositions, qui ont par ailleurs un ou plusieurs sens (J. van Oosten 1977, Cl. Vandeloise 1993), essentiellement de et à, accessoirement en, sur, et peut-être aussi avec, contre, dans, pour (A. Blinkenberg 1960). Si de tels emplois existent effectivement, faut-il alors exclure les mots en question, dans ces emplois spécifiques, de la classe des prépositions (J. Cervoni 1991), autrement dit voir des cas d'homonymie ? Dans une telle optique, le de de Maya revient de Vécole et celui de quelque chose d'interessant n'auraient rien en commun. Quoi qu'il en soit, ce qui est vraiment important, c'est de tenter de revoir le problème sur la base du fonctionnement des mots appartenant l'ensemble traditionnel des prépositions (M. Gross 1975, P. Cadiot 1997). Cela revient avant tout a se demander quels sont les facteurs conditionnant l'occurrence de telle ou telle préposition, dans un contexte donné. On peut distinguer, semble-t-il, quatre cas essentiels : a) Facteur sémantique La préposition est choisie librement par le locuteur en fonction de son message. Elle a un contenu sémantique spécifique (spatial, temporei, causal, etc.) et est en principe commutable avec d'autres prépositions: Maya se lève (a/après/avant/dès/vers/etc.) huit heures - Un verre (a/de) vin C'est là sans doute l'emploi le plus typique de la préposition, celui auquel on pense intuitivement lorsqu'il s'agit de la définir. Il permet même a certains (D. Leeman 1998) de voir dans la préposition une catégorie prédicative, puisqu'elle attribue une propriété au terme suivant, par exemple, dans la phrase cidessus, le statut de locatif. b) Facteur lexical La préposition est conditionnée automatiquement par un verbe, un nom ou un adjectif, devant un éventuel complément. Il n'y a plus alors choix libre du locu teur, donc pas non plus commutabilité, sauf dans quelques rares cas ou deux ou trois prépositions sont possibles, sans différence de sens, et souvent à des niveaux de langue différents {aimer (ø/ä/de) inßnitif, commencer ä/de, abonder en/de). En voici quelques exemples: s 'intéresser à, raffoler de, alterner avec, compter sur, pencher pour
DAVID GAATONE
218
le besoin de, la tendance ä, la confiance en sujet ä, enclin a, digne de, passible de, etc. La préposition conditionnée lexicalement peut être sémantiquement compatible avec son recteur. Il a alors redondance sémantique (Ch. Bally 1965), comme dans Son échec découle de sa paresse, où le sens d'origine de de est déja contenu dans découler. La préposition n'en est pas moins obligatoire. Notons en revanche qu'aucune préposition n'est nécessaire pour reprendre le contenu spatial impliqué par surplomber, survoler. Mais la préposition peut souvent paraítre parfaitement arbitraire sur le plan sémantique, par rapport a son recteur. Il suffit, pour s'en eonvaincre, de comparer des paires de mots qui, bien que proches par leur sens, régissent des prépositions différentes, telles que demander a / exiger de, ressortir a / relever de, consister en / se composer de, s 'échapper de / échapper ä, s 'arracher a / se détacher de, recourir a / s 'aider de, apte a / capable de, propre ä / susceptible de, etc... On notera d'ailleurs, l'inverse, que des mots éloignés par leur sens, ou même antonymes, peuvent régir la même préposition. 'est le cas, par exemple, de tenir, qui appelle ä dans son double sens de "être attaché" et "avoir pour cause", et des antonymes s 'approcher de / s 'eloigner de et donner/ prendre (quelque chose) ä quelqu'un. Rien n'illustre aussi bien le caractère souvent arbitraire, en synchronie, des prépositions a conditionnement lexical, que leurs vicissitudes au cours de l'histoire. Ainsi, obéir, ressembler, survivre, autrefois transitifs directs, se construisent aujourd'hui avec à, alors que aider, persuader, etc., aujourd'hui transitifs directs, régissaient autrefois ä devant un complément humain. ) Facteur syntaxique La préposition peut être conditionnée par le type de construction syntaxique choisi. Le choix n'est donc á nouveau pas libre. Les grammaires utilisent fréquemment ici le terme de "cheville syntaxique", qui n'est qu'un autre mot pour "pur instrument grammatical", donc préposition vide de sens. C'est le cas, par exemple, de de, caractéristique des appositions affectives et d'appellation: cet amour d'enfant, la ville de Paris, le mois de mai C'est encore de qui fait office de lien obligatoire entre un pronom et un adjectif épithète: Rien de nouveau sous le soleil. Qui d'autre était là ? De même, l'infinitif qui, dans une construction impersonnelle, correspond au sujet de la construction personnelle parallèle, doit être précédé de de, lequel n'est que facultatif devant le sujet: (De) vous avoir rencontré m 'est agréable /Ilm 'est agréable de vous avoir rencontré
LES PRÉPOSITIONS FORMENT-ELLES UNE CLASSE ?
219
'est en revanche ä que demande la construction adjectivale dite "Tough move ment" en syntaxe transformationnelle, construction exigeant la compatibilité sémantique de l'adjectif avec l'infinitif complément, plutot qu'avec le substantif recteur (D. Gaatone 1972): des spécialistes difflciles à recycler... *des spécialistes difficiles... Recycler des spécialistes est difficile La commutabilité éventuelle de ä avec de dans, par exemple, C'est agréable (ä/de) lire, ne prouve pas qu'il a choix possible de préposition dans cette cons truction; on a en réalité affaire a deux constructions différentes, Tune où ce fonctionne comme pronom démonstratif anaphorique, et la préposition est , l'autre ou ce est un pronom impersonnel, et la préposition exigée est de. Dans ce dernier cas, c'est la lecture en tant que telle qui est agréable; dans le premier, la lecture d'un texte spécifique. d) Facteur syntactico-lexical Il s'agit ici essentiellement de toute une série de verbes transitifs directs qui présentent cette particularité de construire leur objet avec de, plus rarement avec a, si c'est un infinitif. Le conditionnement est donc double: d'une part, le verbe précédent, de l'autre, la nature de l'objet. Ce cas pose un problème difficile par rapport a la définition traditionnelle de l'objet direct, dans la mesure où celui-ci est défini précisément par l'absence de préposition. C'est pourquoi, sans doute, certains préférent parier a ce propos d'"article" ou de "marque" d'infinitif (M. Grevisse, A. Goosse 1993), d'autres de "complémenteur": Maya accepte (cette idée / de partir). Maya apprend (le français / à parier franqais) Peut-être faut-il ajouter ici le cas plus subtil de la construction directe ou indirecte de l'infinitif avec certains verbes, qui s'accompagne cependant d'une certaine différence de sens, comme le montre l'exemple suivant: Le témoin a jure (avoir vu l 'assassin / de dire la vérité) La construction directe n'est possible que si le procès désigné par l'infinitif est antérieur ou simultané a celui désigné par le verbe fini. De est nécessaire s'il postériorité. La présence ou l'absence de la préposition permettrait donc une opposition temporelle. On voit donc que, en gros, seules les prépositions conditionnées sémantiquement et sans doute aussi quelques-unes á conditionnement lexical peuvent être dites véritablement "pleines". Dans les autres cas, quelques rares prépositions (A. Blinkenberg 1960), "pleines" dans une partie de leurs emplois, sont clairement "vides". Elles sont alors difficiles a intégrer dans la classe des prépositions, si l'on tient à ce que celle-ci comporte un ingrédient sémantique dans sa définition.
220
DAVID GAATONE
Références Bally, Charles. 1965. Linguistique générale et linguistique française. 4e éd., Berne: Éd. Francke. Blinkenberg, Andreas. 1960. Le próbleme de la transitivité en français moderne. Copenhague: Ejnar Munksgaard. Brandal, Viggo. 1950. Théorie des prépositions. Copenhague: Ejnar Munksgaard. Cadiot, Pierre. 1997. Les prépositions abstraites en français. Paris: Armand Colin. Cervoni, Jean. 1991. La préposition. Paris/Louvain-la-Neuve: Duculot. Creissels, Denis. 1995. Eléments de syntaxe générale. Paris: P.U.F. Dessaintes, Maurice. 1960. Eléments de linguistique descriptive. Bruxelles: La Procure. Gaatone, David. 1972. Facile a dire. Revue de Linguistique Romane 36: 129-138. Gaatone, David. 1981. Conjonctions et locutions conjonctives en français. Folia Linguistica 14: 195-211. The Hague: Mouton. Gaatone, David. 1986. Un quantifieur négligé en fraçais. Folia Linguistica XX/3-4: 413-430, The Hague: Mouton. Gaatone, David. 1998. Le passif enfrangais. Paris/Louvain-la-Neuve: Duculot. Grevisse, Maurice; André Goosse. 1993. Le bon usage. Grammaire frangaise. Paris/Louvain-la-Neuve: Duculot. Gross, Maurice. 1975. Méthodes en syntaxe. Paris: Hermann. Hagège, Claude. 1997. Les relateurs comme catégorie accessoire et la grammaire comme composante nécessaire. Faits de Longue 9: 19-27. Leeman, Danielle. 1998. La préposition comme catégorie prédicative. In Prédica tion, assertion, information. Acta universitatis Upsaliensis, M. Forsgren et alii (eds.): 327-334, Uppsala. Le Flem, Daniel 1987. DE + INFINITIF: Préposition ou complémentiseur. Langues et Linguistiques 13: 123-145. Muller, Claude. 1981. Remarques sur les complémenteurs prépositionnels. In Analyse des prépositions, Ch. Schwartze (ed.), Tübingen: Niemeyer, 88-110. Oosten, Jeanne van. 1977. On defining prepositions. In Proceedings of the annual meeting of the Berkeley Linguistic Society 3: 454-464. Pierrard, Michel. 1984. Existe-t-il un de subordonnant en fraçais moderne ? Travaux de Linguistique 11: 73-89, Gand: Université de Gand. Pottier, Bernard. 1962. Systématique des éléments de relation. Paris: Klincksieck. Riegel, Martin; Jean-Christophe Pellat; René Rioul. 1994. Grammaire méthodique du frangais. Paris: P.U.F. Spang-Hanssen, Ebbe. 1963. Les prépositions incolores du frangais moderne. Copenhague: G.E.C. Gads Forlag. Spang-Hanssen, Ebbe. 1993. De la structure des syntagmes a celle de l'espace. Langages : 12-26. Tesnière, Lucien. 1966. Éléments de syntaxe structurale. 2 éd. Paris: Klincksieck.
LES PRÉPOSITIONS FORMENT-ELLES UNE CLASSE ?
221
Togeby, Knud. 1984. Grammaire française V. IV: Les mots invariables. Copen hague: Akademisk Forlag. Vandeloise, Claude. 1993. Présentation. Langages 110: 5-11.
Summary Although a large amount of work has been done in the last two decades on French prepositions, there is still no general agreement about their definition. One first has to make a decision about the necessity of such a class, a decision which can be based on the impossibility of accounting for various syntactic constraints without referring to the notion of "preposition". The main problem in trying to define that class seems to be that most of the 40-50 words generally listed as (simple) prepositions in French grammars have some semantic content, a fact that makes it possible to consider them as subordi nating connectors, while only a few, primarily de and a, have no discernible meaning in various contexts, and do not necessarily play any linking or subordinating role. The various factors, semantic, lexical, syntactic or lexico-syntactic, which can trigger the occurrence of a preposition, make it difficult if not impossible to find some feature common to all the words traditionnally called prepositions in French.
UNE CONSTRUCTION TRONQUÉE DU VERBE FAIRE JEAN FAIT LE (BRA VE + CACHOTTIER + REPENTANT + ENFANT GÂTÉ)
JACQUELINE GIRY-SCHNEIDER Université de Paris VIII et LADL
Il est question ici d'expressions telles que faire le fier, Venfant, le râleur, l'étonné, le languissant, l'autruche, le don Juan, etc. considérées souvent á tort comme toutes également figées. Elles le sont du point de vue syntaxique, et Ton verra pourquoi, mais elles ont une extension lexicale considérable et un sens transparent qui conduit voir une construction autonome et "libre" du verbe faire. Elles désignent et qualifient un comportement et ä ce titre mettent en jeu un sujet humain, un terme apparemment nominal caractérisant un humain et éventuellement un complément avec Nhum (Max fait Vinsolent avec ses parents).
1. Les paradoxes Ces expressions sont paradoxales a plus d'un titre. 1) Elles ont une syntaxe figée (aucune transformation), mais un sens transparent, sauf une vingtaine comme faire la sucrée ou le zouave (voir §4) et une grande productivité lexicale puisqu'on a pu en relever huit cents environ sans que la liste soit close. 2) Elles ont l' rn d'une construction a complément nominal en raison du déterminant le (parfois possessif réfléchi); mais si des noms y figurent comme enfant, perroquet, grand seigneur, bébé, on trouve surtout des adjectifs et des formes verbales qui ne sont pas tous substantivables: Max fait le fier / ?* Max est un fier Max fait Vétonné / * Max est un étonné Or il est difficile de considérer comme substantif un terme qui n'admet de déter minant que dans une seule construction. D'où l'hypothèse, développée au §3, d'une forme tronquée. 3) Du point de vue sémantique, elles peuvent être ambiguës de deux façons: l'ambiguïté peut être lexicale, l'élément qualifiant que nous noterons le N par
JACQUELINE GIRY-SCHNEIDER
224
commodité, ayant deux sens possibles. La construction faire le N a soit le sens de "jouer un role" (sens a) au théatre ou dans la vie, soit celui de simple comportement (sens b): (a) (b)
Dans cette pièce de Brecht, Max fait l'enfant Max fait l'enfant (E + avec son entourage)
On verra aux §2 et 3 à quelles propriétés sont associées ces deux interprétations. Le deuxième type d'ambiguïté concerne les expressions de sens (b), le comportement de N0 pouvant être interprété comme spontané ou bien comme intentionnel, d'où simulé. Est-il possible d'associer ces deux interprétations a des propriétés syntaxiques distinctes, ou bien dépendent-elles du contexte et de l'élément lexical en jeu ? Cette question est développée au §6.
2. La construction (a):N0fait le N = N0 est le N Il existe des expressions de forme N0 fait le N telies que faire peut être remplacé par être sans changement de sens. Ce sont les expressions de sens (a) évoquées dans l'introduction, qui désignent un rôle, une tache, dans le cadre d'une activité a plusieurs, théâtre notamment, mais aussi des actions organisées diverses: Dans cette piece Max fait le pere, un soldat Dans ce casse, Max fait le guetteur, le chauffeur Dans cette discussion, Max fait l'interprete, l'arbitre, le présentateur, le président, etc. Dans cette portie de bridge, Max fait le mort Dans ce jeu, Max fait le chat Par opposition aux expressions de sens (b) désignant un comportement, elles ont les propriétés suivantes: 1) elles mettent en jeu des noms seulement; 2) faire est paraphrasable par être ou jouer le rôle de: Max fait Vinterprète = Max (est le +joue le role de) interprète 3) elles admettent la pronominalisation et la question que?, á savoir des propriétés de complément l'objet. D'ou l'on conclut que dans cette construction le statut du verbe faire est celui de prédicat verbal ä deux arguments. Quant au sens, il est a noter que ces noms qui désignent un métier, une fonction, un statut socio-culturel, ne désignent avec faire que des rôles provisoires et non officiels: faire Vinterprète n'implique pas que l'on soit interprète de métier, sens qui appartient à une construction a verbe être différente, sans déterminant (Max est interprete). Cette question est reprise au §5.
UNE CONSTRUCTION TRONQUÉE DU VERBE FAIRE
225
3. La construction tronquée (b): N0 fait le (N + Adj + participe) (E + avec N1) À propos d'expressions comme Max fait le clown ou /'insolent, qui désignent un comportement et sont figées syntaxiquement, l'idée d'une structure tronquée nous est suggérée par l'existence de phrases usuelles telles que: Max fait celui qui n'entend pas, qui n'apas compris = Max fait celui qui ne sait rien, qui n'a rien vu et surtout par la paire Max fait celui qui est sourd = Max fait le sourd La synonymie de ces deux phrases suggère que la forme apparemment nominale faire le sourd pourrait bien résulter de la réduction de la relative a verbe être qui est sourd. On aurait ainsi: Max fait le capricieux = Max fait celui qui est capricieux Max fait le clown (sens b) = Max fait celui qui est un clown Max fait le dégoüté = Max fait celui qui est dégoüté On note que les noms comme clown, gendarme, etc. ont deux entrées lexicales, noms de métiers, pouvant figurer dans la construction (a) et noms dits "d'injure", qui peuvent entrer dans la construction (b). Cette description par réduction de relative rend compte aisément des paradoxes évoqués dans l'introduction: 1) La structure est syntaxiquement figée, puisque Particle le n'est pas le détermi nant d'un nom, mais elle est lexicalement libre et de sens non opaque, puisque l'élément N est le prédicat d'une phrase a verbe être elle-même libre et de sens non opaque (sauf exception habituelle a toute construction cf. §4). En ce qui concerne le figement syntaxique lui-même, Particle le est le même que celui des relatives déterminatives a verbe réductible du type Prends [le livre qui est sur la table] - Prends [le livre sur la table]. Mais avec faire, de surcroït, l'antécédent celui est effacé comme dans les constructions a relative détermina tive: Prends [le livre qui est bleu] - Prends [celui qui est bleu] - Prends [le bleu]. 2) Le deuxième paradoxe concernait la forme: une construction apparemment nominale, mais pouvant aussi comporter des adjectifs et des participes non substantivables (Max fait Vétonné / *Max est un étonné). Avec l'hypothèse proposée ici, la question est résolue: ces termes sont tous attributs du substantif indéfini sous-jacent à celui qui; donc étonné est bien une forme verbale, aimable est bien un adjectif (Max fait l'aimable / *Max est un aimable). D'où le problème de nota-
226
JACQUELINE GIRY-SCHNEIDER
tion, N0 fait le N étant une simple commodité. Dans cette construction (b), faire a également le statut de prédicat verbal a deux arguments représentés par N0 et celui qui est N 4. Les expressions à sens opaque de la construction (b) On a vu que la construction (b) se caractérise par la propriété N0 fait le N = N0 fait celui qui est un N Mais il arrive que N ait un sens spécifique avec faire, sans forme en être correspondante, par exemple fou dans la phrase: Les enfants font les fous ? * Les enfants font ceux qui sont fous Avec faire, fou a le sens de "turbulent" qu'il n'a pas avec être. Il s'agit donc d'une expression isolée a classer parmi les expressions figées (M. Gross 1984). Par ailleurs il va de soi qu'une phrase comme Max fait le fou peut aussi avoir le sens (a) analysable comme Max f ait le fou = Max est le fou = "Max joue le role du fou", au théatre ou dans la vie. On a pu relever une vingtaine d'expressions opaques selon la définition ci-dessus, qui sont: Max fait le (beau + délicat + entendu + fier + flambard + fou + idiot + imbécile + important + intéressant + jeune komme +joli-cœur + mystérieux + pantin + rigolo + zouave) Marie fait la (belle +jolie + sucrée) Si des expressions comme faire Vautruche ou le paon paraissent tout aussi opaques, c'est en fait a leur construction en être, qui existe cette fois, qu'il faut attribuer ce caractère: Luc est une autruche, un paon Luc fait Vautruche, le paon = Luc fait celui qui est une autruche, un paon On peut joindre a cette liste de formes figées les expressions qui désignent une posture comme Max fait le cheval, l'avion, le pont, la roue, la planche, etc.
5. Le lien entre les constructions (a) et (b) On a distingué deux constructions sur des critères syntaxiques. Mais elles ont un élément sémantique commun: dans les deux cas N0 n'est pas réellement ce qu'il fait. Les expressions faire le pere ou l'interprète (construction a) désignent un role réel en tant que role, mais impliquant que N0 n'est pas père ni interprète officiellement, n'en a pas le statut. De même faire le pitre, l'obéissant ou le grand seigneur (construction b) n'impliquent pas que l'on soit par nature pitre, obéissant
UNE CONSTRUCTION TRONQUÉE DU VERBE FAIRE
227
ou grand seigneur. Autrement dit, faire s'oppose a être; il sert á construire des expressions qui désignent ce qui est simplement visible, apparent. Le lien entre les deux constructions c'est donc le verbe faire, prédicat verbal a sens plein, associé a un terme "humain" avec 1'article le. Pourquoi alors deux constructions ? L'explication est sans doute a chercher du côté du lexique, c'est-a-dire des formes à verbe être qui constituent les entrées lexicales des éléments notés N Quand N est un substantif désignant un statut, faire a le sens "plein" de "jouer" un role. A ce titre les expressions de théatre, qui sont par ailleurs les plus libres puisqu'elles admettent aussi 1'article indéfini (Max fait un valet), seraient un modèle. Un degré de figement de plus avec l'ardcle le exclusivement, et Ton passe du sens de role sur la scène a celui de role dans la vie, role consistant a assumer une tache dans un groupe (Max fait l'arbitre). On peut ensuite faire raisonnablement l'hypothèse d'une extension du modèle purement nominal a des termes adjectivaux, verbaux ou nominaux désignant et qualifiant un simple comportement (Max fait l'insolent, le dégoüté, l'enfant). Cette extension serait facilitée par le fait que beaucoup de substantifs humains peuvent désigner un statut socioculturel ou bien qualifier un comportement, comme enfant ou bébé, selon les deux entrées: Max est un bébé (E + de trots mois) Max est un bébé (E + malgré son grand âge)
6. Les deux interprétations de la construction (b) Les expressions (b) peuvent être ambigues de la manière suivante: Max fait le généreux ou le pitre signifie que Max a le comportement d'un homme généreux ou d'un pitre, soit spontanément, sincèrement, soit par simulation. Mais s'agit-il d'une ambiguïté associable à deux ensembles distincts de propriétés syntaxiques ? En fait, l'nterpretation de comportement intentionnel et simulé dépend du contexte ou parfois, des éléments lexicaux en jeu. Tout d'abord, moyennant un contexte approprié, ce sens est toujours possible, par exemple avec les adverbes exprès, intentionnellement, ce qui implique la simulation: Max fait intentionnellement le pitre, l'airnable, le bougon, le singe, l'obéissant, le râleur, etc. ou encore dans les phrases au futur á la première personne qui marque une inten tion de la part du locuteur: Dans cette réunion, je vais faire le pitre, Vaimable, le bougon, le singe, Vobéissant, le ráleur, etc. Mais cette interprétation "intentionnelle" peut aussi dépendre des éléments lexi caux. Avec les déverbaux elle n'est pas évidente sinon dans les contextes évoqués
228
JACQUELINE GIRY-SCHNEIDER
plus haut: les phrases Max f ait le bagarreur, le baratineur, le râleur, etc. ont quasiment le même sens que les verbes associés qui eux-mêmes désignent deja un comportement. Par contre l'nterpretation intentionnelle est quasi exclusive avec les participes passés de verbes psychologiques (Max fait l'étonné, l'attendri, le désolé, l'indigné, etc.) et avec les adjectifs désignant un état physique subi (Max fait le sourd, le malade, Vagonisant, etc.). En effet, ces termes, contrairement a des adjectifs comme aimable, bourru, insolent, etc., ne désignent pas un com portement, ce qui est explicitable dans le cadre de la description des adjectifs par réduction de noms appropriés (E. Laporte 1997), qui seraient ici comportement, attitude. Max est aimable = Le comportement de Max est aimable = Max a un comportement aimable Max est (étonné + malade) *Le comportement de Max est (étonné + malade) La construction avec faire ne peut donc désigner un comportement spontané puisque les termes N ne peuvent eux-mêmes avoir ce sens. Elle existe cependant, mais seulement avec le sens de comportement simulé, seul disponible. Le vocabu laire des émotions et celui des infirmités (sourd, malade, mort, etc.) se prête évidemment a cette interprétation, mais aussi des mots comme innocent ou ignorant, qui répondent au test ci-dessus. On pourrait, par ailleurs, penser qu'ici faire est une variante de contrefaire, mais ce verbe n'est naturel que dans la forme développée á relative: Max contrefait celui qui est sourd ? * Max contrefait le sourd Cette relation ne sera donc pas retenue.
Conclusion On a distingué deux constructions de forme apparente N0 fait le N. L'une (faire l'interprete), paraphrasable par être le N ou jouer le rôle de N, ne comporte que des substantifs et désigne un rôle effectif que l'on peut jouer au théatre ou dans la vie. Le seconde, qui désigne un comportement (faire la savante ou faire le cerbère) ne met en jeu que le verbe faire, et l'élément noté N peut être un nom, un adjectif, un participe, c'est-a-dire un terme qui se construit avec être. Elle a été analysée comme la réduction d'une construction à relative N0 fait celui qui est N, ce qui explique le figement syntaxique et la variété morphologique des termes notés N. Ces deux constructions ont cependant deux points communs:
UNE CONSTRUCTION TRONQUÉE DU VERBE FAIRE
229
1) malgré leur figement syntaxique, ce sont des constructions "libres" et productives du verbe faire qui a dans les deux cas le statut de prédicat verbal a deux arguments. Parmi les expressions recensées, on considère comme totalement figées celles auxquelles ne correspond pas de forme a verbe être de sens compa tible (faire le joli-coeur)\ 2) du point de vue sémantique, dans les deux cas, on a vu que N0 n'est pas réellement ce qu'il paraït. Il joue un rôle non officiel ou il a un comportement qui n'est qu'apparence, sincere ou trompeuse. Ce qui suggère que toutes ces expressions ont une "source" commune, l'expression de théatre, qui est par ailleurs la moins figée syntaxiquement.
Références Giry-Schneider, Jacqueline. 1987. Les prédicats nominaux en fraçais. Gençve: Droz. Gross, Maurice. 1981. Les bases empiriques de la notion de prédicat sémantique. Langages 63, Paris: Larousse. Gross, Maurice. 1984. Une classification des phrases "figées" du français. In De la Syntaxe ä la Pragmatique, P. Attal et . Muller (eds). Lingvisticœ Investígationes Supplementa Vol. 8, Amsterdam/Philadelphia: John Benjamins. Laporte, Éric. 1997. L'analyse de constructions adjectivales par rétablissement de noms appropriés. Langages 126, Paris: Larousse. Summary Expressions of the form N0 fait le N\ in French are not simply fixed expressions. There are in fact two distinct cases, differing in syntax and meaning: Max fait l'arbitre (Max acts as referee) and Max fait ¡'innocent (Max plays the innocent). In this article, we characterise these two constructions, suggesting a way of solving the contradictions which occur in the second, and explain the semantic overlap between the two types. In addition to the lexical significance of these expressions (they number around 1,000) and their productivity, this study also illustrates the problem of degrees of fixedness, focussing on two types of relation between faire and être.
CLASSES SÉMANTIQUES ET DESCRIPTION DES LANGUES GASTON GROSS Université de Paris XIII, Laboratoire de Linguistique Informatique, UMR 7546
1. Intérêt de la notion de "classes" en linguistique: les classes d'arguments L'objectif actuel de la linguistique est de rendre compte de façon suffisamment explicite du fonctionnement d'une langue naturelle pour qu'on puisse envisager d'analyser des textes automatiquement ou, ce qui est évidemment plus difficile, d'en générer. Cette perspective nécessite que soient résolues un grand nombre de difficultés, parmi lesquelles en premier lieu la description des phrases simples et, dans un second temps, la mise au point des lois qui les combinent dans la constitu tion de textes. Cet article ne traite pas du second point, qui met en jeu, entre autres, l'enchässement, la coordination et les effacements qui en dérivent, les connecteurs et leur syntaxe (G. Gross 1994), diverses insertions, etc. Nous envisageons ici le moyen de rendre compte de façon reproductible des phrases élémentaires, que nous analysons comme composées d'un prédicat et de ses arguments. La description des arguments est le moyen de rendre compte du sens du pré dicat, s'il est polysémique, ce qui est le cas de la plupart d'entre eux. Leur des cription systématique a montré que deux emplois différents d'une forme prédi cative donnée ne peuvent avoir ni le même nombre d'arguments ni des arguments de même nature sémantique. Ces deux paramètres sont donc indispensables dans la description. Si notre but est de reconnaitre automatiquement un emploi prédicatif déterminé parmi tous les autres possibles, nous ne pouvons nous contenter d'illustrer l'emploi par une phrase-exemple, comme le font souvent les dictionnaires; il est nécessaire d'établir la classe sémantique qui caractérise chaque posi tion argumentale et de recenser les éléments lexicaux de chacune de ces classes. Il existe, de ce point de vue, quatre types de prédicats. Certains d'entre eux ne sélectionnent, pour une position argumentale donnée, aucune classe particulière: ils acceptent tous les substantifs, quelle que soit leur nature. C'est le cas, par exemple, du verbe intéresser pour ce qui est du sujet et de parier de quant au complément: (Ce joueur, ce jeu, ce lieu, ce chat) intéresse frère Mon frère parle sans cesse de (ce joueur, ce jeu, ce lieu, ce chat)
232
GASTON GROSS
Un second groupe de prédicais sélectionne de grandes classes, correspondant aux traits sémantico-syntaxiques habituels: humain (réfléchir), animal (crever), végétal (flétrir), inanimé concret (déplacer), locatif (traverser), temps (remonter ä, durer). Il semble clair que si on veut reconnaítre ces emplois dans un texte donné, il faut dresser la liste des éléments lexicaux correspondant à ces six classes, car les verbes cités, pris isolément, ont d'autres emplois: un miroir peut réfléchir, crever peut s'appliquer à un substantif comme pneu, etc. L'établissement de cette classification permet déja, a titre d'exemple, de séparer trois em plois différents du verbe abatire: abatire un homme, abatire un animal (de boucherie), abatire un arbre. Il existe ensuite des prédicats dont le spectre est plus restreint et qui ne peuvent être décrits, avec la précision requise par le traitement automatique, l'aide de ces classes. Les emplois suivants de passer ne se laissent pas identifier a l'aide de traits comme "concret" ou "abstrait": Pour faire cette soupe, il faut passer les pommes de terre Ce bleu a passé Le premier emploi de passer a comme objet un complément de la classe des et non n'importe quel végétal, a plus forte raison un inanimé concret et le second a pour sujet un nom de exclusivement. Nous appelons des ensembles de ce type des classes d'objets. Notons que ces classes sont construites sur la syntaxe, c'est-á-dire sur la compatibilité des prédicats et des arguments et qu'elles ne doivent pas être considérées comme un découpage de la réalité prélable a la combinatoire linguistique. Enfin, il existe des prédicats qui en position argumentale n'ont qu'un seul substantif: abaisser une perpendiculaire, lever une ambiguïté. De telles cons tructions ne doivent pas être assimilées a des expressions figées, dont une des propriétés est de n'avoir pas de paradigme en position argumentale. Cependant, cette restriction n'est pas une propriété définitionnelle du figement. Une telle suite ne permet, en outre, aucune variation sur le déterminant du complément ni aucune propriété transformationnelle, ce qui n'est pas le cas des constructions que nous envisageons: la perpendiculaire que tu as abaissée n'est pas très visible; la per pendiculaire doit être abaissée avant cette opération. Du point de vue des classes, le cas que nous venons d'envisager constitue un singleton. L'établissement de classes d'objets d'arguments pour décrire les prédicats a de nombreux avantages. Ces classes permettent d'abord de rendre compte de façon claire des différents emplois d'un prédicat et donc de décrire la polysémie. On remarquera que les classes mises en évidence pour un verbe donné servent a décrire d'autres verbes, de sorte que leur nombre n'est pas illimité. Par exemple, la classe des permet de sous-catégoriser des verbes comme porter, mettre, enfiler, enlever qui tous ont des emplois multiples. Elle décrit de même des prédicats adjectivaux comme seyant, juste, collant et des prépositions comme en: en pantalon, en robe de chambre. D'autre part, comme ces classes sont
CLASSES SÉMANTIQUES ET DESCRIPTION DES LANGUES
233
décrites en extension, on comprend que l'on soit en mesure de reconnaître dans un texte toute réalisation d'un emploi particulier d'un prédicat. On est en mesure aussi, dans ces conditions, de générer automatiquement toutes ces combinaisons potentielles. On peut alors énumérer toutes les phrases possibles avec un adjectif comme seyant. Dès lors qu'on domine la combinatoire, on peut détecter dans un texte des constructions déviantes: néologismes, métaphores ou autres figures de rhétorique. La notion théorique de "classes d'arguments" a donc un pouvoir descriptif de première importance.
2. Élaboration de classes de prédicais La notion de "classe sémantique d'arguments" a l'avantage, comme nous venons de le voir, de regrouper un grand nombre de phrases dans le cadre d'un emploi déterminé et d'en proposer un traitement uniforme en mettant en évidence toutes les propriétés communes a l'emploi en question. Nous suggérons maintenant d'étendre ce compactage de l'information aux prédicats. On est en face d'un Problème de description identique. Au lieu de répéter pour chaque verbe individuellement l'ensemble des informations de nature diverse qui peuvent le caractériser (nombre et nature sémantique des arguments, aspect intrinsèque et extrinsèque, nature des adverbiaux compatibles, restructurations autorisées, etc.), on établit des classes sémantiques homogènes qui reçoivent une description unique que tous les éléments de la classe ont en partage par héritage. Nous proposons, dans ce qui suit, un exemple d'une classe de ce type.
3. Les prédicats de comportement Les tentatives qui ont été faites d'établir une classification sémantique des prédicats reposent sur une base exclusivement sémantique (B. Levin 1995). Cette démarche a pour inconvénient qu'il est souvent difficile de déterminer si un élément appartient ou non á une classe déterminée. Il convient donc de proposer des descriptions qui marient les deux niveaux de la façon la plus étroite. C'est la seule condition d'une bonne reproductibilité. 3.1. Les adjectifs La sémantique des adjectifs est un domaine largement inexploré (voir I. Bartning 1976, G. Gross 1986, 1991, J. Levi 1975, L. Picabia 1978, M. Riegel 1985, S. Stati 1979, B. Warren 1982, 1984). Cela tient peut-être à la notion traditionnelle d'adjectif "qualificatif", appliquée a l'ensemble de la catégorie, qui a fait croire que celle-ci était homogène, ce qui est loin d'être le cas (cf. G. Gross et J.-H. Lim 1996). Cette carence est due aussi au fait que l'adjectif reçoit une définition essen-
GASTON GROSS
234
tiellement morphologique (formation du féminin et du pluriel). Nous tentons, dans ce qui suit, de délimiter une classe de prédicais comprenant des adjectifs comme agressif, aimable, ainsi que les substantifs associés agressivité et amabilité. Nous appelons cette classe des "predicáis de comportement" et nous la décrivons syntaxiquement de la façon suivante: Le N2 que N0 V (être, *se montrer) Adj Prép N\ où les symboles désignent: N0 et N1 : des humains N2: les ensembles , <écrits>, <propos>, Prép : à l 'égard de, ä l 'endroit de, envers, vis-á-vis de Nous décrivons maintenant les propriétés de cette classe. La construction basique implique un verbe support qui actualise le substantif prédicatif N2; le verbe être conjugue l'adjectif de . Notons que, dans la construction de base, le verbe se montrer est impossible: Les propos que Paul tient (sont, *se sont montrés) agressifs à l'égard de Jean Le comportement que Paul a (est, *s* 'est montré) agressif à l'égard de Jean La lettre que Paul a écrite (est, *s 'est montrée) agressive à l'égard de Jean Le ton que Paul a adopté (est, *s 'est montré) agressif a l 'égard de Jean A ces structures peut s'appliquer l'effacement de la relative, c'est-a-dire celui du verbe support et, corrélativement, de la conjonction que. On obtient alors le génitif subjectif: Les propos de Paul sont agressifs a l'égard de Jean Le comportement de Paul est agressif a l'égard de Jean La lettre de Paul est agressive a l'égard de Jean Le ton de Paul est agressif a l'égard de Jean Ce génitif peut être remplacé par un possessif anaphorique ou un démonstratif: (Ses, ces) propos sont agressifs a l'égard de Jean (Son, ce) comportement est agressif a l'égard de Jean (Sa, cette) lettre est agressive à l'égard de Jean (Son, ce) ton est agressif a l'égard de Jean Cette construction est susceptible d'une restructuration qu'on pourrait appeler dislocation: Nohum (être, se montrer) agressif Prép N\hum dans Poss0 N2 Paul Paul Paul Paul
est agressif à l'égard de Jean dans ses propos est agressif ä l 'égard de Jean dans son comportement est agressif ä l 'égard de Jean dans sa lettre est agressif a l 'égard de Jean dans son ton
CLASSES SÉMANTIQUES ET DESCRIPTION DES LANGUES
235
Observons que, lorsque le substantif humain est ainsi en position de sujet de la phrase dans le cadre de la restructuration, l'adjectif peut être introduit par le verbe se montrer qui est un support approprié aux adjectifs de "comportement": Paul s 'est montré agressif à l'égard de Jean dans ses propos Paul s 'est montré agressif à l 'égard de Jean dans son comportement Paul s 'est montré agressif à l 'égard de Jean dans sa lettre Paul s 'est montré agressif à l 'égard de Jean dans son ton Le complément prépositionnel peut être effacé, ce qui constitue une perte d'infor mation: Paul (a été, s 'est montré) agressifä l 'égard de Jean 3.2. Les substantifs On prendra comme point de départ la même construction que celle que nous avons postulée pour les adjectifs. Le substantif agressivité n'a cependant pas comme support le verbe avoir mais la suite être de: Les propos que Paul tient á l 'égard de Jean (*ont, sont de) une grande agressivité On peut améliorer l'acceptabilité de cette phrase en modifiant l'adjectif en posi tion de modifieur: Les propos que Paul tient à l'égard de Jean ont une agressivité (évidente, surprenante) Une variante appropriée est constituée par le verbe être empreint de: Les propos que Paul tient ä l'égard de Jean sont empreints d'une grande agressivité A quoi on peut appliquer une reformulation de dislocation, où là aussi le verbe avoir n'est pas très naturel: Paul ( ?a, est de) une grande agressivité á l'égard de Jean dans ses propos Quand le sujet est un humain dans la configuration qu'on vient de donner, on ob serve le support approprié aux prédicats de comportement faire preuve de: Paul a fait preuve d'agressivité à l'égard de Jean dans ses propos Le complément prépositionnel peut également être effacé: Paul est d'une grande agressivité à l'égard de Jean Paul a fait preuve d'agressivité ä l 'égard de Jean Enfin, il y une construction impersonnelle:
GASTON GROSS
236
Il adel 'agressivité à l'égard de Jean de la part de Paul Il y a chez Paul de l'agressivité à l'égard de Jean
4. Propriétés aspectuelles Sur la base syntaxique qu'on vient de décrire, il est possible de dresser la liste de tous les prédicats qui relèvent de cette classe, car les propriétés des deux niveaux se déterminent mutuellement: un adjectif comme dégingandé ne peut avoir un complément humain introduit par Tune des propositions que nous avons citées plus haut. Il ne peut donc s'agir d'un prédicat de comportement. Les prédicats de la classe ainsi définie sont caractérisés par des propriétés communes. On vient de voir qu'ils ont des supports spécifiques: se montrer pour les adjectifs et faire preuve de pour les substantifs. Cette propriété est assez importante, puisqu'elle définit la classe a elle seule. Les prédicats de comportement ont de plus en commun d'avoir un aspect ponctuel (comportement momentané) et "duratif! traduisant une "façon générale d'être", c'est-á-dire de représenter un trait de caractère.
Conclusion Nous avons voulu étendre aux prédicats la notion de classes d'objets, qui a été mise au point pour les arguments. Cette procédure a de nombreux avantages. Elle permet de décrire en une fois un très grand nombre de prédicats, de l'ordre de plusieurs centaines, ce qui réduit évidemment la redondance. On peut dès lors coder les arguments de façon compacte et non au coup par coup, ce qui est coüteux en temps et source d'erreurs. On s'assure ainsi que tous les adjectifs sont codés de la même façon et au regard des mêmes propriétés. Les classes sémantiques transcendent les catégories grammaticales, puisqu'il existe des passages des adjectifs aux noms et réciproquement (G. Gross 1995). Il faut cependant prendre la précaution que l'aspect reste constant dans le changement de catégorie. A ce titre, la constitution de classes sémantiques de prédicats constitue un moyen im portant de factorisation.
Références Bartning, I. 1976. Remarques sur la syntaxe et la sémantique des pseudo-adjectifs dénominaux en frangais. Stockholm: Université de Stockholm. Gross, G. 1986. Sur un emploi particulier de certains adjectifs de couleur. Studia Romanica Posnaniensia, Vol. 12, Poznan, p. 3-10.
CLASSES SÉMANTIQUES ET DESCRIPTION DES LANGUES
237
Gross, G. 1991. Typologie des adjectivaux. Analyse et synthèse dans les longues romanes et slaves, Harro Stammerjohann (ed.), Tübingen: Gunter Narr Verlag. Gross, G. 1994. Connecteurs et traitement automatique. TA-TAO: Recherches de pointe et applications immédiates, Montréal: AUPELF-UREF. Gross, G. 1995. Ä quoi sert la notion de partie de discours? Les classes de mots. Traditions et perspectives, Lyon: Presses Universitaires de Lyon, p.217-231. Gross, G., Jung-hae Lim. 1996. Une catégorie hétérogène: l'adjectif. Studi Italiani di Linguistica Teoretica e Applicata XXV(3), Pise: Pacini, p. 447-460. Levi, J. 1975. The Syntax and Semantics of Nonpredicating Adjectives in English. Doctoral Dissertation, University of Chicago. Levin, B. 1995. Approaches to Lexical Semantic Representation. In Walker, Zampolli, Calzolari, eds., Automating the Lexicon. 1: Research and Practice in a Multilingual Environment, Oxford, p. 53-91. Picabia, L. 1978. Les constructions adjectivales en français: systématique transformationnelle. Genève: Droz. Riegel, M. 1985. L'adjectif attribut, Paris: PUF. Stati, S. 1979. La sémantique des adjectifs: Essai d'analyse compositionnelle appliquée aux langues romanes. Saint-Sulpice de-Favières: Fayard. Warren, B.1982. New Ideas Concerning Adjectives. Studia Neophilologica n°54, pp. 169-178. Warren, B. 1984. Classifying Adjectives, Acta Universitatis Gothoburgensis, Göteborg. Summary The purpose of this article is to demonstrate the importance of semantic classes in the description of language. We know that most predicates are polysemous, and that each sense correlates with a particular set of arguments. We can group these arguments into semantic classes ("classes d'objets" (object classes)), so that the meaning of a predicate can be recognized automatically in context. The same can be done for predicates: the establishment of classes (or sub-classes) of "actions", "states" and "events" allows the grouping of verbs, adjectives or nominal predicates which share the same defining pro perties. To illustrate this, we shall describe the semantic class of "behaviour towards others".
238
GASTON GROSS
ANNEXE abject/C:comport/N0:,<propos>, <écrit>,/Nl:avec Nhum abominable/C:comport/N0:,<propos>,<écrit>,/Nl:avec Nhum abrupt/C:comport/N0:,<propos>, <écrit>,/Nl:avec Nhum abusif/C:comport/N0:,<propos>, <écrit>,/Nl:avec Nhum accommodant/C:comport/N0:,<propos>, <écrit>,/Nl:avec Nhum accueillant/C:comport/N0:,<propos>, <écrit>,/Nl:avec Nhum acrimonieux/C:comport/N0:,<propos>, <écrit>,/Nl:avec Nhum affable/C:comport/N0:,<propos>, <écrit>,/Nl:avec Nhum affectionné/C:comport/N0:,<propos>, <écrit>,/Nl:avec Nhum affectueux/C:comport/N0:,<propos>, <écrit>,/Nl:avec Nhum agréable/C:comport/N0:,<propos>, <écrit>,/Nl:avec Nhum agressif/C:comport/N0:,<propos>, <écrit>,/Nl :avec Nhum aimable/C:comport/N0:,<propos>, <écrit>,/Nl:avec Nhum amène/C:comport/N0:,<propos>, <écrit>,/Nl:avec Nhum arrogant/C:comport/N0:,<propos>, <écrit>,/Nl:avec Nhum
MULTI-LEXEMIC EXPRESSIONS: AN OVERVIEW FRANZ GUENTHNER CIS, Ludwig-Maximilians Universität München
XAVIER BLANCO Universitat Autònoma de Barcelona
Introduction: What is a Multi-lexemic Expression? The lexical treatment of natural language, especially in the context of natural language processing, requires that the vocabulary of a given language is encoded in the form of electronic dictionaries and that it can be accessed efficiently in various kinds of applications. A natural question then concerns the nature of the elements in these dictionaries. It has often been observed that lexicon items are not in general just 'simple words', but very often also sequences of simple words (and sometimes also numbers and other symbols) assembled with the use of socalled separators, which may be blanks, certain forms of punctuation marks, etc. Many technical terms have been coined to refer to these complex lexical items: compounds, collocations, idioms, multi-word lexemes, frozen expressions, to men tion just a few. With a few exceptions (e.g. G. Gross 1996b, l'čuk 1995), little work has been done on the two basic questions raised by these items: the nature of their description, i.e. their place in systems of electronic dictionaries and the postulation of the categories into which they should be classified and the type of information that should be attached to them. In traditional dictionaries, complex lexical items appear side by side with simple ones either as lexical entries on their own or as annotations to simple word lexical entries. Almost never are they dealt with in a systematic way. The second point concerns the state of the art of structuring the set of all complex lexical items in such a way that their properties (morphological, syntactic, semantic) can be of direct use in analyzing the millions of complex lexical items still remaining to be encoded. The goal of this paper is to provide some simple answers to these two issues. We would first like to draw attention to the fact that, in our view, simple and complex lexical items must be coded in exactly the same manner and that there are various choices for their maintenance in electronic dictionaries. Secondly we would like to propose a top-level classification of complex lexical
240
FRANZ GUENTHNER & XAVIER BLANCO
items like that does justice to both their form and the way their meaning is already given. For the rest of this note we assume for a given natural language that there exists a dictionary of all simple forms of this language together with their syn tactic and morphological properties as well as a rudimentary semantic classifica tion involving a fixed set of semantic categories.1 We shall propose four main categories for the description of the many phenomena that had been subsumed by the many linguists using the terms mentioned above.
1. Compound expressions In the kind of electronic dictionaries just refer to, most lexical items are typically classified as nouns, verbs, adjectives, adverbs or prepositions. Only a very small percentage of the vocabulary will not be found in these categories. In addition to the simple forms, every language seems to have complex lexical items which consist of concatenated items (separated by an empty separator, a hyphen or a blank). The first criterion which we use to analyze complex lexical items relates to the question of whether such concatenations are to be viewed as essentially involving just one or two lexical items. According to this criterion we want to distinguish proper compounds (cf. 1), that for all intents and purposes have no internal structures from complex lexical items involving real semantic heads and accompanying satellite expressions (cf. 2). 1.1. Compound Nouns We begin with a discussion of compound nouns that are to be identified with one lexical item. The elements in this class cannot be described on the basis of their form alone as the nature of the concatenation can involve many different processes. In fact, depending on the language, one or the other processes will be predominant. For instance in German, most compound nouns are simply conca tenated (some involving a morphological change of one or more of the elements: Fugenformen). In other languages, like English or French, the use of blanks is predominant. In addition, hyphens, single quotes can also be used to construct such compounds (e.g. mandat-poste, aujourd'hui). Exemples of compound nouns are: 1
Examples of sets of large-coverage semantic categories are the classification of Stefan Langer (for German) for the electronical dictionaries system CISLEX (Langer 1995) or the classification in 'classes d'objets' proposed by Gaston Gross for electronic dictionaries of French (Le Pesant; Mathieu-Colas 1998). Full-coverage morphological dictionaries for the majority of European languages have been constructed on the DELA-model during the last ten years in Barcelona, Lisbon, Munich, Paris, Warsaw and other universitary sites.
MULTI-LEXEMIC EXPRESSIONS
241
hard drug drogue dure droga dura harte Droge 2 A large amount of compound nouns have simple variants or synonyms (demó crata cristiano, demócrata-cristiano, demócratacristiano)3 or can (sometimes must) be translated into simple nouns: mail-box, boîte ä lettres = buzón escalier roulant; escalera mecánica = escalator We also think it reasonable to include acronyms as a way of constructing variants of compound nouns: acquired immune deficiency syndrome = AIDS syndrome de l'immunodéflcience acquise = SIDA, sida síndrome de inmunodeßciencia adquirida = SIDA, sida Erworbenes Immundefekt-Syndrom = EIS (rare), AIDS Even if we treat some sequences of simple forms as one lexical item and as semantically opaque, we can choose to classify them on the basis of their morphosyntactic properties. Systematic descriptions of compound nouns has been proposed ranging from just a dozen or so types to over 700 (Mathieu-Colas 1996). However, it seems us that, for most of the applications, it's enough to stay at a certain level of generaliz ation and to take in account only half a dozen cases, such as: N_Adj, AdjN (christian name), N_Prep_N (quality of live), N_N (family doctor), PrepN (under age), V_N (washing machine). It should be observed that the frequency of the different types depends strongly on the language in question (thus for example AdjN is much more frequent in English than in French or Spanish). The morphological form of a compound noun thus not in general allow us to make prediction concerning the morphological form of its translation equivalents, which can assume just about any morpho logical form available in the target language (Blanco 1997). Moreover it seems be necessary to treat some compound nouns as having a recursive structure: auditory canal =: AdjN =: N external auditory canal =: Adj_(Adj_N) =: Adj_N =: N 2
Compound nouns in English, French and Spanish correspond in general to what are call Nominalkomposita in German, that is orthographically concatenated forms. Also many com pound nouns are often translated by simple nouns in another language or have other graphical variants within the same language. 3 These three variants of this Spanish human noun were found in a single issue of a Spanish newspaper. About the problems of variants, cf. Jacquemin 1997.
FRANZ GUENTHNER & XAVIER BLANCO
242
ligne ferroviaire = NAdj =: N ligne de chemin de fer = N_Prep_(N_Prep_N) =: N_Prep_N=: N The number of compound nouns has often been underestimated; typically even in large traditional dictionaries, only a very small percentage seems to have caught the lexicographers attention. If we merge all existing printed dictionaries English together, the total number of compound nouns included in them is hardly more than a few hundred thousand. On the other hand, we suspect that in non technical language a few millions compounds occur regularly in texts. If we add to this the fact that the systematic coding of such compounds should also involve an adequate treatment of variants and synonyms, the vastness of any serious dictionary project in this area became apparent. In this note we will not dwell on the extreme frequency of compound nouns in technical discourse. Clearly the number of items to be inventorized here is colossal.4 When we say that a compound noun is to be treated as a lexical unit we are obliged to describe its form, its meaning and its combinatorial properties (Mel'cuk et al. 1995) independently of the properties the forms it contains may have. From this it follows that we cannot postulate any kind of internal predica tion. This is in opposition to regular constructions exhibiting the same apparent form where this is not the case. A regular construction like a black sweater is reducible to a predication like sweater (black). On the other hand, compound nouns like black hole or black box in no way imply predicate argument schemas like black (hole) or black (box). Similarly, un fait surprenant is reducible to a predication like surprenant (fait) but fait divers don't implies divers (fait). In addition to this fundamental semantic property (or better absence of semantic property) there are many other indices that help us identify the degree to which a compound noun is lexically atomic. Compound nouns are in general inmune to a number of syntactic modifications that similar but regular constructions can easily undergo. Let us have a look at just a few of them: i) modification: * a very black hole * un fait vraiment divers ii) pronominalization: ce fait Vest (évident) vs *ce fait Vest (divers)
4
And this is in spite of the fact that at least in many disciplines, e.g. medicine, mathematics, physics to mention just a few, tremendous attempts have been made to systematize and to normalize the technical terminology.
MULTÏ-LEXEMIC EXPRESSIONS
243
iii) substitution of synonyms: un fait (évident + clair) vs un fait (divers + *varié) a black (sweater + pullover) vs a black (hole + *orifice) 5 iv) coordination: unfait évident et indiscutable vs *un fait divers et indiscutable a black and warm sweater vs *a black and deep hole v) deletion: un fait évident. Ce fait...; unfait divers. *Ce fait... a black sweater. This sweater...; a black hole. *This hole... vi) nominalization: l'évidence de ce fait vs *la diversité de ce fait * the blackness of the hole
6
Clearly these tests have varying degrees of precision depending on the seman tic opaqueness of the compound. It is nevertheless obvious that we need to list them in a dictionary. Not only high school, but also private school or driving school are impossible to predict. How should we came to know that driving school is not a school in which one takes courses while being in a car? Or that private shool is not a school for soldiers of a certain military rank? In this respect, cf. Silberztein(1993). Due to the fact, that very many compounds are not completely opaque, many attempts have been made to motivate their meaning as a function of some semantic operation on their parts. In a more extended version of this paper, we will argue that these attempts are misguided and avoid a thorough evaluation of the predictive power of the methods that are proposed. How in our opinion should the representation of compound nouns in an electronic dictionary of compound nouns look like? Independently of any appli cation (where more information is typically needed) compound names should have the morphosyntactic form, their variants, their semantic class, their syn onyms and their domains encoded in the dictionary. From this information, we can automatically predict the morphological realisations of the compound (for example which plural forms it can take, etc.). 1.2. Compound Verbs Compound nouns, like simple nouns, are used as arguments or as predicates or as both. Compound verbs are obviously not used as arguments of an elementary sentence construction but rather as the name implies as predicative constructions. 5 6
With the exception, obviously in the case of a compositional interpretation. Among others, Gaston Gross has stressed the utility of this test.
FRANZ GUENTHNER & XAVIER BLANCO
244
Neverthless we must also draw attention to the use of compound verbs in support verb context (cf. 2.2.), e.g. Luc a eu un grand courage vs Luc a fait preuve d'un grand courage, where faire preuve de is a compound support verb. Like simple verbs, compound verbs must first all be described in terms of their argument structure and secondly they must also be assigned a semantic category. On the whole, the syntactic variability of compound verbs has access to the wide range of sentential patterns exhibited by simple verbs just as compound nouns may have similar internal structures as regular nominal syntagms (M. Gross 1993). For instance: -
NO V C1:7 he flogs a dead horse; il a perdu le fil NO V N1 Prep C2: I gave him a taste of his own medicine; j 'ai pris le taureau par les cornes NO V C1 Prep C2: I put my shoulder to the wheel; il a mis de l' dans son vin etc.
Compound verbs are semantically highly atomic and syntactically of the same form as regular simple verbs. More often than not the degree of semantical opa city is much higher in the case of compound verbs than in the case of compound nouns. There is in general usually little or no remembrance of the meaning of the parts. Compared to compound nouns it is much more difficult to extract compound verbs from corpora since the extraction algorithms must be able to identify the patterns in a much more complicated fashion (for example, detect verb-direct ob ject relationships, etc.). On the other hand experience shows that the number of elements in this class is considerable smaller than in the nominal counterpart. It is likely that the number of complex verb phrases can easily be kept far below 100,000 in general language.8 Most other studies focussing in complex verbs have paid less attention to there complete enumeration but rather to describing and motivating the figuratives uses of language. 1.3. Adverbs Compound adverbs are the next group of complex lexical items that need to be described (M. Gross 1986). They also have a series of syntactic patterns according to which they may be analyzed (Prep_; Prep_Adj_C, Prep_Cl_Prep_C2...). The lexical encoding of compound adverbs follows essentially the same pattern as the encoding of verbs. In addition to the syntactic pattern we need to indicate the semantic class as well as the class of verbs they may modify: 7 8
is use to encode thefrozencomponent. The most systematic study of complex verbs has been carried out by Maurice Gross for French.
MULTI-LEXEMIC EXPRESSIONS
-
245
on foot; ä pied; a pie; zu Fuß (with motion verbs) auf eigene Gefahr; ä ses visques et perils; at your own risk; por su cuenta y riesgo (with action verbs) in cold blood; a sangre fría; a sang froid (with verbs expressing a bloody crime)9
Their number is even more reduced than the number of complex verbs running much below 10,000 for a language, taken into account that among these adverbs are quite a few compound adverbs schemas which stand for countless instantia tions {de Card en Card: de dos en dos, de tres en tres...). Let us observe that we include here adverbs of the form Prep_1_Prep_N2 with a free N2: in spite of N (often referred to as "prepositional locutions"). Since the position N2 can be filled by a sentence, we can also refer to them as "conjunctive locutions". 1.4. Adjectives As is to be expected the syntactic category adjective contains compound adjec tives as well. What is different here is that many complex lexical items in this category do not have a typical adjectival form. It is rather the fact that they occur in an adjectival context that makes them function as an adjective. If we look at examples like à la mode, de bonne naissance, out of order, pendiente de pago (unpaid) we see that their internal structure is similar to that of a prepositional phrase. 1.5. Determiners We must also take into account the structure of complex determiners. Three cases need to be distinguished: - multi-lexemics determiners: beaucoup de, chacun de, cent quatre-vingt quatorze, many of the, few of the...; - nominal determiners: une demi-douzaine de (which we analyse as consisting of a predeterminer and a preposition), a large number of metaphorical expression like a flurry of criticism...; - combinations of determiners involving combinatorial constraints that can only be enumerated in the form of local grammars {tous les trois, *les trois tous).
9
We cited the simple German adverb kaltblutig in this connection.
246
FRANZ GUENTHNER & XAVIER BLANCO
2. Collocations The elements in the previous categories are lexical items that need to be regarded as units in connection with practically every linguistic operation. Most pro minently here is the example of translation. Compounds are typically translated as a whole without any attempt to maintain either the internal structure or the meaning of particular parts. The expressions we want to look at now are also multiwords forms with the additional fact that more than one lexical unit is called upon in the analysis and representation of the complex items meaning. The multiword items discuss in this section seem to be closely connected to some analysis where the term 'collocation' and 'base of collocation' have been emplo yed to describe the fact that one element of the multiword expression functions as the base or head whereas the other functions as a modifier. These collocations are to be identified with two lexical items, even if one of these items has a very special nature. 2.1. Frozen Modifiers The most typical cases of the kinds of multiword lexemes intended here are nouns, verbs and adjectives that are systematically modified with a specific semantic value. There seems to be a more or less restricted number of semantic scales that applies to a large number of lexical items in more or less a similar manner (Mel'cuk 1998). Examples of such semantic values are intensity, antiintensity, praise and anti-praise. Altogether there are probably not more of a dozen of such values in use for every languages. These modifications take place, as is to be expected, with respect to the major syntactic categories, where the base of the expression is either a noun, verb or adjective. Some examples of such modifications are to condemn strongly (intensity), to endorse heartily (intensity), to cut neatly (praise), fruitful analysis (praise), bad weather (anti-praise). These modifiers need to be coded for each lexical unit separately. Not every lexical unit will have instantiations for every semantic value for the modifier and some lexical units can have more than one modifier for a given semantic value. The modifiers used to indicate the semantic values in question range from high idiosyncratic to almost regular: another reason why they need to be explicitly hard coded. As in all the cases discussed so far, interlingual translation is again a good indicator of the frozen state of these constructions. The translation of an expres sion in this class must proceed by first identifying the type of modification and then reconstructing that modification in the target language on the basis of the translation of the base term. Thus, the sequence une peur bleue will be represented by intensity (peur) and
MULTI-LEXEMIC EXPRESSIONS
247
translated in Spanish for example by intensity (miedo) = miedo cerval, in English by intensity (fear) = mortal fear, in German by intensity (Angst) = Todesangst.10 Similarly heavy smoker will be represented by intensity (smoker) and translated as intensity (fumeur) = gros fumeur, intensity (fumador) = fumador empedernido, intensity (Raucher) = starker and not as *fumeur lourd or *fumador pesado or * schwerer Raucher. 2.2. Support Verb Structures The predicate of a simple sentence can be realized not just by simple and compounds verbs, but also by nouns, adjectives and prepositions. In the latter cases, an additional lexical element, called support verb, is usually associated with the real semantic predicate to form the predicational basis of the simple sentence (M. Gross 1998). This support verbs cannot be predicted just from the nature of the main predicate. This is of course less true for adverbs and adjectives where the copula to be seems to be the typical case11 but in case of predicative nouns the choice of the support verb is directly a function of the noun itself and not even of the semantic class of the noun (cf. eine Attacke reiten vs *ein Angriff reiten, synonyms of the German word for attack, don't combine with the same support verb). There are of course some quasi-regularities that can be formulated in terms of the semantic class (e.g. commit as a support verb for the class of nouns designa ting a criminal act) but even here every generalisation is prone to exceptions. There are at least three types of support verbs that are in use in connection with predicative nouns. Support verbs stricto sensu or level 0 support verbs are used to 'conjugate' just the meaning of the predicate noun itself. No additional meaning elements (apart perhaps from register or intensity information) are present. De pending on the syntactic role of the predicative noun, different support verbs are usually invoked. The most frequent case are those where the predicative noun is the direct object of the support verb. Certain support verbs, like have and make, seem to be more widely distributed than others and are perhaps also - together with other properties - indicative of some high-level semantic classes. Examples of level 0 support verbs are: to do someone a favor (cf. *to make a favor) to make a mistake (cf. * to do a mistake) to play a role to give a advice to take a look at
Quite often several alternatives are available for the expression of intensity: panische Angst, Höhenangst, miedo pánico... 11 An exception is when the language contains several exclusive alternatives (e.g. in Spanish the opposition ser vs estar).
248
FRANZ GUENTHNER & XAVIER BLANCO
hacer un favor cometer un error (cf. *hacer un error) desempeñar un papel (?jugar un papel) dar un consejo echar un vistazo faire un service (faire, commettre) une erreur jouer un role donner un conseil jeter un coup d'œil einen Gefallen tun einen Fehler machen eine Rolle spielen einen Ratschlag geben einen Blick werfen Whereas only a few aspectual verbs are used to introduce aspectual values for verbal predicates (e.g. begin, stop, etc.), a large variety of aspectual support verbs are used to express the inchoative, continuative or terminative aspect of nominal predicates (G. Gross 1996a). Again this cannot be predicted from a particular pre dicative noun or semantic category alone. Examples are: the war broke out la guerre a éclaté I keep my calm romper a llorar ponerse a llover Just as aspectual values are expressed ontop of the basic semantic values of a predicative noun, causative values can come ontop of either basic or aspectual versions of the predicative noun. Exemples are: zur Verzweiflung bringen to reduce to dispair raise hope in (réveiller, susciter) le désir de Hoffnung erregen llamar la atención de mantener la disciplina Still other semantic values concern the inherent qualities of the propositions denoted by the predicative noun. Typically examples here are:
MULTI-LEXEMIC EXPRESSIONS
249
to fulfil a promise to answer a question to follow an advice Mein Traum ging in Erfüllung eine Anforderung erfüllen seguir un consejo cumplir una orden mi sueño se ha hecho realidad The situation is complicated in general by the interaction of syntactic structure and choice of support verb. Depending on whether the predicative noun is subject or one of the objects, different choices of support verbs are made: la artillería enemiga (efectuó, llevó a cabo) un intenso bombardeo sobre la población la artillería enemiga sometió a la población a un intenso bombardeo la población (sufrió, fue víctima) el intenso bombardeo de la artillería enemiga un intenso bombardeo (de la artilería enemiga) (cayó, se cebó) sobre la población esta población fue el escenario de un fuerte bombardeo de la artillería enemiga The association of predicative elements with the various types of support verbs is encoded as in the case of frozen modifiers as attributes in the lexical entries for the predicative noun where for each of the support verb types a construction con taining the appropriate support verb is listed.
3. Frozen Texts So far as we have discussed lexical units belong to the major syntactic categories. There are also multiword expressions there are more or less frozen at higher levels as well. In particular, frozen texts that appear as sentences (these are the strictly speaking 'idiomatic sentences') and as complete texts. The former categories includes many kinds of proverbs as well as sentences values, pragmatemes expressing various speech-act like contexts. Exemples of proverbs are A rolling stone gathers no moss or A bird in the hand is worth two in the bush. Exemples of pragmatems are good night, staff only, etc. and also interjections and exclamations (e.g. Kiss my ass!). We will not spend more time on frozen texts as their analysis for our purposes is essentially a matter of enumeration. Let us also add that frozen texts can undergo certain processes of variation which involve creative mechanisms for the defreezing of the ordinary accepted patterns.
250
FRANZ GUENTHNER & XAVIER BLANCO
4. Grammatical Multi-lexemic Expressions From the point of view of a complete inventory of multiword expressions, we can in general make a distinction between those multiword expressions that belong to a syntactic category that play a role in the classification of simple and compound lexical items and can thus be observed in constituents of sentences and a number of other types of multiword expressions of a more 'artificial nature'. And the latter can again be subdivided in those that can be observed in surface sequences and those that are essentially theoretical reconstructions of directly observed data. The former are call grammatical multi-lexemic expressions, the latter theoretical multi-lexemes. 4.1. Empirical Grammatical Expressions An inspection of frequency information and contextual distribution shows that there are many sequences that even if they don't seem to have a grammatical status on their own (at least according to current syntactic accounts) seem to cooccur together in an essential way. It could be argued that a variety of sequences like certain temporal and periphrastic forms in English (for example has been, could have been, may have been, is on the verge of, etc.) can be analyzed together as if they occurred in a dictionary (M. Gross 1998-99). Something similar could be said about certain discontinuous but nevertheless co-occurring strings like the French negations par ticles (ne... pas) or English conjunctions like either... or, or if... then. Thus even if these expressions cannot be assigned to traditional syntactic categories, they are recognized together and are given a value on the basis of being recognized. The advantages of treating them as multiword items will be discussed in the conclu sion. Other constructions in this category include prepositions that mark arguments in a multi-lexemic way (e.g. aux mains de, de la part de, from the desk of..). More generally speaking there are several thousand highly repetitive sequences usually without specific semantic content that concern various purposes of cohesion and pragmatic emphasis (in short, in other words...). 4.2. Theoretical Grammatical Expressions One basic reason for constructing extensive simple and multiword item dictio naries is that the process of parsing can have recourse to these dictionaries when complex constructions are assembled in the parsing process. Some of the items will be grouped together on the basis on lexical look-ups and some by analytic steps of the parser. The fact that a certain compound expression is in the dic tionary conveys a certain degree of certitude concerning the correctness of the analysis. On the other hand applications of grammatical rules that assume the
MULTI-LEXEMIC EXPRESSIONS
251
existence of a construction of type given the sequence a and b of type c1 and c2 respectively, just because there is a grammar rule that says that any sequence is admitted as if it contains an expression of type c\ followed by an expression of type c2 may produce a wrong analysis since there is no guarantee that the cons truction really makes sense. Let us illustrate this in the case with an example from machine translation. Most of the time, the system will translate an element to a sentence consisting of a predicative part and arguments a\ to an by translating (assuming that everything works correctly) the various constituents separately. It has no chance to verify that this sentential schema P(a1, ...an) is a correct assumption. If it could verify that such schema exists, the confidence in the translation would increase tremen dously. This leads as to conclude that the dictionary should explicitly contain indications of the argument structure of predicates in an explicit way as well as many other schematic combinations that include the admissibility of certain com binations. These applies to almost all parts of the grammar. Examples are: : black dress, red shirt, blue trousers...12 drink : John drink mineral water; the post man is drinking a beer...
Conclusions and Perspectives We have seen that it is possible to separate the ubiquitious occurrences of multi word expressions into a small number of types, each of which with distinct pro perties. As a result, each type needs to be treated in a proper manner. The most important lesson of even a brief glance at the many ways in which multi-lexemic forms present themselves is however the fact that there is no alter native to their systematic manual enumeration. Tests with large collections of multi-lexemic expressions at the LADL and the CIS have shown that at least onethird of any natural language corpus must be analyzed in terms of dictionary entries involving such terms. The upshot is of course that the size of dictionaries will increase by an order of magnitude over current electronic (and paper) dictio naries. On the other hand, the precision that we will obtain in the parsing results will also increase tremendously both in terms of proper identification of lexical items and in terms of the semantic characterization of the text tokens. Let us also mention by way of conclusion that the availability of such large scale multi-word dictionaries will improve the quality of machine translation systems in ways that cannot be overestimated.
12
But blue jeans is a compound noun!
252
FRANZ GUENTHNER & XAVIER BLANCO
References 13 Blanco, Xavier. 1997. Noms composés et traduction français-espagnol. Lingvisticœ Investigationes XXI:1, Amsterdam: John Benjamins. Gross, Gaston. 1996a. Prédicats nominaux et compatibilité aspectuelle. Langages 121, Paris: Larousse. Gross, Gaston. 1996b. Les expressions figées en français. Paris: Ophrys. Gross, Maurice. 1986. Grammaire transformationnelle du français. 3 - Syntaxe de l'adverbe. Paris: Asstril. Gross, Maurice. 1993. Les phrases figées en français. L 'information grammaticale 59, Paris. Gross, Maurice. 1998. La fonction sémantique des verbes supports. Travaux de Linguistique 37, Bruxelles: Duculot. Gross, Maurice. 1998-99. Lemmatisation of Compound Tenses in English. Lingvisticœ Investigationes XXII, Amsterdam: John Benjamins. Jacquemin, Christian. 1997. Variation terminologique: Reconnaissance et acqui sition automatiques de termes et de leurs variantes en corpus. Mémoire d'Habilitation, Université de Nantes. Langer, Stephan. 1995. Selektionsklassen und Hyponymie im Lexikon. Seman tische Klassifizierung von Nomina für das elektronische Wörterbuch CISLEX. Thèse de doctorat, CIS, Ludwig-Maximilians Universität München. Le Pesant, Denis et Michel Mathieu-Colas. 1998. Les classes d'objets. Langages 131, Paris: Larousse. Mathieu-Colas, Michel. 1996. Essai de typologie des noms composés français. Cahiers de Lexicologie 69, Paris. Mel'cuk, Igor. 1995. Phrasemes in Language and Phraseology in Linguistics. In M. Everaert and E.-J. van der Linden (eds.), Idioms: Structural and Psycho logical Perspectives, Hillsdale: Erlbaum. Mel'cuk, Igor. 1998. Collocations and Lexical Functions. In A.P. Cowie (ed.), Phraseology. Theory, Analysis and Applications, Oxford: Clarendon Press. Mel'cuk, Igor, Andre Clas et Alain Polguère. 1995. Introduction ä la lexicologie explicative et combinatoire, Louvain-la-Neuve: Duculot. Silberztein, Max. 1993. Les groupes nominaux productifs et les noms composés lexicalisés. Lingvisticœ Investigationes XVII:2, Amsterdam: John Benjamins. Summary This paper presents a high-level classification of multi-word terms and discuss their encoding in electronic dictionaries. 13
Many bibliographical ressources are available on the Internet. A possible starting point are the bibliographies available at the Home Page of Euralex (European Association for Lexicography).
HERE AND THERE * RICHARD S. KAYNE New York University
Introduction To what extent can we unify the following two instances of there?: (1) (2)
John lives there John spoke thereof
I will refer to the there of (1) as 'locative' there, and to that of (2) as 'nonlocative' there. (2) is archaic in English, although common in Dutch and German. Locative there forms a natural class with here and where (similarly for nonlocative there). Katz and Postal (1964:133) proposed analyzing where as deriving from (at) what place. My proposal will develop the same kind of idea, although the details will be different. I will bring into the discussion the nonstandard English construction recently discussed by Bernstein (1997): (3)
a. this here book, these here books b. that there book, them there books
I will refer to the there (and here) of (3) as 'demonstrative' there (and here). I follow Bernstein (p. 97) in taking the examples in (3) not to be (reduced) relatives, i.e. they are not derived from: (4)
a. this book that/which is here b. that book that/which is there
This is supported by a number of considerations. First, (3) and (4) differ in the following way: (5)
a.* that over there book b.* this right here book
To Maurice, for his support and friendship in those essential irretrievable early years.
RICHARD S. KAYNE
254 (6)
a. that book which/that is over there b. this book which/that is right here
Second, the clearest cases of prenominal reduced relatives in English can be preceded by other material:1 (7)
a. this other recently arrived letter b. these two recently arrived letters . that beautiful recently arrived letter
This contrasts with: (8)
a.* this other here book b.* these two here books2 c.* that beautiful there book
Third, a prenominal reduced relative can be stressed, whereas demonstrative there and here cannot be: (9) (10)
? This RECENTLY ARRIVED letter is more important than that LONG SINCE OUT-OF-DATE one * This HERE letter is more important than that THERE one
Fourth, there is the basic fact that demonstrative there requires demonstrative that (and similarly for demonstrative here and this):3 (11) a.* the there book(s) b.* a there book, *one there book, *some there books Relatives are freer: (12) a. the book that's (over) there b. some books that are (over) there as are reduced relatives: (13) a. the recently arrived letter b. some recently arrived letters Taken together, these four points indicate that demonstrative here and there are not to be thought of as locatives originating in a reduced relative clause. In fact, as I will argue in the remainder of this paper, locative and non-locative there are both, when looked at from the right perspective, to be considered instances of demonstrative there. 1 2 3
On the reduced relative status of recently arrived, see Kayne (1994: 99). John Singler tells me that (b) may be possible for some speakers. Swedish has demonstrative there with what looks like a counterpart of such - v. Holmes and Hinchliffe (1994:167).
HERE AND THERE
255
1. Locatives 1.1. THIS/THAT and PLACE In the spirit of Katz and Postal (1964:134), let me begin by noting the close resem blance between locative here and there and the phrases this here place and that there place: (14) a. b. (15) a. b.
It's It's It's It's
been here for a long time been in this here place for a long time been there for a long time been in that there place for a long time
Abstracting away temporarily from the question of the preposition, we have the following: (16) Locative here and there are derived from structures approximating this here place and that there place More specifically: (17) Locative here/there are parallel to this here place/that there place, except that locative here/there have an unpronounced counterpart of place, and an unpronounced determiner instead of this/that. Put slightly differently, the here/there of ordinary locatives is simply demons trative here/there embedded in a larger DP with unpronounced noun and deter miner. Potential indirect support for the postulation of an unpronounced counterepart of place comes from sentences like: (18)
We'llbe over at John's tonight
This feels very much like: (19)
We'll
be over at John's place tonight
Further indirect support for an unpronounced noun place may also be found in: (20)
John came out from behind the tree
Postulating an unpronounced place, which I will represent as PLACE, might lead to an account of the deviance of: (21) a. *Behind which tree did he just come out from? b. *the tree behind which he just came out from If (20) is really (abstracting away from the determiner): (22)
John came out from PLACE behind the tree
RICHARD S. KAYNE
256
then (21) must correspond to either (23) or (24): (23) * Behind which tree did he just come out from a place? (24) ?? A place behind which tree did he just come out from? If abstract PLACE in (22) cannot be pied-piped, then the deviance of (21) reduces to that of (23). Speakers who accept (21)4 must be able to pied-pipe PLACE in such a way that (21) can have a status more like that of (24). The this/that of this here place / that there place can be unpronounced only if place is: (25) (26)
here, there * here place, * there place
In addition, the locative interpretation of (25) is not available if the demonstrative is pronounced and place unpronounced: (27)
this here, that there
While possible, (27) does not have the interpretation of (25).5 Furthermore, this/ that and place can be simultaneously unpronounced only if here/there is present: (28)
John put the book here/there/*0
These considerations lead to the following proposal: Let THIS/THAT be the phonetically unrealized counterpart of this/that. Then locative here and there start out as: (29)
THIS here PLACE; THAT there PLACE
Movement of the phrase containing here/there and PLACE yields: (30)
[here PLACE]i THIS ti; [there PLACE]i THAT ti
In English this cannot happen with overt this/that: (31)
* here this; *there that
Afrikaans, on the other hand, does have: 6 (32)
hierdie; daardie
with demonstrative here/there followed by the (neutralized) counterpart of this/ that. (The parameter(s) underlying this English/Afrikaans difference remain(s) to be understood.) 4
For example, John Singler (p.c.). This might be related to the acceptability in Dutch (see Bennis (1986:27,39)) of a counterpart of (21), with from a postposition. It may be that (27) is closer to this thing here, that thing there than to this here thing, that there thing. See Donaldson (1994:491).
HERE AND THERE
257
The structure proposed in (30) recalls languages in which demonstratives like this and that follow the noun (not necessarily immediately) - see Cinque (1996: sect. 4).7 Thinking of Koopman and Szabolsci (2000:23) and related work on (bare) remnant movement, let us assume that the movement shown in (30) yields a wellformed output only if here/there is unaccompanied by any other overt material in its phrase; then (33) will, as desired, not be possible (= *here place THIS, etc.): (33)
* here place/book; *there place/book
Alternatively, it may be the case that the movement of 'here/there PLACE' seen in (30) is forced by the presence of unpronounced PLACE. This would exclude a locative interpretation of (27). The further (plausible) assumption that THIS/THAT require movement of the sort illustrated in (30) will prevent (33) from being generated without movement (* THIS here place, etc.). If PLACE must always raise, and if (18) contains PLACE, then (18) is actually: (34)
PLACEi John 's ti
This raising of PLACE may underlie the impossibility, in certain varieties of English (for example, mine), of: (35)
* We'llbe over at hers/theirs tonight
(i.e. (35) is impossible for me in the PLACE interpretation available in (18)). It might be that hers/theirs (or the pronominal part of it) occupies the (higher) Spec position into which PLACE would have to move.8 From this perspective, then, PLACE can either raise by itself, as in (34), or with here/there, as in (30).9 Not possible, on the other hand, is: (36) [other/beautiful PLACE]i THIS ti; [other/beautiful PLACE]i THAT ti This suggests that the licensing of THIS/THAT is specifically dependent on here/there. (Adding here/there to (36) would lead to the violation seen in (33).)
7
There might also be a link with Longobardi's (1994) N-to-D raising with proper names.
8
Why (35) is possible with a pronoun in some varieties of English (see Trudgill and Hannah (1994:76)) remains to be understood. Note that (34) recalls Longobardi's (1996) discussion of the construct state in Romance. Why it is not possible in English with overt place remains to be understood. Raising of the sort seen in (34) differs from that of (30) in not being possible with demons tratives: (i) We 7/ be going to that again tonight (i) is not possible with the PLACE interpretation. 9
Whether there is a close link to someplace else (on which, see Kishimoto 2000), is left open.
RICHARD S. KAYNE
258
1.2. The adposition requirement Locative here and there are excluded from clearly non-prepositional contexts: (37) (38)
John loves Paris and Bill loves that place, too * John loves Paris and Bill loves there, too
This pair contrasts with: (39)
John loves it in Paris and Bill loves it in that place, too
(40)
John loves it in Paris and Bill loves it there, too
Similar to (37)/(38) is: (41)
John considers Paris/that place/*there wonderful 10
Some prepositional contexts are not possible, either: (42)
John is fed up with Paris/that place/*there
This suggests: (43) here/there, after raising (with PLACE) past demonstrative THIS/ THAT, must be licensed by a locative adposition. (The with of (42) is not locative.) This locative adposition may itself be unpronounced, as in (40).11 Also: (44)
John went (*to) there
That there is an unpronounced adposition in (44) is supported by the presence of an overt one in: (45) (46)
He went to Paris ? Where did he go to?
Similarly for: (47)
He stayed (*at) there
and: 10
Although (41) with unstressed there is sharply out, the judgment is less sharp with stressed there. Perhaps stressed there allows PLACE to be licensed in a manner akin to (22), which would recall: (i) I consider under the bed a good hiding place with an analysis: (ii) I consider PLACE under the bed a good hiding place Appreciably better than (41) with there is: (iii) ? John doesn't consider anywhere else as wonderful as Paris 11 See Katz and Postal (1964:135), Emonds (1976:79), Bresnan and Grimshaw (1978:347).
HERE AND THERE
(48) (49)
259
He stayed (at) home ? Where is he staying at?
I have formulated (43) in terms of a requirement on here/there, and not as a requirement on PLACE. Relevant is the status of: (50) (51) (52)
I
We love Bill's don't consider Bill's very comfortable We 're all fed up with Bill's
In the PLACE interpretation, these don't seem fully natural, but neither do they seem as bad as (38), (41) and (42) with there. Thus, it may be that preposed PLACE is favored by an adposition,12 but that (43) is nonetheless correct in the form given. An approach to (38), (41) and (42) in terms of (43) differs somewhat from the one proposed by Larson (1985:613), whose idea was that here and there intrinsic ally have oblique Case and that oblique Case is incompatible with the structural Case that would be assigned in contexts like those of (38), (41) and (42). The problem with this is that Icelandic, as shown by Zaenen, Maling and Thráinsson (1985), does have oblique Case-marked DPs in structural Case positions. I will therefore hold to (43), which takes the deviance of (38), (41) and (42) to simply reflect the absence of the needed licensing configuration.
2. Non-locative there Archaic English has sentences like: (53)
He spoke thereof
These are common in present-day Dutch and German. If one thinks of there as being intrinsically locative, then it's appearance in (53) is surprising. On the other hand, the analysis pursued in § 1 took what we call locative there to be an instance of demonstrative there embedded in a phrase containing the locative noun PLACE. From that perspective, there itself need not be taken to be intrinsically locative, in which case its appearance in (53) is less surprising.13 12
Cf. Longobardi (1996, note 15) on the Romance construct state showing a partial but nonsystematic dependence on a locative preposition. 13 From this perspective, the interpretation of here and there is that of deixis; for interesting recent discussion of deixis, see Jayaseelan and Hariprasad (1999). If here and there are analyzed as 'h+ere' and 'th+ere', with '-ere' in English closely matching the (more widespread) er of Dutch, a question arises (that I will not pursue) as to how to understand the interpretation compositionally.
RICHARD S. KAYNE
260
The there of (53) has in common with the there of locatives dependence on an adposition: (54)
* He mentioned there
Put another way, (53) corresponds to: (55)
He spoke of it/that
in a way that (56) cannot correspond to (57): (56) (57)
* I consider there interesting I consider it/that interesting
This similarity with respect to dependence on an adposition, combined with the identity in form of these two types of there (locative and non-locative), leads to: (58)
Non-locative there is an instance of demonstrative there.14
Generalizing from the earlier analysis of locative there as 'THAT there PLACE" (plus movement), it is natural to take (53) to contain a non-locative there that corresponds to:15 (59)
THAT there THING
Just as 'there PLACE' raises past the (unpronounced) demonstrative determiner THAT in the locative cases, as in (30), so does (phonetically unrealized) THING raise past THAT in the non-locative cases (and similarly for Dutch and German): (60)
[there THING]i THAT ti
In other words, here and there are always demonstrative here and there, in (53) as well as in the more familiar locatives. As in the earlier discussion of locative there, the movement shown in (60) will yield a well-formed output only if here/there is unaccompanied by any other overt material in its phrase: (61)
* there thing; * here thing
However, unlike the case of locatives (see (27)), non-movement in (59) (with an overt determiner) may be a possibility, if 'that there THING' underlies: (62)
that there; this here
Similarly, with there absent, for 'that THING': (63)
that; this
14
As in Gross (1968:54) on French y. (53) can to some extent also involve reference to humans (cf. Bennis 1986:191), so 'THAT there PERSON/BODT must also be available.
HERE AND THERE
261
Recall now (43), repeated here: (64)
here/there, after raising (with PLACE) past demonstrative THIS/ THAT, must be licensed by a locative adposition.
At first glance, it looks as if non-locative there and here (with THING rather than PLACE) differ in that they do not require that the licensing adposition be locative (given (53) and other examples with non-locative adpositions). I would like to suggest, however, that even non-locative here/there require licensing by a locative adposition. Relevant considerations come to the fore if we ask the question: Why does English have locative there (i.e. 'THAT there PLACE'), but no longer have non-locative there (i.e. 'THAT there THING'), even with an adposition? Of importance is the fact that within the Germanic languages the only ones that productively have non-locative there are Germanic languages of the OV type, i.e. Scandinavian seems to be like English.16 This raises the possibility, taking (53) to be an (obvious) instance of a postpos itional PP, that (53) is excluded in present-day English and Scandinavian parallel to the rather general absence of postpositional languages where the normal order of verb and postpositional phrase would be 'V PP' (i.e. 'V DP P'). 17 Since 'V PP' order is of course a perfectly common normal order where PP is prepositional, the next question is why non-locative there never occurs in (archaic) English with prepositions (and similarly for Dutch and German, both of which have many prepositions): (65) * He spoke of there I think the answer to this takes us back to (64). Before returning to (64), however, let me pursue a brief digression. As far as I know (65) is perfectly representative for non-locative there, i.e. the generalization that non-locative there (and similarly for non-locative here and where) is never the 16
Cf. Holmes and Hinchliffe (1994:365) on Swedish; Allan, Holmes and Lundskaer-Nielsen (1995:379) on Danish; similarly for Icelandic, according to Thorhallur Eythorsson and Thorbjörg Hróarsdóttir (p.c.). 17 See Kayne (2000:321). One does hear in some spoken English instances of (adjunct) whereby in relatives. It may be that these are postverbal at no stage of the derivation, and perhaps similarly for therefore. Left open is the question of how a speaker represents/internalizes archaic constructions; also, the status of French (i): (i) Tu peux compter là-dessus (You can count there of-on) which is not archaic. Relevant, too, may be French: (ii) Ils ont tiré dessus (They have shot of-on) with a covert argument that is probably to the left of dessus.
262
RICHARD S. KAYNE
object of a preposition is exceptionless in all of Germanic.18 On the other hand, locative there and here (and where) are sometimes found following a preposition. The facts are complex, since there is a contrast between (66), which at first glance looks like (65), and (67): (66) a.* I'm going to there tomorrow b. * They plan to stay at here for a week (67) It's warm under here The question is whether (67) is, given the contrast between it and (65), compatible with my general claim that locative and non-locative here and there are essentially the same (demonstrative) element. In fact, (67) does not contrast minimally with (65), since here in (67) is not really the object of under.19 This is suggested by the fact that (67) feels close to: (68)
It's warm here under the blanket
Like (67), I suspect, is: (69)
I'm in here
which seems close to: (70)
I'm here in the kitchen
suggesting an analysis for (67) and (69) on the order of: (71)
[under/in X]i A T here ti
which in more detail would be: (72)
[under/inX]iAT[[here
PLACE]j THIStj] ti
More minimal is the contrast between (65) and:20 18
And perhaps universally. Cf. Kayne (1994:50) on the absence of (65) in postpositional lan guages. 19
Rizzi (1988:530) has made the same point for what looks like a fairly close Italian counterpart of (67), which, however, has (as in French) the reverse word order, e.g. qua sotto (here under), with this difference presumably related to English frogman vs. French homme grenouille (man frog). 20
That (73) is substantially different from (67)/(69) is supported by (i) vs. (ii): (i) a. Where is he from? b. Where did he just arrive from? . Where is he off to? (ii) a. * Where is it warm under? b. * Where are you in? (vs. Which blanket is it warm(est) under?, What room are you in?) Similarly: (iii) a. He 'sfrom somewhere else b. He wouldn 't be leaving from anywhere else . This time we 're off to somewhere exotic
HERE AND THERE
263
(73) a. He's from there b. Why is he leaving from there? c. He went from here to there in five seconds I think the way to proceed is to take (73) to be more representative than (66) (and to take (66) to involve an orthogonal factor requiring that the preposition be unpronounced, for reasons that need to be looked into further). Why, then, should there be a sharp difference between locative here/there, which is compatible with a preposition, as seen in (73) and non-locative here/ there, which is not compatible with a preposition, as seen in (65)? Let me propose that the answer lies, paradoxically, in generalizing (64) to cover both locative and non-locative here/there. This generalization yields: (74)
here/there, after raising (either with PLACE or with THING) past demonstrative THIS/THAT, must be licensed by a locative adposition.
In the locative examples of (73), the licenser is the visible preposition (from, to). In (67) and (69) it's the abstract AT shown in (71)/(72). In the non-locative (65), there seems to be no locative adposition, so (65) appears to straightforwardly violate (74). But this cannot be right, given: (75)
He spoke thereof
and especially its fully acceptable counterparts in Dutch and German. If there were really no locative adposition in (65), then there would presumably not be one in (75), either, in which case (75), too, would violate (74) in all three languages, in correctly. The solution I would like to propose (adapting an idea from Hoekstra (1984:290) and Bennis (1986:193)) is that (75) (and its counterparts in Dutch and German) does in fact contain a locative adposition. This solution will have two primary advantages. First, it will allow us to retain the unified (74). Second, it will allow an account of the absence of (65) in all of Germanic. This account will relate the ungrammaticality of (65), repeated here: (iv) a. * It must be warm under somewhere b. * He can't be in anywhere else It appears that the phrase following AT in (71)/(72) must be definite. If so, then the empty position in English topicalization and clefts apparently does not count as definite (alternatively, extraction from the position following AT in (71)/(72) is impossible): We 've been living in this cave/in here for weeks (v) (vi) This cave/*Here we've been living in for weeks (vii) It's that cave/*It 's there that he's been living in (viii) That box/*There you should never have put it in These contrast with: (ix) There I hardly ever go for vacation (x) It was right there that I put it
264
(76) to that of: (77)
RICHARD S. KAYNE
* He spoke of there 21
* He's counting on to win
In Kayne (2000:298), (77) is excluded as a violation of preposition stranding, parallel to the 'heavy-NP-shift' example: (78) * John has shown his work to this semester most of his fellow students In acceptable cases like He's trying to win, the prepositional complementizer to enters the derivation above VP and attracts the infinitive phrase that has been merged as complement to V. That kind of derivation fails to generalize to (77) because of the presence of on.22 Returning to non-locative there, the idea is first, that it requires a locative adposition, as stated above, and second, that, as with infinitival to, this locative adposition enters the derivation above VP. More specifically, this abstract locative adposition enters the derivation after the visible adposition. Therefore, if (76) were possible, it would have to have the (simplified) derivation: (79) ... ... ... ... ...
spoke of THAT there THING → merger of locative adposition P(loc) spoke of THAT there THING → raising to Spec, P(loc) [ THAT there THING]i P(loc) spoke of ti → P(loc)j+W[ THAT there THING]i tj spoke of ti → [spoke of ti]k P(loc)j+W[ THAT there THING] i tj tk
In the spirit of Kayne (2000:238,291ff.), I take this to be a preposition stranding
And perhaps to that of (cf. Kayne 1985:123): (i) a. *He stepped on it flat. b. * They ran around him dizzy. if the well-formed He squashed it flat and They ran him dizzy necessarily involve an abstract preposition that attracts either Whim or it flat/him dizzy. Similarly for: (ii) a. *He stepped on it into a pancake b. *They ran around him into a tizzy The text discussion of (76) assumes that there is hierarchically lower than of. For why it could not be higher, see Kayne (1994:50). 22
Sometimes accepted, in contrast to (77), is: (i) ? He's counting on there to be a solution See Kayne (2000:311) on the (better): (ii) John is thinking about where to go The passive of (i) is worse: (iii) * There's being counted on to be a solution recalling: (iv) * There was prevented/kept from being a solution
HERE AND THERE
265
violation (in the third line) parallel to (77), to (78) and, for many speakers, to:23 (80)
* John shows his work to only Mary
The essential difference between (76) and (73) is now seen to reside in the fact that (73) does not require any abstract locative adposition, since it contains a visible one capable of licensing there. Put another way, the deviance of (76), like that of (77), is due to the interaction of the two adpositions, whereas (73) only has one. More precisely, the extra adposition (P(loc) in (76) and to in (77)) induces an illicit movement (which in (78) is induced by a functional head that is probably not adpositional).24 In (73), on the other hand, no comparable illicit movement takes place at all. To allow for the grammatical cases of non-locative there followed by a postposition, e.g. in Dutch (from Bennis (1986:176)): (81)
Ik heb er over gesproken (T have there about spoken')
I continue to assume that adpositions can be introduced above VP and get together with their 'objects' via movement. In such derivations, as with P(loc) in (79), the relevant DP moves to the Spec of the adposition. In prepositional sentences, there are additional movements of the sort seen in the last two lines of (79). Since (81) is not prepositional, we can take it to involve movement to Spec,P, without it needing to involve those additional movements: (82) ... over gesproken [THAT er THING] → movement to Spec,P ... [THA T er THING]i over gesproken ti The adposition over does not raise to any W, nor does the VP, then, raise to Spec, W. The last line of (82) is followed by the introduction of P(loc): (83) ... P(loc) [THAT er THING]i over gesproken ti Raising to Spec, P(loc) yields, without there being a P-stranding violation of the sort seen in (79), the following:25 (84) ... [THAT er THING]i P(loc) ti over gesproken ti in which er (which, strictly speaking, has moved up within DP past THAT, in a way not illustrated in (82)-(84)) is licensed in virtue of its relation to P(loc). This derivation leaves the overt adposition to the left of VP, which is the 23
This violation will hold independently of where the verb ends up and so will hold, too, for the (ungrammatical) Dutch and German counterparts of (76) with preposition followed by nonlocative there. 24 Cf. den Dikken (1995). 25
A more careful discussion of preposition stranding is beyond the scope of this paper. The movement illustrated in (84) recalls those proposed by van Riemsdijk (1978).
266
RICHARD S. KAYNE
desired (normal) order for Dutch and German. Additional factors must intervene to allow for the acceptability in Dutch (more than in German, it seems) of sentences with postverbal er/daar+P, and similarly for archaic English.26 The derivation of a grammatical sentence with locative here/there would look like: (85) John is from there (86) ... is [ THAT there PLACE J → merger of locative from ... from is [ TEAT there PLACE] → movement to Spec,P ... [THAT there PLACE ]i from is ti → raising of P ... fromj+W[ THAT there PLACE] i tj is ti → raising of VP ... [is tj]kfromj+W[ THAT there PLACE ]i tj tk (86) has not represented the movement of there within DP. Adding that to the third line of (86) would yield: (87) ... [ [there PLACE]m THAT tm ]i from is ti in which there is licensed in Spec from, since from is locative. Thus (85) is correc tly distinguished from (76).
3. French and Italian The adposition doubling that I have advocated in (83) recalls the extra adposition seen in Italian in sentences like:27 (88) a. Passerò sopra alla questione (I-will-pass over/above to-the question) b. Pensero su alla tua proposta (I-will-reflect on to-the your proposal) la legge alla quale ho votato contro (the law to-the which I-have voted against) In these examples, the prepositions sopra, su and contro are accompanied by the preposition a (which in combination with the definite article la gives alla). Italian a has both locative and dative uses: (89) a. Vivo a Milano (I-live in Milan) b. Vado a Milano (I-go to Milan) (90) Do il libro a Gianni (I-give the book to G.) A basic question not discussed here is how Dutch allows preverbal prepositions - for relevant discussion, see Barbiers (1995). Similarly omitted from discussion is the question whether any strongly head-final language of the Japanese/Korean/Turkish sort could allow non-locative there, and if not, why not. 27
Cf. Rizzi (1988), from which example (c) is taken. The other two were provided by Paola Benincà (p.c.).
HERE AND THERE
267
These can be distinguished by cliticization, which yields ci (or vi) with locatives and gli or le with (third person) datives: (91) a. Ci vivo (there I-live) b. Ci vado (there I-go) (92) Gli do U libro (him dat I-give the book) Cliticization in the examples given in (a,b) yields a ci that is clearly 'non-locative' (93) a. Ci passerò sopra (there I-will-pass over/above) b. Ci penserò su (there I-will-reflect on) In none of (88) does cliticization yield a dative. I conclude that the a in (88) is a locative adposition (and not a dative adposition). More specifically, let me propose that the a of (88) is an overt counterpart of the abstract locative adposition that I have taken to play a key role in the licensing of non-locative here/there in Germanic, as in (81)-(84). In Italian, the possibility illustrated in (88) is available only with certain prepositions: (94)
Gianni esce con (*a) quella ragazza (G. goes-out with to that girl)
Despite the fact that con ('with') does not allow an overt 'extra' locative a, cliticization resulting in ci is still possible:28 (95)
Gianni ci esce (G. there goes-out)
This sentence, which could translate into English as 'John goes out with her', contains non-locative ci. Put another way, the ci of (93) and (95) are most naturally analyzed as Italian counterparts of Germanic non-locative there. For example, (b) is plausibly a close counterpart of the archaic (in English): (96)
I
will reflect thereupon
The fact that ci and su are separated in the Italian example is a fact that I take to be orthogonal to the main discussion. (It recalls the way in which (non-locative) there and upon can be separated in the Dutch counterpart of (96).) 28
Cf. Calabrese (1988:562), Corver and Delfitto (1999:822). As in Dutch (see note above), non-locative ci can in some cases go with a human, i.e. with ' TEA T there PERSON/BODY'. That (95) is parallel to (94) is supported by the fact that French generally disallows the former (although Tu peta y compter ('you can there count') is possible) and does not allow an extra ä of the sort found in (88) anywhere near as readily as Italian. (Catalan seems to be fairly similar to Italian, in both respects.) French non-locative is by and large limited to cases where the corresponding overt (nonlocative) preposition would be à.
268
RICHARD S. KAYNE
Although the non-locative ci of (95) has no close counterpart in English, it is clearly closely related to the non-locative ci of (93). More specifically, let me pro pose that the two ci are the same, and that (95) is essentially identical to (93) but for the missing preposition (con) in the former. In other words, (95) is essentially like (96), except that in (95) there is a covert con where (96) has an overt upon. Comparing (95) now with both (93) and (88), we see that (95) has two covert adpositions, one con and one a.29 The fact that con can be unpronounced in (95) is not specific to the cases under discussion, but is in all likelihood related to the possibility of relative clauses with a missing preposition, e.g. in some French: (97)
ce que j 'ai besoin (that that I have need)
In summary of this section, consideration of Italian supports the proposal made earlier that Germanic sentences with thereof, as in the English (75), contain an extra unpronounced adposition, a counterpart of the a of (88). Before going on to discuss number, let me note that the assimilation of Italian non-locative ci to Germanic non-locative there is itself supported by the fact that ci requires licensing by an adposition (which may be unpronounced), just as there does. I repeat an example (56) given above for English, in which non-locative there is prohibited from appearing in a non-adpositional context: (98)
* I consider there interesting
Italian non-locative ci is equally impossible here:30 (99)
* Io ci considero interessante (I there consider interesting)
29
I leave open the question why con differs from sopra, su, contro in the way seen in (88) vs. (94). It may be that (88) has three adpositions, thinking of French: (i) Ils lui ont tiré dessus, à Jean (They himdat have shot of-on, to J. = They've shot at him, J.) and that con, contrary to sopra, su, contro, cannot be preceded by an unpronounced counterpart of this de. (95) might show that this property of con holds only if con itself is pronounced. For discussion of this extra de (of), see Starke (1993). 30
The non-locative ci under discussion will have a structure as in (60), with ci in place of there. Italian locatives are more complex than English, however, in having a clitic/non-clitic distinction {ci vs. lì/la). Non-clitic locative lì/lä ('there') has no non-locative counterpart. It might be that the unpro nounced counterpart of con (and other prepositions like it) must itself be licensed by, or more specifically be carried along with, an object clitic (including in (97)). Irrelevant in the present context is the fact that ci in Italian is also the first person plural object clitic, and in some perhaps dialect-influenced Italian also a third person dative clitic; see Cresti (to appear, note 9). (98) and (99) show that the a of (88) (and its unpronounced counterparts in Italian and Germanic) itself depends on the presence of another adposition, perhaps for Case reasons.
HERE AND THERE
269
4. Number The Italian locative ci of (91) and non-locative ci of (93)/(95) will, as in the earlier discussion of English and other Germanic, correspond to: (100)
[ci PLACE/THING/PERSON]i ti
Like Germanic there, Italian ci will require the local presence of a locative adposition. In the case of ci, and in relation to its clitic character, that locative adposition will always be an unpronounced counterpart of the a seen in (88). Recalling the fact that non-locative there in Germanic is productive only in the Germanic OV languages, it is likely that the unpronounced a that licenses ci is not postverbal at the relevant point in the derivation. Consider now the question whether the abstract noun in (100) can be plural. The initial observation is that neither ci nor there, nor any of their counterparts in other Romance or Germanic languages, show a morphological singular/plural distinction, e.g.: (101) * He went theres None of these forms combine with plural morphology. Despite this, there are indications that a plural counterpart of (100) is available in the languages under consideration. Although I have not directly addressed in this article the status of where, it is plausible to take where to have an analysis parallel to that of here and there (i.e. to occur in a 'D where NP' structure). If it does, then the plurality of where in the following indirectly supports the possible plurality of here and there: (102) a Where all did he go ? b. Where did he go all ? As discussed by McCloskey (2000), (b) is possible in West Ulster English, (a) more broadly (though not in all varieties of English). Similarly, in Dutch one can have (example provided by Marcel den Dikken): (103)
Hij heeft daar/er gisteren allemaal mee gespeeld (he has there yesterday all with played)
in which daar (or er) (which is the 'antecedent' of allemaal ('all')) is a counter part of English there. In addition, in French, one can marginally have:31 (104) ?? Elle y répondra ä tous (she there will-answer to all) From the perspective adopted here, it is not, strictly speaking, where, daar, er, 31
Cf. Kayne (1975: sect. 2.7).
270
RICHARD S. KAYNE
that are themselves plural. Rather (102)-(104) indicate that the nouns PLACE and THING/PERSON that go with these can (in certain cases) be plural. (103), for example, will contain: (105)
[daar THINGS]i THOSE ti
The universal quantifier will combine with this phrase (and not directly with daar). The fact that where, daar, er, (like there in (101)) show no plural mor phology will now be a fact (yet to be well understood) about how plural marking 'percolates' to subparts of DP. Independently of quantifiers, the French and Italian clitics and ci also show plurality insofar as they can be linked with a plural under the form of doubling called Right-Dislocation, e.g.: (106)
Jean y pense, ä ses problèmes (J. there thinks, to his problems)
As in (103)/(105), we will have: (107)
[y THINGS]i THOSE ti
French and Italian share another locative clitic en/ne, e.g. in French: (108)
Jean en revient (J. (from)there comes-back)
I will set aside the question how best to distinguish en/ne from y/ci,32 and simply note that en and ne have non-locative uses, too: (109) a. Jean en parle (J. there speaks = J. speaks of it) b. Gianni ne parla (Italian - same) Like in (106), en and ne can be associated with a dislocated plural: (110) a. Jean en parle, de ces problèmes (J. there speaks, of these problems) b. Gianni ne parla, di questi problemi (Ital. - same) In addition, certain instances of non-locative ne in Italian (and similarly for French en, for some speakers) can be associated with plural agreement: (111)
Gianni ne ha visti tre (G. there has seen(m.pl.) three = G. has seen three of them)
The -i of visti indicates plural agreement. This agreement is likely to be mediated by ne; in the absence of ne, this past participle agreeement does not take place: (112) Gianni ha visto/*visti tre ragazzi (G. has seen(m.sg.)/(m.pl.) three boys) 32
It is possible that en and ne involve two unpronounced adpositions (de/di and à/a), whereas and ci involve only one (à/d); cf. den Dikken (1996), as well as Cresti's (to appear) idea that en/ne is an oblique form of y/ci. Alternatively it might be that de/di itself counts as the licensing locative adposition for en/ne.
HERE AND THERE
271
Despite the fact that ne itself shows no number morphology, the past participle agreement of (111) seems to be determined by the plural number of ne, or, more exactly, by that of the phrase given in (113), in the spirit of the analysis I have developed here for both locative and non-locative there, y/ci, en/ne:33 (113)
[ne THINGS/PERSONS]i THOSE ti
References Allan, R., P. Holmes and T. Lundskaer-Nielsen. 1995. Danish. A Comprehensive Grammar, Routledge: London. Barbiers, S. 1995. The Syntax of Interpretation. Doctoral dissertation, Holland Institute of Generative Linguistics. Bennis, H. 1986. Gaps and Dummies. Doctoral dissertation, Tilburg University. Bernstein, J. 1997. Demonstratives and reinforcers in Romance and Germanic languages. Lingua 102, 87-113. Bresnan, J. and J. Grimshaw. 1978. The Syntax of Free Relatives in English. Linguistic Inquiry 9, 331-391. Calabrese, A. 1988. I pronomi clitici. In L. Renzi (ed.), Grande grammatica it aliana di consultazione. Volume I. La frase. I sintagmi nominale e preposizionale, Bologna: Il Mulino, 549-592. Cinque, G. 1996. The Antisymmetric Programme: Theoretical and Typological Implications. Journal of Linguistics 32, 447-464. Corver, N. and D. Delfitto. 1999. On the Nature of Pronoun Movement. In H. van Riemsdijk (ed.), Clitics in the Languages of Europe (Eurotyp 20-5), Berlin: Mouton de Gruyter, 799-861. Cresti, D. (to appear) Aspects of the Syntax and Semantics of ne. In Tortora (ed.), The Syntax of Italian Dialects, New York: Oxford University Press. Den Dikken, M. 1995a. Extraposition as intraposition, and the syntax of English tag questions, ms., Vrije Universiteit Amsterdam/HIL. Den Dikken, M. 1996. How external is the external argument? Paper presented at WECOL 1996, Vrije Universiteit Amsterdam/HIL. Donaldson, B. 1994. Afrikaans. In E. König and J. van der Auwera (eds.), The Germanic Languages, London: Routledge, 478-504. Emonds, J.E. 1976. A Transformational Approach to English Syntax. Root, Structure-Preserving and Local Transformations. New York: Academic Press.
33
The abstract THING/PERSON must not have intrinsic gender; it must rather agree in gender with its antecedent. On (111)/(113), note: John just saw three tanks. Bill just saw three of the/those things himself
272
RICHARD S. KAYNE
Gross, M. 1968. Grammaire transformationnelle du français. Syntaxe du verbe. Paris: Larousse. Hoekstra, . 1984. Transitivity. Grammatical Relations in Government-Binding Theory. Dordrecht: Foris. Holmes, P. and I. Hinchliffe. 1994. Swedish. A Comprehensive Grammar. Lon don: Routledge. Jayaseelan, K.A. and M. Hariprasad. 1999. Deixis in Pronouns and Noun Phrases. Ms., Hyderabad: Central Institute of English and Foreign Languages. Katz, J.J. and P.M. Postal. 1964. An Integrated Theory of Linguistic Descriptions. Cambridge, Mass.: The MIT Press. Kayne, R.S. 1975. French Syntax. The Transformational Cycle. Cambridge, Mass.: The MIT Press. Kayne, R.S. 1985. Principles of particle constructions. In J. Guéron, H.-G. Obenauer & J.-Y. Pollock (eds.), Grammatical Representation. Dordrecht: Foris, 101-140. Kayne, R.S. 1994. The Antisymmetry of Syntax. Cambridge, Mass.: The MIT Press. Kayne, R.S. 2000. Parameters and Universals. New York: Oxford University Press. Kishimoto, H. 2000. Indefinite Pronouns and Overt N-Raising. Linguistic Inquiry 31,557-566. Koopman, H. and A. Szabolcsi. 2000. Verbal Complexes. Cambridge, Mass.: The MIT Press. Larson, R. 1985. Bare-NP Adverbs. Linguistic Inquiry16, 595-621. Longobardi, G. 1994. Reference and proper names. Linguistic Inquiry 25, 609665. Longobardi, G. 1996. The Syntax of N-Raising: A Minimalist Theory. OTS Wor king Papers, Utrecht University. McCloskey, J. 2000. Quantifier Float and Wh-Movement in an Irish English. Linguistic Inquiry 31, 57-84. Rizzi, L. 1988. Il sintagma preposizionale. In L. Renzi (ed.), Grande grammatica italiana di consultazione. Volume I La frase. I sintagmi nominale e prepo sizionale, Bologna: Il Mulino, 507-531. Starke, M. 1993. Notes on Prepositions and Clause-Structure. Mini-Mémoire, Uni-versity of Geneva. Trudgill, P. and J. Hannah. 1994. International English. A Guide to Varieties of Standard English, third edition. London: Edward Arnold. Van Riemsdijk, H. 1978. A case study in syntactic markedness. The Peter de Ridder Press. Zaenen, A., J. Maling and H. Thráinsson. 1985. Case and Grammatical Functions: The Icelandic Passive. Natural Language and Linguistic Theory 3, 441-483.
HERE AND THERE
273
Summary Locative 'here' and 'there' are parallel to 'this here place' and 'that there place' (which contain demonstrative 'here' and 'there') except that locative 'here' and 'there' have (in the spirit of Katz and Postal (1964)) an unpronounced counterpart of 'place', and an unpronounced determiner instead of 'this'/'that'. The non-locative 'there' of sentences like 'He spoke thereof (widely found in Germanic) is also, when looked at from the right perspective, to be considered an instance of this demonstrative 'there' (and similarly for 'here').
SUR L'ORDRE DES ADJECTIFS FERENC KIEFER Académie des Sciences de Hongrie, Budapest
1. Le problème L'ordre des adjectifs épithètes n'est pas arbitraire, il obéit a certaines règles sémantiques. En général, Tune des suites possibles de deux ou même trois adjectifs est neutre tandis que les autres sont moins naturelles ou même agrammaticales. Considérons les suites (la-b) pour le premier cas, et les suites (2a-b) pour le deuxième. Les suites moins naturelles sont marquées par un point d'interrogation et les suites agrammaticales par un astérisque: (1) (2)
a un mot hongrois long b. ? un mot long hongrois a. sa femme malade précédente b. * sa femme précédente malade
Dans cet article nous essaierons d'établir les principes qui déterminent l'ordre neutre des adjectifs épithètes. Nous essaierons également d'expliquer pourquoi la suite en (lb) est marquée et celle en (2b) mal formée.
2. Une taxinomie sémantique des adjectifs La taxinomie sémantique que nous proposons ci-dessous n'est pas complète, mais elle sera suffisante pour pouvoir formuler notre hypothèse concernant les principes qui semblent déterminer l'ordre des adjectifs.1 2.1. Les adjectifs absolus Les adjectifs de couleur comme rouge, brun, jaune; les adjectifs de nationalité 1
Nous avons proposé une classification sémantique des adjectifs dans Kiefer (1978), basée sur des propriétés présuppositionnelles des adjectifs dont nous n'utiliserons que quelques traits dans cette étude. Pour un résumé des taxinomies proposées dans la littérature pertinente, cf. Hamann (1991).
FERENC KIEFER
276
comme Italien, hongrois, français; les adjectifs contradictoires comme malade sain, humide - sec (les adjectifs contradictoires sont définis par la propriété suivante: x implique la négation de et la négation de y implique x); les adjectifs privatifs comme aveugle, sourd, muet, chauve, tous possèdent la propriété suivante. La phrase () qui contient l'adjectif absolu malade implique les phrases (3b) et (): (3)
a. b. .
Paul est un enfant malade Paul est un enfant Paul est malade
En termes généraux, les implications (4a-b) sont valables:2 (4)
a. b.
X est ADJN X est ADJN
→ →
X est N XestADJ
Les adjectifs qui obéissent a (4a-b) sont appelés adjectifs absolus. Parmi les adjec tifs absolus les adjectifs de nationalité sont dans un certain sens 'plus absolus' que les autres: en tant que noms de nationalité ils n'admettent pas la comparaison: *plus italien/hongrois/frangais. Il s'agit d'une dichotomie absolue: quelqu'un est hongrois ou il ne Test pas, et s'il est hongrois il ne peut être plus hongrois qu'un autre hongrois (cf. * Jean est plus hongrois que Pierre). Bien sur, dès qu'on atta che des caractéristiques des nationalités a ces adjectifs, la comparaison devient possible: Il est plus Italien (plus bavard, plus expansif, etc.) que Luigi. Les adjectifs de couleur n'admettent pas la comparaison non plus: * Ce tissu est plus rouge que l'autre. Mais étant donné qu'un adjectif de couleur dénote tout un intervalle sur le spectre des couleurs avec une valeur focale, il est possible de modifier un nom de couleur par un attribut comme foncé, clair et on peut également combiner deux couleurs pour dénoter l'intersection de deux intervalles, par exemple bleu-vert, brun-jaune. En ce qui concerne les adjectifs privatifs, notons tout d'abord qu'ils manquent d'antonymes. La présence d'une faculté est exprimée par un prédicat plutot que par un adjectif: x n'est pas muet - x peut parier, x n'est pas chauve ~x a des cheveux. En outre, les privatifs ont toujours une connotation négative parce qu'ils dénotent l'absence d'une propriété normalement présente. Les privatifs peuvent être modifiés: un sourd, complètement sourd, de même pour les adjectifs contradictoires: très grand, trop grand. Notons aussi que les adjectifs contradictoires dénotent un état moins stable que les autres adjectifs mentionnés ci-dessus, c'est-à-dire que 'être malade' est normalement un état provisoire tandis que 'être italien/jaune/chauve' expriment des états (plus au moins) permanents. Par conséquent, dans la caractérisation lexicale des adjectifs en question les spécifications suivantes sont nécessaires: les trait [-comparatif] et [-modifiable] pour les adjectifs de nationalité, [-comparatif] pour les adjectifs de 2
L'idée d'utiliser la notion d'implication pour la classification des adjectifs est dûe à BartschVennemann (1972:73).
SUR L'ORDRE DES ADJECTIFS
277
couleur, le trait [-permanent] pour les adjectifs contradictoires. Ceci nous donne la matrice suivante: nationalité
couleur
privatif
contradictoire
Comp
-
-
+
+
Perm
+
+
+
-
Mod
-
+
+
+
Les adjectifs comparables sont sémantiquement plus complexes que les noncomparables, parce que la comparabilité présuppose un intervalle avec des frontières claires et une structure interne qui permet la gradabilité tandis que les non-comparables soit ne représentent pas un intervalle (comme les adjectifs de nationalité), soit sont liés a un intervalle moins structuré (comme les adjectifs de couleurs). Les adjectifs qui expriment une propriété permanente sont moins com plexes que les adjectifs qui expriment une propriété transitoire, parce que les derniers exigent un trait supplémentaire dans leur spécification lexicale. Enfin les adjectifs non-modifiables sont également moins complexes que les adjectifs modifiables grâce au fait que la modifiabilité présuppose un intervalle avec une structure plus complexe. Ceci nous donne la hiérarchie sémantique suivante: (5)
nationalité < couleur < privatif < contradictoire
On pourrait également illustrer cette hiérarchie par les représentations suivantes:
(a)
0 hongrois
(b)
(c) | rouge orange
|
non-chauve chauve
(d) |
| malade
| sain
Syntaxiquement, les adjectifs absolus permettent l'usage attributif ainsi que l'usage prédicatif. Par conséquent, un enfant malade peut être explicité par un enfant qui est malade, et les deux expressions sont sémantiquement équivalentes. Cette équivalence peut être exprimée par la formule (6): (6)
ADJ N ↔ N qui est ADJ
2.2. Les adjectifs relatifs Dans le cas des adjectifs comme grand, long, lourd (les adjectifs de mesure) et bon, joli, paresseux (les adjectifs évaluatifs) seule l'implication (4a) est valable. La phrase (7a) n'implique que (7b):
FERENC KIEFER
278 (7)
a. b. c.
Pierre est un grand bébé Pierre est un bébé Pierre est grand
De même pour (8a-c) où l'implication (8a) → (8c) n'est pas valable: (8)
a. b. c.
Pierre est un correspondant paresseux Pierre est un correspondant Pierre est paresseux
Les adjectifs qui n'obéissent qu'à la première des deux implications sont appelés adjectifs relatifs. L'attribut 'relatif vient du fait que la valeur de ces adjectifs dépend d'une norme ou d'une valeur moyenne. Il s'ensuit que, dans le cas de ces adjectifs, l'équivalence (6) n'est pas valable. Elle doit être remplacée par l'équivalence (9): (9)
ADJ N ↔ N qui est ADJ à l 'égard de NC
où Nc représente la norme dans la classe des entités dénotées par N. En d'autres termes, l'nterpretation correcte de la phrase (7a) est la suivante: en ce qui concerne la taille moyenne des bébés, Pierre est grand. La phrase (8a) peut être paraphrasée d'une façon similaire: a l'égard du comportement présumé d'un cor respondant, Pierre est paresseux. Par conséquent, dans le cas des adjectifs relatifs, la validité de la proposition doit toujours être relativisée en tenant compte de la valeur de NC. Notons cependant que si le nom-tête prédicatif exprime une propriété sémantique qui est inhérente au nom-sujet, la phrase admet les deux implications. Par exemple: (10) a. b. .
Ma voisine est une belle femme Ma voisine est une femme Ma voisine est belle
Il est évident que (10a) implique (10b) ainsi que (10c) malgré le fait que beau est un adjectif relatif mais dans ce cas-la le nom voisine contient le trait sémantique [+féminin]. En effet, la phrase (10a) est redondante, elle est équivalente à la phrase (11): (11)
Ma voisine est belle
Les deux classes d'adjectifs qui appartiennent aux adjectifs relatifs se distinguent par rapport a la façon dont la norme est déterminée. Dans le cas des adjectifs de mesure, la norme peut être calculée, il s'agit de la valeur moyenne de l'ensemble d'entités définies par le nom en question et dans ce sens la norme est objective. Dans le cas des adjectifs évaluatifs, en revanche, il n'y a pas de norme objective: la norme est définie par les exigences du locuteur, la norme est ce qui répond a l'attente du locuteur, il s'agit alors d'une norme subjective. Cette norme subjective est responsable du fait que les adjectifs évaluatifs sont sémantiquement plus com-
SUR L'ORDRE DES ADJECTIFS
279
plexes que les adjectifs de mesure. Par exemple, la phrase comparative Pierre est plus petit que Jean n'implique ni que Pierre est petit, ni que Jean est petit, tandis que la phrase Marie est plus laide que Cécile implique (présuppose) que Marie est laide et que Cécile est laide. Ceci nous donne la hiërarchie sémantique suivante: (12) adjectifs de mesure < adjectifs évaluatifs 2.3. Les adjectifs irréguliers Une petite classe hétérogène contient des adjectifs qui n'admettent pas l'emploi prédicatif, seul l'emploi attributif est possible. Les adjectifs comme précédent, prétendu, présumé, prochain, suivant, antérieur appartiennent a cette classe: le président précédent - *le président est précédent. Un tel adjectif n'entre pas dans des relations implicationnelles, c'est-a-dire que ni l'implication de (13a) a (13b), ni celle de (13a) à (13c) n'est possible. La deuxième implication est également exclue par le fait que la phrase (13c) est mal formée, par conséquent elle ne peut pas exprimer une proposition: (13) a. b. c.
Marie est ma femme précédente Marie est ma femme * Marie est précédente
La raison sémantique qui empêche l'emploi prédicatif de ces adjectifs n'est pas claire. Les adjectifs irréguliers ne sont ni comparables (*une femme plus précé dente), ni modifiable (*une femme moitiéprecedente), et ils n'expriment pas d'état provisoire (*une femme temporairement précédente). En d'autres termes, les adjectifs irréguliers possèdent les mêmes traits que les adjectifs de nationalité en 2.1., c'est-a-dire [-comparable], [-modifiable] et [+permanent]. De ce point de vue, ils ressemblent aux adjectifs absolus mais ils ne satisfont pas a leurs conditions définitoires, c'est-á-dire que les implications (4a-b) ne sont pas valides, par conséquent ils ne peuvent pas être classés comme adjectifs absolus. En effet, ils sont - grace a leur comportement (l'absence complète de relations implica tionnelles (4a-b), l'impossibilité de l'emploi prédicatif) - sémantiquement plus complexes que les adjectifs absolus. 2.4. Une sous-classe dradjectifs relatifs Considérons les exemples suivants: (14) a. b. .
Le hongrois est une langue difficile Le hongrois est une langue Le hongrois est difficile par rapport à NC
où NC dénote l'ensemble des langues pertinentes pour la comparaison. Il est évi dent que (14a) implique (14b) et - au moins au premier regard - aussi (14c). Mais il est facile de voir que (14c) n'est pas suffisamment explicite. Qu'est-ce que cela
280
FERENC KIEFER
veut dire qu'une langue est difficile? Normalement, on dirait qu'une langue diffi cile est une langue qu'il est difficile d'apprendre et une langue facile est une langue qu'il est facile d'apprendre. Ceci n'est évidemment pas la seule interpré tation possible: une langue peut être difficile à écrire, a prononcer, ä analyser, a interpréter, a déchiffrer, etc., mais évidemment la difficulté de l'apprentissage est l'nterpretation par défaut. Par conséquent (14c) doit être remplacé par (15). (15) Le hongrois est difficile ä apprendre Le problème est que le verbe apprendre ne figure pas dans la phrase (14a); alors d'ou vient-il? Ce verbe est le résultat d'une reconstruction sur la base de nos connaissances de tous les jours. Une reconstruction pareille est nécessaire dans beaucoup d'autres cas, par exemple un devoir facile = 'un devoir facile a résoudre', un lit confortable = 'un lit dans lequel on se couche confortablement'. Ceci im plique que la formule (9) n'est pas adéquate pour ce type d'adjectif. Elle doit être remplacée par (16). (16) ADJ N ↔ N qui est ADJ aV a l'égard de NC Vdénote le verbe reconstruit. Il va de soi que (16) est plus complexe que (9). Pour faciliter la référence appelons cette classe d'adjectifs 'les adjectifs relatifs complexes'.
3. Une hypothèse plausible La classe des adjectifs absolus, la classe des adjectifs relatifs et la classe des adjectifs relatifs complexes montrent une complexité sémantique ascendante (cf. les formules (6), (9) et (16)), ce qui nous donne la hiérarchie suivante: (17) absolus < relatifs < relatifs complexes On ajoute la hiërarchie de la complexité sémantique de divers types d'adjectifs absolus (établie sur la base des traits de 'comparable', 'modifiable' et 'propriété permanente'): (18) nationalité < couleur < privatif < contradictoire Enfin, nous avons également établi une hiërarchie de complexité sémantique entre les deux classes d'adjectifs relatifs, les adjectifs de mesure (qui exigent une norme de comparaison objective) et les adjectifs évaluatifs qui sont liés à une norme subjective) que nous répétons sous (19): (19) adjectifs de mesure < adjectifs évaluatifs Considérons maintenant quelques exemples. Commençons par les suites à deux adjectifs (le symbole ► signifie la relation de précédence dans les suites neutres):
SUR L'ORDRE DES ADJECTIFS
281
nationalité ► couleur (20) a. une filie italienne blonde b. ? une filie blonde italienne nationalité ► privatif (21) a. un komme Italien sourd b. ? un homme sourd Italien nationalité ► contradictoire (22) a. une femme italienne malade b. ? une femme malade italienne couleur ► privatif (23) a. une femme blonde sourde b. ? une femme sourde blonde couleur ► contradictoire (24) a. une femme blonde malade b. ? une femme malade blonde privatif ► contradictoire (25) a. un homme sourd malade b. ? un homme malade sourd Les relations de précédence en (20)-(25) nous donnent (26): (26) nationalité ► couleur ► privatif ► contradictoire Cette hiérarchie correspond complètement a la hiérarchie sémantique (18). Il nous reste encore ä clarifier la position des adjectifs irréguliers. Afin de pouvoir placer cette catégorie dans la hiérarchie (26), considérons encore les exemples (27a-b) (30a-b): nationalité ► irrégulier (27) a. sa femme hongroise précédente b. * sa femme précédente hongroise couleur ► irrégulier (28) a. sa femme blonde précédente b. * sa femme précédente blonde privatif ► irrégulier (29) a. son mari chauve précédent b. * son mari précédent chauve
FERENC KIEFER
282
contradictoire ► irrégulier (30) a. la femme malade précédente b. * la femme précédente malade Par conséquent, la position des adjectifs irréguliers dans la hiërarchie (26) ne fait pas de doute: ils doivent être placés après les adjectifs contradictoires, ce qui nous donne la hiërarchie (31): (31) nationalité ► couleur ► privatif ► contradictoire ► irrégulier Rappelons que nous avons noté en 2.3. que les adjectifs irréguliers sont sémantiquement plus complexes que les adjectifs absolus. Jusqu'ici nous avons pu constater une coincidence complète entre la hiërarchie de précédence et celle de complexité sémantique.3 Cet état de choses suggère plication suivante: L'ordre des adjectifs attributifs reflète la complexité sémantique des adjectifs. Plus l'adjectif est complexe plus il est placé ä droite dans la suite des adjectifs. Nous n'avons testé la validité de cette hypothèse que dans le domaine des adjectifs absolus: il nous reste a montrer que notre hypothèse est également valable d'une part pour l'ordre relatif des adjectifs absolus et des adjectifs relatifs, et d'autre part pour celui des adjectifs relatifs et des adjectifs relatifs complexes. Il nous reste également a déterminer la position des adjectifs irréguliers par rapport aux adjec tifs relatifs et aux adjectifs relatifs complexes. Avant d'en venir a la discussion de ces problèmes il vaut la peine de considérer quelques suites ä trois adjectifs dans le domaine des adjectifs absolus: nationalité ► couleur ► contradictoire (32) a. b. c. d. e. f.
? ?? ??? ??? ???
une femme une femme une femme une femme une femme une femme
italienne blonde malade blonde italienne malade malade italienne blonde italienne malade blonde malade blonde italienne blonde malade italienne
Seule la suite (32a) est neutre. Les autres sont plus au moins marquées, ce qui confirme notre hypothèse. Mais nous pouvons aussi tirer une deuxième conclu sion de (31b-f). Moins marquées sont les suites dans lesquelles l'ordre de deux adjectifs qui sont normalement les plus proches du nom-tête est renversé. Les phrases les plus marquées sont les phrases dans lesquelles l'adjectif qui est norma lement placé immédiatement après le verbe se trouve á la fin de la suite. Pour des raisons stylistiques, on évite les suites a quatre adjectifs comme une femme italienne blonde muette malade. Nous ne les discuterons pas. Reprenons 3
La relation étroite entre la complexité sémantique des adjectifs et leur ordre a été déja notée par Vendier (1968).
SUR L'ORDRE DES ADJECTIFS
283
maintenant la discussion de la position des adjectifs irréguliers. mesure ► irrégulier (33) a. le mot long précédent b. * le mot précédent long mesure ► irrégulier (34) a. ta jupe courte précédente b. * ta jupe précédente courte complexe ► irrégulier (3 5) a. le roi généreux précédent b. * le roi précédent généreux complexe ► irrégulier (36) a. b.
le devoir difficile précédent * le devoir précédent difficile
Il semble que les adjectifs irréguliers occupent la dernière position dans les suites d'adjectifs. Étant donné leur comportement irrégulier et leur complexité sémantique ce fait n'est pas surprenant. Il nous reste a déterminer d'une part l'ordre neutre des adjectifs absolus et des adjectifs relatifs et d'autre part celui des adjectifs relatifs et des adjectifs relatifs complexes. absolu ► relatif (nationalité ► mesure) (37) a un mot hongrois long b. ? un mot long hongrois absolu ► relatif (nationalité ► mesure) (38) a. un vase chinois large b. ? un vase large chinois absolu ► relatif complexe (couleur ► relatif complexe) (39) a. un fauteuil rouge confortable b. ? un fauteuil confortable rouge relatif ► relatif complexe (mesure ► relatif complexe) (40) a. une musique ancienne agréable b. ? une musique agréable ancienne Les exemples (37)-(40) fournissent la preuve des relations de précédence suivantes: (41) absolu ► relatif ► relatif complexe
FERENC KIEFER
284
L'ordre en (41) reflète parfaitement la hiërarchie (17). Afin de compléter la preuve de notre hypothése, il nous reste à déterminer l'ordre entre les adjectifs de mesure et les adjectifs évaluatifs: mesure ► évaluatif (42) a un chien lourd paresseux b. ? un chien paresseux lourd mesure ► évaluatif (43) a. une jupe courte superbe b. * une jupe superbe courte Avec ceci nous sommes arrivés a la fin de notre preuve. Nous pouvons alors constater que l'ordre neutre des adjectifs attributifs est déterminé essentiellement par leur complexité sémantique. Nous avons constaté qu'il y a une différence entre les suites marquées mais possibles et celles qui sont tout a fait exclues. Les suites marquées sont apparemment liées a la différence de topicalisation. Par exemple, la suite (42b) est possible si l'on parle des chiens paresseux et la question est de savoir s'il y a un chien paresseux lourd. De la même façon, la suite (38b) est possible si un vase large est topicalisé et qu'on cherche un vase chinois parmi les vases larges. D'autre part, nous ne pouvons offrir aucune explication de l'agrammaticalité des suites comme par exemple (36b) ou (43b). Une telle explication exigerait sans doute une étude plus approfondie de la sémantique des adjectifs que nous avons pu offrir dans cet article.
Références Bartsch, Renate, Theo Vennemann. 1972. Semantic Structures. Franfurt/M.: Athenäum. Hamann, Cornelia. 1991. Adjektivsemantik - Adjectival semantics. In Semantik/ Semantics. Ein internationales Handbuch der zeitgenössischen Forschung/An International Handbook of Contemporary Research, A. von Stechow, D. Wunderlich (eds.), Berlin: Mouton-de Gruyter. Kiefer, Ferenc. 1978. Adjectives and presuppositions. Theoretical Linguistics 2, 135-173. Vendler, Zeno. 1968. Adjectives and Nominalizations. The Hague: Mouton. Summary The present paper discusses the neutral order of attributive adjectives in French. It starts out with a semantic classification of adjectives, which is based on both syntactic and
SUR L'ORDRE DES ADJECTIFS
285
semantic criteria. The following main types of adjectives are distinguished: (i) absolute adjectives, (ii) relative adjectives, (iii) complex relative adjectives and (iv) irregular adjectives. Within (i) and (ii) further subtypes are discussed. It is claimed that irregular adjectives are semantically more complex than complex relative adjectives, the latter are more complex than relative adjectives, which, in turn, are more complex than absolute adjectives. It is also shown that among the relative adjectives measure adjectives are semantically less complex than evaluative adjectives. A similar complexity hierarchy can be established within the various subclasses of absolute adjectives. The main claim of the paper is that the neutral order of adjectives reflects the hierarchy of semantic complexity: the more complex the adjective is the more peripheral the position will be which it occupies in the sequence of attributive adjectives.
ANAPHORES ASSOCIATIVES : DU LARGE Á L'ÉTROIT Georges KLEIBER Université Marc Bloch de Strasbourg et Scolia
Introduction Nul besoin de le rappeler: l'anaphore associative est á coup sûr le processus anaphorique qui a été le plus étudié ces dix dernières années. Ces recherches, menées sur les plans linguistique, psycho-linguistique et informatique ont amené une caractérisation beaucoup plus riche et plus fine du phénomène. Elles ont aussi donné lieu, c'est plus surprenant, a une remise en cause définitoire de l'extension même du phénomène par le biais du caractère anaphorique indirect de ce proces sus. Faut-il, comme le prône un camp, assimiler les anaphores associatives à toute anaphore indirecte ou, comme le soutient le camp opposé, les cantonner aux anaphores indirectes introduites par Particle défini ? Comme l'indique notre titre, c'est ce débat que nous nous proposons d'examiner ici avec pour objectif de montrer, dans la deuxième et troisième parties, que le trait d'anaphorique indirect ou d'anaphore inferentielle, exposé dans la première, ne suffit pas a justifier l'adoption de la conception large du phénomène.
1. L'anaphore associative: une anaphore indirecte Quasiment toutes les présentations des anaphores associatives soulignent qu'elles "réfèrent, en les présentant comme déjà connus, à des objets qui n'ont jamais été mentionnés explicitement dans le contexte antérieur" (Berrendonner 1994a). On comprend facilement pourquoi une telle caractéristique parait décisive. C'est elle qui est a l'origine de la reconnaissance du phénomène: l'anaphore associative a en effet été repérée principalement ä cause du problème d'interpretation que posent des SN définis tels que les roues et le tronc dans les séquences (1) et (2): (1) (2)
Les policiers inspectèrent la voiture. Les roues étaient pleines de boue Il s 'abrita sous un vieux tilleul. Le tronc était tout craquelé
Leur définitude ne peut s'expliquer par la description elle-même, puisque ce ne sont pas des SN définis complets, qui livrent par eux-mêmes, comme les descriptions définies complètes (cf. Le président de la République française)
288
GEORGES KLEIBER
(Kleiber 1981), l'identité de leur référent. Mais elle ne provient pas non plus, comme pour les emplois de défini coréférentiel, d'une mention antérieure de leur réferent. Leur interprétation paraît ainsi de prime abord plus problématique que celle des descriptions définies complètes ou que celle des incomplètes coréférentielles. Elles introduisent un référent nouveau, puisqu'il ne s'agit pas de SN défini de deuxième mention, mais le présentent sur le mode du "défini" ou du connu1, puisque leur incomplétude exige une saturation référentielle, ainsi qu'en témoigne la question en quel licite après une détermination complémentaire non réussie {Quelles roues ?, Quel tronc ?). Ce qui les oppose donc aux anaphores coréférentielles, de quelque type qu'elles soient, c'est le fait qu'elles introduisent un nouveau référent, c'est-a-dire une entité qui n'a pas encore été activée ou rendue saillante, soit textuellement, soit situationnellement, et qui, par la-même ne fait pas partie du stock d'entités déja introduites dans le modéle contextuel ou discursif ou encore focus d'attention. Cette nouvelle entité se distingue des réfé rents nouveaux introduits par une expression indéfinie, les brand-new de Prince (1981) (cf. J'ai acheté un stylo) ou des référents connus, mais nouveaux dans la situation discursive, tels ceux que peut entraîner l'usage d'un nom propre - il s'agit des unused de Prince - en ce qu'elle doit être inférée par l'interlocuteur a partir d'entités déja mentionnées.2 Conséquence immédiate: l'anaphore associative s'oppose clairement aux ana phores coréférentielles par une différence de référents impliqués. Webber (1988) marque cette différence de référents dans les deux types d'anaphores en montrant que dans l'anaphore coréférentielle l'expression anaphorique réfère a ou, pour 1
Nous recourons au qualificatif connu pour des raisons de commodité : il faut évidemment préciser plus avant ce qu'on entend exactement par la, c'est-a-dire dire en quoi consiste exactement la valeur "définie" d'un SN, mais nous n'entendons pas ouvrir ici un tel débat (voir Kleiber 1981 et 1995 et la note qui suit). Rappelons simplement que la définitude d'un SN (celle d'un SN avec article défini, pronom, démonstratif, possessif, etc.) repose sur l'idée d'indépendance, d'autonomie vis-à-vis du prédicat, la valeur référentielle de tels SN se trouve établie ou identifiée ou encore est accessible de manière indépendante. Dans la théorie de la repré sentation discursive (DRT) (Kamp et Reyle 1993), le référent discursif introduit par un SN défini est à apparier (ou lier) avec un référent de discours qui est déjà disponible ou que Ton peut établir de manière indépendante. "The binding conditions of all definite NP's'& take the form of presuppositions to the effect that the dicourse referent x& can be identified with a discourse referent xo, that is independently available or establishable" (Kamp 2000). On retrouve la notion de présupposition chez van der Sandt (1992). 2 Ils font partie chez Chafe (1987 et 1994) des concepts semi-actifs, qui s'opposent aux concepts actifs et aux concepts inactifs. Un concept (d'objet, d'événement et de propriété) est actif, s'il est dans le focus d'attention de quelqu'un, parce qu'il a été mentionné récemment. Il peut alors être verbalisé de façon très réduite (soit en anaphore zéro ou avec un pronom non accentué). Il est semi-actif s'il figure dans la conscience périphérique, soit parce qu'il appartient à un "set of expectations associated with a schema" évoqué par un texte, ce qui est le cas de l'anaphore associative, soit parce qu'il est un ancien concept actif qui n'a pas été "rafraîchi". Il peut avoir pour expression une description définie sans modificateur. Il est inactif lorsqu'il appartient a la mémoire à long terme et n'est ni actif ni semi-actif. Ce sont les SN indéfinis et les définís avec modificateur qui correspondent a ce cas.
ANAPHORES ASSOCIATIVES
289
reprendre ses termes, spécifie l'entité visée sans Vévoquer , alors que dans le cas d'une anaphore associative l'expression anaphorique a la fois spécifie (référe a) et évoque l'entité visée a partir de l'entité évoquée et spécifiée par l'antécédent, comme le montrent les deux schémas ci-dessous:
Ce consensus sur leur caractère d'anaphore indirecte ou encore d'anaphore inférentielle disparait dès qu'il s'agit de tracer les frontières de tels enchaînements. La preuve en est donnée par les travaux de ces dernières années, aussi bien ceux menés par les linguistes et les psychologues que ceux effectués sous la bannière de la recherche en intelligence artificielle.4 S'ils s'accordent sur le role capital que joue l'anaphore associative dans la construction du sens d'un texte, ils en offrent, par contre, une image définitoire qui est loin d'être consensuelle et qui met aux prises en gros deux conceptions de l'anaphore associative: Pune large, l'autre étroite. La conception large, défendue par Erkü et Gundel (1987), Gundel (1996), Gundel, Hedberg et Zacharski (1993), Berrendonner (1994a et b), Berrendonner et Reichler-Béguelin (1995), Reichler-Béguelin (1988 a et b, 1989, 1993 a et b, 1994 et 1995), Apothéloz (1995) et Apothéloz et Reichler-Béguelin (1999), reconnaît comme anaphore associative toute anaphore indirecte, c'est-a-dire toute expres sion satisfaisant aux propriétés (a) et (b): (a)
elle est anaphorique: autrement dit, son référent est identifié grace a des informations présentes dans le contexte antérieur; (b) elle n'est pas coréférentielle: autrement dit, son référent n'a pas été mentionné dans le texte antérieur.
3 4
On soulignera qu'il n'y a pas settlement des SN comme antecedents. Voir Schnedecker, Charolles, Kleiber et David (eds.), 1994.
290
GEORGES KLEIBER
La conception étroite, que l'on peut appeler standard (Charolles 1990), parce qu'elle est la plus répandue, s'appuie sur une définition qui fait intervenir, explicitement ou non, d'autres critères définitoires que la seule relation d'anaphore indirecte. Sont décisifs également pour la reconnaissance du phénomène essentiellement des facteurs comme le type de l'expression anaphorique et la nature de la relation indirecte. L'opposition entre conception large et conception étroite se traduit par une extension sensiblement différente du phénomène. La définition large accueille comme anaphore associative non seulement les anaphores définies du type de (1)(2), mais également tout pronom anaphorique indirect et tout démonstratif anaphorique indirect. Prennent ainsi place au sein des anaphores associatives le ils générique textuel indirect (Kleiber 1994:151-160): (3) (4)
Paul a acheté une Toyota, parce qu'elles sont robustes Le danger d'être piqué par une abeille est le plus grand entre et juillet. Pendant cette période, elles essaiment le plus fréquemment (circulaire médícale, Reichler-Béguelin, 1993:337)
et le ils dit grégaire ou collectif (Kleiber 1992 et 1994: ch. 7): (5) (6)
Paul a été ä l'höpital. Ils Vont soigné énergiquement J'ai vu Paul. Ils viennent enfin de déménager
Du cóté du démonstratif, face aux emplois inférables situationnels, comme notre ferroviaire exemple du Vintimille utilisé a maintes reprises (Kleiber 1990a) pour séparer le démonstratif du défini: (7)
Ce train a toujours du retard ( à qui attend comme lui le Vinti mille sur le quai de la gare)
on dispose d'emplois inférables textuels du type de (8)-(9): (8) (9)
J'ai planté un acacia, parce que cet arbre (= ce type d'arbre) ne craint pas le froid J'ai planté un acacia, parce que ces arbres ne craignent pas le froid
ou du type de(10)-(ll): (10)
(11)
Une future salle [de théatre], s'il existait une volonté régionale unanime d'aller de l'avant immédiatement, ne pourrait pas être terminée avant trois ans. Cela signifierait donc trois années sans saison théatrale puisque le Temple du bas n 'est pas adapté ä cet art et nécessiterait des investissements pour un équipement technique adéquat (L'Express 7/7/93; Apothéloz et Reichler-Béguelin 1999: 385) Il faut bien nourrir les grévistes qui n 'ont trouvé que ce moyen (i.e. la grève) pour s'opposer au président togolais (Programme TV, A2, 14/02/93, Apothéloz et Reichler-Béguelin 1999:375)
ANAPHORES ASSOCIATIVES
291
La définition étroite refuse un tel rassemblement en ne reconnaissant comme anaphore associative possible essentiellement que les SN avec article défini. Qui a tort ? Qui a raison ? Donnons d'abord la parole aux tenants de la conception large.
2. Une relation unitaire Le choix de la conception large s'explique par le désir de rendre compte de façon unitaire des opérations de raisonnement ä l'œuvre dans ces différents types d'anaphores indirectes. L'hypothèse principale est que ce sont des processus cognitifs et pragmatiques communs qui sont l'origine de la diversité des rapports associatifs. S'y ajoute en corollaire l'idée que la spécifické référentielle de chaqué type d'expression référentielle n'est pas suffisante pour entraîner des emplois référentiels particuliers propres á chaeune d'elles: "Though the various forms of anaphoric expressions (definite NPs, demonstrative NPs and pronouns) are dis tinct from one another - at least partially - by use constraints (an issue that has been explored in the literature extensively), we think that these constraints are relatively flexible. Consequently it would be in vain to establish a strict correlation between types of expressions and types of uses" (Apothéloz et Reichler-Béguelin 1999:369). Passer tout de suite a des relations plus particulières et mettre en corrélations ces relations avec des marqueurs référentiels particuliers "aboutit (...) a manquer des généralisations" (Berrendonner et Reichler-Béguelin 1995:26) et conduit les linguistes a être trop normatifs et a écarter les exemples marginaux et non standard embarrassants: "Linguists have a tendency to brush aside specific discursive structures as being inacceptable, even if occurrences have been observed regularly. It appears to be a way to give oneself an easy conscience" (Apothéloz et Reichler-Béguelin 1999:367). Le dénominateur commun a toutes les associations activées par les anaphores inférentielles (dans le sens d'indirect) proposé est celui de la relation d'ingrédience tirée de la méréologie du logicien Lesniewski. Cette relation est définie comme suit dans Berrendonner (1994a ):5 (a) P est un ingrédient de Q si P est le même objet que Q ou une partie de Q ; (b) Si P est une partie de Q, alors Q n'est pas une partie de P ; (c) Si P est une partie de Q, et Q une partie de R, alors P est une partie de R (Lesniewski 1989) Elle convient aussi bien aux relations qui se manifestent dans les anaphores associatives paradigmatiques de la conception étroite, comme les relations partietout de (l)-(2) (voiture-roue ; tilleul-tronc): (1) (2) 5
Les policiers inspectèrent la voiture. Les roues étaient pleines de boue Il s 'abrita sous un vieux tilleul Le tronc était tout craquelé
Voir aussi la tentative de formalisation présentée dans Miéville (1999).
292
GEORGES KLEIBER
la relation de localisation (etre-dans) de (12): (12)
Nous arrivâmes dans un village. L'église était sur une hauteur
ou encore la relation 'procès-actant' {couper - couteau) de (13): (13)
Pierre a coupé du pain, puis il a rangé le couteau (Corblin 1987)
qu'à celles qui règlent l'inférence dans les anaphores indirectes pronominales et démonstratives: (3) (5) (8) (9) (11)
Paul a acheté une Toyota, parce qu'elles sont robustes Paul a été ä Vhopital. Ils Vont soigné énergiquement J'ai planté un acacia, parce que cet arbre (= ce type d'arbre) ne craint pas le froid J'ai planté un acacia, parce que ces arbres ne craignent pas le froid Il faut bien nourrir les grévistes qui n 'ont trouvé que ce moyen (i.e. la grève) pour s 'opposer au président togolais
puisque la relation de 'type-occurrence', a l'oeuvre dans (3), (8) et (9), celle d'ensemble-membres de cet ensemble, pertinente pour (5) et celle de 'actant-objet du procès' illustrée dans (11) se laissent modéliser tout comme celles de (1), (12) et (13) par le foncteur ingrédient. Même les relations d'identité des anaphores coréférentielles signalé trouvent leur place dans ce dispositif compte tenu de la première proposition définitoire du foncteur "ingrédiént": (a)
P est un ingrédiént de Q si P est le même objet que Q ou ...
qui implique qu'un objet peut être un ingrédiént de lui-même: (14)
Paul a adopté un chat. L'animal... (Kleiber, Patry et Ménard 1993)
Ce foncteur permet donc de "formuler des généralisations intéressantes dans le cadre d'un modèle général de l'anaphore" (Berrendonner 1994a) et on comprend le pouvoir attractif que peut exercer une telle présentation unifiée des phénomènes. Est-elle pour autant souhaitable ?
3. Les anaphores indirectes ne forment pas une catégorie homogène En premier lieu, on signalera que 1'integration des anaphores coréférentielles rend finalement superflue la notion même d'anaphore associative. Mais là n'est pas le principal inconvénient de cette relation d'ingrédience. Son défaut le plus grave est d'être beaucoup trop puissante. Elle prédit en effet des enchaînements mal formés tels que (15)-(19), traités dans Kleiber (1999 a et b): (15) ? Ils habitent un quartier central. J'apprécie beaucoup le calme (Fradin 1984) (16) ? Paul enleva sa casquette. La calvitie plut a tout le monde
ANAPHORES ASSOCIATIVES
293
(17)
? Marie est une vieille strasbourgeoise. La naissance ulieu avc le siècle / L a jeunesse a été heureuse (18) ? Paul entra. Les paroles réveillèrent toute l 'assemblee (19) ? Il ramassa une boîte. La matière était inconnue La relation d'ingrédience est présente à chaque fois, puisque: - le calme et la calvitie sont des propriétés, donc des ingrédients du quartier et de Paul; - la naissance est un procès dont Marie est l'actant; - les paroles représentent une action dont Paul est l'actant agent; - la matière, puisque ... matière, est bien un ingrédient de la boite, etc. Malgré tout, il n'y a pas établissement d'une anaphore indirecte. C'est dire que la généralité de la relation d'ingrédience n'a pas de pertinence linguistique. Son incapacité de prédire ces phénomènes vient du fait que la notion de "partie" permettant de définir le foncteur "ingredient" reste elle-même indéfinie au regard de l'ontologie des référents auxquels elle s'applique. Ce flou définitoire permet, certes, de rallier une grande diversité de relations, mais aboutit á un niveau de généralisation artificielle, qui achoppe sur les restrictions discursives liées a l'on tologie des entités des sites associatifs. La conclusion est claire: l'échec d'un rassembleur associatif sonne aussi le glas de la conception large et rétablit la conception étroite dans tous ses droits. S'il n'y a pas de relation associative pertinente pour les anaphores indirectes, c'est parce qu'elles ne forment pas une catégorie suffisamment homogène. Aux deux traits communs d'anaphore et d'anaphore indirecte (ou inférentielle) qui les rassemblent ne correspond pas un dénominateur associatif commun. Qu'on ne s'y méprenne point! Cela ne signifie pas que l'on ne puisse pas réunir les anaphores indirectes (ou inférentielles) sur la base de leur caractère anaphorique indirect. Un tel classement est tout a fait légitime si on entend opérer une typologie des anaphores. Ce qui, par contre, est illégitime, c'est de considérer que les anaphores indirectes ainsi rassemblées répondent aussi á un processus référentiel identique basé sur une même relation associative logico-cognitive. Qui interdit précisément de voir au sein des anaphores indirectes des sous-classes hétérogènes, au fonctionnement et aux relations différents excluant leur assimilation. Bref, ce que nous refusons, c'est la position qui consiste à dénier toute pertinence a une identification, au sein des anaphores indirectes, du type spécifique d'anaphores indirectes que sont les anaphores associatives. Ceci tout simplement, parce que, comme nous venons de le voir, il n'y a pas de dénominateur associatif commun (ou de relation inféren tielle) qui soit à la fois assez général pour couvrir tous les cas et pas trop puissant pour ne pas prédire des anaphores indirectes qui ne se font pas. Ainsi, contrairement à Berrendonner (1994a) qui pose que "Débattre de l'acceptabilité de telle ou telle anaphore et des limites de la notion d'anaphore associative, c'est faire comme si la nature du processus résidait essentiellement dans les restrictions pragmatiques ou normatives auxquelles on constate qu'il est soumis" et qui ajoute que "il (lui) semble au contraire que ces restrictions sont des
294
GEORGES KLEIBER
épiphénomènes déterminés par des considérations opportunistes de pertinence, et que les régulations logico-cognitives propres l'inférence naturelle sont a rechercher au-delà.", nous pensons que l'étude des contraintes régissant l'apparition des référents en site associatif, peut donner des indications fines sur les processus cognitifs sous-tendant l'anaphore associative, "loin des épiphénomènes détermi nés par des considérations opportunistes de pertinence." La raison en est bien simple. Nous pensons aussi que l'hypothèse corollaire sur les expressions référentielles sur laquelle s'arc-boute la conception large est fausse. Contrairement a l'affirmation d'Apothéloz et Reichler-Béguelin (1999: 369) rapportée ci-dessus, il ne nous parait pas vain de tenter de lier de manière rigide des types d'expression et des types d'emploi. Bien au contraire, il nous semble nécessaire même de faire intervenir le marqueur référentiel. Nous Pavons montré a maintes reprises dans nos travaux sur Particle défini, le démonstratif et le pronom et Pavons affirmé haut et fort en réclamant dans un des titres de ces travaux une approche "plus sémantique" des marqueurs référentiels.6 C'est dire que le type de marqueur référentiel nous semble décisif dans la délimitation de Panaphore associative (voir aussi Charolles 1999:313). La manière habituelle de le prouver est de montrer que dans le site associatif des expressions définies ne peuvent figurer ni les pronoms personnels ni les descriptions démonstratives. C'est ainsi que si Ton substitue le démonstratif ou le pronom personnel au défini de (12): (12)
Nous entrâmes dans un village. L'église était située sur une hauteur
on obtient des enchaînements incontestablement mal formés: (20) (21)
Nous entrâmes dans un village. ? Cette église était située sur une hauteur Nous entrâmes dans un village. ? Elle était située sur une hauteur
Il est non moins intéressant de montrer, comme nous allons le faire pour terminer, que les mécanismes associatifs mis en jeu dans les anaphores indirectes avec pronoms personnels et démonstratifs ne sont pas ceux qui font "rouler" les anaphores associatives. Reprenons d'abord les exemples d'anaphores indirectes pronominales et démonstratives donnés ci-dessus. Ils se laissent diviser en trois types. Il a, en premier lieu, ceux qui, comme (3), (8) et (9): (3) (8) (9)
Paul a acheté une Toyota, parce qu'elles sont robustes J'ai planté un acacia, parce que cet arbre (= ce type d'arbre) ne craint pas le froid J'ai planté un acacia, parce que ces arbres ne craignent pas le froid
donnent lieu à une relation entre une ou des occurrences d'une classe et la classe 6
Il s'agit de Kleiber (1990b), dont le titre entier est: Marqueurs référentiels et processus interprétatifs: pour une approche "plus sémantique ".
ANAPHORES ASSOCIATIVES
295
elle-même: une Toyota particulière (antécédent) - la classe des Toyotas; une occurrence d'acacia - la classe des acacias. Trois traits sont ä noter. Le premier est qu'une telle relation ou association ne peut être exprimée par un SN défini en anaphore indirecte. On ne retrouve en effet jamais du cóté des anaphores associatives avec le défini une relation dont les entités sont une occurrence et la classe a laquelle appartient cette occurrence. L'emploi de l'article défini entrame ou bien une perte du lien anaphorique - les Toyotas, Vacada et les acacias de (23)-(25) sont des SN génériques qui ne nécessitent nulle saturation: (23) (24) (25)
Paul a acheté une Toyota, parce que les Toyotas sont robustes J'ai planté un acacia, parce que l'acada ne craint pas le froid J'ai planté un acacia, parce que les acacias ne craignent pas le froid
ou bien, en cas de N hyperonyme, une interprétation différente de celle des énoncés de départ avec pronom et démonstratif: (26) (27) (28)
Paul a acheté une Toyota, parce que les voitures sont robustes J'ai planté un acacia, parce que l'arbre ne craint pas le froid J'ai planté un acacia, parce que les arbres ne craignent pas le froid
Le deuxième met en relief une différence d'orientation. Alors que F anaphore associative est orientée dans le sens d'un tout (antécédent) vers une partie (expres sion anaphorique) (Kleiber, Patry et Ménard 1993), ces exemples d'anaphores indirectes pronominales et démonstratives "roulent" dans le sens contraire: c'est F antécédent qui est en quelque sorte une partie, alors que Fexpression anapho rique représente le tout. Nous voulons dire par la qu'en anaphore associative l'entité englobante ou incluante est celle de F antécédent et Fentité englobée ou incluse est celle de Fexpression anaphorique (cf. 'voiture → roue' et non 'roue → voiture'), alors que dans les exemples (3), (8) et (9), c'est la relation inverse qui prévaut. Il faut enfin signaler que F établissement de ces anaphores indirectes obéit a des contraintes spécifiques, que Fon ne retrouve guère du côté des anaphores asso ciatives, et qui changent selon qu'il s'agit du pronom ou du démonstratif. Pour Fanaphore pronominale générique, comme nous Favons observé ailleurs (Kleiber 1994:152-153), il faut que le pronom soit au pluriel: (29) ? J'ai acheté une Toyota, parce qu'elle (la Toyota, en général) est robuste que F antécédent ne soit ni déterminé par un déterminant du type "défini" (article défini, adjectif démonstratif, adjectif possessif): (30)
? J'ai adopté ce chat / son chat / le chat, parce qu ils (= les chats, en général) sont affectueux
ni par des marqueurs de quantification:
296
GEORGES KLEIBER
(31)
? J'ai adopté deux /plusieurs / beaucoup de chats, parce qu ils (= les chats en général) sont affectueux
et que le prédicat introducteur de antécédent-occurrence soit tel qu'il active ou rende saillante la classe d'appartenanee: (32)
? J'ai aimé un chat, parce qu ils sont affectueux
Il a ensuite le cas du ils collectif de (5): (5) Paul a été ä Vhopital. Ils Vont soigné énergiquement dont l'emploi extrêmement contraint7 rend toute assimilation aux anaphores associatives impossible. Il ne se rencontre qu'au masculin et au pluriel (Goudet 1983), comme l'atteste la malice grammaticale du ils de (33): (33)
Au convent, ils ne font que prier
Même si ce n'est qu'une infirmière qui a badigeonné Paul á Phopital, celui-ci pourra dire en usage collectif (34) a.
A l 'hopital, ils m 'ont mis du rouge sur la plaie et c 'est tout
mais non: b.
A l'hópital, elle m 'a mis du rouge sur la plaie et c 'est tout
Il se trouve restreint aux êtres humains (Goudet 1983), ainsi qu'en témoigne le sourire que peut entraîner l'énonciation de: (35)
? A Paris, ils crottent sur les trottoirs
ù le pronom ils dénote une pluralité "définie", comme le montre l'opposition (36)-(37): (36) a. On sonne (on = quelqu'un / des gens) b. On nous attaque (on = des gens) (37) a. * Ils sonnent (ils = des gens) b. * Ils nous attaquent (ils = des gens) mais une pluralité indéterminée, ainsi qu'il ressort de (38): (38) a.
J'étais hier au concert. Ils jouaient la 9e symphonie (*ils = l'orchestre et la direction et le personnel de l'établissement) b. La familie de Pierre / les Muller habite(nt) la Grand-rue depuis deux siècles. Ils habiteront sans doute toujours Et cette pluralité, comme le montre déjà (38b), rassemble non seulement les occurrences factuelles (passées et présentes), mais aussi les potentielles et contrefactuelles:
7
Voir, pour plus de détails, Kleiber (1992 et 1994,ch.7).
ANAPHORES ASSOCIATIVES
(39)
297
J'ai été hier soir au concert. Ils jouaient la 9e symphonic Le Direc teur m 'a appris qu 'ils la jouaient tous les vingt ans
Dernière restriction, des données comme (40): (40) a. *J'étais pris dans la foule. Ils ont failli m 'étouffer b. *Bien que l'agriculture n'a jamais connu de chômeurs, à l'heure actuelle ils doivent émigrer semblent indiquer que ce ils grégaire a pour antécédent une entité collective, comme celles dénotées par familie, jury, comité, ville, équipe, etc., appelée abges chlossene Mengenquantitative (Mayer 1980) ou group (Cruse 1986), dont la particularite est de regrouper des humains en systèmes: plus que des attributs en commun, les membres d'un groupe ont un but ou une fonction en commun, ce qui assure l'ensemble un facteur cohésif plus grand que celui que possèdent les membres d'une classe (Cruse 1986). Le troisième type correspond aux anaphores démonstratives de (10)-(11): (10)
(11)
Une future salle [de théatre], s'il existait une volonté régio nale unanime d'aller de l'avant immédiatement, ne pourrait pas être terminée avant trois ans. Cela signifierait donc trois années sons saison théatrale puisque le Temple du bas n'est pas adapté a cet art et nécessiterait des investissements pour un équipement technique adéquat Il faut bien nourrir les grévistes qui n'ont trouvé que ce moyen (i.e. la grève) pour s 'opposer au président togolais
qui sont à traiter différemment, parce qu'elles ne répondent qu'apparemment a la définition des anaphores indirectes. Si on regarde de plus près, on s'aperçoit en effet que 1'introduction de l'entité correspondant a l'antécédent s'accompagne déja de celle de l'entité de l'expression anaphorique, de telle sorte que le démons tratif n'introduit pas véritablement un référent nouveau - celui-ci est déja connu. La mention de saison théâtrale comme celle de les grévistes, étant donné la forme et le sens mêmes de ces expressions (un gréviste, c'est quelqu'un qui fait grève et une saison théâtrale, c'est une saison... de théatre), a pour résultat de rendre disponible dans le modèle contextuel l'entité 'theatre' et Pentité 'grève', référents des 57V démonstratifs cet art (cf. 'cet art qu'est le théâtre') et ce moyen ('ce moyen qu'est la grève), qui fonctionnent ainsi sur le mode coréférentiel. Ce qui est vrai et qui peut poser problème, 'est que le nom correspondant a ces entités (a savoir théatre et grève) n'a pas été explicitement introduit et que donc du coup il faut recourir à des procédures référentielles particulières. Mais ceci est une autre histoire - celle des pronoms et des îlots anaphoriques 8 - que peut précisément régier 8
Qui refont surface, comme le titre malicieusement Charolles (1992). Au départ, il s'agissait de rendre compte de l'impossibilité pour un pronom de reprendre les constituants sémantiques que postulait la sémantique générative à la base d'une unité lexicale. Si *Max est un orphelin. Ils (= les parents) lui manquent beaucoup est un enchaïnement mal formé, c'est parce que l'élément
298
GEORGES KLEIBER
un démonstratif et uniquement un démonstratif infidèle (hyperonyme): 9 (41)
(42)
Une future salle [de théatre], s'il existait une volonté régio nale unanime d'aller de l'avant immédiatement, ne pourrait pas être terminée avant trois ans. Cela signifierait donc trois années sans saison théâtrale puisque le Temple du bas n 'est pas adapté a *ce théatre et nécessiterait des investissements pour un équipement technique adéquat Il faut bien nourrir les grévistes qui n'ont trouvé que *cette grève pour s 'opposer au président togolais
Conclusion Le bilan de notre réexamen des trois types d'anaphores indirectes pronominales et démonstratives est sans équivoque et nous permet de conclure de la même façon: les anaphores indirectes pronominales et démonstratives examinées mettent en jeu des processus et relations référentiels distincts, irréductibles, qui justifient leur séparation d'avec les anaphores associatives. Il nous semble donc raisonnable de restreindre les anaphores associatives aux anaphores indirectes introduites par Particle défini. Ce n'est pas brandir le carton rouge contre les tenants de la concep tion large. Nous tenons simplement a souligner qu'en matière d'anaphore il convient de ne pas faire l'économie du palier sémantique imposé par la spécificité sémantique de chaque marqueur. En ce qui concerne l'anaphore associative, le role joué par Particle défini est de ce point de vue-là décisif et conforte la position de la conception étroite.
Références Apothéloz, D. 1995. Role et fonctionnement de l'anaphore dans la dynamique textuelle. Genève, Droz. Apotheloz, D. et M.-J. Reichler-Béguelin. 1999. Interpretations and Functions of Demonstratives NPs in Indirect Anaphora. Journal of Pragmatics 31:3, 363397. parent, pourtant présent dans la structure d'orphelin, n'est pas accessible à une reprise pronominale: "orphan is an anaphoric island with respect to the interpretation of potentially coreferentiel pronouns like them" (Postal 1969:206). Soulignons ici que l'analyse de Postal fait apparaitre explicitement le trait de coréférentialité et donc que, contrairement ä ce qui est fait d'habitude, il n'est pas légitime d'assimiler totalement le phénomène d'ilôt anaphorique à une saisie anaphorique indirecte (ou non coréférentielle). Pour ce qui est de la contrainte elle-même et du débat qu'elle a pu occasionner, voir Charolles (1992) et Kleiber (1994). 9 Et cela via la valeur indexicale du démonstratif qui est à l'origine de ce type de renvoi (Kleiber 1986, 1994:ch.4 et 1998).
ANAPHORES ASSOCIATIVES
299
Berrendonner, A. 1994a. Anaphore associative et méréologie. In D. Miéville et D. Vemant (eds.), Recherches sur la philosophie et le langage 16, 81-98 . Berrendonner, A. 1994b. Anaphores confuses et objets indiscrets. In . Schnedecker, M. Charolles, G.. Kleiber et J. David (eds), 209-230. Berrendonner, A. et M.-J. Reichler-Béguelin.1995. Accords "associatifs". Cahiers de praxématique 24, 21-42. Chafe, W. 1987. Cognitive Constraints on Information Flow. In R. Tomlin (ed.), Coherence and Grounding in Discourse, Amsterdam/Philadelphia: John Benja mins, 21-52. Chafe, W. 1994. Discourse, Consciousness and Time. The Flow and Displacement of Conscious Experience in Speaking and Writing. Chicago: Chicago Univer sity Press. Charolles, M. 1990. L'anaphore associative. Problèmes de délimitation. Verbum XIII:3, 119-148. Charolles, M. 1992. La veuve ou l'orphelin ou: comment les îlots anaphoriques refont surface. In J.E. Tyvaert (ed.), Lexique et inférence(s), Klincksieck: Paris, 131-173. Charolles, M. 1999. Associative Anaphora and its Interpretation. Journal of Pragmatics 31:3, 311-326. Charolles, M. et G. Kleiber (eds). 1999a. Special Issue on 'Associative Anaphora', Journal of Pragmatics 31:3. Corblin, F. 1987. Indéfini, défini et démonstratif. Genève/Paris: Droz. Cruse, A 1986. Lexical Semantics, Cambridge: Cambridge University Press. Erkü, F. et J. Gundel. 1987. The Pragmatics of Indirect Anaphora. In J. Verschueren et M. Bertucelli-Papi (eds), The Pragmatic Perspective, Amsterdam/ Philadelphia: John Benjamins, 533-545. Fradin, B. 1984. Anaphorisation et stéréotypes nominaux, Lingua 64, 325-369. Goudet, J. 1983. Les marques pronominales de la 3e personne dans le Système du français contemporain. L 'information grammaticale 19, 3-10. Gundel, J.K 1996. Relevance Theory meets the Giveness Hierarchy: an account of inferrables. In T. Fretheim and J.K. Gundel (eds), Reference and Referent Accessibility, Amsterdam/Philadelphia: John Benjamins, 141-153. Gundel, J.K., N. Hedberg et R. Zacharski. 1993. Cognitive status and the form of referring expressions. Language 69, 2, 274-307. Kamp, H. 2000. Wide scope and intermediate scope interpretations of definite and indefinite NPs, From NP to DP. Antwerp international conference on the syntax and pragmasemantics of the noun phrase, 10-12 February 2000. Kamp, H. et U. Reyle. 1993. From Discourse to Logic, Dordrecht: Kluwer. Kleiber, G 1981. Problèmes de référence. Descriptions définies et noms propres. Paris: Klincksieck. Kleiber, G 1986. Déictiques, embrayeurs, token-reflexives, symboles indexicaux, etc.: comment les définir ? L'information grammaticale 30, 3-22.
300
GEORGES KLEIBER
Kleiber, G. 1990a. Sur l'anaphore associative: article défini et adjectif démonstratif. Rivista di Linguistica 2:1, 155-174. Kleiber, G. 1990b. Marqueurs référentiels et processus interprétatifs: pour une approche "plus sémantique". Cahiers de linguistique franqaise 11, 241-258. Kleiber, G. 1992. Ils ont encore augmenté les impóts. Sur le ils dit "collectif". In L. Tasmowski. et A. Zribi-Hertz (eds.), De la musique ä la linguistique. Hom mages ä Nicolas Ruwet, Communication & Cognition, Gent, 327-344. Kleiber, G 1994. Anaphores et pronoms. Bruxelles: Duculot. Kleiber, G 1995. Sur les (in)défmis en général et les SN (in)définis en particulier. Bulletin de la Société de linguistique de Paris XC:1, 21-51. Kleiber, G 1998. Les démonstratifs a l'épreuve du texte ou Sur Cette cote de la baie de l'Arguenon. Langue franqaise 120, 77-94. Kleiber, G. 1999a. Anaphore associative et relations partie-tout: condition d'alié nation et principe de congruence ontologique. Langue franqaise 122, 70-100. Kleiber, G 1999b. Associative Anaphora and Part-Whole Relationship: the Condition of Alienation and the Principle of Ontological Congruence. Journal of Pragmatics 31:3, 339-362. Kleiber, G , R. Patry et N. Ménard. 1993. Anaphore associative: dans quel sens "roule"-t-elle ? Revue Québecoise de Linguistique 22:2, 139-162. Lesniewski, S. 1989. Sur les fondements de la mathématique. Fragments, Traduc tion G. Kalinowski., Paris: Hermès. Mayer, R.1980. Ontologische Aspekte der Nominalsemantik. Tübingen, Niemeyer. Miéville, D. 1999. Associative Anaphora: and Attempt at Formalisation. Journal of Pragmatics 31:3, 327-337. Postal, P.M. 1969. Anaphoric Islands. In R.I. Binnick, A. Davison et G.M. Green, (eds.), Papers from the Fifth Regional Meeting of the Chicago Linguistic Society, Chicago: University of Chicago, 205-239. Prince, E.F. 1981. Toward a Taxonomy of Given-New Information. In P. Cole (ed.), Radical Pragmatics, New York: Academic Press, 223-255. Reichler-Béguelin, M.-J. 1988a. Anaphore, cataphore et mémoire discursive. Pratiques 57, 15-43. Reichler-Béguelin, M.-J. 1988b. Norme et textualité. Les procédés référentiels considérés comme déviants en langue écrite. In G. Schoeni, J.-P. Bronckart et P. Perrenoud (eds), La langue franqaise est-elle gouvernable ? Neuchâtel: Delachaux et Niestlé, 185-216. Reichler-Béguelin, M.-J. 1989. Anaphores, connecteurs et processus inférentiels. In . Rubattel (ed.), Modèles du discours. Recherches actuelles en suisse romande, Berne: P. Lang, 303-336. Reichler-Béguelin, M.-J. 1993a Anaphores associatives non lexicales: incomplétude macro-syntaxique ? In S. Karolak et T. Muryn (eds.), Complétude et incomplétude dans les langues romanes et slaves, Cracovie, 327-379. Reichler-Béguelin, M.-J. 1993b. Faits déviants et tri des observables. Travaux Neuchâtelois de Linguistique (TRANEL) 20, 89-109.
ANAPHORES ASSOCIATIVES
301
Reichler-Béguelin, M.-J. 1994. L'encodage du texte écrit. Normes et déviances dans les processus référentiels et le marquage de la cohésion. In L. Verhoeven, et A. Teberosky (eds.), Understanding early literacy in a developmental and cross-linguistic approach, Strasbourg: European Science Foundation, 175-204. Reichler-Béguelin, M.-J. 1995. Alternatives et décisions lexicales dans l'emploi des expressions démonstratives. Pratiques 85, 53-87. Sandt van der, R.A. 1992. Presupposition Projection as Anaphora Resolution. Journal of Semantics 9, 333-377. Schnedecker, C. M. Charolles, G. Kleiber et J. David (eds.). 1994. L'anaphore associative. Aspects linguistiques, psycholinguistiques et automatiques. Paris: Klincksieck. Webber, B.L. 1988. Tense as Discourse Anaphora. Computational Linguistics 14:2,61-73.
Summary Associative anaphora is certainly the anaphoric construction which has been devoted the greatest attention over the past ten years. Various studies in linguistics, psycholinguistics or computer science have led to a much better understanding of the pheno menon. The consequence is a reappraisal of its extension, in connection to its indirect character: is associative anaphora to be assimilated with indirect anaphora in general, or to be restricted only to occurrences accompanied by the definite article? It is hypothesized here that the feature of indirect or inferential anaphora is not sufficient to justify the wider interpretation of the phenomenon.
TREE PRUNING S.-Y. KURODA University of California, San Diego
Introduction The following is a reproduction, with a few editorial corrections, of a part of a manuscript that I wrote in the fall of 1965, about the time I first met Maurice Gross in Cambridge, Massachusetts. It evokes in me dear memories of the many times we spent together in our younger years in Cambridge as well as in Paris. The manuscript was referred to by Haj Ross in his dissertation as an unpu blished, untitled paper (Ross 1967:100ff.). The manuscript, however, was never brought to a published form. The objective of the manuscript was to introduce two principles that determine the derivation of surface structure constituent trees from underlying deep structure trees. The first principle specifies that a non-branching node is eliminated, unless it is a preterminal node directly dominating a lexical item. The second principle is that if the head of a phrase is deleted, the nodes of the phrase dominating the head are eliminated. I reproduce here only the first part of the manuscript where the tree pruning is illustrated by examples from Japanese. How to derive reasonable surface trees from underlying trees in a principled manner was much concern in Japanese syntax: due to the agglutinative character of the language underlyingly complex sentences can become simple sentences at the surface level. The method applied here and the results obtained by it generally presuppose the analyses of Japanese sentences given in Kuroda (1965), in particular, those presented in Chapter 6. The base form dealt with in Example 3 is the form assumed for the ni-causative, but the same method applies mutatis mutandis to the analysis of the o-causative assumed in Kuroda (1965). In the second half of the manuscript, I tried to apply the same principles also to English, and induced hand-written entries of "Ech" by Haj at several places in the manuscript. The outcome of the application of the tree pruning principles of course depends on the character of the underlying representations adopted for the analysis as well as how the transformations that relate the deep and the surface levels are formulated. On both accounts, the analyses of English sentences
S.-Y. KURODA
304
assumed in the original manuscript, though standard at the time, are quite outdated in the present perspective. Hence, there is no point of reproducing the part dealing with English here. Summer, 2000, Del Mar, California. I would introduce two notions which I need when I derive surface trees from base trees. One is head, the other is bound form. Both are, I think, more or less related to the traditional notions. Both are, to a large extent, to be defined in a uni versal way (i.e., individual language independent), but I would not be surprised if they are not completely so. Let us take an example. For the rule: (1)
NP
→
Det N"
I would say that the theory of surface tree should be valid for every language by taking N as the head. However, I would say that for the Japanese rule: (2)
S
→
NP VP Aux
Aux is the head; and I do not know at present whether you can say the same for the English rule: (3)
S
→
NP Aux VP
But the fact that every sentence ends in Aux (roughly tense-marker) (of course sentence-final particles such as ne, sa, yo are irrelevant for our discussion) is a very remarkable (surface) fact in Japanese and Aux is almost the surface marker of the sentence tail (very much like 'period'!). Since surface structures are what lan guages differ in, it would be expectable that different languages deal with the corresponding rules (as (2) and (3)) differently as to the notion of head. So, maybe in English VP is the head of (3). But I rather doubt it. You will see later why I need the notion of bound form. But let me make one remark here. In traditional accounts, a bound form is something which depends on, is appended to, or absor bed in an independent form. But it turns out that in the following examples bound form will absorb an independent form. Probably, the choice of the terminology is not so good. But I think you can see what is essential and will not be misled by terminology. Exemple 1. Let us first take a simple sentence: (1)
Surface form:
(2)
Base form:
John-ga hon-o yon-da John read books John hon yon-da book read-past
I do not give rules to insert -ga and -o, and in general do not worry about what particle appears where. The surface tree I would like to give to (1) is:
TREE PRUNING
305
I put some nodes in brackets for the purpose of cross reference. At a later stage of syntax, word boundaries # are inserted, as shown in (4). No word boundary is inserted between yom and da. Under such circumstances, I would say that they merge under one node, and I would define bound forms as those which absorb others. In the case of (4), da PAST TENSE is (defined to be) a bound form, and yom goes under node Aux. We have:
To get (3) from (5), the nodes in [ ] should go. I would like to say that at the last stage of surface tree generation all nodes without branching except for preterminal ones go. But, aside from this principle, [VP] has another reason to go, because it lost its head yom.
306
S.-Y. KURODA
Example 2: (1)
Surface form:
(2)
Base form:
(3)
Surface tree:
John-ni sore-ga deki-ru John can do it John sore suru koto deki ru it do that be-able PRES
To get (3) from (4) su-ru-koto is deleted. Thus, the bracketed NP loses its head koto, the bracketed VP loses is head su, and the bracketed S loses its head Aux. The reason why I take Aux to be the head of S will, I hope, be seen later. The result is:
TREE PRUNING
307
The word boundaries # is inserted as above. Ru is a bound form, and deki is absor bed under Aux, and as in the case of Example 1, we get (3). Example 3: (1)
Surface form:
(2) Base form:
(3)
ohn-ga Bill-ni hon-o yom-ase-ta John made Bill read books John (Bill hon ) sase ta book read make PAST
Surface tree:
Since something written under the bracketed Aux, 0, is deleted, or since nothing is written there from the start, the node Aux goes, and hence the bracketed S goes out, too, since Aux is the head of S. Word boundaries # will be inserted as above. By definition, sase is a bound form which absorbs the verb stem of the constituent sentence, and hence the bracketed VP loses its head. We get:
S.-Y. KURODA
308 (5)
Next, yomase is absorbed to ta, and in the similar manner as before (5) yields (3). Let me note here that the parentheses in (((yom) V" ase) V td) Ata with em bedded V are necessary for the accent assignment rule to operate. It seems reasonable to think that the finite verb form is, so to speak, the core of a sentence, and if it is lost, the sentence loses its sentencehood. Hence Aux is the head of the rule S →NP VP Aux. Example 4: (1)
Surface form:
(2)
Base form:
(3)
Base tree:
#John
#ill
John-wa Bill-ga hon-o yomu-koto-o kitaisita John expected that Bill would read books John-wa [[Bill-ga hon-o yomu] koto]-o kitaisi ta book read, that, expect PAST
# ru
koto
#kitaisi
ta#
No deletion is involved here. The word boundaries are inserted as above. The verb stem yom is bound to ru and yom-ru = yom-u is bound to koto (as it is so consi dered in traditional grammar). Thus, yom-u is absorbed in koto and we get:
TREE PRUNING
309
Note that the bracketed S and VP in (3) are lost in (4) since they have lost their heads. Next, kitaisi is absorbed into a bound form ta, so we get: (5)
S NP
NP
N
NP
NP
I
'
'
N
N
#John #Bill
Aux N
^^\ Aux
# ru
\
V
\
I
\ \
koto #kitaisi #ta
By deleting redundant [nonbranching] nodes we have:
S.-Y. KURODA
310
Example 5 (for the rales that derive (1) from (2), see Kuroda 1965: Chapter 6): (1)
Surface form:
(2)
Base form:
(3)
Base tree:
John-ni-wa sono-hon-ga kaeru John can buy books John [John sono hon kaw] e ru the book buy be-able PRES
The matrix subject John will be deleted by a rule. Then, the surface tree below can easily be derived. (4) Surface tree:
References Kuroda, S.-Y. 1965. Generative Grammatical Studies in the Japanese Language. Dissertation, Cambridge, Mass.: MIT (Reprinted, New York: Garland Press, 1979). Ross, John Robert. 1967. Constraints on Variables in Syntax. Dissertation, Cam bridge, Mass.: MIT.
TREE PRIMING
311
Summary This paper was originally written in 1965. It introduces two principles that determine the derivation of surface structure constituent trees from underlying deep structure trees. The first principle specifies that a non-branching node is eliminated, unless it is a preterminal node directly dominating a lexical item. The second principle is that if the head of a phrase is deleted, the nodes of the phrase dominating the head are eliminated. How to derive reasonable surface trees from underlying trees in a principled manner is much concern in Japanese syntax: due to the agglutinative character of the language underlyingly complex sentences can become simple sentences at the surface level.
LEXIQUES-GRAMMAIRES COMPARÉS QUELQUES OBSERVATIONS SUR DES DIFFÉRENCES SYNTAXIQUES EN FRANÇAIS DE FRANCE ET DU QUÉBEC
JACQUES LABELLE GRFL, Université du Québec à Montréal « We are forced to conclude that we could obtain no generalization without a reasonably complete study of lexical items of the language and their syntactic uses. » M. Gross, Language, Vol. 55, no 4, LSA, 1979: 861.
Le lexique-grammaire s'est avéré un outil indispensable de comparaison linguistique, en particulier, ici, des variétés de français. La vérification détaillée des propriétés de construction (appuyée de tests d'acceptabilité) de données lexicales exhaustives, patiemment colligées et regroupées en classes, permet de mettre en lumière les propriétés grammaticales et sémantiques de ce lexique, qu'il s'agisse de mots propres au fran9ais de chacune des variétés1 ou de mots communs ayant des comportements phrastiques distincts.2 Nous illustrerons ici quelques propriétés syntaxiques du français qui distinguent les emplois lexicaux des variétés québécoises et françaises. Elles sont réparties sur le lexique de façon variable, imprédictible. Dans certains cas, nous considérons ces écarts comme des tendances, c'est-á-dire comme des phénomènes ayant une plus grande fréquence d'occurrence dans l'une ou l'autre des variétés. 1. Particularités lexicales Cette question est déja bien connue: des mots existent ou n'existent pas (ou plus) dans Tune ou l'autre des variétés:
1 2
Nous noterons F le fraçais de France, et Q lefrançaisdu Québec. Lefrançaiscommun est noté FQ. Depuis près d'un quart de siècle se poursuivent, dans le cadre du lexique-grammaire, des études comparées sur les variétés linguistiques F et Q enfrançais.Ces travaux se sont naturellement imposés a partir de nombreuses discussions d'acceptabilité et de grammaticalité entre linguistes français et québécois. Nous avons largement profité de la collaboration des linguistes du LADL, dont Jean-Paul Boons et Alain Guillet. Nous remercions particulièrement Christian Leclère pour ses remarques et conseils assidus, toujours judicieux.
JACQUES LABELLE
314
Max s 'est acheté des (bobettes + claques + ...) Max s'est acheté des (slips + couvre-chaussures en caoutchouc + ...) Luc a monté un spectacle au boutte Luc a monté un spectacle (extraordinaire + unique + ...) Ces mots, qu'il s'agisse d'archaïsmes, de créations locales, d'anglicismes ou autres, sont liés a la grammaire, a leur emploi dans la phrase. Dans: (1)
Luc a monté un spectacle écœurant Luc a monté un spectacle extraordinaire
l'adjectif écoeurant est ambigu. Il peut s'employer, en Q, au sens de « extraordi naire » ou, en FQ, comme dérivé verbal, au sens de « répugnant, révoltant ». Mais l'adjectif écoeurant, dans Pexemple (1), n'est lié ä aucun des emplois du verbe écœurer, tels que répertoriés ci-dessous: Table 3 (FQ) 13 (FQ) 4 (Q) 32H
Exemples Eva a écoeuré Max de manger des nouilles [décourager] Que Max ait tant réussi éœr Ida [décourager, lasser] Max a écoeuré Luc toute lajournée [agacer, importuner]
On peut comparer le glissement sémantique de écœurant à celui de formidable en français, qui passe d'un sens grandement négatif a un sens hautement positif. formidable: effrayant, épouvantable → écoeurant: dégoütant, répugnant →
épatant, excellent extraordinaire, excellent
Notons que la locution adverbiale intensive en écoeurant: Il fait beau en écoeurant aujourd'hui Il fait très beau aujourd'hui est construite sur un modèle fort productif en Q: Il fait beau en (crisse + maudit + s'il vous plaît + titi + ...) aujourd'hui Il fait très beau aujourd'hui Certains mots québécois sont perçus comme vieillis ou littéraires en France. 'est le cas de Padjectif (ou nom) vite et des verbes s'en venir, s'en retourner, etc. Les phrases: Paul est vite Paul est un (petit) vite ou vite tient le role d'adjectif, puis de nom, sont naturelles en français québécois. On 1'observe aussi dans des adjectifs composés construits sur vite, comme dans les expressions a sujet libre: 3
Les numéros de tables sont ceux du LADL: M. Gross (1975), Boons, Guillet, Leclère (1976a, 1976b), et Guillet, Leelère (1992).
LEXIQUES-GRAMMAIRES COMPARÉS
315
Paul est vite en affaires Paul est vite sur ses patins au sens de « décider et agir rapidement», « comprendre rapidement une situa tion ». Les phrases: La visite (s 'en vient + s 'en retourne) sont aussi tout a fait naturelles en français du Québec. Parallèlement l'étude morphologique de ces mots, décrits dans le dictionnaire électronique du français du Québec (DELQUE4), des études sur les verbes5 ont montré que plus de 20% des entrées lexicales communes aux deux variétés ont des emplois distincts, mis a part les verbes propres aux lexiques Q, comme achaler, bädrer, bretter, etc., et F, comme cafarder, canuler, se rnagner. Ainsi en estil du verbe frapper dont nous extrayons les emplois suivants parmi les dix-sept emplois F et/ou Q:6 (Q)
Guy a frappé une bonne occasion Guy est tombé sur une bonne occasion (Q) Paul, en arrivant au bureau, a frappé le patron Paul, en arrivant au bureau, a rencontré le patron
De telles différences d'interpretation et de classement ne sont pas évidentes pour le linguiste travaillant sur sa propre langue: l'examen systématique du lexique, en fonction des différents emplois sémantico-syntaxiques, n'est vraiment efficace que s'il y a collaboration entre linguistes de chacune des variétés, chacun reconnaissant plus facilement mots, emplois de mots et propriétés de construction qui n'appartiennent pas ä son propre langage. Par exemple: (Q) Max a remis le livre ä Luc Max a rendu le livre a Luc (Q) Le travail n 'a pas dérougi depuis un mois Le travail n'a pas cessé depuis un mois (Q) dérougir est étymologiquement dérivé de rougir, mais avec un emploi métaphorique: (Le fer + le volcan) dérougit alors que: * Le travail a rougi depuis un mois est impossible.
4
J. Labelle (1999). J. Labelle et alii (1990). 6 Voir Armexe 1. 5
JACQUES LABELLE
316
2. Propriétés lexico-grammaticales Dans la séquence: Ce fromage est bon, rare (où la virgule marque un détachement) Ce fromage est très bon, comme rarement on a vu le mot rare a un emploi adverbial particulier, détaché (une pause le sépare du reste de la phrase). Il est nécessairement postposé a l'adjectif (*Ce fromage est rare bon, *Rare, ce fromage est bon). D'autre part, rarement peut être placé devant l'adjectif: Ce fromage est rarement bon mais avec un sens différent, soit: Il est rare que ce fromage soit bon Notons que vrat peut aussi avoir un emploi adverbial détaché: Ce fromage est bon, vrai ?* Ce fromage est vrai bon7 mais, contrairement a l'adverbe rarement, l'adverbe dérivé vraiment peut prendre les deux positions en gardant le même sens: Ce fromage est bon, vraiment Ce fromage est vraiment bon 2.1. Autres propriétés syntaxiques -Détachement. Pour les phrases du type: (Q) Luc en a un, livre Un livre, Luc en a un la forme naturelle en français F est: (F) Luc en a un, de livre impossible en Q. Le détachement du nom complément d'objet direct est Tune des rares transformations qui diffère formellement du français F. Toutefois, l'adjectif peut subir une telle transformation de détachement en Q: Luc a un livre (incomplet, mal écrit, relié, ...) [Détach] Luc en a un, (d'incomplet, de mal écrit, de relié, ...)
7
Ch. Leclère nous sígnale l'avoir entendu récemment en France.
LEXIQUES-GRAMMAIRES COMPARÉS
317
- Sous-structure, La phrase: Les Ursulines quittent 8 Les Ursulines partent constitue un emploi intransitif de verbe transitif, courant en Q: (FQ) Je quitte à cinq heures (Q) Si tu arrives a cinq heures, j 'aurai deja quitté (Q) Pierre achève Pierre a presque fini son (exercice + travail + rapport + ...) La table 1 (cf. achever) de M. Gross (1975), par exemple, présente de nombreuses différences de codage de sous-structures (par effacement du complément). Comme on l'aperçoit dans l'exemple ci-dessus, l'effacement entrame une légère difference sémantique, de type aspectuel {Pierre est en train d'achever). Des formes composées présentent la même tendance: (FQ) La porte (ferme + ouvre) (bien + mal) La porte (se ferme + s'ouvre) (bien + mal) alors que ces formes ne nécessitent pas d'adverbe dans: (Q) La porte (ferme + ouvre) (E + a 14) - Construction neutre. Les phrases: (Q) L 'autobus arrête au coin de Bleury et Sainte-Catherine (Q) Le concert (finit + termine) a 22h sont des constructions neutres du type: N0 V N1 W ↔ N1 V W (Le chauffeur + XXX) arrête l'autobus au coin de Bleury et SainteCatherine (Le chefd'orchestre + XXX) (finit + termine) le concert ä 22h La position N0 n'est pas facile á déterminer; il peut même s'agir, dans certains contextes, d'un «agent fantome » (BGL 1976), noté ici XXX, par exemple si l'autobus est téléguidé ou complètement automatique, ou encore si le concert est retransmis a la radio. Le français F, dans ce cas de figure, leur préfère la forme pronominale: (FQ) L 'autobus s 'arrête au coin de Bleury et Sainte-Catherine (F) Le concert se (finit + termine) ä 22h Boons, Guillet et Leclère (1976:129) les relient par: Nous remercions Annie Meunier de nous avoir signalé cet exemple.I1s'agit d'un titre à la une d'un journal québécois régional.
JACQUES LABELLE
318
N0 V N1 W ↔ N1 se V W Remarque: Jean-Paul Boons nous avait fait observer, il a plusieurs années, que le français du Québec avait «tendance » a privilégier la construction neutre, non pronominale. Nous considérons toujours qu'il s'agit bien la d'une «tendance », puisque, faute d'avoir étudié cette propriété sur l'ensemble du lexique, nous ne pouvons, dans l'etat actuel de nos connaissances, en évaluer l'importance avec précision. - Transitivité. l'inverse, des verbes, normalement intransitifs en F et FQ, ont des emplois transitifs particuliers en français Q: (Q) Max a marché sa ferme Max a parcouru sa ferme de long en large (Q) Max a marché la rue Sainte-Catherine de Bleury ä Saint-Denis (en vingt minutes) Cette construction, V Loc N (scénique), peut être reliée, dans certaines conditions, aux formes en -able: [passif] [par N z.] [pouvoir i.] [Vsup être-able]
La rue Sainte-Catherine a été marchée de Bleury ä SaintDenis (en vingt minutes) par N La rue Sainte-Catherine a été marchée de Bleury ä SaintDenis(en vingt minutes) La rue Sainte-Catherine peut être marchée de Bleury ä StDenis (en vingt minutes) La rue Sainte-Catherine est marchable de Bleury ä SaintDenis (en vingt minutes)
Le contexte à pied a une interprétation voisine: (Q)
Ce trajet est marchable (E + ä pied)
La forme en -able peut toutefois présenter d'autres contraintes contextuelles. La phrase: (Q)
Ce chemin n'est pas marchable Ce chemin n'est pas praticable
peut entrer dans un contexte du type parce qu 'il est (en mauvais état, trop difficile, glissant,...). On trouve aussi: (Q) Ici, 'est pas marchable (Q) Cet endroit (n') est pas marchable (Q) A ujourd 'hui, 'est pas marchable La forme en -able provenant d'un complément prépositionnel Loc N ou Loc direct scénique existe aussi en F: (FQ) Ce chemin est carrossable
LEXIQUES-GRAMMAIRES COMPARES
319
est liée au verbe (vieilli) carrosser: ? On peut carrosser sur ce chemin En somme, il y a deux types distincts de relations: a) V-able - COD (FQ) Ce chemin est praticable (FQ) On peut pratiquer ce chemin ou le verbe pratiquer, rare, signifie « aller régulièrement dans un lieu ». (FQ) Cela est faisable = On peut faire cela (Q)
Cela est marchable = On peut marcher cela
b) V-able-Prép N (FQ) ? On carrosse sur ce chemin [sur z.] ? On carrosse ce chemin [passif] ? Ce chemin est carossépar XXX [par N z.] ? Ce chemin est carossé [pouvoir i.] ? Ce chemin peut être carossé [Vsup être-able] Ce chemin est carossable Outre ce cas, qui fait appel a des états de langue anciens, on rencontre des cas particuliers de ce type en français du Québec: On ne peut pas entrer dans ce bar = Ce n'est pas entrable (dans ce bar) Ce type de question n'a pas été étudié systématiquement. On observe donc des formes, mal connues, de verbes intransitifs, comme le montrent d'autres exemples: (Q) Aujourd'hui, ce n'est pas sortable Aujourd'hui, on ne peut sortir (par si mauvais temps) ou: (Q)
Ce chemin n 'est pas allable On ne peut aller (quelque part) par ce chemin (qui est en si mauvais
état) (Q) Est-ce que 'est allable aujourd'hui ? Aussi: (Q) Aujourd'hui, 'est sortable, il fait beau (FQ) Aujourd'hui, on peut sortir, il fait beau Pour certains verbes, on note que des emplois transitifs anciens, encore attestés dans des formes figées, peuvent motiver la construction dérivée: Il va son chemin
JACQUES LABELLE
320 2.2. Formes figées Les phrases:
(Q) Paul ventre (ä torn les mois + ä toutes les deux semaines) (FQ) Paul rentre (tous les mois + toutes les deux semaines) ne sont pas sans rappeler que la préposition à, depuis le moyen-age9, a perdu du terrain en français dans la construction d'adverbes. Nous avons gardé au Québec: ä matin, ä soir, comme autrefois à matines, ä vespres, ainsi que des formes très productives comme: (Q) Paul arrive a chaque (jour, lundi, mardi, ..., semaine, mois, mois de mai, ..., année, ...). Certaines formes en ä se sont maintenues en français dans des adverbes composés comme: à tout moment, (a) chaque seconde, (ä) chaque automne, ... (GoosseGrevisse 1993). Les expressions figées font actuellement l'objet d'une comparaison beaucoup plus large, s'étendant au français de Belgique et de Suisse (projet BFQS).10 Nous présentons, en annexe 2, quelques entrées de la table C6-Q (expressions avec complétive directe). Cette table (parmi près de 80) regroupe des expressions de la forme: N0 V Qu P Prép 2 =: Luc a inventé de toutes pièces que Max avait fraudé. Les expressions suivantes: (Q) Luc a pour son dire que Guy va réussir Luc pense que Guy va réussir (Q) Marc trouve plate que Luce parte maintenant Marc trouve dommage que Luce parte maintenant illustrent un type de construction à complétives et ses propriétés syntaxiques. Elles sont apparentées a la table 6 des verbes simples (M. Gross 1975): Luc pense que Guy va réussir Une autre forme complexe (Q), faire aller, se rencontre dans des phrases variées qui confirment l'association faire aller - envoyer. Cette observation donne une base observable aux constructions causatives en faire: (Q) Max a fait allé la main ä Lucie Max a envoyé la main á Lucie Il est à remarquer que l'expression se faire aller: (Q) Max s 'est fait aller toute la soirée
9
G. Gougenheim (1951 :185) confirme que « Les indications temporelies que nous construisons sans préposition sont souvent précédées de la préposition à » au seizième siècle. 10 Voir, propos, Ch. Leclère (1999).
LEXIQUES-GRAMMAIRES COMPARÉS
321
peut signifier « s'activer », « s'amuser follement», ..., ce qui la rapproche de l'expression: (F)
Max s 'est envoyé en l'air toute la soirée
où l'on retrouve le couple faire aller - envoyer. Faire aller se retrouve aussi dans des expressions sans lien avec envoyer: (Q) Luc s'est fait aller la gueule sans arret Luc a parlé sans arrêt
3. Conclusion Les études comparées de propriétés lexico-grammaticales permettent d'expliciter des relations sémantico-syntaxiques non seulement l'intérieur de l'une ou l'autre des variétés, mais aussi en français commun. Notre présentation de la méthode comparée en lexique-grammaire n'est qu'illustrative. De nombreuses questions n'ont été qu'effleurées ici, l'idée étant de montrer que le cadre du lexique-grammaire ouvre sur divers programmes de re cherche. De nombreuses études lexicales ont été effectuées par les linguistes ou lexicographes québécois, mais très peu d'entre elles ont parlé de syntaxe, si ce n'est d'un point de vue théorique, et n'utilisant que quelques exemples de phrases. Le travail de description effectué au GRFL offre un grand éventail de données formalisées permettant des applications l'analyse automatique de textes québécois (J. Labelle 2000), ainsi qu'a l'enseignement.
Références Boons, Jean-Paul; Alain Guillet; Christian Leclère. 1976. La structure des phrases simples enfranqais: constructions intransitives. Genève: Droz. Goosse, André; Maurice Grevisse. 1993. Le bon usage. Louvain-la-Neuve: Duculot. Gougenheim, Georges. 1951. Grammaire de la langue franqaise du seizième siècle. Lyon/Paris: IAC. Gross, Maurice. 1975. Méthodes en syntaxe. Paris: Hermann. Guillet, Alain; Christian Leclère. 1992. La structure des phrases simples en franqais: constructions locatives. Genève: Droz. Labelle, Jacques. 1988. Lexiques-Grammaires comparés: formes verbales figées en français du Québec. Langages 90, Paris: Larousse. Labelle, Jacques et alii. 1990. Lexiques-grammaires comparés: structures verbales et derivées en franqais du Québec (I). Rapport de Recherche du GRFL n° 5, Montréal: UQAM.
322
JACQUES LABELLE
Labelle, Jacques. 2000. Linguistique comparée, dictionnaires électroniques et INTEX. In Analyse lexicale et syntaxique: Le Système INTEX, C. Fairon (ed.), Volume spécial, Linguisticce Investigationes XXII:1-2, Amsterdam/Philadel phia: John Benjamins. Leclère, Christian. 2000. Expressions figées dans la francophonie: le projet BFQS. In Bulag numéro spécial, Lexique, Syntaxe et Sémantique, Mélanges offerts a Gaston Gross, Besançon : Centre Tesnière.
Summary This paper deals with the representation of linguistic differences between varieties of french language, french of Quebec and french of France. Quebec french has a lot of linguistic particularities and presents many differences of uses, including lexicon and grammatical properties. It is an illustration of the application of the theory of lexicon-grammar that appears to be a very efficient tool for doing linguistic comparison, involving, particularly, the syntactic features of the lexicon.
LEXIQUES-GRAMMAIRES COMPARÉS
323
A N N E X E 1: Extrait du Glossaire comparé F-Q des constructions verbales frapper: 31H; L'assassin a encore frappé frapper: 32C; On frappe généralement le champagne frapper: 32CL; Max a frappé Luc au visage frapper: 32H; Un infarctus a frappé Max; Un drame a frappé cette familie frapper: 4; Que Léa ressemble á Ida frappe (E + l'œil de) Max frapper: 35L; Max frappe au portail frapper: 36SL; Max frappe son verre (avec + contre + et) celui de Luc frapper: 37M1; On a frappé les importations d'un impót spécial; On a frappé les coupables d'une lourde peine frapper: 38LD; Max frappe (E + de grands coups) sur la porte; Max a frappé sa tête sur la poutre; Le volet frappe contre le mur frapper: 38L1; (Max + L'auto) a frappé un (arbre + (Q)piéton) [F.embrasser, F.emplafonner, F.emplâtrer, F.encadrer, F.s'envoyer, F.taper, Q.bomper, Q.fesser, Q.lutter] frapper: 38L1; Le volet frappe (E + contre) le mur; La lumière frappe les carreaux frapper: F-6; Max a frappé en tête de lettre qu'on était le 10 Aoüt; Max a fait la frappe de ce texte [«taper»] frapper.se: F-8; Max se frappe (E + de ce) que Léa soit partie [«se ficher de »] frapper: Q-35R; Luc frappe pour les Expos = Max est frappeur pour les Expos [baseball; Dqa] frapper-circuit: Q-32R3; Le joueur a frappé un circuit [baseball; Dqa] frapper: Q-32R2; Luc a enfin frappé (la bonne personne + la job idéale) [«trouver, tomber sur»; Dul, Seu, Bar] frapper-balle: Q-38LD; Les enfants ont frappé la balle dans la cour du voisin [«lancer en frappant»; Lq; N1 contraint]
Prép Dét N2 =: NOpc
NO =: Nhum NO =: N-hum
N
+ + + + + + + + + + + + +
1+|+ + + + -
+ + - - - - - - - + + - + - á travers les apprendre - branches avoir - + - - - - - - - + - - - - pour Poss-0 - dire + tête avoir - + - - - + - + - + + - + + dans la + patate avoir - - - - - + - + - + + - + + sur la + + + + + en + mémoire avoir - + chanter - + - + - - - - - + + - + - sur tous les - toits n' enlever Nég - + - - - + - + - + + - + + de la - idée n' enlever Nég - + - - - + - + - + + + + + de la - tête faire - - - - - + - + - + + - + - par - exprès + face garocher - + - + + + - + - + + - + - par la + face lancer - + - + + + - + - + + - + - par la lire - tasse de thé - + - + - - - - + + + - + + dans une + + - - + - - - + + + - + + entre les lire - lignes + + + - + - dans la lire - + - face + tête se mettre - + - - + - - + - + + - + - en + tête se mettre - + - - + - - + - + + - + - dans la + + - - - + - + - + + - + - sur mettre - papier mettre - + - - - - - - - + + - + - à le - procès-verbal + tête + + óter - + - - + + - + - + + - + + de la + idée + + oter - + - - + + - + - + + - + + de la + + - + + pour+ prendre - + - acquis + prendre - + - - - + - - - + + - + - pour de le - cash + prendre - bord - - - - - + - + - + + + + + de le bon + prendre - - - - - + - + - + + + + + de le mauvais - bord + remettre - - - - - + - + - + + - + - à la - semaine de les quatre jeudis + + - + - -+ - ne répéter jamais - + - assez + trouver plate - - - - - + - + - + - - - + -+ + + - + - dans la + face + voir - + Exemples : Max a appris ä travers les branches que Luc serait absent ä la réunion Ida trouve plate que Guy parte demain pour le Canada
V
N0VN1 Nl=:que P N1=: VOW N1=: Aux VOW N1=: de VOW N1 -: que Psubj N1=: VOW N1=: de VOW Nl-siP Qu P - ceci QuP-ppv N1 =: Nhum N1 =: N-hum Nl=:lefaitQuP
TABLE Q - C6
+ +
-
+ + + + +
-
+ + + + + + + + + +
-
+
-
+ + penser fortement que + + avoir sur le cœur + - garder le souvenir - - répandre le bruit + + ne pas changer d'opinion sur + + ne pas changer d'opinion sur - - faire exprès + + crier impoliment + + crier impoliment - - deviner l'avenir - - FQ? + - voir sur la figure + - se convaincre + - se convaincre - - écrire - - écrire dans le p-v + + faire oublier + + faire oublier - - considérer comme certain - - considérer comme vrai - - prendre bien - - prendre mal - - remettre aux calendres grecques - - insister - - trouver dommage + + voir sur la figure
- - apprendre par ouï-dire - - avoir l'opinion
Passif N2~C2deNhum de Nhum = LUI-Poss-0 +
Equivalent sémantique FQ
324 JACQUES LABELLE
ANNEXE 2: Table Q - C6 (extrait)
ITALIAN PEOPLE AT WORK JOBS IN LEXICAL SYNTAX1
NUNZIO LA FAUCI Universität Zürich
IGNAZIO M. MIRTO Università di Palermo
1. Introduction The construction of syntactic dictionaries is one of the main goals of Lexical Syntax, the theoretical framework introduced in seminal work by M. Gross (1975, 1994) and the one we use in this work. The items of common dictionaries are lexi cal elements, whereas the items of a syntactic dictionary are clausal forms. From a lexical viewpoint, in syntactic dictionaries the description of clausal forms must be as thorough as possible. In this work, our target is a clause type built with the verb fare. In Italian this verb is found in a remarkable number of constructions. The sentences in (1) illus trate some uses of the verb: (1) a. Luigi fa il medico L. does the doctor (Luigi is a doctor) b. Mario fa il bambino M. does the child (Mario acts as a child) Giorgio fa lo stupido G. does the stupid (Giorgio plays the fool/ Giorgio behaves as a fool) d. Nino farà da segretario N. will-do as secretary (Nino will act as a secretary)
1
This work was carried out jointly, but La Fauci is responsible for §3, and Mirto for §1, 2, 4 and 5. A version of this article was presented at the 18eme Colloque International "Lexiques et Grammaires Comparés" held in Salerno (6-9 October 1999). We thank the participants to the confe rence for the discussion and wish to express our gratitude to Riccardo Ambrosini and Christian Leclère for reading and commenting on a preliminary version of this article. We are also indeb ted to Lorenzo Renzi and Mireille Piot for their bibliographical help.
326
NUNZIO LA FAUCI & IGNAZIO MIRTO
Italian dictionaries and grammars generally lump all these uses of fare together and devote to them only a few elementary remarks (see §2.1), in which it is often implicitly assumed that they are all instances of the same verb fare.2 This work is part of a broader research that targets all the types of fare given in (1). The construction analyzed here is exemplified in (la). Its constraints make it an ideal item for an Italian syntactic dictionary organized according to the principles of Lexical Syntax. It is a construction specialized in expressing people's jobs, which explains why we call it the Job Fare-Construction (henceforth JFC).3 Some additional examples are shown in (2a) and (2b), while the sequence in (3) illus trates the surface structural scheme of the JFC: (2) a. Eva fa Vingegnere Eva does the engineer (Eva is an engineer) b. Pio fa il postino P. does the postman (Pio is a postman) (3)
Nhum fare DefDet Njob
To the best of our knowledge, in the literature there is little trace of the JFC. In a short note, L. Renzi & L. Vanelli (1975:82) write: "La forma profonda, non ellittica, di fa Vingegnere, fa lo stupido dovrebbe essere: fare le cose che fa Vingegnere, fare le cose che fa lo stupido". Within Renzi & Vanelli's hypothesis nothing prevents the unreduced form to be Max fa le cose che fa un ingegnere, that should yield the elliptical form Max fa un ingegnere. This form, however, is not a JFC (see examples (7a-b) below). We do share Renzi & Vanelli's hypo thesis about the elliptical nature of the JFC, but object two of their statements: first, that the two constructions fa l'ingegnere and fa lo stupido have identical syntactic derivations, and, second, that the derivation offare Vingegnere is the one they propose, as we show in §3. Some Italian dictionaries and grammars do mention the construction, but, as in Renzi & Vanelli (1975), this is often overlapped with other fare constructions that are only superficially alike. For example, in the Vocabolario della lingua italiana (s.v. fare, Roma: Istituto dell'Enciclopedia Italiana 1987) we find: "Esercitare un 2
3
For example, (la-c) can all have a different interpretation, in which Nhum (i.e. Luigi, Mario and Giorgio) is interpreted as an actor playing the role of 'doctor', 'child' and 'stupid' respectively. This interpretation arises from a syntactic construction different from the one analyzed in this study. This construction is treated in Mirto 2001. Within the theoretical framework of Lexical Syntax, a work on nouns for jobs in French is Abeillé 1987. In this work, the author's main interest is the correlation between morphology and syntax; thus her emphasis is on the match between the type of suffix in Njob and the syntactic properties of the clause containing an Njob with that suffix. Abeillé's perspective is a traditional one (it follows Benveniste 1975) and is rather different from ours since our analysis focuses on the structure and properties of the JFC regardless of the morphology and the internal structure of
Njob.
ITALIAN PEOPLE AT WORK
327
mestiere, una professione, avere una qualità o una dignità o uno stato: fa il muratore; ha fatto sei anni l'assistente; f. da sindaco, da presidente, e sim[ili] farne le funzioni o le veci; analogam[ente]: fare da padre, da madre, a qualcuno. Per estens[ione], ƒ il grullo, lo scemo, Vimbecille, comportarsi come se si fosse tali; f. il furbo, il superuomo, darsene l'aria ". Other brief remarks are found in G. Salvi (1988:81-2): " 'fare + articolo deter minativo + nome di professione': indica l'attività permanente del soggetto: (421) Fa il meccanico / È di professione meccanico. 'fare + da + nome di professione' indica invece una funzione occasionale: fare da guida (= 'fungere da guida'). 'Fare + articolo determinativo + aggettivo' indica uno stato simulato: fare lo scemo (= 'agiré come gli scemi, pur non essendolo')."4 In the Italian syntactic dictionary organized in conformity to the principles of Lexical Syntax, these additional fare-constructions are at least as important as the JFC is.5 As for the JFC, they are scarcely explored. Yet, in a syntactic dictionary they cannot be mixed up with the JFC just because of their sharing the verb fare. Our analysis intends to identify some key factors for building up the JFC lexical syntactic item of the form shown in (3). The remainder of this work is organized as follows: in §2, we present some empirical properties of the structure; in §3, we show the construction's derivation, that is the way (3) is arrived at by means of combinations and reductions; §4 discusses two characteristics of the list for Njob; some concluding remarks will be found in §5.
2. Empirical properties Here are some significant properties of the JFC. Property J. The subject of the JFC is mandatorily a Nhum: (4)
4
5
6
* (Che Ivo sia arrivato + la preoccupazione di Lia + il tegame) fa that I. be arrived the worrying of L. the pot does (il tipografo + il doganiere + lo zoologo)6 the typographer the customs officer the zoologist
Salvi's last remark is not entirely correct. From a syntactic point of view, scemo is not an adjective but a noun, as the presence of the determiner shows. Moreover, even with Njob's such as professore or avvocato the simulated state interpretation is always possible: In situazioni simili, Max fa il professore 'In such cases Max acts as a professor'. See Giry-Schneider (1984, and in this volume) for a discussion on French faire constructions such as Jean fait le {généreux + diable). In a few cases, the subject of the JFC can be open to non-humans (e.g. animals or robots) carrying out an institutionally and/or socially acknowledged job as happens, for example, in (i): (i) Fido fa il cane poliziotto F. does the police-dog (Fido is a police-dog).
328
NUNZIO LA FAUCI & IGNAZIO MIRTO
Property 2. The verbal form occurring in the JFC is fare. The verbf e r ecannot be replaced with any of its most common synonyms: (5)
Pia (fa + *effettua + *commette + *esegue + *crea + ...) la barista P. does effects commits executes creates the bartender (Pia (is + * effects + * commits + * executes + * creates) a bartender)
Property 3. Njob belongs to a lexical list containing thousands of items (around 4,000). The list is open: nouns for new activities can enter it: (6) a. Ivo fa il rapper I. does the rapper (Ivo is a rapper) b. Eva fa la cubista E. does the 'cubista' (Eva is a professional dancer in a disco) c. Teo fa il pusher T. does the pusher (Teo is a pusher) Property 4. Njob is mandatorily definite: (7) a. Eva fa (*un + *E) ingegnere E. does an 0 engineer (Eva is an engineer) b. Pio fa (*un + *E) postino P. does a 0 postman (Pio is a postman) 2.1. The JFC has no exact counterpart in other important European languages, either belonging to the Romance family (such as French and Spanish) or to the Germanic one (English and German).7 In these languages, the content Italian expresses with sentences such as (2a) or (2b) is normally expressed with construc-
7
During the discussion at the Salerno conference, it was noticed that if something like the Italian JFC exists in other main Romance languages, it seems to be neither a widespread construction nor a standard one as it is in Italian. The French data in (i) and (ii) below (from C. Leclère) exemplify one such case: (i) Paul fait l'acteur P. does the actor (Paul is an actor) (i) should be considered as an idiom rather than a construction since acteur cannot be replaced {* Paul fait le professeur). Moreover, in informal French we find: (ii) Quand il sera grand il veut faire plombier when he will.be grown.up he wants to.do plumber (When he grows up, he wants to be a plumber) but clauses like (ii) differ from the JFC for the lack of determiner in front of Njob.
ITALIAN PEOPLE AT WORK
329
tions built with a copula (être, ser, to be, sein) in which Njob is either bare or pre ceded by an indefinite article: (8)
Max est plombier 8 (Max is a plumber) b. Spanish Pablo es profesor (Pablo is a professor) e. English John is a doctor d. German Wolf ist Rechtsanwalt (Wolf is a lawyer) a. French
Italian too has a copulative construction akin to (8): (9)
a. Eva è (un + E) ingegnere E. is an 0 engineer b. Pio è (un + E) imbianchino P. is a 0 painter
From a syntactic and semantic point of view, in the copulative construction Njob functions as a predicate. Just as happens in the other languages, in Italian too this construction has the appearance of a common copulative construction in which Njob works as a noun predicate. Things work quite differently for the JFC. Its syntactic characteristics cannot be defined at once. At first glance, the construction appears to be transitive:9 (10) N0 fare DefDet N1 but the JFC fails to pass a number of syntactic tests for transitivity and lacks properties that are strictly related to transitive structures. Below, we discuss two of them: a) passivization and b) referential properties of the direct object. Passivization yields a well-formed sentence in (11) and yet an ill-formed one in the JFC in (12): (11) a. Ada ha fatto la torta di mele (Ada made the apple-pie) b. La torta di mele e statafatta da Ada (The apple-pie was made by Ada) (12) a. Ada ha fatto la tennista (per dieci anni + E) (Ada was a tennis-player (for ten years)) b. *Za tennista e stata fatta da Ada (per dieci anni + E) the tennis-player is been made by Ada for ten years 0
8 9
For the determiners that can occur in this French construction, see the remarks by Abeillé (1987:71-75) and the references therein. The Dizionario della lingua italiana by Devoto & Oli (1990) defines the phrase DefDetN1as a predicative complement and analyzes fare as an intransitive.
330
NUNZIO LA FAUCI & IGNAZIO MIRTO
Alongside the ill-formed passive in (12b), let's also examine the referential properties of Njob The direct object in (11) is a standard referential expression conveyed with a definite determiner, while in (12) the reference of Njob, if there is one, must be the same as Nhum (i.e. Ada). Moreover, the negation of (11), displayed in (13), allows for a double reading: (13)
Ada non ha fatto la torta di mele (Ada didn't make the apple-pie)
In the first reading (de re) the apple-pie does exist, but someone else made it, not Ada. In the second one (de dicto) no apple-pie exists (e.g. Ada non ha fatto la torta di mele, ma quella di zucca). On the other hand, in negating (12) the only reading we obtain is the latter (de dicto): no tennis player whatsoever exists:10 (14)
Ada non ha fatto la tennista (Ada was not a tennis-player)
2.2. Though question words treat Njob as a direct object, they disclose another peculiarity of the JFC. In both (15a) and (16a) the verb is followed by the NP il medico 'the doctor'. (15b) shows that a question targeting the direct object of the verb disapprovare 'disapprove', i.e. il medico 'the doctor', uses the question word chi 'who(m)', the pronoun used for people only (thus the structure 'reads' the [+human] feature of il medico). (15c) and (15d) show that with a [-human] direct object, the constituent il suo lavor 'his/her job', the question word used is che cosa 'what'. On the surface, (16a) appears to be like (15a). If the two sentences were structurally identical, we would expect the NP il medico to behave exactly as with (15b): it should trigger the question word chi. However, (16b) shows that the interrogative pronoun chi does not bring about the appropriate question.11 What (16c) illustrates is that in the JFC the NP following fare prompts the interrogative pronoun che cosa 'what', just as happens with the [-human] direct object il suo lavoro 'his/her job' in (15c). Thus the structure of a JFC does not 'read' the [+human] feature of Njob. The relevant contrast for illustrating this oddity of the JFC is between (15b) and (16c): (15) a. Tu disapprovi il medico you disapprove the doctor (You disapprove of the doctor) 10
To put it differently, Njob has a generic reading: it works as a noun designating a class rather than designating an individual of the class (cf. Renzi & Vanelli 1975). 11 Thequestion in (16b) would be the correct one if the verb fare meant 'to play (the role of)' (see footnote 1). For example, the pronoun chi must be used to question il maggiordomo 'the butler' in (i) (In questa scena chi fa Max? 'Who will Max play in this scene?'): (i) In questa scena Max fa il maggiordomo in this scene M. does the butler (In this scene Max plays (the role of) the butler)
ITALIAN PEOPLE AT WORK
331
b. Chi disapprovi ? who disapprove-you (Who do you disapprove of ?) Tu disapprovi il suo lavoro you disapprove the her job (You disapprove of her job) d. Che cosa disapprovi ? what disapprove-you (What do you disapprove of ?) (16) a. Tu fai il medico you do the doctor (You are a doctor) b.* Chi fai ? who do-you (Who do you do ?) Che cosa fai ? what do-you (What do you do ?) To sum up, we have good reasons to believe that the JFC has an anomalous, very peculiar transitivity.12 2.3. We have already pointed out that, in addition to the JFC, to express people's jobs Italian makes also use of copulative constructions. The JFC could then be easily considered just a doublet of the copulative constructions, but any such conclusion should be rejected for there are both semantic and syntactic reasons to distinguish them. The examples in (17) unveil a significant semantic divergence: (17) a. Ugo è (un + E) ingegnere, fa Vingegnere (Ugo graduated as an engineer, but he does not work as an engineer) b. Ada fa la postina, ma è (una + E) biologa (Ada works as a postman, but she graduated as a biologist) The copulative constructions with Njob foreground a skill, a qualification or a degree of the subject.13 Despite his/her skill, qualification or degree, however, the subject may carry out a job requiring none of them. In other words, the quali12
See also Hopper and Thompson (1980). The JFC does not conform to many of the parameters for transitivity these authors identify. 13 This suggests that the copulative constructions with Njob might be more complex than they appear, with the noun predicate open to (at least) two interpretations: in the first, it means the job the subject actually carries out; in the second, the noun predicate indicates the qualification someone gets after passing a course of study. The addition of a prepositional phrase as in Max è (un) ingegnere presso la Microsoft 'Max works as an engineer at Microsoft' favors the first interpretation (obviously without negating the second one), whereas the context in (17a-b) favors the second interpretation to the detriment of the first one.
332
NUNZIO LA FAUCI & IGNAZIO MIRTO
fication, degree or skill may not be necessary or even useful in the subject's actual job, and are left in the background. On the other hand, the JFC foregrounds the activity actually performed by the subject, leaving in the background his skills, qualifications, or degrees. Copulative constructions and the JFC differ in many other ways. In the former, the definiteness of Njob makes the clause an identificational structure (see (18b)). The latter only allows for a definite determiner. Yet, as the translation in (19) shows, this triggers no identificational value: (18) a. Edo è (un + E) barbiere (Edo is a barber) b. Edo è il barbiere (Edo is the barber) (19)
Edo fa {il + *un + *E) barbiere E. does the a 0 barber (Edo is a barber)
Another difference between copulative constructions and the JFC bears on agreement. In the copulative clauses in (20) the subject controls number agree ment on Njob, and where morphologically possible gender agreement too: (20) a. Dei suoi tre figli, due sono (*calciatore + calciatori) of her three sons two are soccer-player(m.sg) soccer-player(m.pl) (She has three children and two of them are soccer-players) b. Quelle tre ragazze sono {*commessa + commesse) those three girls are salesgirl(f.sg) salesgirl(f.pl) (Those three girls are salesgirls) On the other hand, the NJ0b of a JFC may be in the singular even with a plural subject: (21) a. Dei suoi tre figli, due fanno (il calciatore + i calciatori) of her three sons two do the soccer-player(m.sg) the s-p(m.pl) (She has three children and two of them are soccer-players) b. Quelle tre ragazze fanno tutte {la commessa + le commesse) those three girls do all the salesgirl(f.sg) the salesgirl(f.pl) (Those three girls are all salesgirls) Cliticization is another area in which a sharp contrast emerges between the JFC and copulative constructions. In Italian, nouns working as predicates in copulative constructions always cliticize in the masculine singular, the unmarked value, regardless of their gender and number: (22)
Quelle tre ragazze (lo + He) vorrebbero essere, commesse those three girls 3m.sg 3f.pl would-like to-be salesgirl(f.pl) (Those three girls would like to be salesgirls)
ITALIAN PEOPLE AT WORK
333
But the clitic for Njob in a JFC can inflect for gender and number (as happens with accusative clitics): (23) a. Quelle tre ragazze (?*lo + la) vorrebbero fare, la commessa those three girls 3m.sg 3f.sg would-like to-do the salesgirl(f.sg) (Those three girls would like to be salesgirls) b. Quelle tre ragazze (?*lo + le) vorrebbero fare, le commesse those three girls 3m.sg 3f.pl would-like to-do the salesgirl(f.pl) (Those three girls would like to be salesgirls) Yet, under conditions that are still to be determined, in the JFC the clitic for Njob can also be the unmarked one: (24)
Eva e Pio fanno i giornalisti e anche i loro figli E. and P. do the journalists and also the their children (l + ?*li) vorrebbero fare 3m.sg 3m.pl would-like to-do (Eva and Pio are journalists and their children too would like to be journalists)
Adjectival modification too reveals a distinct syntactic behavior. Only the Njob of copulative constructions can be modified with an adjective. In a JFC, the pre sence of an adjective following NJob brings about an ill-formed sentence: (25) a. Emily fu (una) poetessa sopraffina (Emily was a very fine poet) b. Mario è un medico bravissimo (Mario is a very good doctor) Gianni è l 'avvocato francese (Gianni is the French lawyer) (26)
Dora fa D. does
la giornalista (*esperta + *brava + * francese) the journalist expert good French
However, it must be pointed out that in the JFC NJob can be followed by an adjective, providing the phrase [Njob + adjective] is still interpretable as NJ0b, namely when it is a compound noun. In (27), for example, the noun consigliere plus the adjective delegato defines a job (i.e. 'managing director') and can be used as a complex Njob. The same takes place with compounds as in (28), since the compound names a job (uomo rana = diver). (27)
Giorgio fa il consigliere delegato (Giorgio is the managing director)
(28)
Roberto fa l'uomo rana (Roberto is a professional diver)
The JFC can be used as a test to identify compounds among the phrases expres sing jobs. What is added to the noun to form the compound does not have to be an
NUNZIO LA FAUCI & IGNAZIO MIRTO
334
adjective: bracciante agricolo 'day-labourer', operaio specializzato 'skilled wor ker', medico della mutua 'panel doctor', tecnico del collaudo 'test engineer', uomo di fatica 'man employed for heavy work'.14
3. Building up the JFC As shown above, the JFC has commonly the form in (29): (29)
Nhum
fare DefDet Njob
The syntactic and semantic characteristics highlighted above show clearly that the structure in (29) cannot be basic. The elementary syntactic structure subjacent to the JFC is one with the support verb fare and either the noun predicate mestiere or professione preceded by the indefinite article:15 (30)
Nhum fa IndefDet does
(mestiere + professione) job profession
As with any common construction containing a support verb, in this structure the semantic and syntactic predicative role is taken on by either the noun mestiere or by professione (cf. Gross 1981). A piece of evidence comes from the selectional restrictions on the subject, that must be [+human]. They depend on the nature of the noun rather than on the nature of the verb:
14
Sometimes the addition of an appropriate adjective has no consequences on the grammaticality of a JFC. The adjective might here function as an adverb does. Both the sentences in (i) and (ii) can be paraphrased as Max fa ilpoliziotto onestamente da 30 anni: (i) Max fa ilpoliziotto onesto da più di 30 anni (Max has been an honest policeman for more than 30 years) (ii) Max fa l'onesto poliziotto da piii di 30 anni (Max has been an honest policeman for more than 30 years) Compare (i) and (ii) with the sentences below (cf. La Fauci 1997): (iii) I Ferbi hanno portato un rapido attacco alla carovana (The Ferbi attacked the caravan rapidly) (iv) I Ferbi hanno rapidamente portato un attacco alla carovana (The Ferbi attacked the caravan rapidly) 15 A common idea on the difference between the nouns mestiere and professione is that the former involves manual work, while the latter doesn't. The distinction would then be close to the one found in English between a blue-collar job and a white-collar job respectively. As many Italian dictionaries point out, however, the two words are largely interchangeable: professione, for instance, can be used for jobs requiring manual work (as happens in job application forms), whereas mestiere can be used for lawyers' or engineers' jobs (e.g. il mestiere di avvocato). To us, the distinction seems to relate to a variation of register rather than to the type of work, with professione as a formal term and mestiere as an informal one.
ITALIAN PEOPLE AT WORK
335
(31) a. (Pio + La vostra risposta + Che Ada si risposï) fa scalpore P. the your answer that A. rfl. marry does noise ((Pio + Your answer + The fact that Ada gets married) causes a great sensation) b. (Pio + *La vostra risposta + *Che Ada si risposï) fa P. the your answer that A. rfl. marry does una professione / un mestiere a profession a job ((Pio + * Your answer + *The fact that Ada gets married) carries out a job) From a stylistic point of view, fare is the least marked member of a class of support verbs with whom it can freely commute16: (32)
Nhum (fa + pratica + svolge + esplica + ...) IndefDet does practices carries-out expounds (mestiere + professione) job profession
What is peculiar in the elementary syntactic structure in (30), however, is that mestiere and professione are noun predicates, but are also classifying nouns: as such, these nouns identify the set of jobs, which contains thousands of items and is open. From a syntactic point of view, classifying nouns such as mestiere and professione may work as heads of a noun phrase containing any possible item of the set they identify. The pattern is shown in (33): (33)
16
DefDet (mestiere + professione) di N job profession of
The table below shows all the stylistic variants offare and the possible classifying nouns:
fare esercitare svolgere praticare esplicare attendere a
arte + + -
attivita + + + + +
lavoro + + -
mestiere + + + -
professione + + + + + +
Thus, though a formal term, professione can be used with all the five stylistic variants of fare. On the other hand, the classifying noun mestiere is compatible with only three of them. In the JFC, another noun that might appear to be susceptible to being used as a classifying noun is lavoro 'job'. However, for the derivation we prefer mestiere and professione over lavoro for in certain contexts the latter triggers a concrete reading (de re). One such case is given in (i) below: (i) Max ha completato il lavoro che gli hai chiesto Max has completed the job that to-him you-have asked (Max completed the job you asked for)
336
NUNZIO LA FAUCI & IGNAZIO MIRTO
The sets the nouns mestiere and professione identify contain all the nouns that occur as a complement in a phrase such as (34): (34) a. il mestiere di (macellaio+maggiordomo+magliaia+magnaccia+...) of butcher butler knitter pimp the job b. la professione di (ambasciatore + amministratore + architetto the profession of ambassador administrator architect + astronomo + ...) astronomer As (35) makes clear, the use of a noun belonging to the set {mestiere} and {professione} as a complement for specifying the classifying noun brings about the obligatory definiteness of the whole phrase: (35) (a) un mestiere (a job) (il + * un) mestiere di avvocato the a job of lawyer
(b) una professione (a profession) (la + *una) professione di avvocato the a profession of lawyer
This is a well-known syntactic process. For example, it regularly takes place also with complements used for other classifying nouns such as atto: (36)
un atto (an act) (l' + * un) atto di correre (the act of running) the an act of to-run
The phrase formed by the classifying noun and its complement specifying the nature of the job is then added to the structure either with the support verb fare or with one of its stylistic variants: (37) a. Nhum (fa + pratica + svolge +...) IndefDet professione, DefDet does practises carries-out profession professione di N profession of ex.: Mario (fa + pratica + svolge + ...) una professione, la profes sione di medico b. Nhum (fa + pratica + esercita) IndefDet mestiere, DefDet does practices exercises job mestiere di N job of ex.: Mario (fa + pratica + svolge + ...) un mestiere, il mestiere di medico By means of a reduction process comparable to the one occurring with relativization, we obtain a 'rich' JFC, namely a structure in which the classifying noun predicate and its complement specifying the nature of the job are both present.
ITALIAN PEOPLE AT WORK
337
Obviously, in the new structure the phrase whose head is the classifying noun predicate is definite: (38)
Nhum (fa + pratica + ...) DefDet (mestiere + professione) di N does practices job profession of ex.: Gianni (fa + pratica + ...) (il mestier e + la professione) di medico
The canonical structure of the JFC is now brought forth by canceling the classifying noun predicate. This is done with no consequences on meaning since the cancellation is simultaneously recoverable. Two outcomes caused by the reduction process must be pointed out: first, a radical drop in the commutability of the support verb, that must now be the most generic one, i.e. fare; second, the specifying noun (e.g. avvocato 'lawyer' in (35)) inherits the DefDet of the whole phrase. The change of N into Njob, an indexation process, is a metalinguistic way to signal the recoverability of the semantic and syntactic function of the classi fying noun predicate. The result is (39): (39)
Nhum (fa + * pratica + *svolge + *esercita) DefDet Njob does practices carries-out exercises ex.: Gianni (fa + * pratica + *svolge + *esercita) il medico
The four steps of the procedure leading to a standard JFC are: (40) a. 1. Ivo fa una professione 2. Ivo fa una professione, la professione di avvocato 3. Ivo fa la professione di avvocato 4. Ivo fa l 'avvocato b. l. Ivo fa un mestier e 2. Ivo fa un mestiere, il mestiere di macellaio 3. Ivo fa il mestiere di macellaio 4. Ivo fa il macellaio
(Ivo does a job) (Ivo does a job, the job of lawyer) (Ivo does the job of lawyer) (Ivo does the lawyer) (Ivo does a job) (Ivo does a job, the job of butcher) (Ivo does the job of butcher) (Ivo does the butcher)
In this succinct formula, the index <job> on the appropriate noun is fully warranted from a syntactic point of view. It is the trace left by the series of combi nations and syntactic reductions that yield the structure in (29). The classifying noun can also surface as a prepositional complement: (41)
a. (Di + Come) professione, Ivo fa l'avvocato of as profession I. does the lawyer b. (Di + Come) mestiere, Ivo fa il macellaio of as job I. does the butcher Ivo fa l'avvocato (di + come) professione d. Ivo fa il macellaio (di + come) mestiere
NUNZIO LA FAUCI & IGNAZIO MIRTO
338
4. Characteristics of the Njob list The target of the following observations will be the items in the list for Njob. We will briefly dwell upon the following two subjects: (a) some cases of metonymy; (b) hyponymy, a semantic relationship that holds between a number of items in the list. The first subject we want to examine is the hyponym/hyperonym relationship and its effects on the list for Njob A number of nouns in the list are hyperonyms (or superordinate terms) and, obviously, a greater number of items are hyponyms. Let us provide a couple of examples: (42)
HYPERONYM
HYPONYM
soldato 'soldier'
carrista 'tankman' fante 'infantryman' geniere 'sapper' granatiere 'grenadier' telegrafista 'signaller'
calciatore 'soccer player'
ala destra 'right wing' attaccante 'forward' centravanti 'centre forward' centrocampista 'centre fielder' centroterzino 'centre back' mezzala 'inside forward' portiere 'goal keeper' stopper terzino '(full) back'
It goes without saying that the inclusion of such information in the Njob list would be useful, if not necessary. For example, the hyponymic relationship has wellknown entailment effects (cf. Cruse 1975, 1986, Lyons 1977), and a syntactic dictionary with the possibility of computing such entailments would undoubtedly be of greater value than one without. The need for a distinction between first and second level items can also be shown if we consider clauses of the language able to reveal a distinction between hyperonyms and hyponyms. A hyperonym, for instance calciatore 'soccer player', allows for a JFC specifying the role that Nhum plays (by means of a prepositional phrase). For obvious reasons, the same specification is not available with a hyponym: (43) a.
Leo fa il calciatore {nel + con il) ruolo di terzino L. does the soccer-player in-the with the role of back (Leo is a soccer player. He is a (full) back)
ITALIAN PEOPLE AT WORK
b.
339
Leo fa il terzino (*con il ruolo di calciatore) L. does the (full) back with the role of soccer-player (Leo is a (full) back)
On the other hand, a hyponym such as terzino '(full) back' allows for clauses where ruolo 'role' is a noun predicate, while its superordinate term does not (unless it is in turn a hyponym itself):17 (44) a.
Leo ha il ruolo di terzino L. has the role of (full) back (Leo plays as a (full) back) b. ?? Leo ha il ruolo di calciatore L. has the role of soccer-player
As for the second point, most of the nouns building up the list for Njob are [+animate] just as N0 is. In a few cases it is possible to find [-animate] nouns, albeit all of them are of a special kind. Some examples are given in (45) and commented below: (45) a.
b.
Gianni fa il violino G. does the violin (Gianni works as a violinist in an orchestra) Leo fa la tromba L. does the trumpet (Leo is a trumpet player in an orchestra)
These nouns entering the Njob list designate musical instruments. Their use is idiosyncratic: only some nouns for instruments can enter the Njob list: instruments played in orchestras are generally eligible, while those used in bands are generally not (e.g. *Fabio fa la batteria 'Fabio is a percussionist'). In (45), Gianni and Leo are then musicians working in an orchestra (the translation must include this extra piece of information), and their job is identified by using the name of the instrument they play as Njob The device at work is metonymy, which confirms a point raised above: practically any noun, regardless of the feature [± animate], can enter the JFC as long as it is syntactically indexed as a Njob. Just as for the nouns in (42), these nouns for instruments that by metonymy name a job should be taken as hyponyms for which the superordinate term is musicista 'musician'. 17
The verb avere in (44a) is the least marked member of a set of support verbs that includes (rï)coprire 'cover' and svolgere 'carry.out': (i) Nella nostra formazione, Leo ((ri)copre + svolge) il ruolo di terzino in our team L. re-covers carries-out the role of (full) back (In our team, Leo plays as a (full) back) The word ruolo is not the only noun used for specifying the type of job Nhum does within the structured organization he is part of. Other such nouns are compito, funzione, incarico, mansione, ufficio. Each of these words has avere 'have' as the least marked member among the support verbs that can be used, just as fare 'do' is the least marked support verb with the JFC.
340
NUNZIO LA FAUCI & IGNAZIO MIRTO
5. Conclusion The JFC is only one of the wealth of constructions built in Italian with the verb fare. To fully understand what these constructions have in common and how they differ, each of them will have to be analyzed in detail. This work has probed in depth one of them: the JFC. We have called it the job fare-construction because its sole function is to express people's jobs. Its structure proves to be highly cons trained, in particular with regard to the syntactic and semantic properties of DefDet Njob. Because of the presence of another Italian construction used for people's jobs, we have made a detailed comparison between the two. Several pieces of evidence were provided to prove that the JFC and the copulative constructions differ both syntactically and semantically. We have argued that the JFC is the result of a series of combinations and reductions operating on two classifying nouns, mestiere and professione, that simultaneously function as noun predicates. A great deal of work remains to be done. The properties and constraints of the other fare-constructions have to be found out and compared to those of the JFC. Moreover, it should be made clear whether an analysis along the lines of the JFC will help us explain these characteristics as well as those concerning the semantic ambiguity of some fare-constructions.
References Abeillé, Anne. 1987. Grammaire de noms de métier. Mémoire de DEA (19861987), Paris: Université de Paris 7. Benveniste, Emile. 1975. Nom d'Agent et Noms d'Action en Indo-européen. Maisonneuve. Cruse, D.A. 1975. Hyponymy and lexical hierarchies. Archivum Linguisticum 6, 26-31. Cruse, D.A. 1986. Lexical Semantics. Cambridge: Cambridge University Press. Giry-Schneider, Jacqueline. 1984. Jean fait le (généreux + diable). Revue Québécoise de linguistique 13 (2), Grammaire et Lexique, Montréal: Université du Québec a Montréal, 217-36. Gross, Maurice. 1975. Méthodes en syntaxe. Paris: Hermann. Gross, Maurice. 1981. Les bases empiriques de la notion de prédicat sémantique. Langages 63, Paris: Larousse. Gross, Maurice. 1994. Constructing Lexicon-Grammars. Computational Approaches to the Lexicon, Oxford: Oxford University Press, pp. 213-263. Hopper, Paul J. and Sandra A. Thompson. 1980. Transitivity in grammar and discourse. Language 56 (2), 251-99. La Fauci, Nunzio. 1997. Sulla struttura proposizionale delle costruzioni con nome
ITALIAN PEOPLE AT WORK
341
predicativo e verbo-supporto. In Schribthair a ainm n-ogaim. Scritti in memoria di Enrico Campanile, R. Ambrosini et al. (eds.), Pisa: Pacini. Lyons, John. 1977. Semantics. Cambridge: Cambridge University Press. Mirto, Ignazio Mauro. 2001. Che fare? Analisi di un verbo critico in italiano. Paper presented at the XXXV Congresso Internazionale di Studi della SLI, Paris, September 20-22. Renzi, Lorenzo and Laura Vanelli. 1975. È un ingegnere I è ingegnere (e anche fa Vingegnere). Lingua Nostra 36 (3), Firenze: Sansoni. Salvi, Giampaolo. 1988. La frase semplice. In L. Renzi (a cura di), Grande grammatica di consultazione, vol. I., Bologna: Il Mulino, 29-113.
Summary Italian is the only major Romance language featuring a clause type exclusively devoted to expressing people's jobs. This type, the Job-fare-Construction (JFC), is constructed with a human subject and the verb fare 'do' followed by an obligatorily definite noun. The JFC has thus the appearance of a transitive clause. This paper provides numerous arguments for treating the post-verbal noun as a predicate rather than a direct object and for analysing the JFC as an intransitive in which fare works as a support verb. The JFC has then been compared to a copulative construction that also allows to express people's jobs. It has been shown that the former cannot be considered a doublet of the latter because the two clause-types differ both syntactically and semantically. Within the analysis we suggest, the JFC results from a reduction process alternately operating on two classifying nouns that simultaneously work as noun predicates.
LA STRUCTURE DE LA PHRASE EN FRANÇAIS DE BELGIQUE BÉATRICE LAMIROY KUL-Leuven
JEAN RENÉ KLEIN UCL-Louvain-la-Neuve
1. Le français de Beigique L'étude qui suit vise a décrire dans la perspective du Lexique-grammaire, oeuvre considerable et féconde de Maurice Gross, collègue et ami, un ensemble d'environ 500 verbes propres au fran9ais de Beigique. Une description de cette nature a déja été entamée pour les expressions figées du français de Beigique (Klein & Lamiroy 1994, 1995a) et une première esquisse du projet portant sur les verbes avait été présentée au colloque sur les lexiquesgrammaires comparés a Montréal en 1995 (Klein & Lamiroy 1995b). Les deux volets de cette recherche s'intègrent dans un projet plus vaste de construction d'un lexique-grammaire devant englober les principales variétés du fran9ais, qu'elles soient de France, de Beigique, du Québec ou de Suisse.1 Les français régionaux, de France (Rézeau 1999) ou hors de France (Bal et al 1994, Delcourt 1998, Lebouc 1998, Thibault 1997, Equipe IFA 1988) constituent autant de variétés que Ton a commencé a étudier de plus en plus systématiquement. La recherche actuelle tend en effet a faire justice d'un emploi abusif de Particle défini devant un nom de langue: si "le" français existe pour le linguiste qui s'intéresse au fonctionnement du système, la réalité de ce concept se dilue assez vite dès qu'on observe la variété des pratiques que manifestent les usagers. La même remarque vaut pour "le" français de Beigique: ici aussi, la notion de standard est illusoire. Tous les locuteurs belges francophones n'ont évidemment pas les mêmes usages et seuls des clichés réducteurs permettraient de le croire. Comme partout, jouent les appartenances sociales, les classes d'age, les milieux géographiques qui diversifient a l'envi les pratiques. Le concept de belgicisme demeure donc un concept difficile a cerner et seuls les statalismes2 seraient en fait 1
2
L'étude portant sur l'ensemble des expressions figées des français de Beigique, de France, du Québec et de Suisse (le projet BFQS) est en cours d'élaboration (Lamiroy et al (a paraitre), Lamiroy & Leclère (a paraître), Leclère 2000). Ce sont des régionalismes administratifs usités l'intérieur des frontières d'un État, p.ex. commu-nautariser qui signifie 'transférer une compétence de type national vers les communautésfranco-phone,néerlandophone ou germanophone'.
344
BÉATRICE LAMIROY & JEAN RENÉ KLEIN
des belgicismes au sens strict. En dehors de ces cas, beaucoup d'emplois régionaux de Belgique sont connus dans certaines régions de France (p.ex. se divorcer pour divorcer), tandis que d'autres ne sont vivants que dans des zones limitées de la Belgique romane, p.ex. babbeler qui se dit surtout en région bruxelloise, baligander Vagabonder' qui s'emploie dans la région de Huy, baiter 'plaisanter', attesté dans la région liégeoise, ou beuiller 'faire une bosse', employé en Gaume. Malgré les réserves que nous venons d'émettre, nous considérons que le fran9ais de Belgique reflète une réalité incontestable: on ne parle pas a Bruxelles comme a Montréal, Genève ou Paris. Le point de vue adopté ici consistera donc a faire abstraction des éventuelles variations internes: autrement dit, les verbes décrits ici sont tous des verbes susceptibles d'etre utilisés par un usager beige fran cophone, indépendamment de ses attaches sociales ou locales. Le but de notre étude est double. Nous présentons d'une part une typologie des verbes belges en distinguant les quatre catégories suivantes : - les verbes totalement inconnus en français de France, p.ex. blinquer 'briller'; - les verbes archaïques en français de France, p.ex. se méconduire 'mal se conduire'; - les faux amis, p.ex. acheter 'faire un bébé'; - les verbes a construction syntaxique différente par rapport au français de France, p.ex. répondre sur une question 'répondre a une question'. D'autre part, tous les verbes décrits font l'objet d'une analyse selon le modèle du lexique-grammaire: nous avons donc classé les verbes en fonction de leurs propriétés syntaxiques sous la forme prévue pour le système verbal du français de France (Boons et al 1976, Gross 1975, Guillet & Leclère 1992). La liste complète des verbes analysés est donnée en annexe avec une traduction en français commun, un code correspondant a la table syntaxique et une phrase-exemple.
2. Typologie 2.1. Les verbes inconnus enfrançais de France Ces verbes peuvent être considérés comme les plus spécifiquement belges: il s'agit d'une bonne centaine de cas qui, forcément, sont le plus souvent absents des dictionnaires français, sauf l'une ou l'autre mention dûment marquée du trait 'régional', comme le verbe zwanzer, qui est répertorié dans le TLF. Trois sous-catégories peuvent être distinguées: les emprunts, les dérivations et les déformations de type paronymique. Quant a la première catégorie, il s'agit souvent d'emprunts aux divers dialectes romans du Sud de la Belgique. Ainsi, on trouve des emprunts au wallon, p.ex. baiter 'plaisanter', balziner 'hésiter', berdeller 'faire des reproches', gletter 'baver', mais aussi au picard, p.ex. bleffer 'baver', ou encore au gaumais (dialecte lorrain parlé en Belgique), p.ex. échampeler 'éparpiller' ou sonrer 'somnoler'.
LA STRUCTURE DE LA PHRASE EN FRANÇAIS DE BELGIQUE
345
Nombreux sont aussi les emprunts au néerlandais, en particulier dans la région de Bruxelles. Les verbes blinquer 'reluire', buser 'faire échouer', babbeler 'bavarder', broubeler 'bredouiller', plaquer 'coller', smokkeler 'faire du marché noir', spiter 'jaillir' wageler 'chanceler', zwanzer 'plaisanter' sont autant de témoi-gnages de la présence de cet adstrat germanique. Pour ce qui est des dérivations, on constate que les français régionaux exploi tent parfois certaines virtualités dérivationnelles que le français central de France ignore (Klein 1990). Il est bien connu, en effet, qu'a cöté des dérivations attestées qui figurent dans les dictionnaires, il a les possibles lexicaux qu'il est loisible de générer en observant les règies dérivationnelles du fran9ais et dont l'actualisation dans l'usage est de nature aléatoire (Corbin 1987). Ainsi, on observe un nombre appréciable de dérivations en français de Belgique qui sont inconnues en France: décalcariser 'enlever le calcaire', décauser 'dénigrer', décumuler 'déclarer les revenus des époux séparément', déforcer 'affaiblir', jober 'faire un job', minoriser 'inférioriser', navetter 'faire la navette', prépensionner 'mettre a la préretraite', surcoller 'recouvrir des affiches avec d'autres', etc. Le français de Belgique tend aussi a utiliser, souvent avec le même sens, des formes préfixées la ou le français de France se contente de la forme simple: s'abaisser () vs se baisser (F), débattre (des œufs) (B) vs battre (F), engraisser (B) vs graisser (F), rejointoyer (B) vs jointoyer (F). Le préfixe re- prend parfois une valeur purement intensive, p.ex. relaver 'laver', relécher 'lécher', ressuyer 'essuyer', retrouver 'trouver', etc. Ce phénomène touche aussi des verbes belges inconnus en France: on dit reclaper ou claper 'claquer', recroller ou croller 'boucler'. Dans deux cas, c'est le processus inverse qui se produit: écosser et s'embrouiller, formes préfixées du français central, correspondent, avec la même valeur en français de Belgique, a cosser et se brouiller. On peut parier de paronymie enfin pour certains verbes utilisés en Belgique qui paraissent le résultat d'une "approximation" par rapport aux formes homologues françaises: ainsi on trouve écailler au lieu de écaler, cliquoter au lieu de cliqueter,3 s'ernrnouracher pour s'arnouracher et empuanter4 au lieu de empuantir. Cette catégorie des "déformations" est sans doute la plus délicate a appréhender, dans la mesure ou beaucoup de ces cas appartiennent a la langue orale familière et n'ont pas été répertoriés de façon systématique, étant donné l'absence de corpus oraux d'ampleur significative. 2.2. Les archaïsmes Ceci est la plus petite catégorie (une douzaine de cas). A côté des archaïsmes lexicaux, qui correspondent a des formes ou des sens disparus de nos jours en fran9ais de France, il existe des verbes dont seule la construction est archaïque. 3 4
Cette alternance illustre une concurrence déja ancienne entre les suffixes -eter et -oter. Cette variante morphologique du verbe français est signalée dans le TLF, comme un hapax attesté chez Jules Vallès.
346
BÉATRICE LAMIROY & JEAN RENÉ KLEIN
Parmi les formes qui ne sont plus vivantes en France, on relèvera des cas tels acconduire 'conduire', acter 'prendre acte', s'encourir 's'enfuir', instiguer 'inciter', se méconduire 'mal se conduire', etc. Une série particulière de verbes relèvent de la langue juridique: comminer 'menacer', conster 'résulter', indaguer 'enquêter' etc. Certains archaïsmes ne sont que des archaïsmes sémantiques: ils ont maintenu un sens que le verbe avait autrefois en français de France, tels s'affûter 's'arranger', amuser 'retarder quelqu'un dans une besogne', apprêter 'preparer', rapproprier 'rendre propre'. Le verbe frauder s'emploie encore en Belgique dans 1e sens de 'passer des marchandises en fraude' (p.ex. Il fraude de Valcool), tandis qu'en France, il signifie 'commettre une fraude au détriment d'un créancier' (p.ex. Il fraude le fisc). D'autres verbes, en revanche, ne sont archaïques que du point de vue syntaxique. Ainsi, on remarquera la construction impersonnelle Il éclaire pour 'Il fait des éclairs' ou le verbe aimer construit avec un complément infinitif introduit par de, p.ex. Il aime de voyager, 2.3. Les faux amis Cette sous-classe comprend tous les verbes de forme et de construction identiques a des verbes du français de France, mais ayant un sens différent. Dans la perspec tive du traitement automatique des données, qui est celle du lexique-grammaire, cette catégorie inclut donc absolument toutes les formes homographiques, même celles qui a priori auraient peu de chances d'apparaïtre dans les mêmes types de contextes et donc d'entraïner éventuellement une confusion de la part d'un locuteur ou d'un traducteur humain. Notons que presque tous ces verbes sont en fait des faux amis partiels, dans la mesure ou ils partagent un de leurs sens avec l'équivalent fran9ais, tout en ayant en même temps un sens spécifique en français de Belgique. C'est le cas p.ex. du verbe biser, qui en fran9ais de Belgique a non seulement le sens (fran9ais) de 'faire une bise', mais qui peut signifier aussi 'se mettre a courir, pour une vache'.5 De même, des verbes comme acheter, amuser ou roter s'emploient évidemment en Belgique avec leur sens usuel en France, mais ils signifient en plus respectivement 'faire un bébé', 'retarder quelqu'un' et 'raler'. 2.4. Les verbes syntaxiquement différents Il importe de préciser que les différences de construction visées ici se fondent soit sur des variations de la seule valence soit sur des variations affectant les restric tions de sélection. Ainsi, en français de Belgique, des verbes comme bouger ou regarder peuvent prendre un complément prépositionnel introduit par à, alors qu'ils sont transitifs directs en France: 5
Il s'agit en fait d'une collision homonymique de deux verbes qui remontent a des étymons diffé rents, aufrancique*bison et au latin basiare, respectivement.
LA STRUCTURE DE LA PHRASE EN FRANÇAIS DE BELGIQUE (1) (2)
347
(B) Arrête de bouger à vase 'Arrête de toucher vase' (F) Arrête de bouger ce vase () Cela lui regarde (F) Cela le regarde
Toute une série de verbes, tels se fâcher ou s'occuper, changent de préposition: (3) (4)
() Marie se fâche sur les enfants (F) Marie se fâche contre les enfants (B) Marie s'occupe avec les enfants (F) Marie s'occupe des enfants
Ces cas entrent donc dans des constructions différentes. Mais un verbe comme croquer, en revanche, est transitif direct dans les deux variantes. Or, en français de Belgique, il peut sélectionner un Nhum comme complément, alors que le complé ment d'object direct est toujours de type inanimé en français de France: (5)
() La police a croqué le voleur 'La police a pincé le voleur' (F) Max croque une pomme
Par conséquent, le verbe beige croquer sera classé6 dans la table 32H (verbes a complément d'objet humain) tandis que l'emploi (F) illustré ci-dessus ira dans la table 32C (verbes a complément d'objet concret). Comme le montrent certains des exemples qui précèdent, les variations syntaxiques peuvent aller de pair avec un changement de sens du verbe ou non. Si c'est le cas, conformément au principe du lexique-grammaire qui dédouble systématiquement les entrées homonymiques, on prévoit autant d'entrées du verbe qu'il de sens (et de constructions). Notons que lorsque la variation syntaxique entraïne un changement sémantique, nous donnons en-dessous de la phrase beige une traduction en français. Lorsque le sens reste constant, nous indiquons en revanche simplement les deux structures, en (B) et en (F) respectivement.
3. Lexique-grammaire des verbes en français de Belgique A la suite des travaux entrepris pour le français de France par l'équipe du LADL, nous avons classé les verbes selon qu'ils entrent dans des phrases intransitives ou transitives. En outre, le classement tient compte du nombre et du type de complé ment (prépositionnel ou non) ainsi que de la forme sous laquelle celui-ci se présente, soit un SN soit une complétive. Plusieurs classes enfin sont déterminées par des propriétés distributionnelles affectant le sujet ou les compléments, p.ex. le trait plus ou moins humain du SN, le caractère locatif du complément, etc. (cf. Leclère 1990). 6
On trouvera dans la liste en annexe d'autres emplois belges de ce même verbe, dont nous faisons abstraction ici.
348
BÉATRICE LAMIROY & JEAN RENÉ KLEIN
Il est important de noter que nous n'énumérons ci-dessous que les seuls types de construction représentés en français de Belgique. Pour chaque type, nous indiquons la structure définitoire de la classe, le code de la table (qui correspond au code employé pour le français central) et une phrase-exemple illustrant l'emploi en français de Belgique. Conformément a la méthode du lexique-grammaire, le classement prend la forme d'une matrice binaire, dans laquelle chaque entrée verbale correspond a une ligne (horizontale) et chaque propriété syntaxique a une colonne (verticale). Pour des raisons évidentes d'espace, nous ne pouvons reproduire ici l'ensemble des tables que nous avons élaborées pour les verbes du français de Belgique, mais nous donnons en annexe un échantillon de trois tables, la table 4 (verbes a complétive sujet), la table 32RA (verbes transitifs signifiant 'rendre Adj') et la table 33 (verbes intransitifs a complément indirect en a). 3.1. Constructions intransitives On distingue deux grands sous-types selon que le verbe est suivi d'un complément prépositionnel ou non, soit No V et No V Prép N1. - No V: Les verbes intransitifs sont classés dans trois tables différentes, en fonction du type du sujet: table No = (Il + ça) No = Nhurn No = (Nhum+ N-hum)
table 311 table 31H table 31R
effectif 12 92 29
exemple 77 bise en hiver7 Ils vont se divorcer Ses pieds stinquent
- No V Prép N1 : Les verbes intransitifs à complément prépositionnel entrent dans six tables, en fonction de la préposition qui introduit le complément et du caractère statique vs dynamique du complément lorsqu'il s'agit d'un complément locatif: table
effectif
V= aux modal
table 1
Prép = a Prép = locatif dynamique
table 33 table 35L
11 22
Prép = locatif statique Prép = avec
table 35ST table 35S
3 8
Prép diverses
table 35R
24
7
3
exemple Je ne sais pas venir ce soir Cette biere me goûte Il a poigné dans les bonbons est-ce qu'il kote ? Il a frouchelé avec la voisine Je ne reviens pas sur son adresse
Le sensfrançaisde tous les verbes est donné dans la liste en annexe.
LA STRUCTURE DE LA PHRASE EN FRANÇAIS DE BELGIQUE
349
3.2. Constructions transitives Les structures transitives se divisent également en deux grandes sous-classes, selon que la phrase contient un complément prépositionnel ou non, soit No V N1
et No V N1 PrépN2. -No V N1 : Les verbes correspondant à premier sous-type se répartissent en 10 tables différentes: table
effectif
Que P VN1
table 4
10
No N1 N1 N1
table 6 table 32H table 32C table 32CL
2 30 30 2
N1 = Npluriel
table 32PL
5
N1 = Nde mesure
table 32NM
2
N1 = N contraint 9
table 32R3
38
N1 = N résiduel
table 32R2
1
V = rendre Adj
table 32RA
7
V Que P = Nhum = Nconcret = (Nhum + Npc)8
exemple Que tu m'aies dit ça me chipote Il a postposé de se marier Le profa busé l'étudiant On a beuillé ma voiture Arrête de chipoter les cheveux de Léa On a décumulé les revenus des époux Ce colis approche les 50 kilos Il a bissé sa première année Va choser, je veux dire faxer le document Certains voudraient flamandiser Bruxelles
-No V N1 Prép N2 : Les verbes qui ressortissent sous-type se retrouvent dans 13 tables: table
effectif
Prép = a No V Que Pa N1
table 9
2
No V N1 à ce que P
table 11
1
N2 = Nhum N2 = N-hum
table 36DT table 36R
8 9
6 2
exemple Peux-tu me renseigner si le train a du retard ? Il nous a instigués a protester Il m'aflikké 100 francs Je remets salaire au tien
Npc signifie "nom de partie du corps". Par N contraint, on entend des N appartenant à une classe limitée qui entrent dans des phrases semi-figées.
350
BÉATRICE LAMIROY & JEAN RENÉ KLEIN
Prép = de V = 'enlever'
table 37E
7
V='mettre' Procès non locatif
table 37M1
1
N2 = trace
table 37M2
1
Il
N2 = Nde V-n
table 37M5
3
Il
N2 = V-n de N
table 37M6
3
Prép = Loc N2 = Nloc symétrique
table 36SL
1
N2 = Nloc source N2 = Nloc destin
table 38LS table 38LD
2 13
Prép diverses No V Prép N2 QueP
table 10
1
Prép = zéro No V N1 N2
table 39
1
Il
faut décalcairer la cafetière de son calcaire L 'Etat a subsidié ce théatre dfune aide substantielle a claché la façade de peinture blanche faut engraisser ces chaussures d'une couche de graisse Le magon a rejointoyé le carrelage d'un joint énorme On a surcollé leurs affiches avec les affiches du parti adverse Bourre le chat d'ici Je vous racconduis jusqu'à la porte
Il
a parié pour 100 francs qu'il viendra Ce sous-officier a été assimilé officier
4. Eléments de variation syntaxique Ci-dessous on trouvera les divers éléments formels sous lesquels se manifeste la variation syntaxique. Comme nous l'avons déjà fait remarquer plus haut, parfois celle-ci n'affecte pas le sens du verbe, comme dans (6a-b), alors que dans d'autres cas, tels (6c-d), nous avons affaire a des constructions entraînant un changement de sens, provoquant donc l'apparition de verbes beiges homonymiques par rapport aux verbes français. 4.1. Variation de la préposition On peut distinguer les quatre cas de figure suivants:
LA STRUCTURE DE LA PHRASE EN FRANÇAIS DE BELGIQUE
3 51
- preposition en / pas de préposition en F (6)
a. b. c. d.
L'agriculteur arrache aux pommes de terre Max attend après son train Il coupe aux cerises 'Il cueille les cerises' Demain, on ira voir après un nouveau costume 'Demain, on ira chercher un nouveau costume'
- pas de préposition en / préposition en F (7)
a. b.
(B) (F) (B) (F)
Marie déblatère toujours sa voisine Marie déblatère contre sa voisine C'est ainsi qu'elle a été apprise C'est ainsi qu'on lui a appris
- prépositions différentes en et en F (8)
. () Ce chien aboie sur les promeneurs (F) Ce chien aboie contre les promeneurs b. (B) Max a demandé pour prendre du repos (F) Max a demandé à prendre du repos c. () Luc se (déguise + habille) souvent a femme (F) Luc se (déguise + habille) souvent en femme d. (B) Luc est jaloux sur son frère (F) Luc est jaloux de son frère
- emplois adverbiaux de la préposition10 (9)
. () Ils partent se balader: tu vas avec ? (F) Ils partent se balader: tu vas avec eux ? b. (B) Nous allons faire des courses: tu viens avec ? (F) Nous allons faire des courses: tu viens avec nous ? c. () Veux-tujouer avec ? (F) Veux-tu jouer avec nous ?
42. Variation de la construction pronominale Certains verbes sont pronominaux en français de Belgique alors qu'ils ne le sont pas en France, mais le cas inverse se produit également: - forme pronominale en / forme non pronominale en F (10) a.
10
(B) Elle s'est accouchée le mois dernier (F) Elle a accouché le mois dernier
Ce phénomène est connu enfrançaisfamilier (p.ex. faire avec, vivre avec) mais est plus étendu enfrançaisde Belgique. Ainsi, on trouve également des cas avec d'autres prépositions, p.ex. Ne vous en faites pas, je soignerai pour 'Ne vous en faites pas: je m'en occuperai'. Dans notre classe-ment, nous avons considéré ces cas comme des verbes intransitifs.
BÉATRICE LAMIROY & JEAN RENÉ KLEIN
352 b. c. d.
(B) Tu t'accapares de torn les profits (F) Tu accapares tous les profits () Max et Marie se sont divorcés après vingt arts de mariage (F) Max et Marie ont divorcé après vingt arts de mariage (B) Il s'est trébuché dans les escaliers (F) Il a trébuché dans les escaliers
- forme non pronominale en / forme pronominale en F (11) . () Le malade a dû purger avant l'operation (F) Le malade a dû se purger avant l'operation b. (B) Les enfants doivent aller coucher tot (F) Les enfants doivent aller se coucher tot c. () Il gargarise tous les matins (F) Il se gargarise tous les matins d. (B) Dès qu'il fera beau, nous irons promener (F) Dès qu'il fera beau, nous irons nous promener 4.3. Verbes construits de façon impersonnelle En français de Belgique, on rencontre un certain nombre de verbes impersonnels inconnus en France: (12) a. b. d. e. f.
Il allume souvent en été 'Il fait souvent des éclairs en été' Il éclaire souvent en été 'Il fait souvent des éclairs en été' Il chasse par cette fenêtre 'I1passe un courant d'air par cette fenêtre' Il douche depuis deux jours '11 pleut a verse depuis deux jours' Il bise sur plateau très exposé11 'I1 fait de la bise sur plateau très exposé' Il gouttine 'Il pleuvine'
4.4. Verbes construits de façon absolue Certains verbes transitifs en français de France s'emploient sans complément en français de Belgique, sans (13a-b) ou avec (13c-d) variation de sens: (13) . () Nous allons au cinéma: est-ce que tu accompagnes? (F) Nous allons au cinéma: est-ce que tu nous accompagnes?
11
Ce verbe biser, dérivé de bise 'vent froid', n'est pas attesté en français de France. La même remarque vaut pour gouttiner, dérivé de goutte.
LA STRUCTURE DE LA PHRASE EN FRANÇAIS DE BELGIQUE
353
b.
(B) Marie attend pour le mois de mai (F) Marie attend un enfant pour le mois de mai . (B) Ses parents ne veulent pas qu'il hante déjà 'Ses parents ne veulent pas qu'il ait déja une relation amoureuse' d. (B) Ce couple a trop de soucis pour acheter maintenant 'Ce couple a trop de soucis pour avoir un bébé maintenant'
5. Cas particuliers Les quatre cas qui suivent montrent bien, à titre d'exemples, comment le français de Belgique engendre des sens et des constructions qui s'ajoutent 12 à la polysémie des verbes du français commun. 5.1. Le verbe chipoter Ce verbe qui fonctionne comme verbe intransitif en français de France avec le sens de 'manger du bout des dents' ou 'ergoter', connaït en français de Belgique une plus grande variété de structures. Il a deux emplois intransitifs et trois emplois transitifs et est donc classé dans cinq tables différentes: -No V à N (table 33) (14)
Luc n'arrête pas de chipoter à sa voiture 'Luc n'arrête pas de manipuler sa voiture'
- No V Loc N1 (table 35L) (15)
Luc déteste qu'on chipote dans ses papiers 'Luc déteste qu'on farfouille dans ses papiers'
- Qu P VN1(table4) (16)
Devoir intervenir dans cette affaire délicate le chipote 'Devoir intervenir dans cette affaire délicate le tracasse'
- No V N1 (table 32CL) (17) a. b.
12
Luc chipote les cheveux de Marie 'Luc tripote les cheveux de Marie' Luc lui chipote les cheveux 'Luc lui tripote les cheveux'
Remarquons que dans certains cas, le développement polysémique peut être en partie théorique, dans la mesure où les emplois connus en français de France ne sont pas nécessairement tous vivants en français de Belgique. Ainsi, le sens du verbe goüter 'savourer', attesté dans une phrase comme Prenez le temps de bien goüter ce plat (exemple du Petit Robert), n'est pas commun enfrançaisde Belgique.
BÉATRICE LAMIROY & JEAN RENÉ KLEIN
354
- No V N1 (table 32H) (18)
Max chipote sa voisine 'Max tripote sa voisine'
5.2. Le verbe jouer Ce verbe, qui se caractérise par une remarquable variété d'emplois et de construc tions en français de France, entre dans deux structures supplémentaires en français de Belgique. D'une part, il entre dans une construction transitive avec un com plément d'objet direct correspondant a à N ou a de N en fran9ais de France: - No VN1 (table 32R3) (19) (B) (F) (20) (B) (F)
Luc joue Luc joue Luc joue Luc joue
(tennis + soldat + train) au (tennis + soldat + train) (le piano + l'harmonica) (du piano + de Vharmonica)
D'autre part, il se construit comme un verbe intransitif avec la préposition avec adverbialisée, la différence par rapport au français de France étant que l'élement sous-entendu renvoie a une personne: -NoV
(table31H)
(21) (B) (F) (22) (B) (F)
Luc ne veut pas jouer avec Luc ne veut pas jouer avec nous La pauvre fllle, Luc doit cesser de jouer avec La pauvre fille, Luc doit cesser de se moquer d'elle13
5.3. Le verbe tenir Tenir voit aussi sa grande diversité de constructions s'accroïtre en français de Bel gique de plusieurs emplois. Deux structures sont intransitives:
-No V(table31H) (23)
Luc tient 'Luc prend part au jeu par une mise'
- No Vprép N1 (table 35R) (24)
Luc tient (avec + pour) les socialistes 'Luc est du même bord que les socialistes'
Trois constructions sont transitives. Deux d'entre elles appartiennent a des verbes homonymes entrant dans la même table (32PL):
13
Dans ce dernier exemple, il s'agit d'une construction elliptique de l'expression figée propre au français de Belgique, jouer avec les pieds de N'se moquer de N'.
LA STRUCTURE DE LA PHRASE EN FRANÇAIS DE BELGIQUE
355
-No V N1 (table 32C) (25)
Luc peut tenir ma voiture jusqu'a ce soir 'Luc peut conserver ma voiture jusqu'a ce soir'
-No V N1 (table 32PL) (26)
Luc tient les porte-clefs 'Luc colleetionne les porte-clefs'
-No VN1 (table 32PL) (27)
Luc tient des lapins 'Luc élève des lapins'
5.4. Le verbe goüter Ce verbe connaït en français de Belgique les mêmes constructions transitives et intransitives qu'en français de France, mais certains emplois belges s'ajoutent a ces dernières, ne différant que par les restrictions de sélection affectant le sujet et le complément: -No V N1 (table 32 NM) (28)
Le vin goût e le bouchon 'Le vin a un goût de bouchon'
-No V à N1 (table 33) (29)
Ce gâteau lui goâte 'Ce gateau est a son goût'
6. Conclusion Les données que nous avons rassemblées révèlent plusieurs faits que la littérature traditionnelle sur le français de Belgique a peu mis en évidence jusqu'ici. Premièrement, malgré la très grande proximité géographique et culturelle avec la France, la variété beige du fran9ais manifeste un nombre de différences plus considérable qu'on ne s'y attendrait: si ce phénomène est bien connu dans le domaine du lexique en général, notre recherche montre qu'il existe une variation tout aussi importante sur le plan de la syntaxe verbale. Deuxièmement, la présente étude, effectuée selon la méthode du lexiquegrammaire, donne une image très précise de la répartition des verbes belges selon leur type de construction, en fournissant un classement systématique en fonction de plusieurs paramètres: structure intransitive vs transitive, présence ou absence d'un complément prépositionnel, forme nominale ou phrastique du complément, etc. Cette analyse aboutit a une classification en 33 types syntaxiques différents, représentés chacun par une table, pour lesquels nous avons fourni le détail des
356
BÉATRICE LAMIROY & JEAN RENÉ KLEIN
effectifs. Comme nous ne nous sommes consacrés qu'aux constructions spécifiques au français de Belgique, il est logique que les structures recensées ne cons tituent qu'une fraction de l'ensemble des tables prévues pour le français commun. Troisièmement, nous avons observé que certains types, notamment les struc tures intransitives a sujet Nhum (31H) ou a sujet impersonnel (31I), semblent particulièrement bien représentés en fran9ais de Belgique, ce qui s'explique sans doute par un ensemble de facteurs, tels la présence d'archaïsmes (p.ex. Il éclaire), d'emprunts (p.ex. Luc aime zwanzer) et de certains emplois syntaxiques plus productifs en Belgique, en particulier l'usage adverbial de la préposition (p.ex. Je soigne pour). Les résultats de notre recherche demanderaient évidemment a être confrontés aux analyses analogues effectuées pour les autres variétés du fran9ais dans le cadre du lexique-grammaire.
Références Bal, W., A. Doppagne, A. Goosse, J. Hanse, M. Lenoble-Pinson, J. Pohl, L. Warnant. 1994. Belgicismes. Louvain-la-Neuve: Duculot. Boons, J.P., A. Guillet & Leclère. 1976. La structure des phrases simples en franqais. Constructions intransitives. Genève: Droz. Corbin, D. 1987. Morphologie dérivationnelle et structuration du lexique. Tübingen: Niemeyer. Delcourt, C. 1998. Dictionnaire du français de Belgique. Bruxelles: Le Cri. Equipe IFA. 1988. Inventaire des particularités lexicales du franqais en Afrique noire. Paris: EDICEF. Gross, M. 1975.Methodes en Syntaxe. Paris: Hermann. Guillet, A. & C. Leclère. 1992. La structure des phrases simples en franqais. Constructions transitives locatives. Genève: Droz. Klein, J.R. 1990. Pour une nouvelle image du lexique fran9ais. In Actes du premier colloque international sur Venseignement du franqais en Chine (Pékin, mars 1989). Burnaby: Presses de l'Université Simon Fraser, 347-354. Klein, J.R. & B. Lamiroy. 1994. Lexique-grammaire du français de Belgique: les expressions figées, corpus et tables syntaxiques. Linguisticœ Investigationes, vol.18, 2, 285-320. Klein, J.R. & B. Lamiroy. 1995a. Les expressions figées du français de Belgique: présentation des données. In: J. Labelle & C. Leclère (eds.). Lexiques-grammaires comparés en franqais. Actes du Colloque International de Montréal (Juin 1992). Amsterdam: J. Benjamins. Klein, J.R. & B. Lamiroy. 1995b. Quand il éclaire, les vaches bisent. Lexiquegrammaire des verbes simples du fran9ais de Belgique. In J. Labelle (ed.) Lexiques-grammaires comparés et traitements automatiques. Montréal: UQAM, 257-266.
LA STRUCTURE DE LA PHRASE EN FRANÇAIS DE BELGIQUE
357
Lamiroy, ., C. Leclère, J.R. Klein, N. Kübler & J. Labelle. 1999. Les variétés du français et les expressions figées: le projet BFQS. Communication faite au 18e Colloque International "Lexiques et grammaires comparés" a Salerne, octobre 1999 (à paraître). Lamiroy, B. & Leclère. A paraïtre. Expressions verbales figées et variation en français: le projet BFQS. Communication faite au VIe Journées Scientifiques du Réseau Lexicologie, Terminologie et Traduction (AUPELF-UREF), Bey routh, novembre 1999. Lebouc, G. 1998. Le beige dans tous ses états. Paris: Bonneton. Leclère, 1990. Organisation du lexique-grammaire des verbes fran9ais. Langue française, 87, 112-127. Leclère, 2000. Expressions figées dans la francophonie: le projet BFQS. In Lexique, Syntaxe et Sémantique, Mélanges offerts a Gaston Gross, P.-A. Buvet, D. Le Pesant, M. Mathieu-Colas (eds.), Bulag, n° Hors Série, Besançon: Centre Lucien Tesnière, pp. 321-331. Rézeau, P. (dir.).1999. Variétés géographiques du français de France aujourd'hui. Approche lexicographique. Paris/Bruxelles: Duculot. Thibault, A. 1997. Dictionnaire suisse romand. Particularités lexicales du fran ais contemporain, Genève: Zoé. Summary The paper aims at analyzing about 500 verbs that typically belong to Belgian French, according to the principles of the lexicon-grammar set forth by Maurice Gross. Four categories are distinguished, viz. verbs that are totally unknown in France, e.g. loanwords from Dutch (20 %), verbs that sound archaic in France (2 %), verbs that are common in France but with a different meaning, the so-called "faux amis" (8 %) and verbs that are used in France but with a different syntactic construction (70 %). Each Belgian verb is ascribed to a syntactic class, based on the (in)transitive character of the verb, the absence/ presence of a prepositional complement, etc. The Belgian verbs are thus classified in 33 different classes, the largest of which correspond to transitive structures with two argu ments, viz. subject and direct object. Two major findings of the paper are that Belgian French differs more from the French spoken in France than is usually assumed, and that the differences not only concern lexical matters, but, maybe more importantly, syntactic differences.
358
BÉATRICE LAMIROY & JEAN RENÉ KLEIN
ANNEXE 1: Échantillon de tables Table 4
-
-
-
-
-
-
+ + + + + + + + + +
passif [par]
N1 est Vpp de ce Qu P
N1 se V auprès de N hum de ce Qu P
N1 se V de ce Qu P
No V contre Nhum
+ + +
le fait que Que P
+ + + + +
N-hum
+ + +
Nhum
+
a = (E+at) eur
+ -
a = eux
+
C. Direct
passif [de ]
affranchir chipoter déforcer défranchir désaffranchir épastrouiller maquer peler saisir taniser
a = able
+ + + + + + + + + +
a = ant
+ + + + + + + + + +
Adjectif
NoV
+ + + + + + + + + +
|
V "eoncret"
VI W
1+
le fait Qu P
+ + + + + + + +
|
Nnr
Nhum
Sujet
-
-
-
-
+ +
-
-
-
-
+ + +
-
+ +
-
+
+ + + + + + +
Table 32RA | No
Nl=Nhum NoVNlpcdeNlc NoluiVNlpc No V Nl c Loc Nl pc N1= N-hum Nl-lefaitQuP Ppv = Ie NoVNl N o V N l deN2(mettre) NoVNldeN2(enlever) No V N1 de combien N o V N l app de Nlc No V Nlc dans Nlapp No V Nhum sur ce point N1 estV-ant NlestV-ppW Niest Adj de N2 N2instr est V-ant N o V N 2 ( E + LocNl)
N1 V N2 V N1 -
1-
-
P.A.
m. direct
communautariser décommunautariser empuanter flamandiser mmoriser rapproprier walloniser
- - - - + - - -
-
-
+ - + + + - + + + - + + + + - + + + + - + - + + - + - + +
-
-
-
- +
+ + + + - + + +
-
-
-
LA STRUCTURE DE LA PHRASE EN FRANCAIS DE BELGIQUE
359
|
- -
arracher bouger chipoter couper se déguiser goüter s'habiller se masquer planter regarder regarder
+ + + + + + + + +
-
-
-
+
-
+ +
-
-
-
-
+ + + + + + + + + + + + - - - - + - + - + + + +
+ + +
+
Nhum V sur ce point
N1 = N plur obligatoire
Nl=V-n
ppv-y
ppv = lui
N1 =le fait que P
No lui V PrépNl pc
N1= N-hum
No V prép Npc de N1
Nl=Nhum
No V de №pc
No est Vpp
No est V-ant
NoV
-
No = Nplur obligatoire
No = V-n
+ - + - + - + - + - - + + - + - + - + - - + +
A. Cette idee V Loc son esprit
P.
N1
No = Nnr
No = N-hum
No = Nhum
No
ilVNo
|
|
Table 33
-
-
+
-
-
-
Table 31H 35R 35R 31H 31H 38LD 32R3 32R3 4 IH 37M6 6 IH 35L 35L IH 31I 31R 32 IH 38LD 32 32 32NM 33 39 IH 35R
F
se baisser aboyer contre aecaparer accompagner quelqu'un faire un bébé être enceinte amener accoucher prendre acte habituer un pigeon a un pigeonnier enhardir s'arranger accoutrer aimer aller [au jeu de cartes] aller cueillir toucher accompagner faire des éclairs s'évaporer retarder se plaire noter former préparer friser arracher accorder le même statut être enceinte attendre
s'abaisser aboyer sur s'accaparer accompagner acheter avoir acheté acconduire s'accoucher acter adduire affranchir s'affïiter agayonner aimer de aller aller a (cueillette) aller autour de aller avec allumer aminer jamuser s'amuser bien annoter apprendre apprêter approcher arracher a (légumes) assimiler attendre attendreaprès
Abaisse-toi un peu, tu vas te cogner la tête Ce chien aboie sur les promeneurs Max s'accapare de tous les profits Nous allons au cinéma, est-ce que tu accompagnes? Elle achètera quand elle aura moins de soucis Elle a acheté, ça se voit déja On acconduira un camion de terre Elle s'est accouchée le mois dernier On a acté la décision du conseil On a adduit les pigeons a un autre pigeonnier Avoir vécu a l'étranger l' affranchi Affutez-vous sans moi Leur mère les agayonne bizarrement Il aime de voyager Je vais, j'accepte de conduire le jeu Allons aux muguets Ce gosse va autour de tous les bibelots On va manger; tu vas avec En été, il allume souvent Toute l'eau est en train d'aminer Il est venu m'amuser quand j'étais pressé Il ne s'amuse pas bien a l'école Je n'ai pas annoté son adresse dans mon carnet C'est ainsi qu'elle a été apprise Apprêtez vos affaires Ce colis approche les 50 kilos Ils vont arracher aux pommes de terre Ce sous-officier a été assimilé officier Elle attend pour le mois de mai J'attends après mon café depuis des heures
Exemple
360 BEATRICE LAMIROY & JEAN RENÉ KLEIN
ANNEXE 2: Lexique des verbes du français de Belgique
s'avancer babbeler baligander bailer baiter balziner baquer barboter barboter barloquer berloquer benner berdeller beuiller billeter biquer biser biser (il) biser bisser bleffer blinquer bloquer bouger a bourrer broquer brosser brosser broebeler se brouiller buser Ibruxeller
se dépêcher bavarder vagabonder battre la terre plaisanter avec errer verser grander bavarder brinquebaler brinquebaler verser faire des reproches faire une bosse jouer souvent gros jeu rebiquer courir par panique faire de la bise faire une fugue redoubler (a l'université) baver astiquer bücher toucher chasser se précipiter balayer séeher bredouiller s'embrouiller faire échouer parler en bruxellois
31H 31H 31H 32C 32H 31H 38LD 32H 31R 31R 38LD 32H 32C 1H 31R 31R 31I 35S 32R3 35L 32C 32R3 33 38LS 35R 37E 32R3 1H 1H 32 1H Avance-toi, il est tard Ma concierge n'arrête pas de babbeler Il a encore baligandé au lieu d'aller travailler Après avoir semé, il faut bailer la terre Il aime baiter ses amis tout le temps Il a balziné sans but toute la journée On a baqué un camion de sable dans son jardin Il barbote tout le temps ses enfants Il ferait mieux de moins barboter Il avait une vieille voiture qui barloque Il avait une vieille voiture qui berloque Ils ont benné un camion de terre sur le trottoir Sa femme n'arrête pas de le berdelier On a beuillé ma voiture Il a perdu tout son argent: il a trop billeté Il a des mèches qui biquent Les vaches se sont mises a biser en entendant le tonnerre Il bise en hiver Sa femme a bisé avec le voisin Il a bissé sa première année Ce bébé a bleffé sur son chandail Il a blinqué ses chaussures Il a bien bloqué son cours Ne bouge pas à bibelot Bourre le chat d'ici Un individu a broqué sur moi Il faut brosser le couloir Les étudiants brossent souvent les cours Sa timidité la fait broebeler Il se brouille souvent Le prof a busé l'étudiant A Bruxelles on brusselle encore
LA STRUCTURE DE LA PHRASE EN FRANÇAIS DE BELGIQUE 3 61
Lexique des verbes du français de Belgique
se consommer conster Icontrechasser
cagner calandrer caler caresser carotter carter charmer chasser chasser chatouiller chipoter chipoter chipoter chipoter chipoter choser clacher clacher claper cliquoter cloper cloper cloucher cocher cokoter colloquer comminer communautariser
être cagneux repasser lancer avec force flirter tirer au flanc mêler les cartes labourer avoir un courant d'air renvoyer (au jeu de balie) démanger tripoter tracasser s'occuper a des choses futiles farfouiller tripoter remplacer un verbe qu'on ne trouve pas peinturlurer lancer un liquide en faisant des taches claquer cliqueter avoir peur avoir peur battre nettoyer partager une chambre d'étudiant interner un malade mental formuler une peine transférer a la compétence des communautés régionales se consumer sans flammes résulter renvoyer (au jeu de balie) Ce vieillard cagne Qui va calandrer ces chemises? Les enfants calent des boules de neige sur la maison Les jeunes sortent caresser le samedi soir Il a carotté en faisant croire qu'il est malade Qui veut carter? On vient de charruer les champs Il chasse par cette fenêtre Il arrive a chasser avec force Elle a son nez qui chatouille Il chipote sa voisine Que tu m'aies dit cela me chipote Il a chipoté a sa voiture toute l'après-midi On a chipoté dans mes papiers Arrête de chipoter les cheveux de Léa Va choser, je veux dire faxer le document Il a claché la façade de peinture blanche On a claché de l'eau de javel sur ma veste Il a clapé la porte avec colère Son moteur cliquote Il clope toujours avant un examen Ca clope Veux-tu cloucher ces œufs? Elle coche son trottoir tous les vendredis J'ai toujours cokoté avec ma sœur Sa familie l' colloqué dans un asile Le tribunal a comminé une amende contre lui On a communautarisé l'Education nationale Les büches humides se consomment Il conste qu'il a tort Il a contrechassé adroitement
31H 32C 38LD 32H 31H 32R3 31I 35L 31R 32H 4 33 35L 32CL 32R2 37M2 38LD 32C 31R 31H 31I 32R3 32C 35S 38LD 32R3 32RA 31R 31I 35L
362 BÉATRICE LAMIROY & JEAN RENÉ KLEIN
Lexique des verbes du français de Belgique
décumuler déforcer défranchir se déguiser a désaffranchir déjeter déjeuner délibérer déloger demander pour démerger Idérocher
cosser coter coucher couper a (cueillette) couper courtiser croller croquer croquer croquer cuire curer débattre déblatérer débroler décalcairer décalcariser décauser décommunautariser
ecosser noter se coucher cueillir cueillir avoir des relations sentimentales boucler plier casser (sans les dents) prendre en flagrant délit bouillir faire sécher le linge sur l'herbe battre déblatérer contre détraquer détartrer détartrer dénigrer transférer l'autorité d'une communauté autorité nationale séparer du point de vue fiscal affaiblir faire perdre son assurance se déguiser en faire perdre son assurance gaspiller prendre le petit déjeuner soumettre a délibération découcher demander évacuer des eaux après une inondation décaper (un meuble) Il faudra cosser tous les petits pois J'ai fini de coter tous les examens Il a couché sur le canapé On ira couper aux cerises Elle a coupé quelques roses Elle courtise avec le fils du patron Il a les cheveux qui crollent Vous allez croquer le livre Il croque les noix dans ses mains La police l'a croqué L'eau cuit En été, on met curer les draps Il faut débattre les œufs Ils déblatèrent leurs voisins Ma montre est débrölée Il faudra décalcairer la bouilloire Il faudra décalcariser la bouilloire Sa belle-mère n'arrête pas de le décauser On a décommunautarisé le tourisme On a décumulé les revenus des époux Ce scandale a déforcé sa position Qu'il ait échoué l' défranchi Il aime se déguiser a femme D'avoir échoué l' désaffranchi Il ne faut pas déjeter de la nourriture As-tu déjeuné ce matin? Les étudiants ont été délibérés ce matin Ce soir il déloge Il m'a demandé pour téléphoner Il a fallu démerger le quartier Il a eu du mal a dérocher cette vieille table
37E 32R3 35L 33 32C 35S 31R 32C 32R3 32H 31R 32R3 32R3 32H 32C 37E 37E 32H 32RA 32PL 4 4 33 4 32C 31H 32R3 35ST 9 37E 32R3
LA STRUCTURE DE LA PHRASE EN FRANÇAIS DE BELGIQUE 363
Lexique des verbes du français de Belgique
dessortir détourner diner se divorcer doguer doguer doguer doubler doucher doucher douffer dracher driller droguer échampeler écailler éclairer économiser écouter égoutter s'emmouracher empuanter encommissionner s'encourir engraisser enloger épancher épastrouiller être croqué êtrejaloux être vu se facher
pleuvoir fort entraïner attendre éparpiller écaler faire des éclairs être enceinte obéir pourvoir d'égouts s'amouracher empuantir faire traiter dans une commission s'enfiiir enduire de graisse mettre dans des paniers renverser un liquide étonner fortement avoir un accident de santé êtrejaloux de être trompé se facher contre
peter
être en saillie dévier prendre Ie repas de midi divorcer rosser produire des élancements travailler avec acharnement redoubler pleuvoir a verse pleurer a chaudes larmes
35ST 32C 31H 32H 311 31H 32R3 311 31H 31H 311 32H 31H 32PL 37E 311 31H 32H 37M5 31H 32RA 32R3 35L 37M5 32R3 35L 4 35R 31H 35R Ce rocher dessort de la montagne La police a détourné la circulation En Espagne, on dfne a 14 h. Ils se sont divorces Il a dogué sa femme Qa dogue dans ma tête Ils ont dogué toute la nuit Il a doublé la deuxième Il douche depuis trois jours Arrête de doucher Qui a douffé ici? Qa drache depuis hier On a drillé les gendarmes pour les émeutes Il drogue depuis une heure Il a échampelé ses affaires En automne, on écaille les noix En été, il éclaire souvent Elle economise Il n'écoute pas ses parents On a égoutté ce quartier Les jeunes s'emmourachent facilement Les cochons empuantent les voisinages Ils ont encommissionné cette proposition de loi Les enfants s'encourent a la maison Il faut engraisser ces chaussures d'une couche de graisse Les colombophiles enlogent les pigeons Tache de ne pas épancher sur ton pantalon Tu m'épastrouilles Dès son arrivée en Afrique, il a été croqué Il est jaloux sur son frère Je suis vu dans cette affaire Il s'est faché sur ses enfants
364 BÉATRICE LAMIROY & JEAN RENÉ KLEIN
Lexique des verbes du français de Belgique
fignoler flairer flamandiser flikker flikker fonctionner fourcher fransquillonner frauder fristouiller froucheler froucheler gargariser gletter se godiner goüter goüter gouttiner gouttiner gratter gréer groüler guindailler s'habiller a halkiner handeler hanter indaguer instiguer instiguer jeter se jeter
faire le coquet puer rendre flamand voler arranger, trafiquer travailler avoir un intercours parier le français avec affectation passer en fraude fabriquer flirter magouiller se gargariser baver se régaler plaire au goût avoir le goût de couler goutte a goutte pleuviner démanger se réjouir grander participer a une beuverie d'étudiants s'habiller en hésiter balayer flirter enquêter inciter susciter germer se vanter
31H 31I 32RA 36DT 32C 31H 31H 31H 32C 32C 35S 35L 31H 35L 31H 33 32NM 31R 31I 32H 36DT 31R 31H 33 37E 35S 31H 11 32R3 31R 31H A son age il fignole encore Ça flaire ici Certains voudraient flamandiser Bruxelles Il m'aflikké 100 francs Ce meuble est flikké Il fonctionne dès 7 heures du matin Ce prof fourche deux fois aujourd'hui Ces Flamands aiment fransquillonner Il a fraudé des cigares Qu'est-ce qu'il fristouille? Il était en train de froucheler avec la voisine Il a frouchelé dans cette affaire Il gargarise tous les matins Cet enfant a gletté sur son chandail On s'est godiné Cette bière me goüte Ce vin goüte le bouchon Le robinet gouttine Il gouttine Ce col le gratte Il a obtenu sa promotion: nous le lui gréons bien Le chien groüle parce qu'il est inquiet Les étudiants sont en train de guindailler Il s'est habillé a femme Il l' fait sans halkiner Il faut handeler l'étable Elle hante avec le fils du bourgmestre Le journaliste a longuement indagué Il nous a instigués a protester Cet article a instigué une vague de protestations Les patates jettent Ces filles se jettent en présence des garçons
LA STRUCTURE DE LA PHRASE EN FRANÇAIS DE BELGIQUE 365
Lexique des verbes du français de Belgique
parier parier paumer peler péréquater pesteller
jober jouer avec jouer avec jouer jouer koter laisser licencier maquer maquer se masquer a mastiquer se méconduire mépriser se mettre mijoler minoriser mofier monter dessus muser naveter occulter s'occuper avec officier pairer avec
travailler jouer avec quelqu'un se moquer jouer de jouer a occuper une chambre d'étudiants faire libérer frapper assommer moralement se masquer nettoyer l'ude javel se conduire mal parier mal s'asseoir flirter inférioriser refuser l'examen surenchérir bourdonner faire la navette empêcher la lumière d'entrer s'occuper de remplir une fonction ne pas voter pour compenser l'absence d'un autre parlementaire médire parier mettre a prix ennuyer adapter au coüt de la vie trépigner
Il va jober pendant les vacances Il ne veut jamais jouer avec La pauvre, Luc doit cesser de jouer avec Il joue le piano Il joue tennis Ou est-ce que tu kotes? Il a laissé construire une maison Le directeur a licencié les élèves avant l'heure normale On l' maqué Que tu aies ditçal'maqué Il est masqué a polichinelle Il faut mastiquer le bar Elle s'est encore méconduite Elle me méprise auprès de mes collègues Mettez-vous Il mijole avec la voisine Les femmes se sentent minorisées Il a encore été moflé Si tu veux cet objet, tu devras monter dessus Le public n'a pas arrêté de muser Son travail l'oblige a naveter On a occulté la fenêtre Elle s'occupe avec le café Il officie comme président de jury Ces deputés ont pairé Elle n'arrête pas de parier sur sa belle-mère Je parie pour 100 francs qu'il viendra La maison a été paumée a tel prix Devoir travailler tout le dimanchel'pelé Il faudra péréquater les salaires Cet enfant pestelle de rage
31H 31H 32R3 32R3 35ST 1 32H 32H 4 33 32R3 31H 32H 35L 35S 32RA 32H 31H 32C 35R 31H 35S 35R 10 36R 4 32PL 31H
j
366 BÉATRICE LAMIROY & JEAN RENÉ KLEIN
Lexique des verbes du français de Belgique
rabistoquer racabouillir
pîler pipeter piter piter placer (re)plafonner planter a (légumes) plaquer plèquer poigner poquer postposer poter poter pouliner prélire prépensionner présenter prester prêter prober promener protter prouter purger quetter queuter quitter
péter
recaler geindre prélever avec une pipette donner des coups de pied expulser installer platrer planter coller coller saisir a pleines mains cogner en laissant une trace reporter prendre des pots éliminer par une comptine fienter lire au préalable a haute voix mettre en préretraite passer (un examen) accomplir (a propos d'une tache) emprunter essayer se promener péter péter se purger sauter une femme rouler laisser a quelqu'un quelque chose auquel on a droit rafistoler bouillir excessivement
Ce professeur a pété la moitié des étudiants Cet enfant pile toujours Il a pipeté un échantillon de liquide La vache pite quand on veut la traire Son père l' pité hors de la maison Ils ont placé du parquet au salon Ils viennent de plafonner le mur On vient de planter aux patates Ils plaquent des affiches partout Cette nappe plèque Il a poigné dans les bonbons On a poqué la voiture Il a postposé de se marier Ces jeunes ont poté toute la nuit Ils ont poté avant de jouer Cet oiseau a pouliné sur le balcon Le notaire a prélu les conditions de vente On l' prépensionné 50 ans Il a présenté son examen avec brio Il a presté des heures supplémentaires Il a prêté de l'argent a Luc pour s'acheter une voiture Tu peux toujours prober ça Allons promener au bois Ce bébé n'arrête pas de protter Ce bébé n'arrête pas de prouter Le malade a dü purger avant l'opération Il ne peut pas voir une femme sans la quetter Il s'est fait queuter dans cette combine Je vous quitte cette part d'héritage On a rabistoqué ce vieux vélo Le café a racabouilli
32H 31H 32R3 31R 38LS 38LD 37M5 33 38LD 31R 35L 32C 6 31H 31R 32R3 32H 32R3 32R3 36DT 32C 35L 31H 31H 31H 32H 32H 36DT 32C 31R
LA STRUCTURE DE LA PHRASE EN FRANÇAIS DE BELGIQUE 367
Lexique des verbes du français de Belgique
racconduire raccourir raccuser raccuspoter se racrapoter rafantir rafourer ramasser se ramasser rameter rapipoter rapproprier rattaquer ravoir se ravoir s'en ravoir rechasser réciproquer reclaper reclaquer recroller regarder regarder a regarder, Nég regarder a rejeter rejeter rejointoyer relaver relécher relessiver reloqueter
reconduire accourir cafarder cafarder se recroqueviller retomber en enfance fournir du fourrage vert aux animaux achever de vider se dépêcher caqueter accourir remettre en état reprendre une activité se venger retrouver sa condition physique retrouver sa condition physique renvoyer (au jeu de balie) réadresser des vœux claquer claquer se retourner sur soi-même chercher prendre garde ne pas se soucier concerner percer a nouveau perdre son humidité jointoyer laver la vaisselle lécher faire la lessive nettoyer le sol avec une serpillière
38LD 35L 31H 31H 31R 31H 37M6 32C 31H 35L 32RA 31H 32H 31H 31H 35L 36DT 32C 32C 31R 35R 33 35R 33 35L 31R 37M6 32R3 32C 32R3 32R3 Je vous racconduis jusqu'a la porte Ils raccourent au moindre signe de leur mère Cette fille doit toujours raccuser Il a tendance a raccuspoter Ce tapis s'est racrapoté Les vieux rafantissent parfois Le fermier va rafourer les bêtes Papa ramasse tous les plats Ramasse-toi, on part Il n'arrête pas de rameter Elle a fait rapipoter ses enfants Il faudrait rapproprier le salon Après la pause les ouvriers ont rattaqué tout de suite On vous raura a la première occasion Il a eu une grosse émotion et n'arrivait plus a se ravoir Il a eu une grosse émotion et n'arrivait plus a s'en ravoir Il ne rechasse jamais Il m'a réciproqué mes vœux Il a reclapé la porte Il a reclaqué la porte Ses cheveux recrollent après la pluie Il regarde pour un emploi Regarde a ton genou quand tu joues au hockey Cette mère ne regarde pas après ses enfants Ça lui regarde Ces taches rejettent de nouveau Le mur a rejeté Le maçon a rejointoyé le carrelage d'un joint énorme Il a relavé les casseroles Il pourra relécher le sirop Ils ont relessivé le linge On vient de reloqueter la cuisine
368 BÉATRICE LAMIROY & JEAN RENÉ KLEIN
Lexique des verbes du français de Belgique
remanger remettre remettre remettre renettoyer rencontrer renoncer renoncer renseigner répéter répondre reprendre ressuyer retomber, Neg rétorquer revenir, Neg se retourner, Neg se retourner, Neg se retourner, Neg se revoir riposter risquer roter roufler roufler rouler rouler rüter rouspéter saisir savoir Iscinder
répondre avec agressivité vomir comparer rendre (monnaie) nettoyer répondre a considérer comme incurable résilier un bail indiquer redoubler répliquer mentionner essuyer la vaisselle se rappeler rétorquer se rappeler prêter attention prêter attention prêter attention avoir ses règies riposter a avoir des chances râler se ruer bousculer quémander de porte a porte faire le tour des bars répéter des choses désagréables rouspéter contre surprendre pouvoir partager les examens en deux sessions
32H 38LD 36R 35R 32C 32R3 32H 32R3 9 32R3 35R 32R3 32R3 35R 35R 35R 35R 35R 35R 35R 1 31H 35L 32H 31H 3IH 3IH 35R 4 1 31H Cet enfant effronté a remangé sa mère Il a remis tout son diner dans la voiture Je remets mon salaire au tien Je ne u pas remettre sur 1000 francs Ils ont renettoyé la cuisine On a pu rencontrer toutes vos objections Tous les médecins Tont renoncé Le locataire a renoncé son bail Peux-tu me renseigner si le train a du retard Il répète son année Il répond sur tout Le dictionnaire ne reprend pas ce mot Il faudra ressuyer les couverts Je ne retombe pas sur son adresse Il n' a pas rétorqué sur mes remarques Je ne reviens pas sur son adresse Je ne me retourne pas après de tels détails Je ne me retourne pas sur de tels détails Je ne me retourne pas pour de tels détails Elle a peur de ne plus se revoir Il n'a pas riposté sur ma remarque Il risque de gagner le gros lot Elle rote a cause de son échec Cet enfant est venu roufler dans mes bras On m'a rouflé Les scouts roulent pour les victimes du Ruanda Les étudiants ont roulé toute la nuit Il n'arrête pas de rüter Elle rouspète tout le temps sur ses enfants Tu m'as saisi en entrant brusquement La voiture ne sait pas passer ici On lui a conseillé de scinder
LA STRUCTURE DE LA PHRASE EN FRANCAIS DE BELGIQUE 369
Lexique des verbes du francais de Belgique
Arrête de tafier avec ta copine Cette robe taille grand Qu'il vienne tous les jours me tanise Il faut taper un seau d'eau sur le trottoir Le barman a tapé des bières toute la nuit Il tient des timbres Il tient des lapins Vous pouvez tenir ma voiture jusqu'a ce soir
35S 31R 4 38LD 32R3 32PL 32PL 32C
bavarder être d'une certaine taille (vêtement) tanner jeter tirer collectionner élever garder
tafier tailler taniser taper rtaper
tenir tenir
Itenir
Il a été signé pour ses vermes Il a beaucoup smokkelé pendant la guerre Il faut encore aller soigner les vaches Elle soigne pour ses intéréts Ne t'en fais pas, je soigne pour Les jeunes ont soiré avec nous (Re)sonnez-moi après 18 heures Après son repas il aime sonrer Après son repas il aime soqueter On soupe a 19 heures Je viens de spater une mouche J'aime l'eau qui spite La sauce a spité sur sa cravate On a staté les travaux pour cause de grève Ses pieds stinquent Il aime bien stoefer On lui a strogné son sachet de bonbons L'Etat a subsidié ce théâtre d'une aide substantielle Depuis son accident, il n'a pas arrêté de sukkeler On a surcollé leurs affiches avec des affiches du parti adverse
32H 31H 32R3 35R 32H 31H 31H 32C 31R 35L 32R3 31R 31H 36DT 37M1 31H 36SL
Ses parents le serrent trop Ils ont l'habitude de shifter a 6 heures
guérir par la prière faire du marché noir nourrir veiller a s'en occuper consacrer la soirée a veiller (re)téléphoner somnoler somnoler diner ecraser pétiller éclabousser arrêter puer faire de l'esbroufe chiper subventionner peiner coller des affiches sur d'autres
32H traiter sévèrement relayer une personne a la fin de son travail 31H
signer smokkeler soigner soigner soigner pour soirer (re)sonner sonrer soqueter souper spater spiter spiter stater stinquer stoefer strogner subsidier sukkeler surcoller
serrer shifter
370 BÉATRICE LAMIROY & JEAN RENÉ KLEIN
Lexique des verbes du français de Belgique
tenir tenir tenir tiper tirer tirer toquer toquer se torcher torchonner toumer toumer transir se trébucher tribouler trimeier trisser turbiner tûteler tûter tüter verser verser vinculer wachoter wageler walloniser walloniser zieverer züner |zwanzer
aller (aux cartes) être du même bord être du même bord verser tuer a la chasse tenir de taper attiser se tordre nettoyer le sol avec une serpillière être l'atout (au jeu de cartes) pommer s'impatienter trébucher dégringoler jouer gros jeu tripler une année d'études écrémer le lait trompeter trompeter vider en buvant pleuvoir abondamment déverser des immondices venir a bout de clapoter chanceler rendre wallon se comporter a la façon des Wallons dire n'importe quoi bourdonner blaguer
35R 35R 38LD 32C 35R 31R 32C 32CL 32R3 31R 31R 31H 35L 35L 31H 32R3 31H 31H 32C 311 32C 31R 31R 32RA 31H 31H 31R 31H Je tiens, je m'engage a réussir Il tient pour les socialistes Il tient avec les socialistes Il a tipé un seau d'eau par terre Les chasseurs ont tiré deux lapins Elle tire après sa mère Le soleil toque Il faut toquer le feu Il s'est torché le pied Elle a torchonné le carrelage 'est le pique qui tourne La salade tourne Il transit en attendant ses résultats Il s'est trébuché dans les escaliers Il a triboulé des escaliers Son fils a trimelé et a tout perdu Peu d'étudiants trissent une année La fermière va turbiner Arrête de tüteler Arrête de tüter J'ai tüté une bouteille de vin Il verse encore Il est défendu de verser ici Il a vinculé son obsession Cette machine a laver wachote Le vase a wagelé avant de tomber On a wallonisé cette administration Durant les fêtes locales, les gens ont wallonisé joyeusement Il passe son temps a zieverer au comptoir Une abeille zünait a coté de moi Arrête de zwanzer
LA STRUCTURE DE LA PHRASE EN FRANÇAIS DE BELGIQUE 3 71
Lexique des verbes du français de Belgique
RESTRUCTURATION AND THE SUBJECT OF ADJECTIVES
1
ÉRIC LAPORTE Institut Gaspard-Monge - University of Marne-la-Vallée, CNRS
A significant proportion of French adjectives can be described in a lexicongrammar as adjectival simple sentences, i.e. simple sentences with an adjec tival predicate and a support verb, être. Important distributional properties of such sentences involve their subject. The selectional restrictions on the subject of predicative adjectives in French are particularly complex, because of the existence of numerous types of [Restructuration] and metonymic variants of the subject, and often of both (A. Meunier 1981; R. Vivès 1982; M. Meydan 1999; cf. Nam J.S. 1996; E. Sklavounou 1997). Restructuration and meto nymic variants also exist in other contexts, i.e. with distributional verbs like imiter and récompenser instead of adjectives, and in subjects or in essential complements (M. Gross 1975; A. Zribi-Hertz 1978; A. Guillet & Ch. Leclère 1981). Due to these syntactic variations, the argument has different forms, with two different head nouns Na and Nb: =
Ce fruit est ferme La consistance de ce fruit est ferme
These nouns may have very different distributions, as in this example where Nb =: fruit is concrete, whereas Na =: consistance is an abstract, predicative noun. Sometimes, a third construction is observed, with an "echo" complement in the sense of A. Guillet & Ch. Leclère (1981): = =
Luc a été excessif La réaction de Luc a été excessive Luc a été excessif dans sa réaction
In the case of adjectives, the echo complement is usually optional. 1
This work was partly financed by a grant from Cofecub, and carried out during a stay at the Department of Literature of the Pontifical Catholic University of Rio de Janeiro. I am indebted to M. Gross, Ch. Leclère and A. Meunier for their comments on a previous version, which I presented at the 19th International Colloquium on Compared Lexicon and Grammar in 2000.
ÉRIC LAPORTE
374
In spite of the distributional differences between the two nouns Na and Nb, assigning separate entries to the respective constructions is usually not a satis factory solution. The interpretation of the sentence is little modified by the structural change, and these syntactic relations are observed in a large number of sentences. In some cases, these syntactic relations can be chained (A. Guillet & Ch. Leclère 1981:120), leading to forms with 3 different head nouns: = =
Luc est charmant Le visage de Luc est charmant L 'expression du visage de Luc est charmante
When the subject of an adjectival sentence admits a restructuration or a metonymic reduction, any possible subject noun seems to be able to occur in one of these relations, either as Na, or as Nb, or both. A satisfactory description of adjectives in a lexicon-grammar should take into account these constructions and the syntactic relations between them. Such a description implies identifying a basic simple sentence scheme, and describing other forms through general syntactic relations. However, it is not easy to determine which of these constructions should be considered as simple sentences. In addition, the problem is connected with the separation of senses and the description of the complements in the adjectival sentence (R. Vivès 1982). These two problems involve quite a number of entries, to such an extent that they have been slowing down the description of adjectives in the lexicongrammar of French. When we identify a restructuration or a metonymic reduction in a sentence which is a candidate for consideration as an elementary sentence, we can either consider both forms as basic, or only one of them, but in the latter case we have to choose one of the forms. Thus, we have four solutions a priori: 1) To include both sentence forms in the basic construction of these adjectives. This solution (L. Picabia 1978; J. Casteleiro 1981) is simple, but its main drawback is that the two forms are not distinguished, so the syntactic relation between them cannot be represented (cf. M. Gross 1975:142, about tables 12 and 13). We will consider this solution as an approximation. 2) To choose the sentence with subject Na de Nb as basic, and represent the syntactic relation with the other one as a reduction like the deletion of an appropriate noun (cf. E. Ranchhod 1990:122). This is consistent with the principle that assigns the status of basic construction to the maximal extension of the sentence. 3) To choose the sentence with subject Na (without Nb) as basic, and consider the Na de Nb sentence as a complex sentence obtained from several simple sentences through relativisation and other known transformations (E.
RESTRUCTURATION AND THE SUBJECT OF ADJECTIVES
Laporte 1995). As a matter of fact, Na is often a predicative noun with a support-verb construction: (1) ? Ce fruit a une certaine consistance This approach poses several problems, in particular the dubious, some times indeterminate status of acceptability of some of the sentences in volved. 4) To take the sentence with subject Nb as basic, and consider the Na de Nb sentence as the result of the insertion of Na. The same problem, to a lesser extent, has been faced by specialists in distributional verbs. It seems that this difficulty affects a smaller proportion of verbs than of adjectives. It did not interfere too greatly with the problems of separating verb senses and identifying their essential complements. The four solutions above are not equivalent. Firstly, they are based on different basic forms with N0 =: Na de Nb, N0 =: Na and N0 =: Nb; the respec tive basic forms must be acceptable for the corresponding solutions to be applicable. Secondly, solution 3 implies that a sentence with Na and Nb like (1) must be acceptable. Thirdly, the formal representation of selectional res trictions depends on the basic construction adopted. For example, solutions 2 and 3 are suitable for cases where the selectional restrictions observed between Na, Nb and Adj can be deduced from restrictions between Na and Nb, on the one hand, and between Na and Adj, on the other hand. What is at stake is the organization of the lexical entries of these adjectives in the lexicon-grammar of French. In the following, we identify several situations where it seems possible to choose a satisfactory strategy. We discuss this organization through various examples of adjectives.
1. Determinative nouns In certain cases of restructurations and metonymic relations, Na can be consi dered as a determiner of Nb (M. Gross 1977:59; Guillet & Leclère 1981; P.A. Buvet 1994). In these cases, Na is called a determinative noun. Many deter minative nouns denote sets, containers, or parts of concrete or abstract objects: (2)
L 'armoire est poussiéreuse = L 'armoire est poussiéreuse {en portie + sur le dessus) = (3) {Une portie + Le dessus) de Varmoire est poussiéreux/-euse Ces événements sont imaginaires = Ces événements sont en portie imaginaires = (4) Une portie de ces événements est imaginaire
375
ÉRIC LAPORTE
376
In some examples, Nb Prep Na can be extracted into'est... que (A.Guillet & Ch. Leclère 1981:105), but not in others: * C'est l'armoire en partie qui est poussiéreuse We will therefore attempt to characterize this type of restructuration through other criteria. The relation is easily iterated, by introducing determinative nouns as new Na's: Le haut du côté de Varmoire est poussiéreux Une partie du haut du cöté de Varmoire est poussiéreuse Such a chain is obtained by considering the relation as oriented from Nb être Adj W to Na de Nb être Adj W, and by taking the target form as a source form. The lexical choice of the new Na's introduced is relatively independent of the initial Nb and Adj, but the initial Nb is dependent on the adjectival entry. Thus, the relation can be iterated only in one direction, which suggests organizing our lexico-syntactic description around the form with N0 =: Nb, i.e. solution 4 above. The possibilities of inserting a given Na into Nb être Adj W depend on Nb: Ce (film + fruit) est bizarre Le début de ce (film + 1* fruit) est bizarre but usually not on the adjective: (Ce + Le début de ce)film est (bizarre + ?abordable + *vermiforme) Therefore, the description of such insertions might be relatively independent of the description of adjectives. There are exceptions: (Ce + * Le dessus de ce) siege est bancal In particular, adjectives with human subjects do not admit the insertion of the same nouns of body parts into their subject: Luc est (poilu + sincère) Les pieds de Luc sont (poilus + * sincères) The existence of selectional restrictions between Nb and Adj, when there are no selectional restrictions between Na and Adj, is an argument against solu tions 2 (No =: Na de Nb) and 3 (N0 =: Na). Solution 3 is unsuitable for additional reasons. Forms Na être Adj W are restricted. Some of them are acceptable, but they cannot be the initial sentence of a discourse and they have a co-referential meaning with respect to a pre vious occurrence of Nb: Le dessus est poussiéreux Le début est agréable Une partie est imaginaire
RESTRUCTURATION AND THE SUBJECT OF ADJECTIVES
377
which suggests that such sentences are reductions of sentences like Une partie de Nb est imaginaire. Many forms Ce Na être Adj W are unacceptable: Cette portie est imaginaire ?* Ce dessus est poussiéreux Sentences like (3) and (4) are therefore not easily representable as a combi nation of simple sentences into complex sentences, even if one accepts forms like the following: ?* L 'armoire a un dessus ?* Ce film a (un début + un milieu + une fin) Thus, (2) could be chosen as a basic construction, and the introduction of dessus could be described as an insertion (solution 4). The element inserted is not an autonomous elementary sentence. It can be compared to other deter miners or to auxiliariesverbs (M. Gross 1975, table 1; M. Gross 1999): - the set of insertible elements is large; - these elements are not only grammatical, but convey a lexical content; - selectional restrictions take place between the subject of the sentence and the element inserted into it; - the insertion of an element into a simple sentence does not add a new argu ment to the predicate. We have applied four criteria to recognize instances of the insertion of deter minative nouns: - the relation can be iterated by inserting new Na's into the Na de Nb form; - the sentence with subject Na (without Nb) is either unacceptable, or corefe rential with respect to a previous occurrence of Nb; - Nb Vsup Na has a low level of acceptability; - the possibility of inserting a given Na into Nb être Adj W may depend on Nb, but usually not on Adj. According to these criteria, début, dessus, haut, partie... are extensions that can be inserted into simpler sentences as (1). Nouns of body parts behave in the same way with some adjectives like poilu but not with others like sincère, cagneux (D. Leeman 1993). Many nouns denoting objects that may or may not be parts of other objects behave differently. They regularly occur in Ce Na être Adj W: Ces colonnes sont sales and in Nb Vsup Na: Ce monument a des colonnes An analysis with a relativisation is possible for such nouns (solution 3):
ÉRIC LAPORTE
378
Ce monument a des colonnes # Ces colonnes sont sales = Les colonnes de ce monument sont sales
2. Elementary adjectival constructions with predicative subject Consider the adjective bizarre. Its observable subjects are non-restricted in the sense of M. Gross (1975). However, it seems that any possible other subject noun of the adjective can be used in one of the relations (5) and (6): (5) (6)
Na de Nb être Adj W=Nb être Adj W Na de Nb être Adj W=Nb être Adj W Prép Na,
either as Na, or as Nb, or both. We did not find convincing counter-examples to this assertion yet. For example, Les circonstances sont bizarres and Cette sensation est bizarre can be related respectively to: Les circonstances de cet événement sont bizarres (Na =: circonstances), and to: ?L'experience de cette sensation est bizarre (Nb =: sensation). A large number of adjectives, either with non-restricted subjects or with actual selectional restrictions, apparently have the same property. Among the three sentence structures involved, the one with N0 =: Na de Nb could be chosen as basic construction (solution 2): - it comprises Na, Nb and Adj, unlike Nb être Adj W, and therefore it could be considered as the maximal extension of the sentence; - it enters into both relations (5) and (6); i.e. for the adjectives involved, all sentences with a nominal subject are related to a sentence structure with N0 =: Na de Nb. In contrast, the structure Nb être Adj W Prép Na is sometimes unacceptable: Ce voyage est abordable (E + * Prép son prix) - it is structurally close to the forms with sentential subjects which can be observed with some of the adjectives involved (Qu'il pleuve est bizarre), as opposed to the structure Nb être Adj W Prép Na, which has an additional complement. Solution 3 (No =: Na) is not completely satisfactory, because of the indeter minate acceptability of many forms Ce Na être Adj W: L'allure de Luc est insouciante (7) ?* Cette allure est insouciante
RESTRUCTURATION AND THE SUBJECT OF ADJECTIVES
(8)
379
L 'odeur de fruit est alléchante Cette odeur est alléchante
La consistance de ce fruit est pâteuse Ce fruit est pâteux (9) ?* Cette consistance est pâteuse Native speakers tend to disagree on the acceptability of (7) and (9), or feel that it depends on sentences in the context. When Ce Na être Adj W is acceptable, it usually has a co-referential meaning with respect to a previous occurrence of Nb, and is intuitively felt as a reduction of Na de Nb être Adj W, which makes it difficult to consider Na de Nb être Adj W as a complex sentence and Ce Na être Adj W as one of its elements. Solution 4 is not suitable either, since the possibility of inserting a given Na into Nb forms does not depend only on Nb, but often on Adj also: Luc est (courtois + ferme + gracieux) Les habitudes de Luc sont (courtoises + * fermes + *gracieuses) La décision de Luc est (* courtoise + ferme + * gracieuse) La démarche de Luc est (* courtoise + * ferme + gracieuse) These facts support the idea that lexico-syntactic description could be organized around the form with N0 =: Na de Nb, at least for the forms with nominal subjects.2 In the appendices, we display tables of a selection of adjectival entries with the properties mentioned in this section. The properties in the tables are about: - the predicative subjects Na with restructuration or metonymic reduction; - the possibility of occurrence and the actual form of the echo complement. In the rest of this article, we investigate the properties of these constructions.
3. Selectional restrictions Clearly, selectional restrictions can be observed between Na and Adj. Several predicative nouns Na are generally suitable for a given adjective, which accounts for the ambiguity of Nb être Adj W. Many predicative subjects Na admit prepositional complements with adverbial properties. Selectional restrictions take place between Na and such complements. These complements are conserved in the reduced forms without Na (R. Vivès 1982). The presence of such a complement in a reduced form restricts the choice of Na. For example, we can relate: Luc est bizarre sur ce point 2
And provided that Na itself does not behave as an Nb', the subject of a predicative noun Na', in another Na '/Nb '/Adj combination similar to Na/Nb/Adj.
380
ÉRIC LAPORTE
to sentences with Na =: attitude +jugernent, and ?Luc est bizarre envers Marie with Na =: attitude, but not with jugernent. The subject Na de Nb has several variants. We already mentioned examples where de Nb can be omitted. With human Nb's, certain Na's are compatible with a complement de la part de Nb: Cet enthousiasme est bizarre de la part de Luc The insertion of an adjectival or prepositional modifier into Na de Nb can be acceptable: (10) La consistance (E +pdteuse + de velours) de ce fruit est bizarre Ce fruit est bizarre par sa consistance (E +pdteuse + de velours) or not (M. Meydan 1999:67), depending on Adj: (11) La consistance (E + * souple + * de velours) de ce fruit est pâteuse Ce fruit est pâteux In particular, in many of the adjectival sentences related to the adverbs studied by A. Balibar-Mrabti (1980, 1987), Na cannot have a modifier: Le pas (E + * saccadé) de Luc est rapide However, the modifiers with adverbial properties studied by J. Giry-Schneider (1997) can be accepted where others are not: La consistance habituelle de ce fruit est pâteuse Le pas habituel de Luc est rapide As examples (10) and (11) show, the same Na may or may not be modified, depending on Adj. These restrictions on the insertion of modifiers, first noticed by A. Meunier (1995) and M. Meydan (1999) to our knowledge, seem to be important facts. They are correlated with other formal properties. For example, - when an echo complement of the form (de par + par + pour) Det Na occurs, Na can usually be modified (10), whereas echo complements of the form dans Det Na and de Na preclude the occurrence of modifiers of Na; - when a given adjective, like bizarre, accepts a subject Le Na Modif de Nb (10), it is usually relatively easy to erase de Nb from subjects Na de Nb, and sentential subjects are often accepted. We used these restrictions on modifiers as a criterion to distribute syntactic properties across the three tables in the appendices. From (8), two operations introduce Nb =: fruit into the position of the subject of alléchant. The possibility of restructurating (8) with an echo com-
RESTRUCTURATION AND THE SUBJECT OF ADJECTIVES
3 81
plement in par appears as a syntactic property of the pair3 odeur/alléchant: (12) Ce fruit est alléchant par son odeur The deletion of Na =: odeur in (8) or in (12) appears as a metonymic reduction which is all the more acceptable as Na is more appropriate4 in the context: Ce fruit est alléchant The appropriateness, and thus the reducibility, of Na is a cultural and contex tual matter, not only a syntactic property. All the constructions with nominal subjects can be connected, through general syntactic relations, to constructions with subject Na de Nb like (8). Subject nouns that do not behave as Na can thus be excluded from the subject position of the basic construction, and introduced with the aid of syntactic operations, as suggested in M. Gross (1975:143) about the direct complement of louer (table 13). Selectional restrictions are observed between Nb and Na: all concrete subjects of Na =: odeur are introduced as subjects of Adj =: alléchant. Conversely, for each sentence of the form N0 être alléchant with a concrete subject, it seems possible to find at least a predicative noun that behaves as Na while N0 behaves as Nb, and to relate the sentence to a structure like (8). This is consistent with our choice of classifying and describing these adjectival entries on the basis of construction (8). Some of the same adjectival entries are also used with non-nominal sub jects, in particular with sentential clauses:5 Que Luc ait cette attitude est courtois (E + de sa pari) ? Que ce fruit ait une telle odeur est alléchant Some adjectives do not: ?* Que Luc s 'exprime de cette fagon est {grandiloquent + indescriptible) * Que ce voyage ait ce prix est abordable The subject of some of these adjectives can also be an infinitive clause. Depending on the adjective, the implicit human subject of the infinitive clause is obligatorily co-referential either with the optional complement de la part de Nb: Avoir cette attitude est courtois (E + de la part de Luc) 'est courtois (E + de la part de Luc) d'avoir cette attitude or with a prepositional complement Prep N\ of the adjective: 3
The pair odeur/bon does not admit the same restructuration: *Cefruitest bon par son odeur is not accepted. 4 A very particular context is needed to interpret Cefruitest bon as the result of a metonymical deletion of odeur in L 'odeur de ce fruit est bonne. 5 Many adjectival derivatives of verbs of table 4 (M. Gross 1975) belong to this class.
ÉRIC LAPORTE
382
Voyager est intéressant pour Luc 'est intéressant pour Luc de voyager In the sample of adjectival entries described in the appendices, we analysed prepositional complements pour N\ as essential complements of the adjective when we observed an infinitive clause obligatorily co-referential with N1. According to a convincing argumentation by A. Meunier (1999), the infinitive clause in sentences like Luc est original d'avoir cette attitude is not a subject of the adjective, but could be related to 'est être original que d'avoir cette attitude. It would be interesting to relate phrasal-subject sentences to nominal sub ject sentences, but since these relations are still obscure, including all these forms in the basic sentence scheme seems to be the appropriate level of formalization and precision. According to this analysis, the subject of the basic construction can be represented by marking as possible subjects: -the lexical values of Na used in the definitional construction, if this is realis tic given their number; - sentential clauses; - infinitive clauses. This method of formalization indirectly marks Nb as a possible subject of Adj: if Na is marked as subject in the basic construction of Adj, if metonymic reduction is marked as applicable to this construction, and if Nb is marked as subject of Na, then Nb is implicitly marked as subject of Adj in metonymic sentences. The nouns Na =: façon + manière are a special case, since they obli gatorily occur with an infinitive clause or a relative clause.
4. Echo complements The formal difference between restructuration and metonymie reduction is the presence vs. absence of an echo complement. The possibility of occurrence of an echo complement, and its form, i.e. the value of the preposition and deter miner, are lexico-syntactic properties. These properties depend primarily on Na but also on Adj. For example, Na =: décision usually can occur in echo complements with dans, and Na =: odeur with de par or par, and Na =: enthousiasme with both: Luc est rapide (dans + * de par) ses décisions Ce fruit est bizarre (* dans + de par) son odeur Luc est (charmant + ?* excessif) de par son enthousiasme Luc est (?* charmant + excessif) dans son enthousiasme
RESTRUCTURATION AND THE SUBJECT OF ADJECTIVES
Whether or not the echo complement can occur depends on the particular ad jective: Ce voyage est (* abordable + intéressant) de par son prix
5. Sentences Nb Vsup Na Adj W Sentences of the form Nb Vsup Na Adj W are regularly observed as additional variants of the forms we examined: (13) Ce fruit (a + est dé) une consistance ferme Again, they can be related to Na de Nb être Adj W in two ways: either through the application of a link operator sequence Nb Vsup (M. Gross 1981), or through a combination with Nb Vsup Na by a relativisation. However, cons tructions apparently similar to (13) are not always related to Na de Nb être Adj W. They can also be observed where Na de Nb is not a possible subject of Adj: Cette affirmation {a un caractère + est) diffamatoire * (Le + Un) caractère de cette affirmation est diffamatoire Lea (est d'une humeur + est) joyeus e ?* L'humeur de Léa est joyeuse even with nouns that occur in Na position in restructurations with other Adfs: Le caractère inattendu de cette invitation est charmant Cette invitation est charmante par son caractère inattendu L'humeur enjouée de Léa est charmante Léa est charmante par son humeur enjouée
Conclusion Restructurations and metonymic reductions are known for the complexity of the conditions that determine their applicability, and for the formal diversity of echo complements. We have attempted to identify situations where it seems possible to organize the syntactic and transformational description of these relations around a basic construction. When Na is a determinative noun, we consider the sentence with N0 =: Nb as the basic construction; when Na is a noun denoting a part of a concrete object but occurring naturally in Ce Na être Adj W, we consider this sentence to be basic; and when the subject of the ad jective obligatorily participates in a restructuration or a metonymic reduction, we consider the sentence with N0 =:Na de Nb as the basic construction. We developed our analyses and descriptive methods on subjects of adjectival constructions, but part of them could probably be extended to
383
ÉRIC LAPORTE
384
subjects and essential complements of verbal and nominal constructions: (Cette odeur + Cette consistance pateuse) plait a Luc Luc (aime + a du gout pour) {cette odeur + cette consistance pateuse) Luc imite (cette attitude + ce ton agacé)
References Balibar-Mrabti, Antoinette. 1980. Une liste d'extensions lexicales pour les opérateurs manière et façon. Lingvisticœ Investigationes IV:1, Amsterdam/ Philadelphia: John Benjamins, pp. 1-20. Balibar-Mrabti, Antoinette. 1987. Règies formelles et règies thétoriques sur un cas d'analyse d'adverbes. Lingvisticce Investigationes XI:2, Amsterdam/ Philadelphia: John Benjamins, pp. 303-335. Buvet, Pierre-André. 1994. Détermination : les noms. Lingvisticce Investiga tiones XVIII:1, Amsterdam/Philadelphia: John Benjamins, pp. 121-150. Casteleiro, Joao Malaca. 1981. Sintaxe transformacional do adjectivo. Regência das construções completivas. Lisbon: INIC. Giry-Schneider, Jacqueline. 1997. Sur quoi peut porter un adjectif épithète? L'expression du temps et de l'aspect dans les groupes nominaux. Langages 126, Paris: Larousse, pp. 11-38. Gross, Maurice. 1975. Méthodes en syntaxe. Paris: Hermann, 414 p. Gross, Maurice. 1977. Grammaire transformationnelle dufrangais. Syntaxe du . Paris: Larousse. Gross, Maurice. 1981. Les bases empiriques de la notion de prédicat sémantique. Langages 63, Paris: Larousse, pp. 7-52. Gross, Maurice. 1999. Sur la définition d'auxiliaire du verbe. Langages 135, Paris: Larousse, pp. 8-21. Guillet, Alain, Christian Leclère. 1981. Restructuration du groupe nominal. Langages 63, Paris : Larousse, pp. 99-125. Laporte, Éric. 1995. Appropriate nouns with obligatory modifiers. Language Research 31(2), Seoul National University, pp. 251-289. Leeman, Danielle. 1993. Éléments pour une description linguistique de la personne physique. LINX 28, University of Paris X, pp. 107-131. Meunier, Annie. 1981. Nominalisations d'adjectifs par verbes supports. Thèse de troisième cycle, LADL, University of Paris 7, 281 p. Meunier, Annie. 1995. La construction N0 être de Dét Adj-n Modif et une classe de N classifieurs. Unpublished talk, 14th European Colloquium on the Compared Lexicon and Grammar of Romance Languages, Tel-Aviv University. Meunier, Annie. 1999. Une construction complexe N0hum être Adj de V0-inf W caractéristique de certains adjectifs a sujet humain. Langages 133, Paris: Larousse, pp. 12-44.
RESTRUCTURATION AND THE SUBJECT OF ADJECTIVES
Meydan, Métiyé. 1999. La restructuration du sujet dans les phrases adjectivales a substantif approprié. Langages 133, Paris: Larousse, pp. 59-80. Nam, Jee-sun. 1996. Classification syntaxique des constructions adjectivales en coréen. LIS 21, Amsterdam/Philadelphia: John Benjamins. Picabia, Lélia. 1978. Les constructions adjectivales en français. Systématique transformationnelle. Genève: Droz. Ranchhod, Elisabete Marques. 1990. Sintaxe dos predicados nominais com estar. Lisbon: INIC, 477 p. Sklavounou, Elsa. 1997. Etude comparée de la nominalisation d'adjectifs en grec moderne et enfranqais. Thèse de Doctorat, Université Paris 8. Vivès, Robert. 1982. Une analyse possible de certains compléments prépositionnels. Lingvisticœ Investigationes VI:1, Amsterdam/Philadelphia: John Benjamins, pp. 227-233. Zribi-Hertz, Anne. 1978. A propos d'une classe de formes réflexives métonymiques en français, Langue franqaise 39, Paris : Larousse. Summary The distribution of the subject of adjectives in French is particularly difficult to represent in a lexicon-grammar, because of the numerous restructurations of the subject. In addition, the description of subject distribution is connected with the separation of senses and the description of the complements in the adjectival sentence. Thus, it is a fundamental issue. We identify several situations where it seems possible to choose a satisfactory strategy. We discuss this organization through various examples of adjectives.
385
ÉRIC LAPORTE
386 Appendix 1
1 abordable pour ancien \bon (état) \bon (gout) \bon (résultats) \courtois Idétendu excellent (état) excellent (résultats) \ferme (chair) \ferme (ton) insouciant \jaloux \joyeux \mat \nonchalant \onctueux \pdteux Iplissé \poli \proche de Irapide \subalterne \vermiforme
+
valeur
sourire
rire
résultats en
regard
rang Loc
prix
position Loc
morphologie
forme
état
date
consistance
chair
allure (a Dét)
acoustique
Modifiers of Na not accepted; metonymical reduction ; no echo complement
+
+ + + + -
-
-
-
-
-
-
-
-
-
-
+ +
+
+ +
-
-
+
+
-
-
+
+
-
+
-
-
+ + -
-
+ + + + + +
+ -
+ -
+ + + + + +
-
-
-
-
+ +
-
-
-
-
-
-
+
-
+
-
+
-
-
-
-
+
-
+
-
-
-
-
-
+ -
-
+
beau bizarre bon (état) bon (gout) charmant courtois excellent (état) excellent (gout) \gracieux indescriptible \inhabituel \inoubliable pour [interessant pour [laid \obligeant [original \poli \proche de \relaxant \repoussant \typique de
Modifiers of Na accepted Nb être Adj W de par Dét Na
-
- - - + - - + - + + + + - - - + + - - - + + - - - + - + - - - - - - - + + + + + + + + - + + + + + + - + + + + + + + + + + + + - + + - + + -
+ + + + - + + - - - - + + - - - + - + + - - + + + + - + + + + + + + + + + - + + + + + + + + + + + + - + + + + + - + + + + + + + + + + + - + - + - + + - + - + - - + + - + + - + - + + + + + - + + + + + + + + + + + + - + + + + + - + + - + - + - - + - + + - - + - - + + - - + - + + - + - - - - - - - + + + + - - + + - + + + - + - - + + + + + - + - + + + + - + + - + - + - + + - + - + + - + - + + - - - + - - - + - - - + + - + - + - + + - - + - + - - - + + + + - + + - + + - + - - + + + + + + + + + + + + + + - - + + + + + + + + + - + + + - + + + + + + + + - - + + - + - + + + + - + - - - + + - + - - - - + - + - + - - - - + - + + - -
acoustique allure aspect attitude beauté caractère caractère Adj caractéristique chair comportement consistance couleur démarche enthousiasme esprit état expression fonctionnement forme geste gout habitude humeur jugement look manière de morphologie odeur prix regard rire site sourire tempérament valeur réd. métonymique : gout
Modifiers of Na accepted Nb être Adj W de par Dét Na
RESTRUCTURATION AND THE SUBJECT OF ADJECTIVES 387
Appendix 2
ÉRIC LAPORTE
388 Appendix 3
|
allure attitude comportement décision démarche enthousiasme examen expression fonctionnem ent geste jugement maniere de progression promenade regard ton allure caractère désir enthousiasme Npc tempérament ton Nb être Adj W de le Npc Nb être Adj W Loc le Npc
Modifiers of Na not accepted; restructuration Nb être Adj W de Nb Nb être Adj W dans Dét Nb
ardent beau [bizarre [bon (état) bronzé charmant courtois détendu excellent (état) excessif [ferme (ton) [fervent forcé frisé gracieux grandiloquent lindescriptible inhabituel insouciant jaloux joyeux laid long pour nonchalant obligeant original poli proche de rapide rouge sale \typique de
- - - - - - - - - - - + - - + - - + + + + _ _ _ _ - + + + + - - - - + + + - - . - + + + + _ . _ . + + + + + - + - + - - + - + - + - - - - + - . + - + - - - + - - - + + + + . + + + + + + + + _ _ . + + +
- + - - + _ . + + +
- - + + _ . + . - + + + - - _ +
+
+
+
+ + + - + + + + + + - + - + +
+
+
+ + + + +
+
+
+
_ _ _ -
+
+
+ + + - - - + + - - + _ - _ + _ _ _ _
+ + -
+ + + + + -
+ + - + - - - - + + + + + + - - + - - - - + - + + - + - + + +
+ - + - - + + + + + + + + + + + + + +
- + +
+
- +
+
+ -
- . + - - -
+ + +
SYNONYMIE DE MOTS ET SYNONYMIE DE PHRASES UNE APPROCHE FORMELLE 1 CHRISTIAN LECLÈRE IGM (CNRS), Marne-la-Vallée
JACQUELINE BRISBOIS-LEENHARDT Polytech Ste Geneviève, Groupe d'Orsay
Introduction On peut envisager la synonymie de toutes sortes de façons. Considérons une pre mière définition, trés générale: une séquence est synonyme d'une autre séquence quand elle peut s'y substituer sans changement de sens fondamental. Une remarque préalable s'impose concernant la formulation "sans changement de sens fonda mental": d'une part, il ne peut s'agir que d'un jugement intuitif, et, d'autre part, il a été noté depuis longtemps qu'il n'y aurait pas (ou quasiment pas) de synonymes si la synonymie étaitliéa l'idée d'une équivalence sémantique stricte (d'ailleurs très difficile a apprécier). Le terme "synonyme" sera donc compris, dans la suite de cet article, comme: "ayant un contenu sémantique similaire, aux nuances stylistiques près". De quel type de séquences est-t-il question ? A un bout de l'échelle, celui de la séquence minimale, on peut envisager des unités de sens plus petites que le mot. Dans l'exemple des trois mots: astronaute, cosmonaute, spationaute cité par J. Rey-Debove (1997:95), il serait légitime de parler de préfixes synonymes (ceci peut n'être vrai que dans le contexte -naute). Á l'autre bout de la chaine se situent les discours synonymes. Deux textes, de longueurs quelconques, peuvent véhiculer le même message (a des nuances prés). Les Exercices de style de Queneau en fournissent un bon exemple. Ces deux extrêmes, qui relèvent respectivement de la morphologie et de la stylistique, ne sont pas retenus ici. La synonymie est le plus souvent abordée a partir de l'unité de sens considérée comme la plus facile a décrire: le mot (simple ou composé). Or il est aisé de montrer que, pour toutes sortes de raisons, il s'agit la d'une unité impossible a manipuler en dehors du contexte dans lequelle elle apparaît: la synonymie ne peut être jugée que sur un critère sémantique, et le mot, la plupart du temps poly1
Nous avons une dette particulière envers Mr et Mme Pétrusa, qui ont joué un role crucial dans la constitution de la première équipe du LADL (Laboratoire d'Automatique Documentaire et Linguistique, CNRS) de Maurice Gross, a lafindes années 60.
390
CHRISTIAN LECLÈRE & JACQUELINE BRISBOIS-LEENHARDT
sémique, ne trouve son sens précis qu'au sein de la phrase dans laquelle il est employé. Considérons le mot sel. Dans son sens "propre", populaire, habituel, si tant est que Ton puisse définir ces notions, on pourrait lui trouver comme synonyme (savant): chlorure de sodium. On voit bien que, si ce synonyme peut être considéré comme satisfaisant dans un contexte comme: L'eau de mer contient du (sel + chorure de sodium) il ne Test plus dans d'autres emplois, pourtant scientifiques, de sel comme: Ce produit contient des (sels de lithium + *cholures de sodium de lithium) et pas non plus, dans des emplois ordinaires comme: Cette pizza manque de (sel + ?*chlorure de sodium) Le problème s'aggrave encore lorsque Ton sort de l'emploi "propre": sel peut faire partie de toutes sortes d'expressions ou son sens ne peut être décrit que si Ton considère d'autres éléments de la phrase auxquels il se combine. Ainsi dans: Ces hommes sont le sel de la terre Cette plaisanterie ne manque pas de sel chlorure de sodium ne constitue évidemment pas, sauf plaisanterie, un bon syno nyme de sel Dans la première phrase, sel n'a pas de synonyme clair: il est un élément indissociable du nom composé sel de la terre (dont un synonyme simple pourrait être quelque chose comme élite). Dans la deuxième, il fait partie de l'expression verbale figée ne pas manquer de sel et pourrait être remplacé par piquant (cette plaisanterie ne manque pas de piquant). Mais le cadre plus large de la séquence ne pas manquer de N ne suffit pas: avec un autre sujet que plaisan terie, on aurait une phrase acceptable: Cette pizza ne manque pas de sel dans laquelle sel ne peut plus être remplacé par piquant sans une variation impor tante de sens. Ces types de problèmes constituent le cas général (voir Balibar-Mrabti (ed.) 1997). Ils conduisent a la conclusion que, même si Ton étudie des unités simples comme le mot, la phrase constitue le cadre sémantique minimal dans lequel il est possible de travailler. Il ne s'agit pas, évidemment, d'établir un catalogue de toutes les phrases possibles dans lesquels peut figurer un mot donné, mais de disposer d'un ensemble de types de phrases possibles dans lesquelles il peut entrer, chaque type correspondant a un de ses sens, et donc a une classe de synonymes. Une telle classification existe au LADL, en particulier pour les verbes simples dont nous traiterons plus spécifiquement ici.
SYNONYMIE DE MOTS ET SYNONYMIE DE PHRASES
391
1. De la synonymie de mots à la synonymie de phrases Dans le cadre de la phrase, on peut envisager (sans prétendre être exhaustif) les types de synonymes suivants: - synonymie mot / mot: on peut constituer des listes de mots considérés comme synonymes possibles dans un même type de phrase. Par exemple, voiture, auto mobile, auto, bagnole ou, pour s'en tenir aux verbes: jeter, lancer, envoyer, balancer (les différences stylistiques ou de niveau de langue n'étant pas ici prises en compte). - synonymie mot / groupe de mots: on peut enrichir considérablement les listes en incluant des mots composés: la cité phocéenne pour Marseille, ou l'équipe de France pour les bleus, ou les tricolores. En ce qui concerne les verbes, plusieurs types de constructions complexes ont été répertoriées. L'une consiste en une combinaison de verbes-supports et de noms prédicatifs, correspondant a un verbe simple. Ce type constitue un réservoir de synonymes: Paul [a giflé] Marie Paul [a survolé] la région
Paul [a donné une gijle a] Marie Paul [a fait le survol de] la région
Des centaines de combinaisons de ce types, avec les verbes supports faire, avoir, prendre, être, etc. ont été répertoriées au LADL (cf. Vivès, 1993). - Combinaisons groupe de mots / groupe de mots: on peut encore élargir les séquences considérées comme synonymes. Un bon exemple est celui des ex pressions figées (cf. M. Gross 1982, 1988): elles sont constituées d'un nombre quelconque de mots indissociables, qui peuvent être synonymes d'un verbe simple ou d'une autre expression figée, de structure différente et composée de mots diffé rents. Dans les phrases suivantes, par exemple: Paul [est mort] Paul [a cassé sa pipe] Paul [s'est attaqué au problème] Paul [a pris le taureau par les cornes] Paul [a pris le problème à bras le corps] seul le sujet constitue un élément variable. Les séquences synonymes prédicatives casser sa pipe d'une part, prendre le taureau par les cornes, s'attaquer au problème, prendre le problème a bras le corps d'autre part, sont complexes et hétérogènes mais doivent être prises ici comme des entités uniques. Outre les problèmes de niveau de langue, d'hypo/hypéronymie, etc. qui se posent constamment lors de l'établissement des listes de synonymes, une caractéristique de ces listes est que les éléments qui les composent sont en général compris comme devant occuper les mêmes places dans la phrase (le plus souvent sans que ce soit explicite). C'est la position adoptée par les dictionnaires. On
392
CHRISTIAN LECLÈRE & JACQUELINE BRISBOIS-LEENHARDT
trouvera ainsi, comme synonymes d'acheter, des verbes simples comme acquérir, ou des expressions comme faire l'acquisition de, qui entrent dans un même schéma de phrase, c'est-a-dire où les roles thématiques sont tenus par des actants qui occupent les mêmes places syntaxiques. La synonymie est envisagée "toutes choses égales par ailleurs":2 (1) (2) (3)
Paul a acheté une voiture a Marie Paul s'estprocure une voiture auprès de Marie Paul a fait Vacquisiton d'une voiture (? a Marie)
On ne trouvera pas, par exemple, le verbe vendre dans cette liste. Or la phrase: (4)
Marie a vendu une voiture a Paul
est bien synonyme des trois autres. Pour passer de la synonymie de mots (ou groupes de mots) a l'intérieur d'une même phrase, a la notion de synonymie de phrases, il faut modifier le point de vue de départ. En effet, si l'on considère l'identité des actants {Paul, une voiture et Marie) et que l'on ne tient pas compte de leur place syntaxique, les séquences qui alternent, dans les phrases (1) et (4) cidessus, sont seulement les verbes simples acheter et vendre. C'est une synonymie de ce type qui nous intéresse ici (le point de départ de cette étude a été la recher che automatique d'informations dans un corpus, quelle que soit la façon dont elles sont formulées). Nous essaierons de définir les conditions dans lesquelles une telle extension de la notion de synonyme est possible (dans certains cas bien définis) et peut même se faire en partie automatiquement.
2. La classification syntaxique des verbes du Lexique-Grammaire Avant de montrer comment on peut l'utiliser dans le cas qui nous occupe, nous ferons un rappel très bref et très schématique du matériel disponible. Le Lexique-Grammaire constitué au LADL contient, entre autres, un classement complet des verbes simples du français (M. Gross, 1975; Boons, Guillet & Leclère, 1976a et b; Guillet & Leclère, 1992). Chaque verbe a autant d'entrées que de constructions considérées comme caractéristiques d'un de ses sens. Les constructions identiques (dites définitionnelles) sont regroupées en tables. Pour
2
Notons que, du point de vue de l'analyse de corpus, cette approche permet d'envisager la constitution semi-automatique de listes de synonymes: dans le cas d'un très gros corpus, surtout s'il est homogene thématiquement, on peut considérer que les mots (ou groupes de mots) qui apparaissent dans les mêmes contextes gauche et droite sont des synonymes potentiels (cf. Renouf 1996).
SYNONYMIE DE MOTS ET SYNONYMIE DE PHRASES
393
prendre un exemple simple, le verbe couvrir a (entre autres) trois entrées correspondant aux trois phrases suivantes: (1) (2) (3)
La tempête a couvert le toit de neige (table 37M) Ce journaliste a couvert la guerre du golfe (table 32R3) Le taureau a couvert cette vache (table 32H)
dont les constructions définitionnelles sont respectivement: 37M: N0 VN1 de N2 32R3: N0 VN1(événement) 32H: N0 V N1hum (le trait hum est ici étendu aux animaux) Chacune de ces constructions définitionnelles peut avoir des constructions dérivées, qui sont codées dans la table et ne font donc pas l'objet d'entrees autonomes, dans la mesure ou l'on estime: a) qu'il s'agit du même sens, b) que la relation entre la construction définitionnelle et sa dérivée est connue et décrite. Ainsi, la cons truction: (4)
La neige couvre le toit
est considérée comme dérivée de (1) par une double opération bien connue (pour une sous-classe des verbes de la table 37M au moins): effacement du sujet causatif et passage du complément prépositionnel en position sujet (le résultat étant une phrase ù le verbe a une interprétation "statique"). Le couvrir de (4) est donc considéré comme décrit par la table 37M et ne fait pas l'objet d'une entrée dans une autre table, comme serait le cas si la phrase avec agent actif de type (1) était inacceptable. Dans ce dernier cas, c'est la construction de type (4) qui est "définitionnelle" et le verbe figure dans la table correspondante, en l'occurrence 38L1: N0 V N1locatif. Par exemple occuper: Le tapis occupe toute la surface ?* On a occupé toute la surface d'un tapis Il est fréquent que les verbes d'une même classe sémantique se retrouvent dans la même table syntaxique. On parle alors de "classe naturelle". Par exemple, les verbes de la table 4 (étonner, surprendre, agacer, etc.) ont pu être notés "verbes psychologiques" et les verbes qui décrivent l'incarcération de quelqu'un, comme incarcérer, emprisonner, embastiller, etc., constituent une sous-classe a l'intérieur de la table 38LH. Ces classes ou sous-classes naturelles constituent potentiellement des classes de synonymes au sens classique du terme: l'environnement syntaxique est le même par définition. Mais un certain nombre de verbes que l'on pourrait considérer comme syno nymes, et comme tels regroupés dans une même classe dans le répertoire des synonymes (fait manuellement), ont des constructions syntaxiques différentes (et donc appartiennent a des tables différentes dans le Lexique-Grammaire). Le fait de considérer deux prédicats comme synonymes implique:
394
CHRISTIAN LECLÈRE & JACQUELINE BRISBOIS-LEENHARDT
- qu'ils mettent (ou puissent mettre) en jeu les mêmes actants (au moins en partie). C'est-a-dire qu'on doit pouvoir clairement identifier, dans chacune des phrases comparées, où se trouvent les différents actants communs (et éventuellement ceux qui sont absents); - qu'ils décrivent le même type de procès, c'est-a-dire que la relation entre les actants décrite par la phrase est, au moins en partie, la même (ou très comparable). Autrement dit, la notion de phrases synonymes, telle que nous l'envisageons ici, n'est pas subordonnée a une parenté de construction syntaxique. Pour prendre un exemple simple, les verbes fournir et alimenter peuvent être décrits comme syno nymes dans le cas de phrases comme: Paul fournit des informations a l'armee Paul alimente l'armee en informations Il faut pour cela avoir clairement indiqué que ce que donne Paul apparaït en position objet direct avec fournir et en position de complément prépositionnel avec alimenter (et vice versa pour le bénéficiaire des informations). Les différentes classes syntaxiques décrivant les verbes "locatifs" du français dans le Lexique-Grammaire permettent cette mise en correspondance syntaxique des différents rôles thématiques, et ceci de façon automatique. 3. Un exemple: le système locatif3 3.1. Codes syntaxiques et distribution des rôles thématiques Une vingtaine de tables du Lexique-Grammaire groupent des verbes impliquant la localisation d'un objet (ou 'argument' du lieu) en déplacement par rapport a un lieu (ou deux). Par principe, le lieu ici considéré est 'non scénique', c'est-a-dire qu'il ne s'agit pas de l'endroit où se déroule l'ensemble du procès, comme dans Paul travaille dans son bureau. Les compléments 'scéniques' ne sont pas considérés comme compléments du seul verbe et ne sont donc pas retenus pour la classi fication. L'ensemble des verbes locatifs est intégré dans un système général a l'intérieur duquel les actants, quel que soit le verbe, recoivent des étiquettes "sémantiques" définies (formellement) de la même manière. Ces étiquettes sont aux nombre de quatre: - agent (Nag) - argument du lieu (Narg) (i.e. l'objet "situé" par rapport au lieu) - lieu source (Nsource) - lieu destination (Ndest) 3
Cette partie a fait l'objet d'une communication au colloque "Lexiques et Grammaires Comparés" de Louvain-la-Neuve en 1997 (cf. Leclère 1999).
SYNONYMIE DE MOTS ET SYNONYMIE DE PHRASES
395
Il est important de souligner que la notion de lieu est, dans cette description, indépendante de la notion traditionnelle de complément "circonstanciel" de lieu. Le substantif noté "lieu" peut être en position sujet ou objet direct, comme c'est le cas respectivement dans: Les troupes envahissent la ville(Ndest) La machine(Nsource) projette de la vapeur Les classes syntaxiques (tables du LADL) sont différenciées, on dit, par le fait que les actants portant les mêmes étiquettes n'apparaissent pas aux mêmes places dans les phrases, selon le verbe concerné. Ce qui nous intéresse ici est que le code attribué au verbe (i.e. le code de la table dans laquelle il figure) traduit automatiquement la position respective des actants (ou, si l'on préfère, la position syntaxique des différents rôles thématiques autour du verbe). Le tableau 1 donne les différentes positions syntaxiques possibles de ces rôles thématiques, et le code de la table correspondante (c'est a dire la table du Lexique-Grammaire définie par cette configuration). Lieu Destination
Lieu Source Sujet
COD Prép. Sujet
COD Prép.
Arg. Sujet
-
38Lls
35Ls
-
38Lld
35Ld
Arg. COD
38L0s
-
38LS
38L0d
-
38LD
Arg. C. Prép.
34L0s
37E
-
34L0d
37M
-
Tableau 1: Répartition des tables en fonction de la position des rôles thématiques Les exemples ci-dessous correspondent a chacun des cas du tableau 1. Ils sont précédés du code de la table concernée et de la construction qui la définit {Loc = préposition locative): 38Lls 35Ls 38Lld 35Ld 38L0s 38LS 38LD 38L0d 34L0s 37E 34L0d 37M
N0arg V N1source N0arg V Loc N1source N0arg V N1dest N0arg V Loc N1dest N0source V N1arg N0ag V N1arg Loc Nsource N0ag V N1arg Loc Ndest Nodest V N1arg Nosource V deN\arg Noag V N1source de N2arg Nodest V de N\arg Noag V N1dest de N2arg
Paul quitte la pièce La fumée sort de la pièce La fumée envahit la pièce La bille entre dans le trou Le volcan crache de la lave Paul arrache le clou du mur Paul pose la vis sur la table L'éponge absorbe le vin Le toit dégouline d'eau Paul débarasse le grenier des malles La planche se couvre de poussière Paul recouvre le lit d'un drap
396
CHRISTIAN LECLÈRE & JACQUELINE BRISBOIS-LEENHARDT
Lorsque le code de la table contient une minuscule (s ou d), il s'agit en fait d'une sous-table. Par exemple, la table 38L regroupe les verbes transitifs a double complément prépositionnel locatif, source ET destination, comme basculer dans l'emploi: Paul bascule Venclume du balcon dans la cour. Pour des raisons pra tiques, nous avons ici distingué les deux compléments en divisant la table en 38Ls (pour le complément "source") et 38Ld (pour le complément "destination"). Les tables 38LS et 38LD (avec S et D en majuscule) existent par ailleurs pour les verbes qui n'ont qu'un seul complément locatif, source OU destination, comme arracher et poser respectivement. D'autre part, nous n'avons pas fait figurer ici certaines tables dont la définition comprend, en plus des critères concernant la localisation, des spécifications distributionnelles supplémentaires: - table 2 des verbes de mouvement. Il s'agit d'un cas particulier de la construction de type 35L, ou le locatif alterne avec un complétive: Paul court au bistro, Paul court boire un coup; - table 36SL des symétriques locatifs: le lieu et son argument peuvent être "symétriques". Dans ce cas, la préposition locative alterne avec la conjonction et: Paul encastre le tenon (dans + et) la mortaise; - table 38LH, qui regroupe les constructions ou l'argument du lieu, en position objet direct, est obligatoirement un Nhumain: 38LHs N0ag V N1arg(hum) Loc N2source On a extradé Paul (Narg) de France (Nsource) 38LHd Noag V N1arg(hum) Loc N2dest On a interné Luc(Narg) dans un asile(Ndest) L'ensemble de cette classification des locatifs concerne environ 2500 verbes (ou plus précisément 2500 emplois verbaux considérés comme distincts). Chaque emploi verbal correspondant a un sens locatif autonome est doté d'un code qui indique: - sa construction de base; - la position syntaxique des rôles thématiques dans cette construction. Cette description unifiante permet de mettre en relation de synonymie (au sens de "synonymie de phrases"), n'importe quels verbes du système locatif. Par exemple basculer et tomber dans des emplois comme: (1) (2)
Paul bascule le piano du grenier dans la cour (38L) Le piano tombe dans la cour (35Ld)
La correspondance entre l'objet direct de (1) et le sujet de (2) d'une part, entre le complément prépositionnel de (1) et l'objet direct de (2) d'autre part, sont déduc tibles automatiquement du code de table attaché aux verbes basculer (38L) et tomber (35L). Comme on le voit ici, le marquage permet de traiter des synonymies partielles (dans les deux exemples ci-dessus, les deux verbes ne sont synonymes que pour ce qui concerne le mouvement du piano vers un lieu destination (l'agent
SYNONYMIE DE MOTS ET SYNONYMIE DE PHRASES
3 97
et le lieu source sont absents en (2), qui est déductible du code 35Ld). Le point important est que cette relation sera la même pour TOUS les couples de verbes marqués 38L/35Ld, puisque les roles thématiques des actants ont par définition des places constantes dans la construction qui définit une table. 3.2. Constructions dérivées et tables fictives Les exemples ci-dessus concernent des constructions définitionnelles de tables. Il va de soi que les phrases rencontrées dans les textes sont souvent des phrases déri vées de ces constructions (sous-structures ou résultats de transformations). Ces dérivées, on dit, font l'objet d'un codage en colonnes dans les tables. Leurs constructions peuvent donc être intégrées dans notre système général. Reprenons le cas de basculer (38L) évoqué plus haut. La phrase: Le piano bascule dans la cour ne correspond pas a la construction définitionnelle du verbe. Mais la table 38L contient une colonne (N1 V) spécifiant que l'objet direct peut passer en position sujet: (1) (2) (3)
On a basculé le piano du grenier dans la cour (construction défini tionnelle 38L) Le piano a basculé du grenier dans la cour (transformation → 35L) Le piano a basculé dans la cour (effacement du lieu source → 35Ld)
(L'importante question des effacements possibles ou non n'est pas développée ici). Dans la table, le déplacement de l'objet direct en position sujet est marqué explicitement dans la mesure ou l'intitulé de la colonne conserve a l'actant déplacé son numéro d'origine (celui de la construction définitionnelle). Les autres actants conservent eux aussi leur numéro d'origine. La structure définitionnelle de la table 38L étant: () N0ag V N1arg Loc N2source Loc N3dest la phrase Le piano bascule dans la cour, issue de la colonne N1 V Loc N3 est donc "traduite" automatiquement, du point du vue du rôle respectif des actants, en: (3')
Narg V Loc Ndest
Cette structure est celle qui définit la table 35Ld. Nous considérons que le verbe basculer appartient, pour sa sous-structure, à la classe 35Ld et nous lui attribuons ce code, en plus de son code définitionnel 38L. Cette attribution d'un code de table fictif a tous les emplois dérivés locatifs peut concerner des verbes dont la construction définitionnelle ne comporte pas de localisation. La possibilité pour ces verbes d'avoir une construction locative n'est
398
CHRISTIAN LECLÈRE & JACQUELINE BWSBOIS-LEENHARDT
qu'une éventualité qui figure en colonne dans la table. Prenons le verbe construire: il a été classé dans la table 32A, défïnie par le fait que l'objet direct "apparaït" au cours du procès: Paul construit une table / une maison Le complément de lieu éventuel n'a pas été considéré comme définitionnel de verbe, mais la possibilité de sa présence est notée en colonne dans la table 32A: Paul construit une maison sur la colline (colonne N0 V N1 Loc N2dest) Cette phrase peut être décrite comme un emploi 38LD du verbe, auquel on attribuera donc ce code. Dernier exemple: tituber est classé en 31H (verbes a sujet humain sans complément). Certains verbes de cette table peuvent avoir un complément directionnel (qu'on peut assimiler a une destination) et donc être intégrés au système locatif avec l'étiquette correspondant a l'emploi 35Ld: Paul titube vers la cuisine Cette procédure permet de faire entrer dans le système général locatif toutes les constructions locatives "secondaires" figurant en colonne dans des tables non loca tives. Il est nécessaire pour cela de: - sélectionner toutes les colonnes pertinentes (ici, toutes les colonnes impliquant une localisation) dans la totalité des tables. Ce travail ne peut être effectué qu'à la main; - attribuer le code de table fictif correspondant a la construction décrite par cette colonne (c'est-a-dire le code de la table dans laquelle figurerait le verbe si la cons truction dérivée était une construction définitionnelle); - faire entrer dans l'index général des verbes toutes les nouvelles attributions de codes. Toute construction dérivée sélectionnée se verra ainsi attribuer une "définition" syntaxique (structure, place des actants) qui lui permettra d'entrer dans le système général et de devenir comparable a n'importe quelle autre construction locative, qu'elle soit définitionnelle ou dérivée elle aussi.
4. Constitution des classes de synonymes en fonction des codes de tables Toute la classification syntaxique des emplois locatifs de verbes décrite ci-dessus aboutit finalement a un vaste index ou chaque emploi (i.e. "sens") d'un verbe s'est vu attribuer autant de codes que de types de phrases dans lesquelles on peut s'attendre a le voir apparaïtre dans les textes. Chacun de ces codes, répétons-le, traduit automatiquement la répartition des roles sémantiques dans la construction syntaxique concernée.
SYNONYMIE DE MOTS ET SYNONYMIE DE PHRASES
399
Dans la mesure où les substantifs présents dans la phrase sont les mêmes, cet index permet d'associer dans une même classe de synonymes des verbes ayant des constructions hétérogènes. Considérons: (1) (2) (3)
Le président s'est rendu a Paris Le président a regagné Paris Paris a accueilli le Président
Les structures superficielles de ces phrases sont respectivement: (l') N0 V Prép N1 (2') N0 V N1 (3') N0V N1 Les verbes se rendre, regagner et accueillir ont (entre autres) pour code, dans l'index, 35Ld, 38L1 et 38L0 (respectivement), qui correspondent a ces structures. Ces codes permettent d'attribuer aux substantifs les roles qui leur correspondent, en l'occurrence: (1") N0arg V Loc N1dest (2") N0arg V N1dest (3") N0dest V N1arg Il est donc possible d'intégrer les trois verbes dans une même classe de synonymes, a condition de leur associer le code de table qui donne la configu ration syntaxique et distributionnelle pour laquelle ils sont synonymes: se rendre 35L, regagner 38L1, accueillir 38L0. Ces verbes peuvent avoir par ailleurs d'autres emplois, marqués par d'autres codes, pour lesquels ils ne sont pas syno nymes. Par exemple, se rendre 33 correspond a l'emploi: Paul s'est rendu a Vennemi qui n'a rien a voir avec sa construction locative. Ce dernier emploi pourra figurer dans une autre classe de synonymes, celle par exemple de capituler 35R (Paul a capitulé devant l'ennemi). Reste que, si l'attribution des différents codes aux emplois verbaux est automatique a partir des tables du lexique-grammaire, la constitution des listes de syno nymes, elle, ne peut se faire que manuellement. Certaines régularités sémantiques inter-tables permettent, cependant, de rendre une partie de la tache semi-automatique. Pour reprendre un exemple déjà cité, de nombreux verbes codés principalement 38L, comme basculer, ont un emploi secondaire (dérivé) de type 35L: Paul bascule Venclume du balcon dans la cour (38L) L'enclume bascule dans la cour (35L) Ces sous-emplois 35L vont souvent être synonymes de verbes dont 35L est le code principal (par exemple, ici: tomber, chuter, choir).
400
CHRISTIAN LECLÈRE & JACQUELINE BRISBOIS-LEENHARDT
4.1. Extensions auxprédicats complexes Les observations précédentes concement les verbes simples. Rien n'interdit de prévoir l'extension du système de codage aux cas des prédicats complexes évoqués plus haut, comme les combinaisons de verbes-supports et de noms prédicatifs, ou les verbes complexes figés. Ainsi, on pourrait attribuer le code 38LHd (celui des verbes simples incarcérer ou emprisonner, par exemple) a des expressions équivalentes comme jeter en prison, mettre sous les verrous, etc. Il faut pour cela décrire ces expressions comme des entités verbales uniques, autour desquelles les roles thématiques s'organisent de la même manière que pour les verbes simples. Ainsi, la construction de mettre sous les verrous ne s'écrira pas, comme le suggère la structure superficielle: Nag V Narg Loc Ndest Paul [met]v Luc sous les verrous (c'est-a-dire comme un cas particulier du verbe mettre), mais: Nag [mettre sous les verrous]v Narg Paul [met sous les verrous]v Luc 4 Les expressions verbales complexes de ce type, très nombreuses, sont déjà répertoriées dans le Lexique-Grammaire du LADL, avec un code correspondant a leur construction syntaxique. 4.2. Extension a d'autres systèmes que les locatifs La mise en correspondance des différentes constructions et des codes qui leur sont associés n'est possible qu'à rintérieur d'un système ou les roles thématiques des différents substantifs (et leur place syntaxique) sont clairement définis, comme c'est le cas dans notre système locatif. La procédure peut être étendue a d'autres groupes présentant une homogénéité sémantique, comme les datifs (bénéfactifs ou privatifs) par exemple. Les verbes datifs mettent en jeu, en effet, des actants dont les rôles dans la phrase sont très comparables a ceux des phrases locatives (a cette nuance près que le "lieu" est un substantif humain). Syntaxiquement, les deux systèmes sont parallèles et certains verbes appartiennent aux deux: Paul vole un sac a Jean (datif privatif) Paul vole un sac dans le bureau (locatif source) Paul distribue les papiers aux enfants (datif bénéfactif) Paul distribue les papiers dans les boites (locatif destination) 4
La possibilité d'avoir l'ordre des mots: Paul met Luc sous les verrous, ou l'argument du lieu vient s'insérer dans l'expression verbale, pose évidemment un problème supplementaire pour l'analyse automatique.
SYNONYMIE DE MOTS ET SYNONYMIE DE PHRASES
401
Ce type d'extension est envisageable pour d'autres classes dont les verbes impliquent les mêmes types d'actants.
5. Conclusions au-delà de la synonymie Les relations de synonymie entre phrases peuvent être plus ou moins précises et plus ou moins complètes, selon le type de parenté sémantique que l'on recherche. On a vu par exemple qu'on peut avoir une synonymie partielle entre deux phrases dont Tune contient un sujet causatif et l'autre pas. Les deux phrases: Paul a basculé l'enclume dans la cour L'enclurne est tombée dans la cour sont synomymes en ce qui concerne la "localisation" de l'enclume, mais évidemment pas en ce qui concerne le rôle de Paul. Du point de vue d'une recherche d'informations dans un corpus, on peut imaginer des cas ou TOUTES les constructions locatives pourraient être a priori retenues pour répondre a certaines questions (en langage naturel) du type: Quels endroits ont été touchés par un cyclone en 1994 ? A condition d'avoir constitué une liste de substantifs "synonymes" contenant non seulement cyclone, typhon, mais aussi les noms des cyclones de 1994: Colina, Geralda, Hollanda, etc. , on pourra lancer une recherche sur toutes les phrases contenant un verbe locatif dans un corpus contenant l'année 1994 d'un quotidien. Les phrases suivantes, susceptibles d'apparaïtre dans un tel corpus, contiennent une réponse (nous les faisons suivre du code syntaxique correspondant a l'emploi du verbe): Le cyclone s'est abattu sur Tananarive (s'abattre: 35L) La dépression a détourné Hollanda vers l'île Maurice (détourner: 38LD) Plusieurs typhons ont balayé la Polynésie (balayer: 38L1) Geralda a quitté Madagascar {quitter: 38Lls) Les seules phrases retenues ici par le système sont celles ou un substantif de la classe "cyclone" figure dans la position syntaxique correspondant a Narg. Cette position est déductible du code de chaque verbe, lui même lié a la structure de la phrase: - sujet pour s'abattre (35L), balayer (38L1), quitter (38L1); - complément d'objet direct pour détourner (38LD). Les codes permettent alors de savoir automatiquement, pour chacune des phrases, dans quelle position syntaxique se trouve le lieu, qui constitue une réponse a la question:
402
CHRISTIAN LECLÈRE & JACQUELINE BRISBOIS-LEENHARDT
- complément prépositionnel pour s'abattre 35L et détourner 38LD (donc réponse: Tananarive et l'île Maurice); - complément d'objet direct pour balayer 38L1 et quitter 38L1 (donc réponse: la Polynésie et Madagascar). Il manque évidemment toutes les réponses figurant dans des phrases dont le verbe n'a pas été codé comme locatif dans l'index. Par exemple: Colina a ravagé Tahiti. Le dispositif ici schématisé est tout théorique. Nous n'avons pas la naïveté de croire que les phrases d'un corpus se présentent de façon aussi schématique. Il convient donc de terminer sur une note prudente, voire pessimiste. Le système de recherche, comparaison et codage des constructions verbales décrit ici concerne des phrases théoriques élémentaires. Si Ton envisage d'utiliser les classes de phrases synonymes ainsi établies pour une recherche documentaire, plusieurs problèmes vont se poser qui sont loin d'avoir encore trouvé des réponses satisfaisantes en analyse automatique du langage naturel. Il faudrait notamment: - disposer d'une description syntaxique satisfaisante de toutes les phrases du corpus; - distinguer les compléments "essentiels" des compléments circonstanciels ou adverbiaux (ce qui est particulièrement difficile dans le cas des compléments locatifs); - tenir compte des expressions figées, des métaphores et autres fantaisies stylistiques. Dans le cas de la question ci-dessus, par exemple, Washington pourrait être retenu comme réponse si l'on avait trouvé dans le corpus une phrase comme: Washington est dans l'œil du cyclone; - éliminer les ambiguïtés de toutes sortes. Andrew est certes le nom d'un cyclone, mais dans Andrew est arrivé aux Malouines, il peut s'agir du prince britannique; - savoir attribuer aux pronoms leur référent correct, et, plus généralement, tenir compte des informations qui relève du discours et non de la phrase simple; - etc. Même si ces problèmes étaient résolus, on peut s'attendre à ce que la recherche automatique d'informations dans un corpus comporte toujours des lacunes et des réponses parasites. Il ne s'agissait ici que de tenter de dégager quelques pistes de recherche, peut-être prometteuses.
SYNONYMIE DE MOTS ET SYNONYMIE DE PHRASES
403
Références Balibar-Mrabti, Antoinette (ed.). 1997. La synonymie, Langage 128. Paris: Larousse. Boons, Jean-Paul; Alain Guillet; Christian Leclère. 1976a. La stucture des phrases simples en frangais. 1: Constructions intransitives, Genève: Droz. Boons, Jean-Paul; Alain Guillet; Christian Leclère. 1976b. La stucture des phrases simples en frangais: Classes de constructions transitives. Rapport de Recherche du LADL n° 6, Paris: LADL, Université Paris 7. Guillet, Alain; Christian Leclère. 1992. La stucture des phrases simples en fran qais. 2: Les constructions transitives locatives, Genève: Droz. Gross, Maurice. 1975. Méthodes en syntaxe, Paris: Hermann. Gross, Maurice. 1982. Une classification des phrases figées du français. Revue Québécoise de Linguistique 11:2, Montréal: Presses de l'UQAM, p. 151-185. Gross, Maurice. 1988. Sur les phrases figées complexes du français. Longue Frangaise 11, Paris: Larousse, p. 47-70. Leclère, Christian. 1999. Une approche syntaxique de la synonymie. In J. Klein, B. Lamiroy et J.-M. Pierret (eds.), Théorie linguistique et applications informatiques, Actes du 16e Colloque européen sur la grammaire et le lexique comparés (Louvain, 24-27 sept. 1997), Cahiers de Vlnstitut de Linguistique de Louvain Vol. II, Louvain-la-Neuve. Renouf, Antoinette. 1996. Les Nyms: en quête du thésaurus des textes, Lingvisticœ Investigationes XX:1, Amsterdam/Philadelphia: John Benjamins, p. 145165 Rey-Debove, Josette. 1997. La synonymie ou les échanges de signes comme fon dement de la sémantique. Langages 128, Paris: Larousse, p. 91-104. Vivès, Robert. 1993. La prédication nominale et l'analyse par verbes supports, L'information grammaticale 59, Paris: Bibliothèque de l'information gramma ticale, p. 8-14.
Summary Classes of synonyms are typically established according to the criterion that the rest of the sentence in which they can alternate remains the same; that is, the structure does not change and the various elements remain in the same place. This approach recognises the synonymy between, for example, accueillir and recevoir: Londres accueille/regoit le Premier ministre frangais (London welcomes/receives the French Prime Minister) but not between these verbs and se rendre, in spite of the fact that the sentence: Le Premier ministre frangais s'est rendu a Londres (The French Prime Minister went to London)
404
CHRISTIAN LECLÈRE & JACQUELINE BRISBOIS-LEENHARDT
contains almost the same information (the elements being the same, but their syntactic position having changed). To extend the notion of synonymy to allow for this syntactic variability, it is necessary to know, for each verb construction, the different positions that the associated nouns may occupy, and their respective semantic roles. The exhaustive syntactic classification of verbs established at LADL makes such an approach possible.
LES AVENTURES DE MAX ET ÈVE, J'AI AIMÉ
À PROPOS D'UN C.O.D. « CANADA DRY » DANIELLE LEEMAN Université de Paris X-Nanterre, U.M.R. 5610 In French, unlike English, Topicalisation does not normally apply to NPs: (101) a. This book, I have read b. * Celivre,J'ai lu (M.A.Jones 1996:33)
Les nombreux recueils qui existent sur l'accord du participe passé en français ne signalent pas un type d'exemple qui cependant mériterait quelque commentaire en appendice a la règie qui veut que le participe passé conjugué avec avoir s'accorde avec le complément d'objet direct si celui-ci est placé avant: (1)
La tarte, j'ai aimé
Si Ton suit les propositions de M. Wilmet dans son récent Le Participe passé autrement, on pose la question Qu 'est-ce qui est aimé ? pour trouver le support qui décide de l'accord; la réponse est ici la tarte, ce qui conduit à écrire * La tarte, j'ai aimée, puisqu'on n'est pas dans l'un des cas ou l'accord est susceptible d'être « bloqué »: il ne peut s'agir d'une ellipse de en {Les cerises, j'en ai mangé) car un tel pronom ne pourrait pas en l'occurrence être restitué (* La tarte, j'en ai aimé); ni de l'effacement d'un infinitif qui serait le véritable objet (Manger la tarte, j'ai aimé), car la construction concerne aussi des verbes qui ne sont pas susceptibles de régir un infinitif (Les États-Unis, tu as visité ?); ni de la suppression d'un pronom démonstratif postposé auquel la tarte serait en apposition (La tarte, j'ai aimé ç), sa restitution dans une phrase source n'étant pas non plus toujours admissible (Stroheim dans « La Grande Illusion », j'ai adoré vs *J'ai adoré ç).1
1
Cette formulation serait possible à condition de ne pas interpréter ç comme la reprise directe de Stroheim, ce qui change le sens par rapport à la phrase de départ (P. Cadiot 1988).
406
DANIELLE LEEMAN
1. Dislocation et topicalisation Le groupe antéposé la tarte en (1) paraît donc bien être le complément d'objet direct du verbe aimer, ce que corrobore le test des propriétés habituellement avancées pour définircconstituant (M. Gross 1969), ici toutes représentées: (2)
a. b. c. d. e.
La tarte, je l 'ai aimée La tarte quej 'ai aimée Qu 'est-ce que tu as aimé ? - La tarte 'est la tarte quej 'ai aimée La tarte a été aimée
On aurait done affaire avec (1) a une topicalisation, définie comme le déplacement frontal d'un complément régi sans reprise pronominale (M. A. Jones 1996: 33). La topicalisation se distingue de la dislocation en ce que cette dernière ou bien suppose auprès du verbe un clitique en relation de coréférence avec le cons tituant déplacé (2a), ou bien concerne un element qui n'est pas régi par le verbe; dans ce dernier cas, on peut distinguer deux sous-types (M. Blasco-Dulbecco 1999:115 sqq.): soit on a un clitique reprenant element frontal (3), soit le clitique n'est pas coréférent du groupe (4a) et il peut ne pas avoir de clitique (4b) - ces exemples sont puisés dans le corpus attesté de M. Blasco-Dulbecco {pp. cit): (3) (4)
Pour lesfigues ilfaut les laver et les essuyer a. b.
La mairie ils ont dit d'attendre Les nuits a quatre hemes de sommeil, moi je u plus
Dans (1) au contraire, la tarte, ayant toutes les propriétés du complément d'objet direct, est un constituant régi par le verbe: le GN peut donc être dit «topicalisé » (et non « disloqué »). Dans ce cas, l'absence d'accord du participe passé serait a imputer au déplacement frontal ou a un illogisme dans l'orthograplie du fran9ais.2
2. Doutes sur l'analyse Toutefois, certaines grammaires citent des cas de compléments d'objet déplacés mais - lorsque le verbe est a un temps composé - ou le participe passé est accordé: (5)
2
a. Trois enfants, j 'ai eus (Wagner et Pinchon) b. Ma chemise, j'aurais donnée pour en être (Grevisse) Bien des ennuis, il avait eus (Grevisse)
En (1) en effet, la tarte ne change pas d'interpretation selon qu'il se trouve après le verbe ou avant la phrase, et la conséquence thématisante du déplacement n'empêche pas l'accord en (2a).
UN C.O.D. « CANADA DRY »
407
Si l'on admet comme valides aussi bien la règie de l'accord traditionnellement enseignée que l'intuition qui me fait écrire La tarte, j'ai airné (et non j'ai aimée), émerge la possibilité que trois enfants, ma chemise ou bien des ennuis mais non la tarte sont a analyser comme des compléments d'objet. De fait, les énoncés (1) et (5) ne sont pas sur le même plan: different d'une part la valeur de la virgule et 1'intonation, d'autre part les contraintes distributionnelles et syntaxiques. Ainsi, une phrase telle que (1) permet par exemple une commutation de la virgule avec deux points ou un point d'interrogation, qui n'est pas le cas de (5): (6)
a. La tarte ? J'ai aimé b. * Trois enfants ? J'ai eus c. *Ma chemise ? J'aurais donnée pour en être d. *Bien des malheurs ? Il avait eus
A Poral (F. Sabio citée in C. Blanche-Benveniste 1996:114), Pintonation attribuée a (1) serait semblable a celle de En ce qui concerne la tarte, je réponds que je l'ai aimee (7a), tandis que (5a) ou (5b) supposent une insistance sur le groupe nominal, comme si Pon disait jusqu'à trois enfants, jusqu'a ma chemise, et (5c) un accent sur le déterminant (sur le ton de ah la la ! si tu savais..., ce que schéma tise grossièrement (7b): (7) (7)
a. b.
(1) est plutôt informatif (je dis ce que je pense de la tarte) alors que les énoncés (5) relèvent davantage de Pexclamation (j'attire Pattention sur le caractère exceptionnel d'un référent, remarquable par son identité ou sa qualité). La phrase (7c) effectivement entendue selon le modèle (7b): Lui, 'est le vrai français, qu'il parle - peut aussi se dire sur le modèle (7a): Le vrai frangais, il le parle: (7)
c.
Le vrai frangais, il parle
La différence de déterminant entre (1) et (5) n'est pas non plus fortuite; s'il est possible formellement de remplacer en (1) le défïni par le numéral, le résultat obtenu est en réalité différent; dire: (8)
a.
Trois tartes, j'ai aimé
ne suppose pas le schéma intonatif de (1) - figuré en (7a) - mais celui de (5) figuré en (7b) - ou celui que l'on adopterait pour une rectification, à la manière de Ce sont trois tartes que j'ai aimées (et non deux); on ne pourrait pas non plus dire sur le modèle de (1) tel qu'énoncé en (7a): (8)
b. Une tarte, j 'ai aimé . Bien des tartes, j 'ai aimé
408
DANIELLE LEEMAN
La relation instituée entre le groupe nominal frontal et le reste de la phrase apparaït aussi différente par le fait que si (1) se prête aux modalités négative et interrogative par exemple, ce n'est guère le cas pour (5): (9)
a. La tarte, j'ai pas aimé b. * Trois enfants, j'ai pas eus
Il est certes possible d'écrire (10b) Trois enfants, tu as eus ? mais la question ne suppose pas la même intonation que (10a) La tarte, tu as aimé ?; dans le premier cas (10b), il s'agit d'une demande de confirmation - il en irait de même pour (5b) et (5c) formulés sur le mode interrogatif -, dans le second (10a) d'une vraie question: (10) a. b.
La tarte, tu as aimé ? Trois enfants, tu as eus ?
Le regroupement par M. Grevisse (1993:456), pour illustrer le placement en tête du complément d'objet sans reprise pronominale, d'exemples ù l'n trouve aussi bien (5) que, entre autres: (11) a. b.
Et ça, je ne veux pas La politique, ils connaissent
rassemble donc en fait des phrases qui n'ont pas la même analyse, (11a) et (11b) relevant du type (1) et non du type (5).
3. Conséquences de l'observation Si le type (5) illustre le cas du déplacement (sans reprise) d'un complément d'objet, donc d'une topicalisation, le type (1) est différent puisque la tarte n'est pas C.O.D. Le verbe étant transitif d'une part, et en l'absence de reprise prono minale, dond de clitique dans la position objet d'autre part, la première consé quence attendue est qu'une place est laissée vide que devrait pouvoir occuper un complément d'objet. De fait, la chose est syntaxiquement possible mais seulement par le biais d'une anaphore, soit (pronominale ou lexicale) coréférentielle, soit (lexicale) associative,cqu'illustrent respectivement (12),(13),(14) et (15): (12) a. b. c. d.
3
Une cascade avec la quattro, tu oublies3 (ça) Les déportations, il a pas accepté (ça) Les films de cul, il a toujours détesté (ça) Les sauts a l 'élastique, t 'as essayé (ça) ?
Publicité (orale) pour les voitures Audi passée a la télévision au mois de janvier 2000.
UN C.O.D. « CANADA DRY »
(13) a. b. c. d. (14) a. b. (15) a. b. e. d.
409
La faim, t'as pas connu/tu l'as pas connue Sa réaction, j 'ai pas compris /je l'ai pas comprise Cet article, il faut quej 'abrège / que je l 'abrège La compétition, j'ai laissé tomber /je l'ai laissée tomber Paul, tu apprécies (cet imbécile) ?4 Le football, je déteste (ce sport) Le rendez-vous, j 'ai oublié (l'heure) Le traitement, il a pas supporté (les effets secondaires) La tarte, j 'ai juste goûté (un bout) L 'huile, t'as vérifié (le niveau) ?
Le groupe frontal contraint donc le choix du complément d'objet: il « cadre »le propos, restreignant les possibilités distributionnelles pour l'argument du verbe. La deuxième conséquence de l'analyse qui précède, 'est que si la tarte n'est pas complément d'objet en (1), il faut en trouver la fonction. On peut admettre, dans la continuité des ellipses énumérées en introduction, un effacement d'une « formule de détachement » (M. Riegel et alii 1994:430) ou plus exactement d'un « focalisateur » (M. Wilmet 1998:538): pour, quant à, au sujet de, en ce qui concerne, ce qui conduit a ranger la construction (1) - qui n'est pas une topicalisation, on l' vu - dans les dislocations, et plus précisément dans le deuxième sous-type distingué par M. Blasco-Dulbecco (pp. cit.) illustré en (4b) ci-dessus. Les GN tels que la tarte en (1) sont donc analysables comme des compléments circonstanciels qu'on pourrait dire « de point de vue », car ils établissent un «espace discursif» (J.-C. Anscombre 1989) qui donne a interpréter l'énoncé a partir non seulement d'un «theme », mais encore d'un thème a valeur « polyphonique » en tant qu'il met en scène un énonciateur par rapport auquel se situe le locuteur (J.-C. Anscombre op. cit.: 82); (1) s'oppose ainsi a (5) par les enchaïnements qu'ils peuvent constituer (je remercie Boris Ryczek de m'avoir fourni cette donnée): (16) a. b. d.
Et la tarte ? - La tarte, j'ai aimé * Et trois enfants ? - Trois enfants, j'ai eus * Et ta chemise ? - Ma chemise, j 'aurais donnée *Et bien des ennuis ? - Bien des ennuis, il a eus
On remarquera que dans l'énoncé (1) de la sorte remis dans son contexte, la tarte n'a plus les propriétés typiques (2b) ou (2c) du C.O.D.: (17) a. * Et la tarte ? - La tarte quej 'ai aimée était aux cerises b. ?? Et la tarte ? - 'est la tarte quej 'ai aimée5 4 5
Exemple forgé a partir de P. Hirschbühler (1974:9). (17b) est possible mais en un sens différent de (2c), lequel peut être compris soit comme 'est la tarte (et non le gateau) que j'ai aimée, soit comme Voici la tarte que j 'ai aimée. On peut admettre (17b) dans un contexte argumentatif tel que Justement, puisque tu me paries de la tarte,
410
DANIELLE LEEMAN
Le fait que la réponse pourrait être constituée de (2a): Et la tarte? - La tarte, je l'ai aimée ne signifïe pas que (1) et (2a) soient des dislocations équivalentes; la différence sémantique apparaït clairement lorsque l'on fait varier les paradigmes; ainsi, Corneille n'a-t-il pas le même statut selon que l'on dit (A. Kihm 1988:58): (18) a. b.
Corneille, je connais Corneille, je le connais
ni Max dans: (18) c. Max, j'ai aimé d. Max, je l'ai aimé (dans le premier cas, j'ai aimé une prestation de Max, dans le second, il s'agit de sa personne même). Il n'est donc pas étonnant que le participe passé ne s'accorde pas en (1), la tarte n'étant pas un complément d'objet direct.
4. Conclusion L'analyse menée ci-dessus me parait montrer trois choses: d'une part, la relativité de la pertinence des propriétés syntaxiques généralement avancées pour caractériser une position, surtout si elles sont testées sur un énoncé censé être saisi hors contexte6 - cf. (2) vs (17) -, ainsi que M. Gross l'avait déja pointé dans son article de 1969 (op. cit.); d'autre part la nécessité de prendre en compte la langue orale aussi bien dans les tests (l'intonation a ici permis de séparer des manipulations donnant sur le papier des résultats similaires) que dans l'élaboration des corpus (C. Blanche-Benveniste 1996); l'exemple donné par M. A. Jones (op. cit.) ne mérite aucunement l'astérisque, qu'on lui attribue d'ailleurs une intonation de type (1) ou de type (5): (19) a. b. e. d.
(Et ce livre ?) - Ce livre (c 'est fait:) j 'ai lu (Tu as lu quel livre ?) - Ce livre (je le montre:)j 'ai lu (J'ai pas compris: lequel ?) - Ce livre (je te dis!)j'ai lu (Qu 'est-ce que tu as lu ?) - Ce livre, j 'ai lu
Notons que Pon trouve de telles constructions attestées a l'écrit; on voit ainsi dans un article de Libération du 10 mars 1999, retraçant la biographie d'André Guelfi, un exemple de type (1): «En 1939, appelé sous les drapeaux a 20 ans, le coursier-armateur rejoignit le 2ème régiment des tirailleurs marocains. L 'armee, Guelfi n 'aime pas.» 6
'est la seule chose quej 'ai aimée. En l'occurrence, la tarte en (1) a toutes les propriétés d'un complément d'objet (2), mais nous concluons qu'il n'en est pas un.
UN C.O.D. « CANADA DRY »
411
A de même été relevé (D. Leeman 1996:192), dans le même journal mais du 23 juin 1995, un exemple de type (5): «Treize ans, elle avait, Suzanne, quand elle écrivit ces vers, aujourd'hui disponibles, avec quelques autres (datés de ses 9, 11 ou 13 ans), sur l'Internet.» Ces deux observations rejoignent des conclusions concernant le complément circonstanciel (D. Leeman 1998). On ajoutera celle de la pertinence de l'orthographe: en l'occurrence, l'accord et le non-accord du participe passé correspon dent a deux statuts syntaxiques et sémantiques qui passent inaperçus lorsque la phrase, au présent, ne manifeste de différence ni a l'oral ni a l'écrit (ce dont témoigne le rassemblement d'exemples en fait hétérogènes par M. Grevisse op. cit.);7 le -s du pluriel est bien un morphème - et non un résidu obsolète et superflu - permettant d'identifier une fonction syntaxique (A. Chervel 1977) et sémantique (B. Peeters 1997), et donc son absence aussi révélatrice que sa présence.
Références Anscombre, J.-C. 1989. Thème, espace discursif et représentation événementielle. In Fonctionnalisme et Pragmatique. A propos de la notion de « thème », J.-C. Anscombre et G. Zaccaria (eds.), Milano: Unicopli. Blanche-Benveniste, C. 1996. Trois remarques sur l'ordre des mots dans la langue parlée. Langue frangaise 111, Paris: Larousse. Blasco-Dulbecco, M. 1999. Les dislocations en frangais contemporain. Etude syntaxique, Paris: Champion. Cadiot, P. 1988. De quoi ç parle ? La référence de ç pronom sujet. Le français moderne 3-4, Paris: CILF. Chervel, A. 1977. Et il fallut apprendre a écrire a tous les petits Français, Paris: Payot. Grevisse, M. 1993. Le Bon Usage (refondu par A. Goosse), Louvain-la-Neuve: Duculot. Gross, M. 1969. Remarques sur la notion d'objet direct en français. Langue française 1, Paris: Larousse. Hirschbühler, P. 1974. La dislocation a gauche comme construction basique en français. In Actes du colloque franco-allemand de grammaire transformationnelle I, Rohrer et N. Ruwet (eds), Tübingen: Max Niemeyer. Jones, M. A. 1996. Foundations of French Syntax, Cambridge: University Press. Kihm, A. 1988. Récupérer un thème: une étude contrastive. Langue frangaise 78, Paris: Larousse. 7
Et le fait que l'exemple canonique illustrant la topicalisation est Le chocolat, j'aime (H. Nølke, 1997:281).
412
DANIELLE LEEMAN
Leeman, D. 1996. Attributs du sujet et verbes attributifs. Linx (Hommage a Jean Dubois) 34-35, Université de Paris X Nanterre. Leeman, D. 1998. Les circonstants en question(s), Paris: Kimé. Nølke, H. 1997. Note sur la dislocation du sujet: thématisation ou focalisation ? In Les formes du sens, G. Kleiber et M. Riegel (eds), Louvain-la-Neuve: Duculot. Peeters, B. 1997. L'accord du participe passé et la notion d'objet affecté. Le franqais moderne 2, Paris: CILF. Riegel, M., J.-Ch. Pellat et R. Rioul. 1994. Grammaire méthodique du français', Paris: PUF. Wagner, R. L.; J. Pinchon. 1962. Grammaire du français classique et moderne, Paris: Hachette. Wilmet, M. 1998. Grammaire critique du franqais, Paris-Bruxelles: Hachette et Duculot. Wilmet, M. 1999. Le participe passé autrement, Paris-Bruxelles: De Boeck et Larcier, département Duculot.
Summary It is generally considered that in French, unlike English, the phenomenon of topicalisation applied to a direct object, as in This book, I have read, does not exist. In fact, constructions such as this are common in oral language and are also encountered in written language. I shall nevertheless show that, appearances to the contrary, in a sen tence such as La tarte, j'ai airné, the NP la tarte is not a direct object and that, in consequence, this construction is not an instance of topicalisation (it should be recalled that the canonical example of topicalisation is Le chocolat, j'aime). My demonstration is based on comparisons between the orthographic, intonational, distributive and syntactic properties of utterances such as La tarte, j'ai aimé and Trois enfants, j 'ai eus.
NOMINALIZATIONS OF ENGLISH NEUTRAL VERBS PETER A. MACHONIS Florida International University
Introduction In the construction of a lexicon-grammar, Maurice Gross (1981, 1996) intro duces the notion of support verbs - verbs of little semantic content, that are used for syntactic support, indicating tense, person, number, and sometimes aspect. For example: The roller coaster made a tilt The flyer (got + jumped + went) into circulation The semantic content of these sentences is carried by the following noun (tilt) or prepositional phrase (into circulation), rather than the verb (make, get, jump, go). This is a highly productive process in language, which has been investigated in a lexicon-grammar framework for French (Giry-Schneider 1987, G. Gross 1989), Italian (Vietri 1996) and other languages, as well as from a Chomskian standpoint for English (Catell 1984) and Japanese (Dubinsky 1997), where we find the term light verb. This article explores the use of three light or support verbs of English: give, make and have. We limit our analysis to their occurrence with the deverbal nominals of 537 neutral verbs of English. Also termed ergatives (Keyser and Roeper 1984), neutral verbs are defined as those that fit the following equation, where the arrow means relative synonymy: N0 V N1 ↔ N1 V For example, the verbs in the following sentences are considered neutral: Max chimes the bell ↔ The bell chimes The pilot landed the plane ↔ The plane landed In these sentences, the direct object of the sentence to the left of the arrow is the subject of the sentence to the right, and the meanings are similar. The subject of the left sentence causes the object of the sentence to undergo the action
PETER A. MACHONIS
414
expressed by the verb. The only extra information is the idea of "cause to happen".
Table of nominalizations From a previously constructed list of 537 neutral verbs of English (Machonis 1997), we systematically examined environments favoring the use of support verb plus the following deverbal nominal constructions: N0 give N1 a V-n N0 give N1 a adj V-n N0 make a V-n ofN1 N0 make a V-n with N1 N0 make a V-n in N1 N1 make a V-n N1 make a adj V-n N\ have a V-n N\ have a adj V-n
Max gave the bell a chime Max gave the bell a loud chime Mike made an enlargement of the photo Max made a chime with the bell The nail made a rip in the clothes The bell made a chime The photo made a beautiful enlargement My arm had an itch The bell has a loud chime
Our analysis includes both cases of the support verb make, one corresponding to the transitive use of the neutral verb: Max (chimed + made a chime with) the bell and another corresponding to the intransitive use of the neutral verb: The bell (chimed + made a chime) We also looked at the deverbal nominals of neutral verbs in certain prepo sitional phrases preceded by the verb be: N1 be in V-n N1 be in a V-n N\ be at a V-n
The car was in acceleration The ball was in a curve The horse was at a gallop
A sample of this table is given in the Appendix (cf. Table 1: Nominalizations of English Neutral Verbs). For each neutral verb, we list an N1 that works along with certain distributional properties (human and non-human) of the N0 and N1, which are indicated by a plus or a minus. The column V-n states the appropriate suffix used to create the deverbal nominal. For each possible support verb construction or be prep expression, acceptance is indicated with a plus and rejection with a minus. When an adjectival is necessary in order for the give, make or have expression to be grammatical, a possible adjective is given on the far right. Finally, the semantic properties listed for each verb - generally not part of a lexicon grammar - are used to help compare verbs similar in meaning.
NOMINALIZATION OF NEUTRAL VERBS
415
Support verb combinations In this article, we will examine the conditions that permit nominalizations to see if any criteria favor the use of support verbs. A little over 5% of the verbs exa mined could accept all possible support verbs followed by a nominalization: Dan gave the paper a fold Dan made a fold in the paper The paper made a even fold The paper had a even fold The driver gave the horn a honk The driver made a honk with the horn The horn made a honk The horn had a loud honk The majority of the cases, however, reject all the support verbs examined: *Max gave the eggs a (E + long) boil *Max made a boil (of+ with + in) the eggs *The eggs made a (E + long) boil *The eggs had a (E + long) boil *The sun gave the ice a melt *The sun made a melt in the ice *The ice made a melt *The ice had a melt Nevertheless, it appears that nominalizations can appear with the various support verbs in every possible combination. Some verbs might accept give and have, but tolerate only one of the uses of make: The child gave the top a spin *The child made a spin with the top The top made a spin The top had a good spin The wine gave the dress a stain The wine made a stain in the dress * The dress made a stain The dress has a stain Others admit give and both uses of make, but not have: Dorothy gave her heels a click Dorothy made a click with her heels Her heels made click *Her heels had a (E + good) click
416
PETER A. MACHONIS
Art gave the door a slam Art made a slam with the door The door made a slam * The door had a (E + terrifying) slam Others accept have and both uses of make, but not give: * The pilot gave the plane a (E + safe) landing The pilot made a landing with the plane The plane made a landing The plane had a safe landing Finally others recognize both uses of make, but neither give nor have: *Anne gave the dishes a (E + loud) clatter Anne made a clatter with the dishes The dishes made a clatter * The dishes had a (E + loud) clatter * The jockey gave the horse a jump The jockey made a jump with the horse The horse made a jump * The horse had a (E + nice) jump In examining this one class of English verbs, neutral verbs, we have found that nominalizations can appear with various support verbs in every possible combination. Following Z.S. Harris, it appears that many of these nominaliza tions can be associated with elementary sentences and therefore their use with various support verbs would be most accurately represented in the form of a lexicon-grammar.
Semantics Many linguists would argue that semantics plays a large role in determining this syntactic behavior. However, verbs of similar semantic content do not always exhibit the same degree of acceptance with the various support verbs. For example, although many verbs of circular motion accept give: The cowboy gave the rope a coil The child gave (the top a spin + the handle a turn) others do not: * The cowboy gave the bottlecap an unwind *Max gave (the wheel a roll + the ice-cream a swirl) Likewise, break verbs accept have in many cases, but not all:
NOMINALIZATION OF NEUTRAL VERBS
417
The clothes have a rip The balloon has a puncture The glass had a (crack + *shatter + *smash) It appears that the semantic class of sound verbs permits nominalizations with support verbs fairly frequently. However, the verb blast and blare seem to work with only intransitive make plus adjectival: *Max gave the radio a (blast + blare) *Max made a (blast + blare) with the radio The radio made a loud (blast + blare) * The radio had a (blast + blare) Even cook verbs, which seem to reject all uses of the support verbs examined, present a few exceptions involving make: The chicken made a delicious roast The avocado made a delicious puree The butter made a (E + loud) sizzle They made a (barbecue + marinade) with the steaks But other than generalities, it is difficult to find concrete semantic informa tion that accurately determines one expression to be admissible and another unacceptable.
Frequency of support verb use Verbs that accept all uses of the support verbs studied represent a very small percentage of our data - only 35 instances or a little over 5%. More than half of the neutral verbs examined (296 cases) accepted none of the nominalizations with support verbs described so far. But even if the majority of our data involves cases where no support verbs are accepted, 241 verbs can undergo nominalization with at least one support verb. For example, the use of give plus nominal is acceptable for about 20% of our data (115 uses), but an adjective is obligatory for 27 cases: The hurricane gave the sand an (*E + unusual) erosion Time gave his bones a (*E + gruesome) decalcification The use of have plus nominal1 is accepted for 127 cases (almost 25%), but in 1
In our judgements of have, we rejected any cases of obvious lexical have. For example, for the verbs latch and lock, we have the neutral uses: They (latched + locked) (the gate + the door) (The gate + the door) (latched + locked) Max drained the sink The sink drained
PETER A. MACHONIS
418
this instance, an adjectival is necessary for all but 41 verbs: The lights had a (*E + very bright) beam The top has a (*E + good) spin We examined both cases of the support verb make, corresponding to the tran sitive and intransitive uses of the neutral verb. The pilot made a (landing + swerve) with the plane The plane made a (landing + swerve) In a few cases, an adjectival was necessary for the intransitive make to be accep table: The shop made an enlargement of the photo * The photo made an enlargement The photo made a beautiful enlargement * The car made an acceleration. The car made a sudden acceleration Intransitive make is accepted in 20% of our data (107 cases), whereas transitive make is accepted in 15% (85 cases). Overlap occurs in less than 10% of all data (44 cases) - that is, where both uses are attested for the same verb, such as land and swerve above. So, we can conclude that each support verb appears fairly fre quently with the various deverbal nominals.
Be Prep V-n In our study, we also remarked that although some verbs admitted none of the support verb plus nominal combinations described, nominalizations did appear in certain prepositional phrases preceded by the verb be: *Max gave the camera a focus *Max made a focus with the camera * The camera made a focus * The camera had a focus The camera is in focus Some of the verbs that accept support verbs also enter into these be prep expressions: The driver gave the car a sudden acceleration But the following sentences exhibit the use of lexical have, rather than support have and are therefore not indicated as acceptable in this study of support verbs: The gate had a lock The door had a safe latch The sink had a drain
NOMINALIZATION OF NEUTRAL VERBS
419
The car (made + had) a sudden acceleration The car was in acceleration In over 10% of our data (59 cases), we found be prep plus nominalization to be acceptable. Again, this appears to be the sort of information that must be included in a lexicon-grammar, since it involves idioms of encoding and is not predictable: * The camera was in a focus * The boy was in (fluster + panic) The boy was in a (fluster + panic) In two instances, the V-n had to be in the plural: The glass was in shatters The paper was in shreds In some cases, the preposition at is required: The horse was at a (canter + jog + trot) And for some deverbal nominals, we have two possible be prep combinations: The car was (in + at an) idle The mortgage was (in + in a) foreclosure Conclusions In examining one class of English verbs, neutral verbs, we have found that nominalizations can appear with various support verbs - give, make, have - in every possible combination and occur in almost half of the verbs that we have systematically classified. Furthermore, semantic criteria do not categorically predict one use or another. The deverbal nominal could also occur in a be plus preposition combination, and its occurrence here seems even more idiomatic. Our examples suggest that every verb needs to be described on an individual basis and give further evidence for building a formal lexicon, or lexicongrammar, that incorporates syntactic properties, both distributional and transfor mational.
Acknowledgements: An initial draft of this article was originally presented at the 18th Colloque sur les Lexiques et Grammaires Comparés (October 1999, Salerno) and I would like to thank the participants for their comments and suggestions. Furthermore, many linguistic judgements were verified by students in General Linguistics at Florida International University. In particular, I would like to thank the students of Fall 1999 for their help and observations.
PETER A. MACHONIS
420 References
Cattell, Ray. 1984. Composite Predicates in English. Syntax and Semantics, vol. 17. Orlando, F1: Academic Press, Inc. Dubinsky, Stanley. 1997. Syntactic underspecification and light-verb pheno mena in Japanese. Linguistics 35, pp. 627-672. Giry-Schneider, Jacqueline. 1987. Les prédicats nominaux en franqais. Les phrases simples a verbe support. Geneva: Droz. Gross, Gaston. 1989. Les constructions converses du franqais. Geneva: Droz. Gross, Maurice. 1981. Les bases empiriques de la notion du prédicat sémantique. Langages 63, pp. 7-52. Gross, Maurice. 1996. Lexicon Grammar. In Concise Encyclopedia of Syntactic Theories, K. Brown & J. Miller (eds.), New York: Elsevier. Keyser, S. J. and Roeper, T. 1984. On the Middle and Ergative Constructions in English. Linguistic Inquiry 15, pp. 381-416. Machonis, Peter A. 1997. Neutral Verbs in English: A Preliminary Classification. Lingvisticœ Investigationes XXI:2, pp. 293-320. Vietri, Simonetta. 1996. The Syntax of the Italian Verb essere Prep. Lingvisticce Investigationes XX:2, pp. 287-363. Summary This article explores the use of three light or support verbs of English, give, make, and have, as they co-occur with the nominalizations associated with the class of English neutral verbs (537 verbs). Neutrality, also known as the ergative construction or the causative alternation, is present when the following equation holds: N0 V N1 ↔ N1 V For example, the verb in the following two sentences is considered neutral: Max chimes the bell ↔ The bell chimes Certain neutral verbs undergo nominalization and may occur with support verbs, as in the following examples: Max gave the bell a chime Max made a chime with the bell The bell made a chime The bell has a loud chime Prepositional phrases associated with nominalizations of these neutral verbs are also briefly examined. The appearance of these nominals with the various support verbs and prepositional phrases is shown to be highly idiosyncratic. This reinforces the notion that transformations associated with verbs can be best described on an individual basis and gives further evidence for building a formal lexicon or lexicon-grammar.
N0 =: Nhum
1 +
| + + + + + + + + + + + + + + + + + + + +
+
+ + +
N0 =: N-hum
+ + + + + + + + + + + + + + + + +
jligbt [lighten
lift
Verb incubate inflate intensity interlock H ch jangle jerk Jiggle jingle jog jolt jump keel kindle knell land latch lather launch leak lengthen lessen levitate
N1
the bacteria the economy their efforts his fingers my arm the keys the car the handle the bell the horse the aircraft the horse the boat the fire the bell the plane her door the cream the rocket oil the book the pain the woman their spirits the tire her hair
=: Nhum
N1
+ + + + + + + + + + + + + + + + + + + + + + + + + +
=: N-hum
N1
+ + + -
+
-ing -E -E -E
-E +
+
-mg
-ing
+ + -
-
N0 giveN1a V-n
-E -E -E -E -E -E -E -E
V-n -tion -tion
N0 giveN1a adj V-n +
+
+ -
-
+
+ + + + -
-
N0 make a V-n of N1 +
-
-
+ -
+
-
-
-
+ -
-
N0 make a V-n with N1
-
-
N0 make a V-n in N1 -
-
-
-
-
-
-
-
-
+
+ + +
+ + - + - + - + - - + +
+ + + +
+ +
+ + - -
-
-
-
-
-
+
-
-
- + + - +
- - + + - + - + +
-
-
-
+
-
-
N! make a V-n N make a adj V-n 1 N1 have a V-n N1 have a adj V-n N1 be in V-n Ni be in a V-n N1 be at a V-n -
Semantic Properties
irritate sound motion/sudden motion/up & down sound motion/forward motion/sudden motion/up & down motion/upside down light emission sound motion/down motion/close change/increase motion/up motion/down increase decrease motion/up increase light emission change color
join
start increase increase
good fast
safe
loud nice sudden
loud
enormous
Adj
NOMINALIZATION OF NEUTRAL VERBS 421
APPENDIX. Table 1: Nominalizations of English Neutral Verbs
REMARKS ON THE COMPLEMENTATION OF ASPECTUAL VERBS 1 ELISABETE MARQUES RANCHHOD Faculdade de Letras da Universidade de Lisboa, Centro de Automatica da Universidade Técnica de Lisboa (IST)
1. Introduction The study of auxiliary verbs is perhaps one of the most discussed questions of the grammar in any language, and it often leads to controversial positions. Lists of auxiliaries differ from grammar to grammar, from author to author. In fact, the history of languages shows that verbs that are not auxiliaries at a given moment will later lose all or part of their distributional properties, acquiring an auxiliary status; furthermore the lack of well-defined definitions and criteria for recognizing them makes difficult the determination of the boundaries of auxiliarity. In Portuguese, the auxiliary system (tense-aspect-modal system) is far from being consolidated. Traditionally, studies on auxiliary verbs focus mainly on two cases (cf. §2 below): cases where the auxiliary verb bears on a verb, the cons tructions where a copula is an adjective auxiliary. Recent studies dedicated to the analysis of predicative nouns point to another kind of auxiliary verb: support verbs, whose function is to provide inflectional support for a noun that, like lexi cal verbs and adjectives, represents the main predicative element of a sentence (cf. §3). The auxiliaries that we are going to analyse in this note are the so-called aspectual verbs, a category that overlaps to a great extent with tense, pragmatics and modality. Within this semantic group, we restrict ourself to the analysis of those verbs that combine with an infinitive verb form, preceded or not by a preposition. The basic sentence forms in which aspectual verbs occur may be roughly represented by the formula: N0 Vasp (Prep + E) V0inf W=:
1
This research was in part supported by the FCT (Programmes PRAXIS XXI, Proj. 2/2.1/CSH/ 775/95, and POCTI, Proj. PLP/34729/99-00).
424
(1)
ELISABETE MARQUES RANCHHOD
O Zé (continua + persiste em) fazer o mesmo erro Zé (keeps to + persists in) make the same mistake2 (Zé (keeps on + persists in) making the same mistake)
where Vasp is a tensed (aspectual) verb, and V°inf is a verb in the infinitive whose subject is obligatorily identical to the grammatical subject of the Vasp. So, the V°inf position cannot be filled: - neither by a sentential complement que F (that-clause) containing a finite verb: (1')
*0 Zé (continua a + persiste em) que tu faças mesmo err Zé (keeps on + persists in) that you make the same mistake
- nor by a Vinf-pn form (inflected infinitive, with person-number morphemes): (1")
* O Zé (continua a + persiste em) fazeres tu mesmo err Zé (keeps on + persists in) make+pn you the same mistake
We listed a few dozens of verbs with such a behavior (cf. Table Vasp, Annex), so they were good candidates to the status of auxiliary verbs. The study of other properties of the constructions where they occur confirmed that status. We will begin our analysis by briefly referring: (i) to the treatment of the auxiliary verbs within the Portuguese grammatical tradition. It will become evident that, except for typical aspects of Portuguese (whether they are lexical or syntactic), the approach does not substantially differ from those proposed for other languages; (ii) to constructions with support verbs. They are not mentioned in Portuguese grammars, but are descriptively interesting for they allow to treat in a natural way certain types of nominal complementation accepted by some aspectual verbs: (2)
O Zé persiste no mesmo err (Zé persists in the same mistake)
2. The notion and the function of auxiliary verbs Portuguese grammatical tradition usually associates the notion of auxiliary verb to the morphological expression of tense, aspect and voice. The combination of an auxiliary and a main verb is called a "verbal locution", but the criteria for deter mining whether two given verbs constitute a verbal locution are mainly intuitive, they not surprisingly differ from one grammarian to another.
2
Next to the Portuguese examples, follows a literal translation that aims to show the linguistic phenomena involved. The translations in brackets stand for a more appropriate meaning in English.
COMPLEMENTATION OF ASPECTUAL VERBS
425
2.1. Tense auxiliaries Portuguese grammarians usually agree in distinguishing "simple tenses", formed by a single inflected verb, such as comprar (to buy) in: (1)
Ele compra esse vinho no supermercado (He buys that wine in the supermarket)
from "compound tenses", formed by the combination of the verb ter (to have), and less commonly, haver (there + be), and the past participle of a main verb: (2)
Ele tem comprado esse vinho no supermercado (He has been buying that wine in the supermarket)
Although it is not explicitly mentioned, it is clear, from a semantic/aspectual point of view, that compound tenses are involved in the expression of aspect in Portuguese. The example in (2) exhibits an habitual/progressive/imperfective value that (1) doesn't possess. This differs from what can be observed in other Romance languages with compound tenses, French, for instance. In the correspon ding French example: (3)
Il
a acheté e vin au supermarché
the verb acheter (to buy) is in the "passé composé", a grammatical terminology corresponding to the Portuguese "pretérite perfeito composto", used in (2). How ever, (3) doesn't have the aspectual value of Portuguese (2). It corresponds to a simple tense in Portuguese: (4)
Ele comprou esse vinho no supermercado (He bought that wine in the supermarket)
that, like French (3), is marked with the perfect aspect. These examples illustrate two points: (i) the categories tense and aspect im pinge to a great extent on each other; (ii) traditional terminology is often an obstacle to adequate description of linguistic phenomena. As said before, compound tenses in Portuguese are formed by the combination of ter (and haver) and a past participle. Past participles are also found in passive forms, but they have a different morpho-syntactic behavior. In compound tenses, the past participle is invariable: (Ele + Ela) tern comprado esse vinho no supermercado (He + She) has bought that wine in the supermarket ((He + She) has been buying that wine in the supermarket) As this example shows, there is no concord in gender and number between the participle, comprado (bought), and the subject. That contrasts with passive forms, where the past participles, constructed with ser and estar (to be), agree with the subject (cf. examples in §2.3).
ELISABETE MARQUES RANCHHOD
426 2.2. Aspectual verbs
Verbs other than ter and haver related to time or aspect are briefly mentioned. C. Cunha & L. Cintra refer (1984:396): ir (to go) vir (to come), andar (to keep on), ficar (to keep in), acabar (to stop). They are followed by an infinitive: (5)
Eles vao ler esse texto They go to read that text (They are going to read that text)
(6)
Eles andam a ler esse texto They keep on to read that text (They keep on reading that text)
Some of them, ir and vir for instance, can also occur with a gerund: (7)
Eles foram melhorando texto progressivamente (They went on improving that text progressively)
(8)
O numero de desempregados vem crescendo de forma dramatica The number of unemployed comes increasing in a dramatic way (The number of unemployed goes on increasing dramatically)
But no consensus between grammarians has been reached for such verbs. Some don't mention them at all, other argue that they are semi-auxiliaries or even main verbs with an infinitival complement (cf. A. Gon9alves 1992). 2.3. Voice auxiliaries The copula ser (to be) and estar (to be) are also included in the list of auxiliaries, as they are involved in active-passive relations, respectively in "active" and "stative" passives. The passive voice involves the combination of ser or estar and a past participle. However, contrarily to participles constructed with ter and haver, passive participles inflect in gender and number in the same way as adjectives do: (9)
Esse vinho é apreciado (E+ por toda a gente) That wine (m.s.) is appreciated (m.s.) by everybody
(10)
Essas uvas sao apreciadas (E+ por toda a gente) These grapes (f.p.) are appreciated (f.p.) by everybody
These examples show participle forms apreciado, apreciadas (appreciated) agreeing with the grammatical subject of ser, respectively esse vinho, essas uvas. Like adjectives, past participles appearing in passive sentences can be gradable and quantified: (11)
Esse vinho é (muito apreciado + apreciadissimo) por toda a gente (That wine is (very appreciated + most appreciated) by everybody)
COMPLEMENTATION OF ASPECTUAL VERBS
427
This possibility does not exist for Vpp appearing in compound tenses: * Toda a gente tern (muito apreciado + apreciadissimo) esse vinho Everybody has (very appreciated + most appreciated) that wine Notice that in French it is sometimes possible to insert a quantifier between avoir (to have) and the main verb Vpp: (12)
Luc a très apprécié ce vin Luc has very appreciated this wine
This possibility however is limited to a small set of verbs. The insertion of the adverb très (very) is not possible in: *Luc a très (acheté + bu)cvin Luc has very (bought + drunk) this wine This indicates that in examples such as (12) the past participle has adjectival pro perties (M. Gross 1999). So, from a syntactic point of view, the combination (ser + estar) Vpp behaves like a copula Adj construction (which is not the case for compound tenses: (ter + haver) Vpp), Thus, in spite of a long grammatical tradition that includes the pas sive voice in the chapter of verbal inflections, passive sentences are better descri bed if they are considered as adjectival constructions. Besides, the equi-valence relations between "active" and "passive" forms don't differ much from others involving sentence pairs with verbs and adjectives, for instance (M. Gross 1996): O parlamento revogou essa lei = Essa lei era revogavel (E + pelo parlamento) (The parliament revoked that law) (That law is revocable (E + by the parliament)) Such an analysis clarifies on one hand the different behavior of past participles when they are constructed with ter or with ser and estar, and on the other hand, it describes in a coherent way numerous cases of passive-like constructions as well as passive forms without a corresponding active verbal sentence: É bem conhecido (E + de todos) que esse livro é um best-seller (It is well known (E + by everybody) that that book is a best-seller) * Todos conhecem bem que esse livro é um best-seller Everybody knows well that that book is a best-seller
3. Support verbs Support verb sentences can be represented by the following general formula: N0 Vsup (E + Prep) N1 W
ELISABETE MARQUES RANCHHOD
428
where N0 represents the grammatical subject of Vsup, an auxiliary verb of a predi cative noun, noted N1, and W stands for any sequence of complements of N1, possibly none. In Portuguese, the following sentences are examples of support verb sentences: (1)
Ele ainda tern esperanga de encontrar esse livro He still has the hope of finding that book
(2)
Ela fez um grande disparate (She made a big mistake)
Support verbs {ter (to have) and fazer (to make) in the above examples) don't have selectional properties. In support verb sentences, it is the supported nouns {esperanga (hope) in (1), and disparate (mistake) in (2)), and not the verbs, that determine a characteristic distribution. The grammatical subject of the Vsup is semantically selected by the predicative noun, the possibility of having comple ments, as well as their syntactic nature, also depends on the supported nouns. Such verbs can be seen as inflecting nouns, that is, as expressing the person, number, tense and aspect values. In order to distinguish support verb constructions from other Verb Noun combinations, a set of well-established syntactic properties has been set up (cf. M. Gross 1981, J. Giry-Schneider 1987, E. Ranchhod 1990). We briefly mention those used later in the description of the nominal complementation of aspectual auxiliaries. 3.1. Support verb reduction Given their morphemic nature, support verbs can be reduced - [Red Vsup] under adequate syntactic conditions: [Red Vsup] = (1')
A sua esperanga de encontrar esse livro <é va> (His hope of finding that book )
[Red Vsup] = (2')
<Ela é incapaz de> um disparate (<She is incapable of> a mistake)
The noun phrases issued from support verb reduction occur in subject or com plement positions of verbs and adjectives selecting sentential arguments. 3.2. Aspectual support verbs Aside from their intrinsic aspectual values, sentences (1) and (2), with elementary support verbs, are not aspectually marked. If we compare (1) with: (3)
a. Ele está com esperanga de encontar esse livro (He is in hopes he could find that book)
COMPLEMENTATION OF ASPECTUAL VERBS
429
b. Ele (mantém + alberga) a esperanga de encontrar esse livro (He (maintains + entertains) the hope of finding that book) c. Ele perdeu a esperanga de encontar esse livro (He lost his hope of finding that book) we verify that the substitution of the support verb ter by estar com (), manter and albergar (3b) introduces in sentences new aspectual (also stylistic (3b)) values. In (3c), the Vsup =: perder (to loose) is a terminative aspectual variant of ter: "He doesn't have any more his hope of finding the book". The Vsup substi tution doesn't affect neither the basic interpretation of sentences nor their syntac tic structure. The argument selection depends on the predicative noun (esperanga (hope) in the above examples), and not on the Vsup.
4. Aspectual Auxiliaries The aspectual verbs we are dealing with constitute a heterogeneous semantic group that introduces in sentences various kinds of aspectual values: progressive, iterative, inceptive, terminative, etc. Aspect often involves temporal properties, pragmatic notions and even subtle nuances relating to modality. From a syntactic point of view, aspect in Portuguese, as in other languages, can be expressed by a variety of linguistic means, but, as said in §1, we will restrict ourself to the analysis of aspectual verbs that typically combine with an infinitive verb form, often preceded by a preposition. Given the sentence form: N0VW the insertion of a Vasp: N0 Vasp (Prep + E) VinfW does not modify the argument selection of V, but converts the inflected V form into an infinitive, i.e. into a verbal form without person, number, tense or aspect morphemes. These linguistic categories are carried by the Vasp, that together with the Vinf yield a complex verbal predicate. In Portuguese, the syntactic cohesion of such verbal combinations exhibits the following main features: - The Vinf cannot have an independent subject from the Vasp subject. Thus, the Vinf position cannot be occupied neither by a full sentence of the form Que F (That-clause) nor by an Vinf-pn (§4.1); - As for the main verb complements (if any), they can be attached (after cliticization) either to Vasp or Vinf (§4.2).
430
ELISABETE MARQUES RANCHHOD
4.1. The subject of the complex verbal predicate is selected by Vinf A number of lexical verbs have sentential complements, for instance: (1)
Elai reconheceu que tinhai sido um pouco indelicada3 (Shei admitted that shei had been a little bit impolite)
The direct object of reconhecer is a Ml sentence introduced by que (that), with its own argument structure. In (1), the subject of the that-clause que tinha sido um pouco indelicada, holds a non-obligatory co-reference relation with the subject of reconhecer: (2)
Ela reconheceu que os miúdos tinhorn sido um pouco indelicados (She admitted that the kids had been a little bit impolite)
The co-reference relation observed in (1) allows the reduction of the finite thatclause to an equivalent non-finite one: [Red que F] = (1') Ela reconheceu ter sido um pouco indelicada She admitted to have been a little bit impolite As for the complement clause of (2), it can also be reduced to a non-finite clause but, the fact that there is no co-reference between any terms of the main and the subordinate clause, an inflected infinitive (with verb-agreement morpho logy) must be used: [Red que F] = (2') Ela reconheceu (Her + terem) os miúdos sido um pouco indelicados She admitted to have-n the kids been a little bit impolite (She admitted that the kids had been a little bit impolite) The inflected infinitive iterem, in (2')) agrees in person and number with the infinitive clause subject: os miúdos (the kids). The use of the inflected or noninflected infinitive in complement clauses with co-reference also depends on the main verb. Some verbs, for example some volitional and manipulative, where the direct object is co-referent to the subject of the complement clause: (3)
Ela autorizou-nosi a que admitissemosi todos os candidatos She authorized us that we should admit all applicants (She authorized us to admit all applicants)
allow the use of both non-inflected and inflected infinitive in the corresponding non-finite complement clause: [Red que F] = (3') Ela autorizou-nos a (admitir + admitirmos) todos os can didatos She authorized us to (admit + admit-pn) all applicants 3
In Portuguese, the co-referent subject of the complement clause is left unexpressed, unless it acts as a focal element.
COMPLEMENTATION OF ASPECTUAL VERBS
431
Other verbs, such as querer (to want) or tentar (to try), only accept a finite com plement when there are no co-reference relations between their own subject and the subject of the subordinated clause: (4)
Ela (queria + tentou) que tu fizesses o jantar She (wanted + tried) that you cook dinner (She wanted you to cook dinner) (She tried to make you cook dinner)
The reduction of the that-clause to an infinitive one is obligatory if the subjects are identical: (4')
Ela (queria + tentou) fazer o jantar (She (wanted + tried) to cook dinner)
We assumed before that aspectual verbs don't have selectional properties, and that the Vasp (Prep + E) Vinf combination constitutes a complex verbal predicate, where Vasp can be seen as a linguistic device for the expression of person, num ber, tense and aspect values. The grammatical subject of the Vasp is selected by the main verb, Vinf. The possibility of having complements also depends on the Vinf. Consequently, sentences with aspectual verbs differ from the constructions illustrated above, and the Vinf position cannot be occupied neither by a que F clause nor by a non-finite clause with an inflected infinitive. The following exam ples illustrate these restrictions. - In a Vasp (E + Prep) Vinf combination, the subject is selected by Vinf. (5)
(O Euro + *O Zé) (continua + comega + está + volta) a desvalorizar face ao dolor (The Euro + Zé) (keeps on + starts + is + starts again) eroding against the dollar
(6)
(*O Euro + O Zé) (continua + comegou + estd + volta) a dizer que esse estudo é altamente relevante (The Euro + Zé) (keeps on + starts + is + starts again) saying that the study is highly relevant
- Vinf is a nominal form (without person-tense morphemes) of a lexical verb: (7)
O Zé (costuma + deixou de) ler banda desenhada Zé (uses + quit) to read comics (Zé (has the habit of + quit) reading comics)
Therefore, its position cannot be occupied neither by a finite clause: (8)
* O Zé (costuma + deixou de) que tu leias banda desenhada
nor by an infinitive clause with Vinf-pn: (9)
* O Zé (costuma + deixou de) tu leres banda desenhada
ELISABETE MARQUES RANCHHOD
432
These syntactic restrictions are not specific of aspectual verbs. They can be observed in constructions with modal auxiliaries, for example poder (can) and dever (must). 4.2. Clitic attachment to both Vasp and Vinf In a complex sentence structure such as: (10)
Ele prometeu a Ana enviar esses livros aos miúdos He promised to Ana to send these books to the kids (He promised Ana to send the kids these books)
The verb prometer has a sentential direct object, the infinitive clause: enviar esses livros aos miúdos, issued from the reduction of a que F (that-clause) form: Ele prometeu à Ana que enviaria esses livros aos miúdos (He promised Ana that he would send the kids these books) In both sentence forms, the noun phrases esses livros (these books) and aos miúdos (to the kids) are, respectively, the direct and indirect object of enviar, and they don't have any syntactic relation with prometer. The cliticization in (10) of these complements leads to: (11) a.
Ele prometeu a Ana envia-los aos miúdos (He promised Ana to send them to the kids)
b.
Ele prometeu a Ana enviar-lhes esse livro (He promised Ana to send them these books)
Ele prometeu a Ana enviar-lhos He promised to Ana to send them_them (He promised Ana to send them to them)
The clitic pronouns are correctly attached to enviar, and it is obviously impossible to link them up with the main verb prometer: (12) a. * Ele prometeu-os a Ana enviar aos miúdos b. * Ele prometeu-lhes a Ana enviar esses livros * Ele prometeu-lhos a Ana enviar In constructions with auxiliary verbs, we don't have two sentential domains, so it is possible to attach clitic pronouns either to the main verb or to the auxiliary4. 4
With tense auxiliary ter. Ele tinha enviado livro ao Zé He had have sent the book to Zé the attachment of the pronouns to the auxiliary is obligatory: Ele tinha-o enviado ao Zé vs *Ele tinha enviado-o ao Zé Ele tinha-lho enviado vs *Ele tinha enviado-lho
COMPLEMENTATION OF ASPECTUAL VERBS
433
The following examples with aspectual verbs (começar and passar) illustrate this possibility. Starting with: (13)
Ele começou a enviar o jornal ao Zé todas as semanas He started to send the newspaper to Zé weekly (He started sending the newspaper to Zé weekly)
(14)
Ele passou a escrever a Ana todas as semanas He passed to write to Ana weekly (He began writing to Ana weekly)
The simultaneous pronominalization in (13) of the two complements of enviar (to send) results in the contracted pronominal form lho (it to him); in (14), the pro noun corresponding to the indirect object is the (her): (13) a. b. (14) a. b.
Ele comegou a enviar-Iho todas as semanas He started sending it-to him every week Ele comegou-lho a enviar todas as semanas He started it-to him sending every week Ele passou a escrever-lhe todas as semanas He began writing her weekly Ele passou-lhe a escrever todas as semanas He begun her writing weekly
In sentences (13a) and (14a), clitic pronouns are attached to main verbs (enviar, escrever); in (13b) and (14b), they are linked up with Vasp (comegar, passar) before the preposition (a, in both cases). With other verbs, for example: (15) a.
Ele deixou de escrever a Ana He has left to write to Ana (He stopped writing to Ana) b. Ele deixou de escrever-lhe (He stopped writing her) ? Ele deixou-lhe de escrever d. Ele deixou de lhe escrever
The example (15c) shows that, in some constructions with aspectual verbs, the direct attachment of pronouns to the auxiliary is not completely acceptable. Instead, they can be moved to the left position of the main verb, after Vasp Prep (15d). In a few cases, we don't find such liberty for clitic position. In cases such as: (16) . incidente ameaça abrir uma crise politica (The incident threatens to open a political crisis) b. incidente ameaga abri-la (The incident threatens to open it)
434
ELISABETE MARQUES RANCHHOD
. * O incidente ç- abrir The incident threatens it to open it is not possible to attach the clitic pronoun to ameagar (to threaten). In the Table of Vasp (Annex), the columns: N0 Vasp Pron Prep Vinf W, N0 Vasp Prep Pron Vinf Wand N0 Vasp Pron Vinf W represent the possibilities of clitic attachment to Vasp, The signs "+" and "-" are used to indicate whether or not these properties are verified. Anyhow, examples such as (15) and (16) point out that the syntactic behavior of the verbs included in the Vasp class is not homogeneous, and that the classification needs to be refined. 4.3. Nominal Complements In all the situations discussed before (§4.1, 4.2), aspectual verbs were introduced in sentences with lexical verbs. But, in fact, nothing prevents their insertion in adjectival constructions: (17)
A situagão ameaça tornar-se particularmente quente The situation threatens to become particularly hot
(18)
Eles costumam estar presentes nessas reuniões They use to be present in those meetings (They are usually present in those meetings)
In (17) and (18) ameagar and costumar are inserted before the copula tornar-se, a lexical variant of ser (to be), and estar (to be), respectively. In the same way, aspectual verbs can occur in support verb sentences, as it is the case in: (19)
Eles persistem em (fazer + cometer) o mesmo err (They persist in (making + committing) the same mistake)
(20)
Ele voltou a (fazer + colocar) a pergunta inicial He went back to (ask + pose) the initial question (He (asked + posed) again the initial question)
As said before (§3.1), support verb sentences can be reduced to nominal phrases under adequate syntactic conditions. The support verb reduction in (19) and (20) doesn't affect the prepositions - em and a:5 [Red Vsup] = (21) Eles persistem no mesmo err They persist in the same mistake
5
The forms no and à correspond respectively: (i) to the contraction of the preposition em (in) and the definite article o; (ii) to the contraction of the preposition a (to) and the definite article a (the). In Portuguese, contracted forms issued from the agglutination of prepositions and determi ners, pronouns and some primitive adverbs are rather frequent: pel (o, a, os, as) <por + o, a, os, as (by the); daqui <de + aqui (from here), etc.
COMPLEMENTATION OF ASPECTUAL VERBS
435
[Red Vsup] = (22) Ele voltou à pergunta inicial He went back to his initial question and leaves predicative nouns erro and pergunta in Vasp complement position. Thus, in situations like the ones illustrated above, the description by support verb reduction avoids to consider that verbs such as persistir and voltar have two diffe rent syntactic status: aspectual verbs when they occur in sentence forms like (19) and (20), lexical verbs when they appear in sentences like (21), (22). The analysis by support verb reduction also clarifies the equivalence relations existing between the different sentence forms: N0 Vasp Prep Vsup N1 = N0 Vasp Prep N1 These sentence forms correspond to two columns of the Table of aspectual verbs; the signs "+" and "-" allow to verify the generality of the relation. In exam ples like: (23) = (24)
O sistema ameaga entrar em ruptura financeira The system threatens to enter in financial collapse sistema ameaqa ruptura financeira The system threatens financial collapse
the Vasp =: ameagar (to threaten) combines directly with the support verb entrar em, reinforcing its inchoative value. The Vsup reduction also affects the prepo sition em, remaining the predicative noun in direct object position of ameagar. In the Table, the columns: N0 Vasp Vsup N1 and N0 Vasp N1 encode these related constructions. The possibility of reducing support verbs is not general. The observation of the Table 'Vasp' shows that there are a few aspectual verbs that can appear in support verb sentences, but they cannot occur with predicative nouns (noted N1 in the Table). This is the case of: (25)
(26)
Esse acontecimento costuma ter inicio em 20 de Agosto That event uses to have beginning on August 20th (That event usually begins on August 20th) *Esse acontecimento costuma inicio em 20 de Agosto That event usually beginning on August 20th
The description by support verb reduction doesn't apply to the analysis of other NPs found in Vasp complement position. In examples such as: (27)
O Zé (acabou + ) esse livro (Zé (finished + began) that book)
the NP =: esse livro occurs in direct object position of acabar and comegar (to finish and to begin). But (27) is ambiguous: it allows at least the following inter pretations:
ELISABETE MARQUES RANCHHOD
436
a. Zé (acabou de + comegou a) ler esse livro Zé (finished of + began to) read that book (Zé (finished + began) reading that book) b. O Zé (acabou de + comegou a) escrever esse livro Zé (finished of + began to) write that book (Zé (finished + began) writing that book) This means that (27) could be issued from the reduction of an appropriate lexical verb, which also includes the reduction of a preposition (de and a in above examples). Notice that in sentences like: (28)
O Zé (acabou de + comegou a) comprar esse jornal Zé (finished of + began to) buy this newspaper Zé (finished + began) buying this newspaper
it is difficult to reduce the verb comprar (to buy); the interpretation of: (29)
O Zé (acabou + comegou) esse jornal Zé (finished + began) this newspaper
is not obvious, and doesn't corresponds at all to (28).
Conclusion On the basis of general syntactic criteria, we established for Portuguese a set of auxiliaries that are semantically related to aspect. Although some of these criteria ask for further refinements, they allowed us to distinguish complex verbal predi cates, formed by Vasp Vinf, from other superficially identical combinations (V Vinf), involving lexical verbs. All the Vasp's have in common the feature that the Vinf position cannot be filled neither by a that-clause nor by an inflected infi nitive. With a number of Vasp it is possible to attach clitic pronouns both to the auxiliary and to Vinf, the main verb in the infinitive. In situations where aspectual verbs are introduced in sentences with supportverbs, it is often possible to reduce the latter. The Vsup reduction leaves the supported (predicative) nouns in Vasp complement position. However, the possi bility of reducing support verbs is not general. There are a few aspectual verbs that can appear in support verb sentences, but they cannot occur with predicative nouns.
References Cunha, Celso; L. Lindley Cintra. 1984. Nova Gramática do Português Contemporâneo. Lisboa: Edições Joao Sá da Costa.
COMPLEMENTATION OF ASPECTUAL VERBS
437
Dias, A. Epiphanio da Silva. 1917. Syntaxe Histórica Portuguesa. 5a ed., 1970, Lisboa: Livraria Classica Editora. Giry-Schneider, Jacqueline. 1987. Les prédicats nominaux en français. Les phrases simples a verbe support. Genève: Droz. Gonçalves, Anabela. 1992. Para uma Sintaxe dos Verbos Auxiliares em Português Europeu. Dissertação de Mestrado, Faculdade de Letras da Universidade de Lisboa. Gross, Maurice. 1981. Les bases empiriques de la notion de prédicat sémantique. Langages 63, Paris: Larousse. Gross, Maurice. 1996. Les verbes supports d'adjectifs et le passif. Langages 121, Paris: Larousse. Gross, Maurice. 1999. Sur la définition d'auxiliaire du verbe. Langages 135, Paris: Larousse. Lamiroy, Béatrice. 1999. Auxiliaires, langues romanes et grammaticalisation. Langages 135, Paris: Larousse. Mattoso Camara JR. 1941. Principios de Lingüistica Geral. 4a ed., 1967, Rio de Janeiro: Livraria Acadêmica. Pontes, Eunice. 1973. Verbos Auxiliares em Português. Petrópolis, RJ: Editora Vozes Ltda. Ranchhod, Elisabete Marques. 1990. Sintaxe dos predicados nominais com Estar. Lisboa: INIC. Ranchhod, Elisabete Marques. 1995. Les Vsup issus du latin esse et stare dans les langues romanes. Linguisticœ Investigationes, XIX:2, Amsterdam: John Benjamins Publishing Company. Summary The notion of auxiliary verbs and their role is discussed within Z. S. Harris' transfor mationalframework.Following Maurice Gross' proposals, the traditional approach to the subject, usually limited to verbal combinations, is extended to adjectival and nominal constructions. Such an approach to auxiliaries leads one to generalize the notion of auxi liary verb and to propose that aspectual verbs should have a syntactic status identical to that of tense auxiliaries; furthermore, it allows a coherent description of the aspectual verbs complementation. The empirical basis of the analysis is constituted mainly by data from Portuguese but references to other languages are also made.
Vasp Prep Vinf0 W
Vasp VinfO W
Vasp Pron Prep Vinf0 W
Vasp Prep Pron Vinf0 W
Vasp Pron Vinf0 W
Vasp PrepVsupNl
Vasp Prep N1
N0
N0
N0
N0
N0 VaspVsupNl
Vasp N1
N0
N0
N0
N0
ELISABETE MARQUES RANCHHOD
438
+ + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + +
+ -
+ + + + +
+ + + + + + -
-
+ -
+ -
+ + + + + + + + + + + + + + + +
+ + + + + + - | -
+ -
+ -
+ + + +
+ -
+ -
-
+ + + + + + + +
+ + -
+ -
+ + + + +
+ -
+ -
+ -
-
+ + + + + + + + + + + + +
+ + +
Vasp Vinf-pn W
a de de por a a para a a de a a por em a por sem de de a a a a para por a a de a em a a em a para a a
N0
abalançar-se abster-se acabar acabar acorrer ameaçar andar andar apressar-se arriscar-se nao cessar chegar comecar comecar contentar-se continuar continuar continuar costumar deixar nao deixar demorar desatar escusar-se estar estar estar ficar ir nao parar passar persistir por-se procurar tardar tardar tender tender vir voltar
Prep
Vasp Que F
¥
N0
ANNEX: Table Vasp
-
-
-
-
-
-
À PROPOS DE [pc z.] CLAUDE MULLER Bordeaux-3 et ERSSAB-UMR 5610
1. La comparaison des structures de complémentation selon que le complément est un nom ou un verbe fait apparaïtre des variations, dont la plus spectaculaire est sans doute celle qui oppose la construction directe du complément propositionnel a la construction prépositionnelle du nom: Pierre s 'apergoit du départ de Paul Pierre s 'apergoit que Paul est porti Avec plus ou moins de naturel, on peut le plus souvent proposer une forme prépo sitionnelle pour le complément phrastique: Pierre s 'apergoit de ce que Paul est parti Il est clair que le verbe reste dans tous les cas transitif indirect, comme le montre la complémentation: Pierre s'en apergoit/... *se l'apergoit Dans ses travaux sur la complémentation verbale, Maurice Gross (1968:108) a décrit ce phénomène en utilisant la terminologie transformationnelle de Harris,1 sous l'étiquette de [pc z.] - pour "preposition ce zeroing". Dans Phypothèse générale selon laquelle les phrases réalisées sont des formes réduites de discours de base plus complets, la complétive recevait la structure ce que P, et la complé mentation était alors régulière. Les formes que P sont soit le produit de Peffacement de ce en construction directe, soit le produit de l'effacement conjoint de la préposition et de ce. Pour être complet, Maurice Gross a distingué [pc z.] d'autres effacements de prépositions, notamment lorsque l'absence de préposition s'accompagne d'une modification de forme du pronom complément correspondant, ou encore lorsque la préposition peut s'effacer devant Pinfinitif: Je suis venu pour te parier /Je suis venu te parier
1
H.Huot (1981:117) critique [pc z.] parce qu'elle juge différentes les complétives objet et les complétives sujet, qui seraient les seules a accepter ou non une tête nominale(lefait que).
440
CLAUDE MULLER
Dans son livre de 1975, M. Gross a examiné cette propriété pour un nombre important de verbes.
2, Les structures mises en relation par [pc z.]. sont les suivantes: d'une part, une construction complétive directe, d'autre part, une construction complétive indi recte, introduite par une préposition suivie de ce. Il faut donc que la préposition se construise avec ce que et non directement avec que. Cela écarte de cette mise en relation un grand nombre de prépositions, qui se construisent directement avec que: pendant que, avant que, des que, outre que, sans que...D'autres n'admettent aucune forme de complément phrastique: *avec que/*avec ce que... D'autres en core forment des locutions complexes avec ce que, sans réduc-tion possible: parce que; jusqu 'a ce que/* jusque P (sans ce, on a jusque la; jusqu 'alors, mais sans possibilité de dire jusque P). Cependant, certaines de ces locutions ont des variantes courtes, dans lesquelles ne figure pas une préposition finale suivie de ce: en dépit de ce que P / en dépit que P. On observe que c'est la finale de la locution qui construit ce et qui s'efface avec lui. Si on en reste aux prépositions simples, on ne trouve qu'une liste restreinte de prépositions qui se construisent obligatoirement avec ce: a, de, en, sur, par. De façon très marginale, pour peut aussi introduire ce: "Sa modeste besogne de scribe, il l'a élue entre toutes pour c qu 'elle retient, assise, a une table, sa seule et fallacieuse apparence d'hornme." (Colette, citée par Grevisse, §467). Il s'agit ici d'un pour causal, variante archaïque de par, qui, lui, se construit obligatoirement avec ce. La forme dissociée par ce que semble réservée au ce antécédent de relative. Si on veut introduire une complétive après par en la distinguant de la circonstancielle de cause, on utilisera plutôt par le fait que: "La langue se transmet normalement par le fait que les enfants s 'assimilent la longue de leur entourage" (Meillet, cité par Sandfeld, p.45). Les constructions en ce que, sur ce que sont assez peu usitées: "Ce changement est en lui-même plutôt surprenant, en ce qu'il nous offre un cas d'articulation se déplaqant en arrière" (cité dans Sandfeld, 44). "Nombre de trouvères s 'excusent de ne pas parier purement sur ce qu 'ils ne sont pas nes en France" (ibid). Enfin, l'absence conjointe de la préposition et de ce semble limitée aux cas où la sémantique de la construction verbale permet de retrouver l'interprétation prépositionnelle. L'essentiel de [pc z.] est donc a chercher dans les constructions utilisant les prépositions à et de sans valeur prédicative indépendante de celle du verbe (cas général) ou de la construction (agent passif de certains verbes). On le trouve donc dans les constructions verbales argumentales (par exemple: conclure
A PROPOS DE [pc z.]
441
â ce que P/ conclure que P) , dans certaines constructions adverbiales impliquant de soit comme introducteur du complément d'agent, soit comme circonstanciel de cause: Luc est ennuyé (de ) que Marie vienne Luc a de la peine (de ) que Paul soit sans travail On le trouve aussi dans des constructions non verbales, par exemple dans les locutions prépositionnelles comme on l' vu: de façon ( ) que; de manière (a ) que. Egalement, dans la construction d'origine locative: d'ici a ce que P /d'ici que P.
3. On peut aujourd'hui analyser quelque peu différemment le role de ce dans la formation des conjonctions de subordination. Le français se distingue des autres langues romanes en ce qu'il a cliticisé la conjonction que, la rendant partiellement inapte a la formation d'un argument pour certaines prépositions. On peut admettre que la conjonction occupe un paradigme particulier dans la position ou s'articulent les subordonnées a un terme recteur éventuel (la position C), la plus plausible étant une position interne dans (soit celle de la tête elle-même) alors que les relatifs pleins par exemple occuperaient la position externe. Ceci suppose qu'on admette qu'il existe deux positions paradigmatiques distinctes pour - hypothèse généralement admise aujourd'hui; ainsi, bien que les deux positions ne soient pas occupées simultanément en français standard, elles peuvent l'être dans des registres plus familiers: Où qu 'il est ? (standard: Où est-il ?) Dans cette perspective (que j'ai développée dans Muller 1996), le paradigme de la conjonction se distingue nettement de celui construit par les syntagmes nomi-naux classiques: la conjonction introduit une structure défective (cf. également Huot 1981). Cette structure n'a que partiellement les propriétés du syntagme nominal. Ceci explique que M.Gross, pour décrire la syntaxe des complétives et leur distri bution comme sujets ou compléments, ait proposé une structure sous-jacente complétée par une tête pronominale (ou de déterminant), ce. On peut peut-être supposer autre chose: les complétives, comme les relatives a antécédent introduites par des formes qui, que proches de conjonctions et qu'il faut analyser comme relevant du même paradigme (analyse classique de Kayne 1975), sont essentiellement des structures appositives d'un point de vue fonctionnel. Elles sont susceptibles de se construire directement avec un terme recteur (le terme qui se trouve dans la position de l'antécédent), qu'il soit nominal ou adverbial, contrairement aux relatifs pleins. Le schéma syntaxique est donc:
442
CLAUDE MULLER
Terme recteur (Pronom relatif plein (Conjonction fonctionnelle (....))) 1 2 3 avec les réalisations suivantes: 1
3
2 1 3
2
(complétives a antécédent; relatives a antécédent non prépositionnelles avec qui sujet et que) (relatives indépendantes) (relatives a antécédent avec préposition) (complétives sans antécédent)
Les contraintes syntaxiques sont les suivantes: pour la suite 1+2, il faut un lien prépositionnel (sinon, 2 est construit seul); pour la suite 7+5, le lien est appositif (pas de préposition réalisée). Dans ce cadre, ce que est du type 7+5. Ceci revient a dire que le schème syntaxique construisant les complétives a antécédent est grosso modo le même que celui des relatives sans préposition; la différence essentielle est celle des relations de coréférence (il a coréférence globale entre l'antécédent et la proposition dans le cas des complétives, il co référence partielle, relative a un seul terme, avec les relatives): J'ai acquis la conviction qu 'il viendra Les convictions qu 'il affirme a tout bout de champ sont exaspérantes D'un point de vue fonctionnel, les complétives a antécédent sont donc des appo sitions a des noms. On comprend dès lors le rôle de ce: il s'agit simplement d'une béquille syntaxique2, d'un artefact inventé par la langue pour tenir lieu d'ante cedent a la complétive la ou c'est nécessaire. La répartition des prépositions en deux grands ensembles, celles qui utilisent ce et celles qui ne l'utilisent pas, se comprend dès lors ainsi: certaines prépositions sont des antécédents possibles, d'autres non. Très clairement, les prépositions adverbiales peuvent servir d'ante cedent; par exemple, avant sert a construire des comparatives, structures dans lesquelles le terme précédant que régit un marqueur corrélé effacé dans la subordonnée: Luc est entré avant que Paul ne sorte Dans cette phrase, avant est la tête d'un adverbial de temps, et son correspondant est obligatoirement vide dans la subordonnée, ce qui laisse supposer une forme de coréférence entre le terme introducteur et cette position vide, comme le montre la difficulté de construire un adverbe de temps autonome dans cette position: * Luc est entré avant que Paul ne sorte a midi Un certain nombre de prépositions sont donc des antécédents possibles pour les structures phrastiques; la même analyse conduit a mettre dans la même catégorie (les propositions adverbiales) des termes comme après, pendant, durant, outre, 2
Pour Wilmet (1997), un "tampon"; pour Sandfeld, une "soudure".
À PROPOS DE [pc z.]
443
selon, hormis, depuis, qui tous se construisent directement avec que. Il faut probablement rattacher aussi sans, et des, bien que ces termes n'aient pas normalement une des fonctions basiques des adverbes, qui est de pouvoir apparaïtre seuls: Paul est sorti, Luc était entré avant Par contre: Luc est entré des que Paul est sorti * Paul est sorti, Luc est entré des. Si des, qui se construit directement avec que, fait bien partie du même groupe de prépositions, le critère de loccurrence indépendante n'est donc pas crucial. Il aussi pour qui se construit directement comme on l' vu. Dans les classifications des prépositions, pour figure parmi les prépositions "mixtes", entre les "incolores" et les "colorées, pleines de sens, fortes" (cf. Spang-Hanssen, Cadiot). Cette préposition a aussi une fonction prédicative en isolation: Jean est pour (Cadiot 1997:34) qui la rapproche des prépositions prédicatives a emploi adverbial.
4. Dans l'hypothèse minimale qu'on retiendra d'au moins deux classes syntaxiques distinctes de prépositions du point de vue de la complémentation, on supposera que à, de, par, en, sur ne sont pas des antécédents possibles pour que. Ils sont par contre des recteurs possibles aussi bien de noms que de la forme réduite , compris dans sa version désémantisée qui introduit les complétives. Ces prépositions se distinguent d'une part de la série des prépositions "adverbiales", qui semblent exclure le ce des complétives (depuis le moyen français seulement, cf. Combettes 1996) pour cause de redondance, d'autre part de celle des prépositions qui n'introduisent en français moderne ni ce ni que (cas de avec). On ne dira pas: * Luc est entré pendant ce que Paul parlait a Marie * Cela entre en ligne de compte avec ce que Paul est parti mais les raisons en sont différentes: dans le premier cas, ce est exclu parce que sans justification syntaxique en termes fonctionnels3; dans le second cas, ce est exclu parce que le complément de avec, antécédent de la complétive, doit être "consistant" sémantiquement. Les raisons en somme pourraient être opposées: redondance d'un antécédent d'un côté, inconsistance de l'autre; on dira: Cela entre en ligne de compte aveclefait que Paul est parti 3
C'est trop ou trop peu; la construction nominale serait: pendant le moment ù; la construction directe: pendant que.
444
CLAUDE MULLER
regarder de près, on constate que ce n'est pas simplement un pronom désémantisé: 'est surtout une forme corrélée a certaines prépositions, celles qui sont également les plus polyvalentes des la syntaxe du français - les prépositions "incolores" de Spang-Hanssen. On posera donc deux conditions pour régir l'occurrence de devant une com plétive: 1) une préposition qui ne peut régir directement que P; 2) une préposition qui autorise le nominal désémantisé corrélé. Cette seconde condition est souvent ignorée. Elle doit s'interpréter comme un fait de grammaticalisation, qui associe certaines prépositions a ce, rendant ainsi pos sible l'absence d'occurrence de l'ensemble.
5. La situation est donc la suivante: quelques prépositions, essentiellement à et de en français moderne, peuvent régir une complétive introduite par ce. Le minutieux recensement des possibilités de [pc z.] par Maurice Gross (1975) permet de faire quelques rapprochements entre les propriétés des constructions décrites et [pc z.]. On trouve cette possibilité dans les constructions suivantes. - Table 4, type Qu P V N1 Dans la construction réflexive N1 se V de ce que P. Les verbes sont des verbes "de sentiment", et de introduit la cause de ce sentiment, soit une forme de "com plément d'agent" dans une construction de type passif pronominal. La construc tion est une forme proche du passif. Les passifs de ces verbes sont également a [pc z.] , et un certain nombre de prédicats adjectivaux de même sens ont la même construction: Pierre se fâche que Paul soit venu Pierre est fâché que Paul soit venu Pierre est furieux que Paul soit venu - Table 7, type N0 Va ce Qu P La liste des verbes a [pc z.] est assez restreinte. J'en relève 14 dans Gross (1975), a quoi il faut ajouter veilier a (2 occurrences sur 56 exemples dans la base numérisée de Frantext après 1800). Le sens des verbes est également assez homogène. N0, de type "humain", évalue (ou se voit conseiller d'évaluer) prospectivement Paction. Un certain nombre de verbes sont des locutions a prédicat nominal: avoir avantage, a cœur, droit, intérêt; être attentif, d'avis; faire atten-tion, prendre garde. - Table 8, type N0 V de ce Qu P Cette fois, le nombre de verbes a [pc z.] est important. On trouve également bon nombre de locutions verbales a prédicat non verbal: avoir assez, besoin, cons-
A PROPOS DE [pc z.]
445
cience, envie, hate, honte, horreur, souvenance, vent; avoir le temps, l'impression, l'intention, la chance, la ressource, la veine, le droit, le sentiment', faire le vœu, semblant, un drame; se faire fête, gloire, un devoir, une joie, un plaisir, un point d'honneu; se fendre la N; se frotter les mains; se mordre les doigts; prendre acte, conscience, garde, la peine, le mal, le porti, le soin, le temps, note, soin. Des variantes peuvent s'y ajouter; par exemple avoir Vavantage dans: Cette échappée a Vavantage qu'elle est homogène... (20-7-2000, Télé (A2), commentaires sur le Tour de France, 16h10) Autre caractéristique: il a beaucoup de constructions pronominales qui sont en fait des intransitives, la complétive étant du type causal déjà signalé pour la table 4: comme se biler, se marrer, mais sans construction active possible. Dans d'autres cas, le verbe demande la réalisation effective de la cause, qui est donc incorporée a sa valence: se douter, se méfier, se soucier. Certains de ces verbes sont le plus souvent réalisés avec la proforme pronominale du complément en, même si la complétive est présente: s 'en branler, s 'en balancer, ne pas en revenir, en avoir soupé: Il s 'en branie que Paul soit venu / ? Il se branie que Paul soit venu L'Eglise s'en moque que vous soyez aimés, garç...(Bernanos, Jour nal d'un curé de campagne, 1936) Je n'en reviens pas que tant d'hommes puissent ainsi loger dans un si pauvre espace (Tharaud, citation de Sandfeld 1977:29) Les verbes, pronominaux ou non, sont également sémantiquement homogènes: il s'agit de verbes "de sentiment" dont la complétive est la cause. Parmi les non pronominaux: blaguer, blêmir, désespérer, enrager, jouir, jubiler, maronner, pester, raffoler, rigoler, rougir, trembler, verdir... L'aspect du verbe complétif est variable selon les constructions, factif ou non factif. Les rares verbes qui semblent de prime abord échapper a cette catégorisation sémantique s'y rattachent historiquement; ainsi, douter est d'abord un verbe de sentiment (= redouter), avant d'être un verbe de modalisation de l'assertion; idem pour profiter. Par contre, se rappeler est peut-être mis a tort dans la catégorie déclenchant [pc z.]: la complé tive directe est liée a la construction transitive directe, seule admise selon la norme (je me le rappelle; *je m 'en rappelle; je me rappelle cela). La construction indirecte du complément est manifestement liée au rapprochement sémantique avec se souvenir de (table 15, qui serait mieux placé en 8). Au demeurant, la notion "verbe de sentiment" doit être prise assez extensivement: elle inclut, comme on le verra plus loin, des verbes de "conscience" comme avoir conscience, avoir le sentiment, avoir souvenance, être au courant et le lien se fait naturellement avec les verbes d'humeur par des verbes comme se soucier de. Dans les tables a double complémentation, on remarque tout de suite l'inégalité en pourcentage entre les constructions en à et les constructions en de sujettes a
446
CLAUDE MULLER
[pc z.]. Les tables 11 et 14 ont une complétive en à: table 11, type N0 V N1 à ce Qu P; table 14, type N0 V à ce Qu P Prép N2, et on ne trouve aucune construction a [pc z.] selon M.Gross. Il en va autrement dans les tables a complétive en de: - Table 13, type N0 V N1 de ce Qu P Un certain nombre de verbes autorisent [pc z.], permettant donc une double com plémentation transitive directe. Ce sont, selon M.Gross: adjurer, alerter, assurer, avertir, aviser, chicaner, conjurer, convaincre, défier, dissuader, informer, instruire, menacer, mettre au courant, mettre au défl, pénétrer, persuader, préaviser, prévenir, prier, supplier, tenir au courant, urger. Le type sémantique est également assez homogène: il s'agit de verbes de parole ( compris, dans ce cas, pénétrer qui a ici le sens de convaincre). La construction semble être une variante causative de la table 8, du moins pour la simple relation de connaissance: N1 prend conscience de ce que P; N1 est au courant de ce que . Il a donc une relation de prédication seconde entre N1 et la complétive introduite par de. - Table 15, type N0 V Prép N2 de ce Qu P 'est une variante de la table 8, avec des verbes qui ont un complément nominal prépositionnel (Prép N2). A s'en tenir aux compléments phrastiques, on ne voit guère de différence et le role de ce complément nominal semble marginal. Par exemple, il n'y a pas de différence sensible entre être content de ce que P et être content pour N2 de ce que P. La position d'argument nominal N2 n'est parfois pas obligatoire: dans se plaindre de ce que P, on peut imaginer un fonctionnement a deux arguments, sans destinataire des plaintes. On retrouve dans cette table un certain nombre de verbes de sentiment (se plaindre, protester, rouspéter, se lamenter) avec une complétive en relation causale. D'autres verbes sont égale ment apparentés a ceux de la table 8: il s'agit des constructions qui sont liées a la prise de conscience, ou a la connaissance, d'une information. En fait, le même domaine sémantique est couvert dans les trois classes 8, 13 et 15; en 8, il s'agit de prédicats a deux arguments (prendre conscience de, être au courant de, se douter de); en 13, la même relation sémantique s'établit entre N1 et la complétive (informer N1 de, instruire N1 de, persuader N1 de, assurer N1 de, convaincre N1 de, tenir au courant N1 de, avertir N1 de); en 15, la relation sémantique, parfois avec le même verbe, met en jeu un N2 introduit par une préposition (s'informer auprès de N2 de, s 'assurer auprès de N2 de, faire état a N2 de, rendre compte a N2 de). Ces relations entre les tables sont d'ailleurs explicitement signalées par M.Gross (1975:207). Il a donc une forte homogénéité sémantique entre toutes ces constructions. Les deux séries de verbes avec [pc z.] sont donc: être content pour, reconnaissant a, (de ce que P); justifïer auprès de N; se lamenter auprès de N, se plaindre auprès de N / a N, se porter garant auprès de N, protester auprès de N, rouspéter (idem), savoir gré a N, tenir rigueur a N, en vouloir a N. Le complément de ce
A PROPOS DE [pc z.]
447
que P est causal. L'autre série est: s 'assurer auprès de N, se confesser auprès de N, faire état / faire part a N, rendre compte a N, ne souffler mot a N, se vanter a N. Le complément de ce que P est l'information transmise, source de l'action. Un exemple: Il en riait, ce con, se vantant que dans sa familie on avait des couilles au cul (M. Charef, Le thé au harem, 1983) Le complément est en relation de prédication seconde avec le complément prépositionnel N2 dans la plupart des cas (le sens est alors "N0 fait savoir a N2 que P" I "N0 fait que N2 apprend que P"). Si la construction est réflexive, N0 peut alors être le sujet de cette prédication seconde ("s 'assurer auprès de N2 de ce que P"). Aux verbes notés par M.Gross, j'aurais envie d'ajouter s'informer auprès de N2 de ce que P (sans [pc z.]); parmi ceux qui ne sont pas notés positivement pour [pc z.], j'ajouterai aussi: témoigner auprès de N2 (de ce) que P, mais ce verbe a des emplois très proches comme transitif direct et on peut hésiter sur la construction en jeu dans les exemples: "Vous savez, je suis très connu en France, mes livres témoignent que je suis une personne morale.." (J.Kristeva, Les samouraïs, 1990) Parmi ces verbes de transmission de l'information, figurent dans la table 15 de nombreux verbes variantes sémantiques de parier avec N de. Il me semble, contrairement aux indications de la table, que la plupart de ces verbes ne permettent pas [pc z.] {causer, comploter, converser, dialoguer, médire, négocier, palabrer). Seule exception nette pour moi, délïbérer avec N (de ce) que P, mais le verbe était transitif direct en français classique, et c'est peut-être cette construction qui apparaït dans: "Le conseil du roi délïbéra que des conférences seraient entamées pour le maintien de la paix..." (Prince de Barante, Histoire des ducs de Bourgogne, 1824). - La table 16, type N0 V Prép N1 Prép N2, décrit des constructions a deux complétives compléments. Seuls deux verbes permettent [pc z.]: s'apercevoir (de ce) que P ace que P; se rendre compte (idem). - Enfin, la table 17 (constructions impersonnelles sans relation avec des phrases a sujet plein) contient quelques cas a [pc z.]. Ce sont essentiellement des construc tions a prédicat nominal (par exemple: avoir avantage, être question) sauf deux verbes, s 'agir et la construction archaïque il souvient a N. Fréquemment, le passif des complétives sujets permet [pc z.]. Il s'agit évidemment de la construction en de causal rencontrée également pour les verbes de sen timent et les réflexifs: Je suis surpris que Paul soit venu
448
CLAUDE MULLER
"Ainsi étais-je ému que la tache brune dans le ciel d'été ne fût ni un moucheron, ni un oiseau, mais un aéroplane monté par des hommes qui veillaient sur Paris" (M. Proust, Le temps retrouvé, 1922) Les tables ne mentionnent pas systématiquement cette construction; par contre, le passif en de ce que P est mentionné (table 4), et [pc z.] s'applique assez systéma tiquement a cette construction; et il semble bien qu'il s'agisse toujours du même sous-ensemble des verbes de sentiment: Marie a été chagrinée que vous ne puissiez pas venir Les verbes sans passif en de de la table 4 (a complétive sujet) ne sont guère susceptibles de construire directement le complément d'agent: Que Paul soit venu a compromis Marie ?* Marie a été compromise que Paul soit venu
6. Un cas particulier pour finir: celui des verbes en sur. M.Gross en énumère une petite liste de 10 verbes classés dans la table 6 (1975 :180) auxquels j'ajouterai 18 verbes ayant un complément phrastique possible et naturel avec cette préposition. La liste est la suivante: s 'appesantir sur, s 'aveugler sur, se baser sur, compter sur, discuter sur, divaguer sur, enquêter sur, épiloguer sur, s'excuser sur, s 'expliquer sur, (se) fonder sur, s 'hypnotiser sur, s 'illusionner sur, influer sur, insister sur, interpeller N sur, jouer sur, lésiner sur, se méprendre sur, miser sur, se prononcer sur, renchérir sur, reposer sur, spéculer sur, statuer sur, surenchérir sur, tabler sur, se tromper sur. Tous ces verbes peuvent avoir comme complément sur le fait que P. Par contre, il est extrêmement peu naturel d'en faire un complément en sur ce que P: ? *Paul s 'aveugle sur ce que Paul l'aime Cette possibilité éventuelle est peut-être admissible avec se fonder: ? Le tribunal a fondé son arret surcque le prévenu était de bonne foi La construction directe de la complétive concerne très peu de ces verbes; pour moi, seulement compter, insister, spéculer, statuer, tabler. Les constructions directes avec enquêter, divaguer, renchérir, me semblent douteuses. Discuter a pu avoir une complétive directe, mais probablement due a une autre construction, discuter (de). Enfin, chacun de ces verbes a, ou a eu, une possibilité de complé mentation directe nominale. Par exemple, pour tabler: "Elle prit Vhabitude de tabler Vavenir sur la vente du phonographe" (Duras, dans Lexis) Autre exemple, insister: il s'agit dans la construction directe d'une extension de dire, donc d'un emploi calqué sur celui d'un verbe transitif, et cet usage est ancien:
A PROPOS DE [pc z.]
449
"J'insistai que l'on n 'innovat rien" (Retz, 17ème siècle, cité dans Lexis) Les possibilités d'emploi direct de la complétive me semblent par conséquent devoir être dissociées ici de celles de Prép ce que P . Elle dépendent étroitement de l'interprétation lexicale du verbe, orientée dans un certain sens par l'existence d'un complément phrastique. La construction en ce n'est au mieux qu'une repré sentation commode de la forme nominale de la complétive, mais elle n'a guère de réalité dans ce cas.
7. Un élément de structure apparaït nettement dans les observations ci-dessus: la présence d'un terme non verbal dans la locution verbale favorise la construction directe. La préposition qui entre en jeu lorsque le complément est un nom est un de assez particulier: celui qui n'a d'autre justification que celle de permettre une construction de complément, la juxtaposition simple ayant disparu assez tot du français: certain de cela / *certain cela; la conviction de cela/*la conviction cela, Ce de semble une simple marque de rection indirecte obligatoire lié a la nature nominale du complément (nom ou infinitif) et il disparaît avec la complétive: Certain qu 'il réussira / la conviction qu 'il réussira On peut décrire ces faits par [pc z.] mais il a une limite: la construction de le fait que P, dans laquelle l'apposition de la complétive au nom recteur ne peut provenir d'un effacement de ce type, sous peine de réduplication indéfinie: *le fait de ce que P = * le fait du fait que P...si ce que P est bien une variante de le fait que P. Il vaut donc mieux, plutot que de postuler une préposition et ce pour les effacer, admettre ici que la conjonction que annihile le besoin d'un génitif de liaison avec le nom ou l'adjectif: la jonction est appositive avec le fait, et cela vaut pour les extensions comme la certitude que P, dès lors que Ton peut dire: que P est une certitude. À partir de cette possibilité, l'existence d'un lien direct avec un antécé dent nominal existe, quelle que soit l'interprétation sémantique, et hors des cas évidents de coréférence entre antécédent et l'action phrastique: J'ai peur qu 'il ne vienne Dans ce cas, il n'y a pas de coréférence: qu 'il ne vienne est un "fait", et la peur est un "sentiment" causé par le fait. Peut-être faut-il voir, dans cette construction, une extension du cas précédent, motivé sémantiquement, d'une identification possible de la complétive a son antécédent (a la manière d'une apposition: comme une détermination particulière). Admettons formellement ceci: que = (+/- N génitif) pour signifier que la conjonction complétive est capable d'entrer indifféremment dans une position nominale de complément direct, ou de complément génitif. Cela conduit a décrire directement la présence de de dans les locutions verbales
450
CLAUDE MULLER
avec un nom complément, ainsi que la proforme en: si le complément est un nom, il a une contrainte locale d'intransitivité qui impose une préposition, dont la valeur non marquée est de. Si le complément est un verbe, cette contrainte locale disparaît: que peut donc être construit directement; bien entendu, la proforme reste en puisqu'elle est encore catégorisée parmi les nominaux. Alors que que apparaîtra aussi bien en complémentation non génitive qu'en complémentation génitive: J'ai peur de cela /j'en ai peur /j 'ai peur qu 'il vienne Dans ce cas, l'occurrence de de ce est peu acceptable: ?*J'ai peur de ce qu 'il vienne On décrit du même coup la relation a un antécédent nominal: la peur qu'il ne vienne. Une autre observation faite ci-dessus peut s'expliquer de la même façon: dans un grand nombre de cas, la construction directe estlia une construction prono minale du verbe (tables 4, 8 et 15 de M. Gross 1975): s'agacer de (4), se moquer de (8), se vanter (auprès de N2) de (15). Dans tous les cas, qu'il ait ou non une construction non pronominale, on peut supposer que le réfléchi prend une place d'actant direct, qui impose un génitif de structure pour la complétive complément: ce génitif n'a pas d'autre motivation que celle de différencier complétive et réflé chi; la complémentation en que échappe a cette contrainte de différenciation: la cooccurrence d'un objet direct nominal et d'une complétive directe sont possibles, comme onl'vu (table 13): Luc conjure Marie qu 'elle veuille bien accéder a sa demande 8. Admettons maintenant que le que complétif soit doté d'un trait sémantique comme (+/- génitif), qui le rende apte a construire directement la complétive, soit parce que la complémentation du terme recteur est directe, soit parce qu'elle serait réalisée avec un nom par de. On obtiendra dans ce cas les deux variantes que P et de ce que P, mais il reste a comprendre pourquoi la variante courte est parfois interdite. Comment expliquer cette fois-ci que ce ne sont qu'une partie des complétives correspondant a des noms introduits par de qui se construisent directement ? L'explication tient semble-t-il a la sémantique des constructions. Toutes ont trait, soit a un sentiment né d'un fait, ou de façon, moins marquée a la prise de conscience d'un fait, et dans les tables ayant un autre complément nominal, a la transmission de ce sentiment (ou de cette information). Comment intervient concrètement cette contrainte sémantique, compte tenu du fait qu'il a de fortes variations d'acceptabilité selon les constructions (et selon les époques) ? La différence entre l'aspect factuel et le non factuel ne me semble pas perti nente. On trouve la construction directe dans les deux cas: Pierre s 'indigne que Luc soit venu (=Luc est venu)
A PROPOS DE [pc z.]
451
Pierre s 'inquiète que Luc obtienne son permis (non factif) Par contre, la construction en de ce que oriente déja vers une causation "psychologique"; on peut dire: Pierre est blessé de ce que Luc l'ait oublié Pierre a été blessé par la chute d'une pierre / *de la chute d'une pierre mais avec: Pierre a été blessé (de ce) qu 'une pierre soit tombée bizarrement, seul le sens "psychologique" est possible. Le sens matériel requiert par, donc: Pierre a été blessé parce qu'une pierre est tombée 'est donc, préalablement a [pc z.], la combinaison de ce que qui fixe le sens sur l'image mentale d'une action plutot que sur Taction même. Ensuite, dans ce cadre déja restreint, le verbe a complémentation en de ce que doit entrer dans le modèle sémantique décrit plus haut. Si, au lieu d'un verbe de conscience ou de sentiment, on a affaire a une opération mentale d'un type différent, la construction directe est bloquée: ? Pierre l'accuse de ce qu 'il a raconté des histoires a tout le monde * Pierre l'accuse qu 'il a raconté des histoires a tout le monde * Pierre s 'accuse qu 'il a raconté des histoires a tout le monde 9. La construction en à est encore plus restrictive pour l'application de [pc z.]. L'action est vue comme prospective et orientée vers le sujet, et l'effet [pc z.] est limité a quelques verbes de réflexion sur l'action. Beaucoup de verbes avec la même valeur pour a ne permettent pas la construction directe: aboutir a, accéder a, s 'accorder a, s 'accoutumer a, aider N a, appeler a, applaudir a, s 'attacher a, autoriser N a, se borner a, sont des verbes qui envisagent l'action comme pros pective. Ils ne sont pas tous orientés vers le sujet, et n'autorisent pas de réduction. Peut-être sont-ils déjà trop performatifs ? On aura pourtant consentir a qui permet la construction directe, mais c'est sans doute le limite du domaine défini par aviser, faire attention, chercher, être d'avis, prendre garde, réfléchir, veilier. 10. Lorsque Maurice Gross, dans les conclusions qu'il tire de son examen détaillé des constructions transitives (1975:221) dit: "Nous considérons que certaines propriétés sémantiques déterminent les propriétés syntaxiques des verbes, c'est-a-dire la forme des phrases simples", il décrit exactement la situation a laquelle on est arrivé en examinant [pc z.]: le conditionnement syntaxique préalable en à c que / de ce que oriente déja l'interprétation vers des valeurs particulières: fait envisagé sous son angle mental, préposition soit vide de sens propre, soit causative de
452
CLAUDE MULLER
sentiment (de) ou prospective (à). La constraction directe restreint encore le domaine sémantique, sur des verbes d'affect psychologique. L'hypothèse d'un que ayant des propriétés particulières (+/- génitif) est appuyée par l'observation suivante de Michel Pierrard (1996:83): le français a tenté, entre le 15ème et le 17ème siècle, de remplacer la séquence que suivant de par la forme de conjonction forte quoi (disparue depuis longtemps du français en tant que conjonction) - cf. Haase § 42 rem.IV): Je ne m 'étonne plus de quoi je gagne tant (= de ce que je gagne tant) Cette substitution, qui disparaït au cours du 17ème siècle, tente donc de donner plus de consistance au que par le processus inverse de [pc z.], et elle apparaït dans la complémentation des verbes "affectifs"(Haase), aussi bien pour des complé ments argumentaux que pour le complément d'agent. Le que des constructions a [pc z.] actuelles pourrait donc être une conjonction au génitif, marquée sémantiquement comme l'introducteur d'une action verbale vue sous l'aspect particulier d'un causatif de sentiment, ou au sens plus large, de réaction mentale. L'étude détaillée a quoi nous invitent les tables dressées par M. Gross permet ainsi de mieux cerner l'effet sur la syntaxe des catégories sémantiques cognitives qui en modèlent les propriétés. Références Cadiot, Pierre. 1997. les prépositions abstraites enfrangais. Paris: Armand Colin. Combettes, Bernard. 1996. L'intégration syntaxique de la subordonnée conjonc tive topicalisée en français: approche historique. In Muller (ed.), Dépen dance et intégration syntaxique, Tübingen: Niemeyer, 89-96. Grevisse, Maurice. 1980. Le bon usage, Paris-Gembloux: Duculot. Gross, Maurice. 1968. Grammaire transformationnelle du frangais. Syntaxe du verbe. Paris: Larousse. Gross, Maurice. 1975. Méthodes en syntaxe. Paris: Hermann. Haase, A. 1965. Syntaxe frangaise du XVIIe siècle. Paris: Delagrave. Huot, Hélène. 1981. Constructions infinitives du français. Genève: Droz. Kayne, Richard S. 1975. French relative que. Recherches Linguistiques de Vincennes 2, 40-61 et 3, 27-92. Muller, Claude. 1996. La subordination en frangais. Paris: Armand Colin. Pierrard, Michel. 1996. Ce que en subordination propositionnelle: un stabilisateur catégoriel. In Muller (ed.): Dépendance et intégration syntaxique, Tübin gen: Niemeyer, 77-87. Sandfeld, Kraus. 1977. Syntaxe du frangais contemporain, Les propositions subordonnées. Genève: Droz. Spang-Hanssen, Ebbe. 1963. Les prépositions incolores du français. Copenhague: G.E.C. Gads Forlag. Wilmet, Marc. 1997. Grammaire critique dufrangais. Paris: Hachette.
À PROPOS DE [pc z.]
453
Summary French completives introduced by que are limited to prepositional complements, with two peculiar properties: the preposition, unlike adverbs, cannot be understood as an ante cedent for the completive; the preposition does not need a consistant argument for its complementation. Among these constructions, only a very limited list authorizes a direct completive complementation with indirect interpretation - what was studied by Maurice Gross under the name [pc z.]. We analyse this property as the result of: - the recoverability of the meaning of the preposition; - the appositive ability of que (what we call +/- genitif); - a semantic filter favoring a mental or psychological interpretation of the completive.
SOME LINGUISTIC PROBLEMS IN BUILDING A KOREAN ELECTRONIC LEXICON OF SIMPLE VERBS 1 NAM JEE-SUN Dept. of Linguistics, Hankuk University of Foreign Studies, Korea
1. Introduction Any system that aims to automatically process a natural language should first be equipped with a well-constructed electronic lexicon. An electronic lexicon is a large-scale data base that contains all linguistic information a machine requires, i.e. inflectional, derivational, syntactic and some reliable semantic information. In Nam (1996b),2 we discussed some problems we encountered in building a morpho-syntactic lexicon of Korean adjectives. About 5,000 items were defined as adjectives in our lexical system. Each one was then examined and assigned to a syntactically defined class. Similarly, to build a systematic lexicon of simple verbs, several linguistic criteria should be considered. This study constitutes a preliminary step in the construction of a syntactic lexicon of Korean verbs. In the following section, we will consider the problem of hada (to do) sequen ces, which raises the contentions of distinguishing between a simple verb and a verb phrase in Korean. In section 3, we discuss the derivational entries and comp lex forms: how to handle these items in a machine-readable lexicon is not a simple question. Section 4 covers the treatment of some incomplete forms in the lexicon. Finally, in the last section, we outline the direction of future work.
1
2
We have started to examine Korean verbs from 1996 under the KORELEX project supported by ETRI (Korea) and LADL (France). The main idea of this work was presented in Nam (1996a). We are now preparing a complete version of a Korean electronic lexicon, which will be accessible to the public shortly. We are grateful to all ourfriendsof LADL and IGM, especially to Maurice Gross, without whose guidance we certainly could not have attempted to realize such a long term project. We also wish to thank Marilyn Plumlee, HUFS colleague, for her reading and helpful comments on our English manuscript. This work is based on our Ph.D dissertation presented at the University of Paris 7 in 1994.
NAM JEE-SUN
456
2. Sequences including hada and the lexicon of verbs One of the most problematic cases in listing simple verbs in Korean is that of the sequences made up of a Noun and hada. The following examples represent the first entries of transitive verbs in hada encountered in existing conventional dic tionaries:3 (1)
gagamhada 4 gagyelhada gagonghada ganeumhada gamihada gabulhaha gasanhada gasanghada gaselhada gaseihada
(to) calculate (to) accept (to) treat (to) measure (to) add (to) borrow (to) add (to) imagine (to) install (to) help
Let us compare the following two sentences containing one of the verbs above: (2)
jenhwagug-eise gugjeitongsinmang-eul geu jiyeg-ei mainmenje gaselha-ess-da Telecom-nmtf internet system-Acc this area-Postp first install-Mpas-St (Korea Telecom has installed the internet system first and foremost in this area)
(3)
jenhwagug-eise gugjeitongsinmang-eul geu jiyeg-ei mainmenje gasel-eul ha-ess-da Telecom-nmtf internet system-Acc this area-Postp first installation-Acc do-Mpas-St (Korea Telecom has done installation of the internet system first and foremost in this area)
These two sentences have different constructions, which can be formulated as follows: (4) a. NO N1-Acc N2-Postp Adv V b. NO Nl-Acc N2-Postp Adv N3-Acc hada In other terms, the predicative term in (4a) is a simple verb gaselhada [(to) install], derived from a noun gasel [installation] by means of a derivational suffix 3
4
The conventional dictionaries consulted in this study are as follows: Korean Dictionary by Hangeul Haghoi (Korean Research Association), Korean Dictionary by Lee Hi-Seung and New Korean Dictionary by Sin Gi-Chel & Sin Yong-Chel. In this paper we do not adopt Yale Romanization System. The issues involved in standardizing the romanization of the Korean alphabet are discussed in Nam (1996b).
KOREAN ELECTRONIC LEXICON OF SIMPLE VERBS
457
hada, whereas that in (4b) is a syntactical phrase containing an accusative noun gasel-eul [installation-Acc] and a simple (light) verb hada [(to) do]. In this case, the verb (V) gaselhada in (4a) should be counted as a simple verb, and the noun (N3) gasel in (4b) will be considered a simple noun. However, it is surprising that the verb (V) in (4a) is made up of two units (N and hada), exactly like the two constituents of the verbal phrase in (4b). Since these sentences have the same meaning (without considering some emphatic effect), it would be plausible to claim that these two sentences are originally one and that they are obtained by means of some appropriate transformations. Nevertheless, it can be argued that these two structures are syntactically diffe rent, because we can put an item such as an adverb inside the sequence N3-Acc hada in (4b) as: (5)
jenhwagug-eise gugjeitongsinmang-eul geu jiyeg-ei gasel-eul mainmenje ha-ess-da Telecom-nmtf internet system-Acc this area-Postp installation-c first do-Mpas-St (Korea Telecom has done, first and foremost, installation of the internet system in this area)
whereas it is forbidden in the construction containing a simple verb, i.e. in (4a). Besides, the accusative postposition eul linked to the noun N3 in (4b) can be replaced by some other (modal) postpositions such as man(=on\y), or eun(=at least) like: (6)
jenhwagug-eise gugjeitongsinmang-eul geujiyeg-ei mainmenje gasel-(man+eun) ha-ess-da Telecom-nmtf internet system-Acc this area-Postp first installation-(Postp) do-Mpas-St (Korea Telecom has done installation of the internet system first and foremost in this area)
The insertion of these postpositions in construction (4a) is not permissible. The syntactic properties we observe in construction (4b) underline the hypothesis that the sequence N3-Acc hada is actually composed of two syntactic components: in (4b), the predicative part is a verb phrase made up of a noun morphologically related to the simple verb in (4a), and a verb which, lexically empty, accompanies its accusative noun.5 Obviously, this consideration has important consequences in the construction of the lexicon of verbs and nouns. However, in the absence of morphological changes, handling them as two different constructions can hardly be justified. Moreover, there are a number of 5
Note that this verb is named light verb; verbe support in French (M. Gross 1981, J. Giry 1987, G. Gross 1989); gineungdongsa in Korean (Hong 1987). These terms denote a lexically empty verb, containing all grammatical markers, which accompanies a lexically complete predicative noun.
NAM JEE-SUN
458
facts which argue against treating the verbs N-hada and the nouns in N-leul(Acc) hada as two separate lexical entries. We will therefore adopt the assumption that these sentences are in transformational relation and that they should be counted only once in a lexicon. We shall examine each of the facts supporting our assump tion in turn. 2.1. Regularity of the relations between N-hada and N-Acc hada In existing dictionaries, we observe about 7,000 simple nouns that can occur with the string hada. All of these, without exception, can also be used in the string NAcc hada. Therefore, for these nouns, it would be enough to mark the existence of N-hada strings, the latter being automatically transformed into two disjunct units. To provide duplicate lexical entries would be redundant. 2.2. Productivity of Nouns in N-hada strings The productivity of the nouns in N-hada causes considerable problems in building the list of these nouns, and if we duplicate them as both noun and verb entries, we will meet the same difficulties in the building of the list of the verbs N-hada. Let us present here two cases: N-hada strings containing concrete nouns; and N-hada strings produced by derivational or compositional operations. First, we observe that a great number of concrete nouns can be linked to hada quite often, like: (7) a.
bab-hada
b. jangjolim-hada
rice-do = (to) cook rice plate of beef-do = (to) make a plate of beef
In addition to N-hada strings based on a simple noun such as sensaing [teacher]: (8) sensaing-hada teacher-do = (to) be teacher there are also N-hada strings based on complex nouns, obtained by addition of affixes or other nouns, either at the end of the simple noun such as: (9) a. sensaing-jil-hada teacher-act-do = (to) play a role of teacher b. sensaing-noleus-hada teacher-role-do = (to) play a role of teacher sensaing-haingsei-hada teacher-appearance-do = (to) pose as a teacher or in the front of the basic noun such as: (10) a. guge-sensaing-hada b. yeonge-sensaing-hada bule-sensaing-hada
Korean-teacher-do = (to) be a Korean teacher English-teacher-do = (to) be a English teacher French-teacher-do = (to) be a French teacher
We will discuss these problems below.
KOREAN ELECTRONIC LEXICON OF SIMPLE VERBS
459
2.3. Same relations between N-Adj and N-Postp Adj strings Analogous to the case of N-hada and N-Postp hada, there are similar pairs of bare N-Adjective and N-Postp Adjective, such as N-issda/ebsda/gatda and N-Postp issda/ebsda/gatda. Consider the examples in (11) and (12): (11) a. mas-issda b. yonggi-ebsda ggum-gatda
taste-present = (to) be tasty courage-absent = not (to) be courageous dream-resembling = (to) be dreamlike
(12) a. mas-i issda b. yonggi-ga ebsda ggum-gwa gatda
taste-Postp present = (to) be with tastiness courage-Postp absent = (to) be without courage dream-Postp resemblant = (to) be like a dream
The strings in (11) are made up of a noun and an adjective, and they can be transformed into two sequences such as in (12). To be consistent in the cons truction of electronic lexicons, we would be obliged to duplicate these cases also: that is, there would be Adjective entries such as (11) and Noun entries as those in (12), an obviously uneconomical solution. 2.4. Other N-Verb strings showing the same relation If we examine N-Verb strings more closely, we begin to wonder whether any transitive verbs requiring an accusative noun can be linked to the latter without typographic blanks. Let us consider the following verbal phrases of the N-Acc Verb type: (13) a. bel-eul(Acc) juda punishment-Acc give= (to) punish b. salang-l () badda love-c receive = (to) be loved jam-eul(Acc) jada sleep-Acc sleep = (to) sleep They all appear as one unit like: (14) a. bel-juda b. salang-badda jam-jada
punishment-give = (to) punish love-receive = (to) be loved sleep-sleep = (to) sleep
Notice that some of these N-Verb strings have been handled as Verb entries in several of the most conventional Korean dictionaries without any explicit criteria for their inclusion. Therefore, in addition to the verbs requiring N-Acc comple ments, some of the bare sequences N-Verb without the Acc marker might have been arbitrarily included in the dictionaries. Their inclusion, however, has not been based on any discernible formal criteria. Thus we cannot account for why the following cases have been omitted from such dictionaries. To take one illustrative example, compare (14a) with (15):
NAM JEE-SUN
460 (15) a. bel-badda b. bel-hada e. bel-nailida
punishment-receive = (to) be punished punishment-do = (to) punish punishment-execute = (to) execute punishment
Moreover, it is also possible to observe the same situation with a verb requiring a concrete noun as a complement such as megda[(to) eat]. In this case, the list of Noun-Verb strings will be hard to establish. Let us consider some of them: (16)
(bob + bbang + sagwa + saingsenhoi + oligogi)-rnegda (rice + bread + apple + raw fish + duck)-eat = (to) eat (rice + bread + apple + raw fish + duck)
It is obvious that we cannot consider all these strings as simple verbs in dictio naries: these nouns are real objects for the predicative form megda. To avoid the above-mentioned problems, we have decided to systematically treat nouns occurring in Noun-hada strings in the lexicon of nouns, but these Noun-hada strings themselves will not be treated as verbs in the lexicon of verbs. As information about Noun-hada and Noun-doida strings has been given more systematically in dictionaries than information for strings including other verbs, this information might be encoded by a specific code such as PRED around the nouns. The Noun-Verb strings currently so identified in conventional dictionaries should be handled with a separate code, while the exhaustive inventory of possible Noun-Verb combinations is being compiled.
3. How to handle derivational relations ? 3.1. Conventional dictionaries and derived terms Derivational relations among parts of speech are complex and sometimes very productive, but they are hardly regular. In existing conventional dictionaries, some of the derived terms are found, but their lists are not only incomplete, but also without systematic principles for selection. For instance, there are verbs in deriva tional relations with adjectives such as: (1)
Adjective
↔
{Adjective}-{Suffix.e}-{hada} = Verb
(2)
Adjective
↔
{Adjeetive}-{Suffix.e}-{hada}
= Verb
The following examples represent relation (1): (3) a. gibbeuda [(to be) joyful] b. antaggabda [(to be) regretful] and those of (4) illustrate relation (2):
↔
gibbeuda+Sfx+hada = gibbehada [(to) rejoice] ↔ antaggabda+Sfx+hada = antaggawahada [(to) regret]
KOREAN ELECTRONIC LEXICON OF SIMPLE VERBS
↔
(4) a. gaggabda [(to be) near]
↔
b. nelbda [(to be) large]
461
gaggabda+Sfx+jida = gaggawajida [(to) get near] nelbda+Sfx+jida = nelbejida [(to) get large]
These procedures concern an important number of adjectives, but in dictionaries, we observe only a few cases listed: there are only twenty-odd verbs introduced by procedure (1). We could already observe, however, more than 500 items of this type. Similarly there are only 2 verbs of the Adj-ejida type provided in conven tional dictionaries, whereas at least 40 adjectives of this type allow this procedure. Therefore, we are obliged to classify these verbs separately in order to compile a list of them in a systematic way. 3.2. Syntactic units or morphological
suffixes?
Let us examine the following examples: (1) a. b. d.
bag-hi-da dagg-i-da gulm-gi-da giul-i-da
(to) insert (to) clean (to) starve (to) lean
- Passive Sfx = (to) be inserted - Passive Sfx = (to) be cleaned - Causative Sfx = (to) let starve - Causative Sfx = (to) let lean
These examples contain grammatical morphemes that transform transitive verbs into passive forms (i.e. (la) and (lb)), or intransitive verbs into causative forms (i.e. (lc) and (ld)). The processes can be described as follows: (2) a.
a passive processing with passive suffixes: {Vt}-{Passive Sfx} = {Passive Verb} b. a causative processing with causative suffixes: {Vi}-{Causative Sfx} = {Causative Verb}
The strings in (1), in effect, result from these operations being applied to the follo wing simple verbs (two transitive verbs and two intransitive verbs, respectively): (3) a. b. d.
bagda daggda gulmda giulda
(to) insert (to) clean (to) starve (to) lean
There is, however, another type of passive/causative operation. Let us examine the following examples: (4) a. ggeunhda b. gubulida
(to) cut (to) curve
For the verbs above, the following strings are observed:
462
NAM JEE-SUN
(5) a. ggeunh-e-jida [ggeunhda+Sfx+jida = (to) be cut] b. gubuli-e-jida [gubulida+Sfx+jida = (to) be curved] The pairs (4)-(5) may result from the passive operation shown in (6): this passive string is obtained by addition of the sequence '{e}-{jida} (note that this element must be distinguished from the derivational suffix ejida that derives a verb from an adjective). Consider: (6)
a passive processing with {e}-{jida}: = {Passive string}
{Vt}-{Sfx.e}-{jida)
And to obtain a causative string for this case, we have: (7)
a causative processing with {e}-{ddeulida}: {Vt} - {Sfx.e} - {ddeulida} = {Causative string}
such as: (8) a. ggeunh-e-ddeulida [ggeunhda+Sfx+ddeulida = (to) cut] b. gubuli-e-ddeulida [gubulida+Sfx+ddeulida = (to) curve] Obviously, the causative operators '{e}-{ddeulida}' replace '{e}-{jida} in (5): they are not imposed upon the basic form in (4). In other words, the items in (8) are not the causative forms of basic verbs in (4), but of the verbs in (5): (8) are semantically equal to (4)6. It is usual that the former (i.e. in (2)) is considered to be a morphological ope ration, whereas the latter (i.e. in (6) and (7)) is treated as a syntactic one: the former seems to be an ad hoc operation applied upon a very limited number of verbs, while the latter is observed more systematically. But as we do not know under what lexical constraints these two passive/causative operations can be applied, we are obliged to enumerate all these combined forms in the lexicon. The passive/causative forms obtained by the former process are of small number and so relatively easy to list; those of the latter process are very incomplete in existing conventional dictionaries and it will be a long-term task to exhaustively compile a list of them.
6
Notice that, in the case of the verbal strings Noun-hada, some triplets Noun-hada / Noun-doida / Noun-sikida are similar to the triplet above V / V-e-jida / V-e-ddeulida. Compare (4a)-(5a)-(8a) with jungdan-hada [N:stop-do = (to) stop] / jungdan-doida [N:stop-become = (to) be stopped] / jungdan-sikida [N:stop-let = (to) let stop].
KOREAN ELECTRONIC LEXICON OF SIMPLE VERBS
463
4. Incomplete verbs and their treatment in the lexicon 4.1. Morphologically incomplete verbs In existing dictionaries, we observe the following items as verb entries: (1) a. dageuda b. dengdalda deilida
(to) approach (to) accompany (to) bring
However, we never encounter them as autonomous elements in texts. As a matter of fact, they only occur with other verbs in larger strings to constitute complex forms. Let us consider: (2) a.
daga-seda daga-oda b. dengdala-ulda dengdala-usda deiligo-oda deiligo-salda
approach-stand = (to) go near approach-come = (to) step up to accompany-cry = (to) cry following suit accompany-laugh = (to) laugh following suit bring-come = (to) come accompanied by bring-live = (to) be attended by
As shown above, the basic forms in (1) become, in (2), daga-, dengdala- and deiligo-, respectively. We wonder if the forms in (1) are actual verbs: given that they are observed only as linking (i.e. adverbial) forms, we do not have any formal grounds for their classification. Therefore, considering the verbs in (2) as complex ones, composed of two verbal units, might also be doubtful: they probably are a subcategory of verbs requiring some particular prefixes. Another analysis can be suggested regarding the items in (2b) and (2c). Even if typographical rules concerning spacing between words are not always rigorously respected in Korean writing, the items in (2b) and (2c) can optionally be written with a blank, whereas those in (2a) cannot: (3) a. * daga goda / * daga seda b. dengdala ulda / dengdala usda . deiliko oda / deligo salda The optional orthographic representation of the string in (3b) and (3c) supports the hypothesis that the first parts of the sequences in (2b) and (2c) are autonomous units, that is, adverbial units, and not prefixes attached to verbs. If this is the case, strings (2b) and (2c) can be considered complex forms which contain more than one categorical item. For the moment, we leave this question open, but we consider that, in the lexicon, the complex forms such as those in (2) should be entered rather than the odd units such as those in (1). Some specific codes are required around these entries to indicate their problematic morpho-syntactic status and to indicate that the inventory of these forms needs to be completed.
NAM JEE-SUN
464
4.2. Syntactically incomplete verbs Let us compare: (1) a. geudeul-eun nugu-eigeina bigulha-gei gul-ess-da they-nmtf everybody-Postp mean-gei behave-Mpas-St (They behaved meanly to everybody) b. * geudeul-eun nugu-eigeina gul-ess-da they-nmtf everybody-Postp behave-Mpas-St (They behaved to everybody) The verb gulda [(to) behave] cannot occur without a -gei ending string (i.e. 'Adjgei') to its left: the verb gulda is syntactically incomplete.7 It is semantically in complete as well. It accompanies the -gei ending string which is actually a lexical pivot. Thus, the following sentence retains the same lexical information as (la): 8 (2)
geudeul-eun nugu-eigeina bigulha-ess-da they-nmtf everybody-Postp mean-Mpas-St (They were mean to everybody)
Likewise, while we observe the following sentences: (3) a. geu namja-neun jasin-eui mogsoli-leul sihemha-e bo-ass-da this man-nmtf himself-Gen voice-c test-e intend-Mpas-St (This man intended to test his voice) b. geuyeja-neun cha-leul phal-e beli-ess-da she-nmtf car-c sell-e finish-Mpas-St (She ended up by selling her car) those without -e ending strings like in (4) are not allowed: (4) a. * geu namja-neun jasineui mogsoli-leul this man-nmtf himself-Gen voice-c (This man intended to his voice) b. * geu yeja-neun cha-leul beli-ess-da she-nmtf car-c finish-Mpas-St (She ended up by her car)
bo-ass-da intend-Mpas-St
The verbs boda [(to) try] and belida [(to) end up] should be accompanied by a linking sequence, i.e. one ending in -e. Moreover, these verbs do not have a lexi7
8
Note that, in this case, the -gei string is only appended to adjectives. Let us remember that, in general, both verbs and adjectives can be linked to -gei out of this structure, such as in causative sentences. The Adj-gei string in (la) should also be distinguished from an adverb in -gei which can easily be omitted: geudeul-eun nugu-eigeina (bigulha-gei + E) insaha-yess-da they-nmtf everybody-Postp (mean-gei+E) bow-Mpas-St (They bowed (meanly+E) to everybody) Without considering some aspectual differences between (la) and (2).
KOREAN ELECTRONIC LEXICON OF SIMPLE VERBS
465
cal meaning: they add some modal effects (e.g. attenuation, emphasis) to the -e ending strings, which have predicative meanings. Thus, the verbs in (3) are oppo sed to their homonyms in (5), which are actual lexical verbs (i.e. boda [(to) see] and belida [(to) throw away]): (5) a. geu namja-neun salinbem-eui elgul-eul bo-ass-da the man-nmtf murderer-Gen face-c see-Mpas-St (The man saw the murderer's face) b. geuyeja-neun modeun ggum-eul beli-ess-da she-nmtf all dream-Acc throw away-Mpas-St (She threw away all her dreams) Actually, the verbs mentioned above are called 'auxiliary verbs' (or 'auxiliary adjectives' in some cases) in conventional dictionaries as well as in traditional grammars. Let us consider the following examples: (6) a. IBM-eun sailoun sopeuteuweie gaibal-eul sedul-eya ha-ess-da IBM-nmtf new software development-Postp hurry up-Sfx have to-Mpas-St (IBM had to hurry up the development of the new software) b. IBM-eun sailoun sopeuteuweie gaibal munjei-eiisseseneun sinjungha-eya ha-ess-da IBM-nmtf new software development problem-Postp careful-Sfx have to-Mpas-St (IBM had to be careful in the problem of the development of the new software) Sentence (6a) contains a so-called auxiliary verb (i.e. hada [have to]), the name of which is understood to indicate that it supports the main verb. Likewise, (6b) has to do with an auxiliary adjective (i.e. hada [have to]), which is destined to support the main adjective. Indeed, the unit the suffix -eya attaches to in (6a) is a verb, while that of (6b) is an adjective, as shown in (7): (7) a. NO N1-Acc V-Sfx{eyd) hada b. NO N1-Postp Adj-Sfx{eya) hada
[NO have to V N1] [NO have to be Adj Prep Nl]
However, this principle is not coherently applied in dictionaries and in grammars. Thus, we observe that the items which support only adjectives, such as the exam ple above (i.e. gulda [(to) behave]), have been treated as auxiliary verbs. It would be more systematic to consider that if an auxiliary predicate is atta ched to -nda (a declarative suffix in the present) like any usual verb in Korean, it should be included in the lexicon of verbs; otherwise it should be an adjective, whatever the supported strings are. Then, hada in (6a) and (6b) are both verbs,
NAM JEE-SUN
466
because both of them take the suffix -nda, whether the element supported by them is a verbal string or an adjectival one. Let us now consider the following senten ces. The form hada takes a -gineun ending string to its left: (8) a.
b.
geu-ga il-eul ha-gineun ha-nda he-nmtf work-c do-Sfx hada-St (He does work, indeed = It is true that he does work (even if there is no result...)) geu-ga sengsilha-gineun ha-da he-nmtf serious-Sfx hada-St (He is serious, indeed = It is true that he is serious (even if he is not smart...))
In (8a), hada is accompanied by a verb string (i.e. {do}-{Sfx(gineun)}), while that in (8b) occurs with an adjective string (i.e. {(be) serious}-{Sfx(gineun)}), like the pair (7a) - (7b). However, given that the hada in (8a) attaches to the -nda suffix (St), it is a verb, whereas that in (8b) is an adjective because of its incompatibility with the -nda suffix. Consequently, the items occurring in constructions such as (6a), (6b) or (8a) should be considered as verbs and should be entered in the lexicon of verbs.
5. Perspectives Out of many linguistic irregularities, the problems mentioned above are especially important in deciding the extension of the verb class. For instance, the number of N-hada strings entered in existing dictionaries is considerable. If we do not consi der these sequences to be verbs, but rather verb phrases made up of a noun and a light verb hada, our lexicon of verbs will be much smaller than the existing dictionaries, and consequently the lexicon of nouns will include much richer infor mation about morpho-syntactic behavior. Some concrete nouns that appear in a Nhada string such as daitonglyeng-hada (president-do=play the role of president) will also be affected by this syntactic information. From the existing Korean dictionaries, we observed about 7,000 N-hada strings classified as verbs. As we stressed above, nouns in this category can be easily expanded by derivational and compositional operations. In the case of complex verbal strings such as Adj-ejida(become), their list in conventional dictionaries is also very incomplete and requires systematic treatment. These classificatory difficulties need to be satisfactorily resolved, given that many tokens of this type are observed in corpora based on current Korean texts. For instance, the frequency of N-hada strings is extremely high in newspaper corpora. Here is an extract of the list of occurrences of hada, presented under a KWIC (key-word-in-context) form (Figure 1).
KOREAN ELECTRONIC LEXICON OF SIMPLE VERBS
467
Figure 1 The use of large-scale corpora will be very helpful in the expansion of an electronic lexicon. In particular, given that the sequences frequent in texts but absent in an MRD (machine-readable dictionary) disrupt automatic text analysis, the sequences observed in large corpora should be added to the lexicon, or the relevant information about these strings should be available. Systems that are not based upon a well-built electronic lexicon do not give reliable, coherent results for different strings based on the same unit. One example of the existing Korean morphological analyzers illustrates this point and under lines the need for a well-designed Korean electronic lexicon (Figure 2).
Figure 2 We observe that, following this system, three synonymous sentences (meaning: = He bows) are analyzed in different ways: the first two nouns attached to hada(V) are handled as a predicative noun and as part of a verb, respectively, and the third one as a simple predicative noun, whereas in fact they are two simple predicative nouns and a complex one as we note at the end of the matrix. This false analysis results from an inappropriate MRD. To construct a reliable electronic lexicon, the
468
NAM JEE-SUN
morpho-syntactic characteristics of all lexical entries have to be described in a systematic and exhaustive way. Only then can we expect to expand the list by consulting a large-scale corpora. The results obtained by lexicon-grammar studies [Gross75] will play a significant role in the construction of a systematic electronic data base, indispensable in any computational application area. References Choi, Hyen-Bai. 1929 (republished 1989). Ulimalbon (Korean Grammar). Seoul: Jengeum Munhwasa. Courtois, Blandine. 1987. Dictionnaire électronique du Laboratoire d'Automatique Documentaire et Linguisique pour les mots simples du franqais (DELAS). Rapport Technique du LADL n° 17, Paris: University Paris 7. Courtois, Blandine. 1989. DELAF: Dictionnaire électronique du LADL pour les mots fléchis du franqais. Rapport Technique du LADL n° 20, Paris: University Paris 7. Giry-Schneider, Jacqueline. 1987. Les prédicats nominaux en franqais: Les phra ses simples a verbe support. Genève: Droz. Gross, Maurice. 1975. Méthodes en syntaxe. Paris; Hermann. Gross, Maurice. 1987. The use of finite automata in the lexical representation of natural language. Lecture Notes in Computer Science 377, Springer-Verlag. Gross, Maurice. 1989. La construction de dictionnaires électroniques. Annates des Télécommunications, tome 44 n° 1:2, Issy-les-Moulineaux / Lannion: CNET. Gross, Maurice. 1994. Dictionnaires électroniques et traduction automatique. Langages 116, Paris: Larousse. Hong, Chai-Song. 1987. Studies of Korean verbal constructions. Seoul: Tap Chulpansa. Nam, Jee-Sun. 1996a. Dictionary of Korean Simple Verbs. Rapport Technique du LADL n° 49, Paris: University Paris 7. Nam, Jee-Sun. 1996b. Classification syntaxique des constructions adjectivales en coréen. LIS 21, Amsterdam: John Benjamins. Nam, Jee-Sun. 1997. Lexique-grammaire des adjectifs coréens et analyse synta xique automatique. Langages 126, Paris: Larousse. Nam, Jee-Sun. 1998. Lexique-grammaire et lexique électronique: les séquences comportant hada. Travaux de Linguistique 37, Duculot. Silberztein, Max. 1993. Dictionnaires électroniques et analyse automatique de textes - le systeme Intex. Paris: Masson. Korean Dictionaries Sin, Gi-Chel; Sin, Yong-Chel. 1990. New Korean Dictionary, Seoul: Samseng Chulpansa. Lee, Hi-Seung. 1988. Korean Dictionary. Seoul: Minjungselim. Hangeul Haghoi (Korean research association). 1991. Korean Dictionary, Seoul: Emungag.
KOREAN ELECTRONIC LEXICON OF SIMPLE VERBS
469
Summary Any system that aims to automatically process a natural language should first be equipped with a well-constructed electronic lexicon. An electronic lexicon is a largescale database that contains all linguistic information a machine requires, i.e. inflectional, derivational, syntactic and some reliable semantic information. To build a systematic lexicon of simple verbs, several linguistic criteria should be considered. This study constitutes a preliminary step in the construction of a syntactic lexicon of Korean verbs. In section 2, we consider the problem of hada (to do) sequences, which raises the contentions of distinguishing between a simple verb and a verb phrase in Korean. In section 3, we discuss the derivational entries and complex forms: how to handle these items is not a simple question in a machine-readable lexicon. Section 4 covers the treat ment of some incomplete forms in the lexicon. Finally, in the last section, we outline the direction of future work. To construct a reliable electronic lexicon, the morphosyntactic characteristics of all lexical entries have to be described in a systematic and exhaustive way. Only then can we expect to expand the list by consulting large-scale corpora. The results obtained by lexicon-grammar studies will play a significant role in the construc tion of a systematic electronic database, indispensable in any computational application area.
DU LOCATIF DIRECTIONNEL AU DATIF DANS LES CONSTRUCTIONS DU VERBE ARMVER KOZUÉ OGATA Université Aoyama Gakuin, Tokyo
Introduction Nous nous intéressons a l'opposition entre le datif et le locatif directionnel (non positionnel1 et non scénique), comme ci-dessous: (1) (2) (3)
La lettre est arrivée au bureau La lettre rn'est arrivée ce matin Un accident lui est arrivé sur la route
Nous appelons locatif le complément essentiel du verbe comme au bureau dans (1), et scénique comme sur la route dans (3), qui situe tout le procès et n'est ni directionnel ni essentiel. Le locatif directionnel est celui qui marque la destination d'un verbe de déplacement directionnel comme arriver. Les deux compléments, datif et locatif directionnels, ont un point commun sémantique et syntaxique: ils sont tous les deux directionnels et peuvent prendre la forme à N. Ces compléments s'observent également dans les constructions d'autres verbes comme laisser: (4) (5)
Il Il
a laissé son manteau au vestiaire a laissé la clef au gardien
Ils peuvent être distingués en partie par les pronoms: au vestiaire de (4), qui se remplace par y, est un locatif directionnel et au gardien de (5), qui se pronominalise par lui, est un datif. Mais le datif me dans (2) n'est-il pas comparable au locatif au bureau dans (1) du même verbe arriver? Nous voudrions ci-dessous examiner de près la concurrence du locatif directionnel et du datif que l'on peut déceler dans les constructions d'arriver.2
1 2
Complément essentiel d'un verbe statique ou a emploi statique. Notre corpus de départ est Le Monde 1994 (=LM ci-dessous) et Frantext. Nous avons également cherché des exemples dans Le Monde d'autres années pour certaines constructions.
KOZUÉ OGATA
472
Notre propos consiste en trois points: 1) relever les différences des constructions locatives, ex. (l)-(2) et non-locatives, ex. (3), en nous appuyant sur les différences de comportement du datif et du locatif; 2) les mettre en rapport en tenant compte de la continuité de leurs propriétés; 3) et remarquer, de façon plus générale, les spécificités du datif dans les construc tions d'un verbe essentiellement locatif comme arriver. On pourrait nous objecter qu'il s'agit, dans (1), (2) et (3) de deux arriver sans rapport, dont l'identité formelle est une coincidence. Mais nous croyons inté ressant de les mettre en rapport dans la mesure où leurs constructions semblent constituer les deux extrêmes d'une échelle entre lesquels se trouvent des étapes intermédiaires.
1. Définition du datif Nous entendons par datif le pronom de type lui et le complément à N qui se pronominalise par ce pronom. Quant au complément à + pronom tonique comme à lui, on peut distinguer deux cas. Avec un effet de mise en relief contrastif, à + pronom tonique peut apparaïtre dans la construction d'arriver avec une valeur de datif comme dans: (6)
Vous vous rendez compte de ce qui nous serait arrivé a nous ? (Thorez)
Nous le considérons également comme datif. Quant au syntagme a lui qui ne se pronominalise pas par lui comme: (7)
Il
était impossible d'arriver a lui 3 (*Il était impossible de lui arriver)
nous le distinguons du datif. Ce complément n'est possible que lorsque arriver fonctionne comme verbe de déplacement (cf. * Un accident arrive a lui) 4, et il est plus proche de syntagmes tels que jusqu'à lui ou auprès de lui, qui sont nettement locatifs.5
2. Constructions locatives et non-locatives Les deux types de constructions d'arriver, que nous appelons respectivement locatives et non-locatives, se présentent de la façon suivante: 3
Sandfeld, p. 82. Avec un effet de mise en relief contrastif, cette phrase est acceptable. 5 Ex. Le moment où les pompiers arrivent jusqu 'à Edmond Safra {LM).
4
CONSTRUCTIONS DU VERBE ARRIVER
473
A. Locatif N0 V(prép N1[liim] +
ø)
N0 V(à N1hum+ ø) N0 V (prép N1 [lieu] + ø) N0 V à N1 [abstrait] N0 lui V à N1[pc]
(Pierre + La lettre) est arrivé(e) (a Paris + chez nous + 0) La lettre rn'est arrivée de Paris (Adj +N) La lettre est arrivée chez lui déchirée Pierre est arrivé (au pouvoir+ a ses fins + à Vage de la raison) (Locatif Statique) Mafille m'arrive a l'épaule
B. Non-locatif N0 V (à N1hum+ ø) L'accident lui est arrivé hier sur la route Il V N1 (à N2hum+ ø) Il lui est arrivé une chose curieuse Il V à N1hum de infinitif Il arrive à Paul Valéry de se tromper (LM) Les constructions locatives (A) ont un sujet nominal et désignent le déplace ment (concret et abstrait) du sujet N0, dont la destination (le point final) est mar quée par le locatif. On pourrait appeler ces constructions « directionnelles » plutot que « locatives ». La il ne s'agit pas toujours d'un changement de lieu déictique de N0. Les constructions non-locatives (), quant à elles, ont un sujet complétif, infinitif ou nom événementiel (ex. accident) et arriver peut être para-phrasé dans la plupart des cas par survenir.
3. Constructions locatives On relève les propriétés suivantes, qui distinguent les constructions locatives des non-locatives.6 Propriété 1: On peut généralement faire figurer dans ces constructions un complément locatif de source (de N): Pierre est arrivé de Lyon.7 Lorsque le locatif est abstrait comme dans Pierre est arrivé à une conclusion, la source est également abstraite: De là, Pierre est arrivé à une conclusion. Cette propriété met en évidence le fait que le N0 existe avant le procès de déplacement exprimé par arriver.
6
7
Quant a la possibilité de la question où ? , elle ne s'observe pas de façon unanime pour toutes les constructions locatives: dés que le locatif devient plus ou moins abstrait, il ne répond plus a la question ou ? : Pierre est arrivé au pouvoir ne répond pas a la question ou ?. Comme arriver a une polarité finale et ne s'intéresse pas au procès qui mène No jusqu'à la destination, la juxtaposition de la source et de la destination rend la phrase peu naturelle: ?Pierre est arrivé de Lyon a Paris.
KOZUE OGATA
474 Propriété 2:
La nominalisation par arrivée est possible pour une grande partie de ces cons tructions: Pierre arrive a Paris / L'arrivée de Pierre a Paris, L'hiver est arrivé / L'arrivée de l'hiver. Les constructions non-locatives n'ont pas cette possibilité (*L'arrivée d'un accident), Cette propriété montre une certaine unité sémanticolexicale que possèdent les constructions locatives malgré leur diversité. Propriété 3: Pour une partie assez importante des constructions locatives (avec un N\ nominal), on peut reconnaïtre une correspondance avec la construction en être Prép. L'énoncé en arriver au passé composé implique l'énoncé en être Prép: (8)
On est arrivé a (Paris + la fin de notre vie + la page 10 + le printemps) On est a (Paris + la fin de notre vie + la page 10 + le printemps)
3.1. Constructions locatives orientées et non-orientées Les constructions locatives, qui sont ainsi distinctes des constructions nonlocatives, se subdivisent en deux: orientée (vers le locuteur ou le lieu en question dans le contexte) et non-orientée, selon leur compatibilité avec les compléments, comme suit: destination locative orientée locative non-orienté
datif (Prép N1+ø) à N1
source de N possible impossible
+/+/-
3.1.1. Constructions locatives orientées Le déplacement exprimé par arriver a une orientation déterminée, quand la destination est un lieu déictique. Cette destination se trouve toujours du côté du locuteur ou du lieu en question dans le contexte.8 Ainsi, la présence d'un locatif n'y est pas obligatoire. Le datif est possible uniquement dans ces constructions locatives orientées. On distingue deux types de constructions locatives orientées, selon N0 et la compatibilité avec de N source: - N0 concret / de N source Il s'agit de l'emploi le plus fréquent: N0 concret se déplace jusqu'a un lieu déictique qui est la destination. La source en de N est compatible: (9)
La lettre est arrivée des Etats-Unis
La construction infinitive fait aussi partie de ce groupe: 8
D'où l'impossibilité de l'impératif: *Arrive là-bas ! Cf. M.Gross (1975:166).
CONSTRUCTIONS DU VERBE ARRIVER
(10)
475
Pierre est arrivé de chez lui reprendre ses disques 9
- N0 temporei / *de N source Avec un N0 temporei comme le printemps, le déplacement exprimé par arriver est orienté: N0 se déplace sur un axe temporei vers le locuteur ou vers l'endroit en question dans l'énoncé. Dans (11) et (12): (11) (12)
Le printemps arrive? Aérez votre maison... (LM) La saison des betteraves arrive: me voilà aux champs toute la journée (Debatisse)
on peut comprendre que le printemps ou la saison arrive la ou on est ou au locuteur: (13) (14)
1968 arriva la-dessus (LM) Le moment attendu depuis deux jours arrivait enfin (Chardonne)
Ci-dessus, le N0 est toujours déterminé (le moment attendu, Vannée 1968), L'existence de N0 est ainsi supposée. On distingue ces sujets de ceux de la cons truction non-locative comme un accident, qui n'existent pas avant le procès (Un accident lui est arrivé hier), Mais l'ajout du complément source de N est impos sible ou difficile, parcequ'il s'agit d'un déplacement (passage) abstrait sur un axe temporel.10 Etant donné qu'arriver a une polarité finale, la directionnalité est déterminée par rapport au point final du procès. La nominalisation est possible: Varrivée de 1968, l'arrivée du moment attendu, 3.1.2. Constructions locatives non-orientées Le déplacement exprimé par arriver n'est pas orienté quand la destination dénotée par le N\ est abstraite, comme, par exemple, un état ou un moment (le dessert, la page 10, le printemps), Le N0 se déplace vers un état, un stade, une saison. Ces constructions expriment un changement d'état du N0, concret ou abstrait. Le syntagme prépositionnel (le locatif), dont la préposition est limitée a à, est obligatoire. Dans ces constructions, le locatif à N1, dénotant un état, n'est pas en concur rence avec le datif. (15) (16) (17) (18) 9 10
Pierre est arrivé a (le pouvoir + Vage de la raison + cette conclusion) On arrive enfin a 5 heures, Vheure de l'apéro L 'indice arrive a 348,61 points Le contrat arrivait a expiration (LM)
Par contre, cette construction n'admet pas le datif. On trouve également le No temporel avec une source et une destination : Pendant ce temps, et de toutes les banlieues environnantes, le printemps arrivait sur les marchés. Des milliers de roses se fanaient dans les corbeilies des marchandes (Camus). Dans un tel cas, on peut dire que le printemps existe déjà au lieu source et se déplace vers la destination. Ici, le printemps est lié aux signes, aux manifestations du printemps.
KOZUE OGATA
476
On peut faire fïgurer une source dans une partie de ces constructions: (19)
De la page 5 on a commencé l'étude, on est enfin arrivé a la page 20 aujourd'hui (20) ?De l'aperitif, on est enfin arrivé au dessert (21) *D'un long hiver, on est enfin arrivé au printemps (22) *Du mois de mai, on est enfin arrivé au mois de juin 11 Les N1 (destination) du type la page 20 (19), le dessert (20), qui représentent une étape assez concrète dans la succession, admettent la source, alors que les N1 plus abstraits comme la saison, le mois, ne l'admettent pas. Cela semble être lié au fait que le déroulement du temps, comme le changement de saison, est considéré comme étant hors du controle de l'homme. Les constructions infinitive ou com plétive suivantes font partie de ce groupe non-orienté: Je n'arrive pas a le trouver, Pierre est arrivé a ce que tous le respectent. 3.2. Datif dans les constructions locatives Le datif est donc possible uniquement lorsque le déplacement exprimé par arriver a une orientation déterminée. Le sujet peut être un N concret comme la lettre, le cadeau et un N moins concret comme la rumeur ou, dans certains cas, un humain: N0 V à Nhum(de N) (23) (24)
Une lettre envoyée d'un quartier à l'autre de Rome m'arrive après six jours (LM) Ne sachant toutefois quand ce cadeau leur arrivera, les boursiers ont préféré, dans le doute, s'abstenir (LM)
Le lieu source de N est compatible avec le datif: (25)
D'Italië nous arrive une rumeur judiciaire des plus pédagogiques (LM) (26) Il n'y a que le soleil qui arrive en Russiepar Vest, tant tout nous arrive de l'Ouest (LM)
Dans le couple datif-Nsource, le datif dénote une destination et il est très proche d'un complément locatif. Cette observation peut être confirmée par les deux faits suivants: a) dans ces constructions locatives, on peut remplacer le datif par le syntagme jusqu'a + pronom, avec une différence systématique de sens (jusqu'a N insiste sur
11
On peut améliorer l'acceptabilité d'un tel énoncé a l'aide du contexte : Du mois de mai qui trainait en réunions permanentes, on est enfin arrivés au mois de juin.
CONSTRUCTIONS DU VERBE ARRIVER
477
la distance parcourue).12 On verra que ceci n'est pas possible pour le datif des constructions non-locative. (27)
(La nouvelle + la rumeur) nous est arrivée d'Italie
(27')
D 'Italie, (la nouvelle + la rumeur) est arrivée jusqu 'a nous
b) Le datif est compatible avec un datif « sémantique »pour Nhum: (28) Il lettre qui nous est arrivée pour toi Le pronom datif nous marque le lieu ou est arrivée la lettre et pour toi, le destinataire/bénéficiaire de la lettre (cf. ci-dessous, 3.3). Avec quel type de N0 le datif est-il possible dans une construction locative? La condition semble être la suivante: le datif doit éprouver un intérêt envers le sujet, que celui-ci soit humain ou non-humain, pour que cette construction soit possible. Ainsi, pour le déplacement physique décrit dans (29), le datif est bizarre: (29)
Une voiture est arrivée jusqu'à nous. La dame qui la conduisait voulait des renseignements * Une voiture nous est arrivée
No+humain: le sujet de la construction locative avec le datif peut être un humain. Le sujet humain est assimilé a un non-humain comme une lettre, une nouvelle, qui sont sans volonté propre. C'est le datif qui a toujours une plus grande importance dans la valence verbale. (30) (31) (32)
Les jeunes qui nous arrivent depuis un an ou deux ont indéniablement plus de maturité que nous n'en avions a leur âge (LM) On est stupéfait du médiocre niveau des étudiants qui nous arrivent après avoir passé un de ces bacs bizarres (LM) Peu avant Noël nous arrivait de Jérusalem le tout jeune Aviv Quartet (LM)
Avec le N0 humain, le datif nous est le plus fréquent dans notre corpus13. D'une part, nous est conforme au fait que, avec arriver, le point final du déplacement se trouve du cóté du locuteur ou du lieu en question dans le contexte. D'autre part, nous est volontairement vague et peut renvoyer l'époque ou a la société ou se trouve le locuteur. Par ailleurs, dans cette construction ou le N0 et le datif sont tous les deux humains, il faut une hiérarchie nette entre eux: le datif doit être nettement supérieur au sujet N0. La première personne plurielle est classée haut dans le paradigme des personnes, d'où la fréquence de nous. La construction suivante avec le syntagme adverbial apposé au sujet et le datif 12
Il a aussi la valeur modale de jusqu'à quelqu'un qu'on peut paraphraser par quelqu 'un. 13 Le seul exemple que nous ayons trouvé avec un datif a la 3 e personne est; Elle regarde le nouveau, qui lui arrive droit dessus, libre depuis vingt minutes (Blier).
KOZUE OGATA
478
nous se justifie également par cette hiërarchie. L'apposition, qui exprime l'appréciation faite par nous au point final du déplacement, sert a augmenter l'importance du datif par rapport au N0 qui est également humain: N0hum datif V Adv (33)
Michel Serraut tourne,(...), Vhistoire d'un grand criminel (...). Et il nous arrive sous les traits, la défroque de Paul Léautaud, tel que l 'écrivain misanthrope était {LM)
A propos du datif dans les constructions locatives, on remarque qu'il ne réfère pas a un non humain, contrairement qu'on constate dans le datif des constructions non-locatives. Cette contrainte peut être expliquée par le fait suivant: parmi les compléments ayant une directionnalité, le datif est 'supérieur', du point de vue de construction, a un locatif directionnel. Dans les constructions locatives, le sujet N0 est un N concret et arriver ne dénote que le déplacement de celui-ci. Il n'y pas de raison pour élever le 'grade' du complément locatif qui marque une destination. Ainsi, le lieu déictique apparait dans cette construction sous la forme typique de prép N et non comme le datif lui, leur. 3.3. Datif et locatif dans les constructions locatives Autour d'un verbe directionnel, un vrai locatif directionnel et un datif s'excluent mutuellement, car ils sont tous les deux fortement liés verbe. Quand le complément locatif est scénique et sert juste a fournir une scène nondirectionnelle du procès, il est compatible évidemment avec le datif: (34)
Tout nous arrive, en Russie, de VOuest
On peut mettre en évidence la fonction scénique du complément, en le mettant en tête de phrase: (34')
En Russie, tout nous arrive de VOuest
En dehors de ces cas de scénique, un locatif directionnel et un datif sont compa tibles dans certaines conditions. Considérons l'exemple suivant: (35)
Si l'on se demande pourquoi cette exposition nous arrive a Paris (un peu modifïée), Vedova peut encore servir d'alibi: connaît-on sa peinture ? (LM)
Le locatif a Paris est directionnel, comme le N0 arrive de l'extérieur. Mais le locatif ne fonctionne pas ici de façon indépendante, comme il sert a préciser le référent du datif nous. La phrase suivante est analysable de même façon: (36)
La mode du roller-blade nous arriva en France en 1995
Comme le N0 (la mode du roller-blade) arrive de l'étranger, on peut considérer
CONSTRUCTIONS DU VERBE ARRIVER
479
que le locatif en France est directionnel. Mais en cooccurrence avec nous, auquel il est apposé, il n'est pas indépendant du datif. Il sert a préciser a quoi renvoie nous, qui, lui, est vague. Le locatif directionnel et le datif sont compatibles également lorqu'ils sont en rapport d'inclusion. Dans ce cas aussi, le locatif qui sert a préciser dépend du datif. Sa directionnalité est 'affaiblie', mais il n'est pas pour autant scénique. Avec le N partie du corps, cette relation d'inclusion se trouve dans la construction qu'on peut qualifier de statique, parcequ'il ne s'agit pas d'un déplacement mais d'une exten sion: N0 lui V à N1 [pc]: (37)
L'eau
lui arrive (jusqu'aux + aux) genoux
Ce locatif est dépendant du datif, étant inclus par lui. N'étant pas scénique, on ne peut pas le déplacer en tête de phrase à N1 [pc]: (37')
* Aux genoux, l'eau lui arrive
Avec un N du type une lettre, un colis, qui désigne un objet concret, donc localisable, et qui a un destinataire (qui peut être exprimé soit par le datif soit par pour N+h), le rapport entre le datif et le locatif peut être inclusif ou non-inclusif. Dans (38), le locatif au bureau sert a préciser a quel endroit, parmi les endroits liés au datif lui, la lettre est arrivée. Le locatif dépend ainsi du datif lui et il n'est pas aussi directionnel que dans la construction sans datif: (38)
Cette lettre va lui arriver au bureau
Avec ces N, on peut avoir le datif et le locatif sans rapport d'inclusion: (39)
Il a une lettre qui t'est arrivée a notre bureau
Si on exprime cette situation avec pour quelqu 'un au lieu du datif, on aura: (39') (39")
Il une lettre qui est arrivée a notre bureau pour toi Il a une lettre qui nous est arrivée au bureau pour toi
Quand le N0 est un type de nom sans destinataire spécifique comme notice, le datif dénote, en absence du locatif, le lieu ou est arrivé le N0: (40) (40')
La notice de coupure d'électricité nous est arrivée La notice de coupure d'électricité nous est arrivée au bureau ce matin
Arriver, dans les constructions locatives, nécessite avant tout une destination et même un humain (datif) prend une valeur locative. Ainsi le datif suivant sera interprété plutôt comme le lieu ù est arrivée la lettre et on laisse une ambiguïté quant au destinataire: (41)
Il a une lettre qui nous est arrivée ce matin
KOZUÉ OGATA
480 4. Constructions non-locatives
Cette construction exprime une apparition du N0 qui est un événement. Comme il ne s'agit pas ici d'un déplacement de N0, il n'y a pas de destination. N0 n'existant pas avant le procès, on ne peut pas faire figurer la source de N dans ces construc tions: *De là, lui arriva un accident. La nominalisation par arrivée n'est pas possible: *l'arrivée d'un accident. Arriver dans cette construction est remplaçable par le verbe survenir, ce qui n'est pas possible dans la construction locative: Un accident est survenu sur la route. Le datif est soit possible {Ce grand bonheur lui est arrivé tardivement (LM)), soit obligatoire (Au cours d'une grave maladie, il arriva a Marie Noël de se sentir irréelle (LM)). Le datif ne peut pas être remplacé par le syntagme prépositionnel jusqu'a lui, contrairement a ce qu'on a vu dans les constructions locatives: *Ce grand bonheur est arrivé jusqu'a lui tardivement. 4.1. Datif non-humain Le datif est le plus souvent doté du trait +humain, mais il peut référer a un nonhumain dans certains cas. Nous avons remarqué plus haut que le datif dans les constructions locatives réfère toujours a un humain. Dans la construction nonlocative, on a relevé quelques datifs non-humains dans notre corpus.14 Ils apparaissent tous soit dans une construction impersonnelle, soit dans une construction personnelle avec sujet indéfini du type cela, ce:15 Cela lui arrive. Nous citons quelques exemples: i) Construction personnelle (ce qui + cela) lui V / (ce qui + cela) V a N-h (42)
Quand Vhistoire bégaye, ce qui lui arrive plus souvent que prévu, 'est rarement pour nous faire rire (LM)
Le datif en à N a plus de chance de référer a un non-humain que le pronom datif lui, qui est plus restreint. Cependant, on n'a trouvé qu'avec les sujets indéfinis du type ce qui, cela comme ci-dessous et on n'a pas trouvé de cas avec syntagme nominal défini comme sujet.
14
Quant aux 5 000 exemples environ d'arriver de notre corpus du Monde, ceux comportant le datif qui réfère à un non-humain se répartissent comme suit. Nous donnons le nombre d'occurrences entre parentheses : i) personnel: N lui V (0); ce quilui V (4); ce qui V à N-h (6) ; cela VàN-h (1). ii) impersonnel: il lui V de infinitif (7); il VàN-h de infinitif (3); il VàN-h que P (2). 15 Dans notre corpus, aucun datif non-humain n'apparait dans une construction personnelle ayant un sujet spécifique. Mais ce n'est pas impossible : Je ne voudrais pas qu'un accident arrive a mes fleurs.
CONSTRUCTIONS DU VERBE ARRIVER
481
(43)
Pas le plus petit panonceau pour leur expliquer ce qui est arrivé a leur terrain de promenade. De VEcole Militaire a la Tour Eiffel, douze serpentins de fer s'y sont poses (LM)
(44)
Même quand elle perd un peu le sens de la hiérarchie (...) comme cela arrive aussi a la presse écrite, la télévision frangaise demeure... un parangon de pudeur (LM)
ii) Construction impersonnelle il lui V de infinitifl il V à N-h de infinitif (45)
(46)
(47)
Elles (= les valises Samsonite) se manipulent facilement. Mais comme il leur arrive d'éclater parfois dans la tourmente des manipulations d'embarquement (...), les métaux légers semblent inspirer depuis peu les fabricants (LM) le
renseignement ne circule pas et, quand il lui arrive d'etre commu niqué, il est dégradé ou embelli par une série de filtres tous occupés a le recueillir (LM) S'il arrive a la sociologie, en effet, de se déployer sur le même terrain que la recherche en gestion (LM)
Cette contrainte observée dans notre corpus peut être expliquée ainsi: dans ce type de construction (construction impersonnelle ou personnelle avec un sujet indéfini cela, ce), le sujet est moins 'important', moins 'saillant' que le nom mis au datif6 et un N non-humain peut être accepté comme datif.17 4.2. le datif et le locatif dans les constructions non-locatives Dans les constructions non-locatives, il n'y a pas de locatif directionnel qui marque une destination, car il ne s'agit pas la d'un déplacement directionnel de N0. Le locatif apparaît soit comme un scénique, soit comme une apposition au datif. Par exemple, aux Jeux de Barcelone, qui est scénique dans (48), peut être thématisé en tête de phrase: (48) 16
La mésaventure lui était arrivée aux Jeux de Barcelone (LM)
Le datif humain répond normalement a la question à qui? Mais le datif non humain ne répond pas a cette forme de question, qui exige très fortement un humain. (45') Elles (= les valises Samsonite) se manipulent facilement. Mais comme il leur arrive d'éclater parfois dans la tournente des manipulations d'embarquement (...) *A qui arrive-t-il d'éclater ? 17 Contrairement a ce que nous avons observé pour le datif, le N référant a un non-humain est fréquent comme sujet réel du complétif dans la construction il arrive que P. Car cette construc tion n'exige pas un agent. Autrement dit, dans cette construction-ci, le sujet n'est pas restreint. Ainsi, on remarque que c'est essentiellement dans cette construction que le sujet non-humain apparaît. On en a relevé 34 occurences: ex. Il arrive que, dans ce bureau paysager, l'agrafeuse ait disparu (LM).
482 (48')
KOZUÉ OGATA
Aux Jeux de Barcelone, la mésaventure lui était arrivée
Ci-dessous, au Monde est une apposition au datif nous qui sert a préciser le réfé rent de nous: (49)
Toujours est-il qu'il nous est arrivé, au Monde, comme cela est sûrement arrivé ailleurs, de nous interroger sur Vexercice de notre profession {LM)
On a le cas, concernant les constructions non-locatives également, ù un datif et un locatif directionnel apparaissent dans un énoncé en rapport d'inclusion: (50)
Avec ce qui m'arrivait moment dans ma vie intime (...) {LM)
Le complément locatif dans ma vie intime est en rapport d'inclusion avec le datif me et il n'est pas indépendant du datif. Il est moins directionnel que dans le cas d'absence du datif.
5. Datif dans les constructions locatives et non-locatives En résumé, on peut remarquer, sur le datif dans les constructions locatives et nonlocatives, les propriétés suivantes: Locatif Non-locatif 1) datifjusqu 'a N\ +/2) datif non-humain +/3) inclusion entre datif et locatif directionnel + + La propriété 1 (substitution du datif par le syntagme jusqu'à N+h) met en évi dence que le datif dans la construction locative n'est pas loin d'un complément locatif, alors que le datif dans la construction non-locative n'a pas du tout le caractère locatif. La propriété 2 (impossibilité d'avoir un datif non-humain dans la construction locative) s'explique par le fait que dans les constructions locatives, arriver dénote uniquement un déplacement physique de N0 et qu'il n'y a pas de raison de 'dativer' le locatif, la dativation étant une opération qui lui donne un rôle plus important dans la valence verbale, quand il a le choix entre le locatif et le datif pour un verbe. La propriété 3 (inclusion du locatif par le datif) est commune aux constructions locatives et non-locatives. Mais, en analysant de près ce que nous avons appelé locatif dans les deux cas, nous en voyons mieux la différence. Dans la construction non-locative (49), le complément dans ma vie intime n'est pas un lieu déictique mais une partie de l'être humain me qui subit une influence du procès: Avec ce qui m'arrivait cmoment dans ma vie intime... Ainsi, les autres locatifs possibles se limitent a des domaines abstraits comme dans:18 Avec 18
Quant au complément tel que dans bureau, il serait scénique, référant a un lieu concret déictique: Avec ce qui m 'arrivait cmoment dans bureau...
CONSTRUCTIONS DU VERBE ARRIVER
483
c qui rn'arrivait moment (dans ma vie professionnelle + au bureau)... Par contre, dans la construction locative, le locatif est le lieu déictique qui fait partie du domaine du datif: Cette lettre va lui arriver au bureau. Ainsi, les autres locatifs possibles seraient comme dans: Cette lettre va lui arriver (a la Sorbonne + chez ses amis + à sa résidence secondaire + à son lieu de vacances).
6. Conclusion Le datif et le locatif directionnel dans les constructions d'arriver s'excluent mutuellement. Nous n'avons trouvé aucun cas ou le datif et le locatif directionnel prennent la même place par rapport au verbe. Un verbe a un seul complément directionnel. Et il a une hiërarchie selon laquelle le datif a une priorité sur le locatif directionnel quand ils se trouvent dans la même construction. D'ou l'inclusion du locatif par le datif. Si on considère que le complément indirect peut se pronominaliser en datif seulement lorsqu'il est au même 'niveau' que le sujet, les faits observés peuvent être interprétés ainsi: quand arriver est un verbe de déplacement, le locatif dénote un pur point final de ce déplacement et ne peut pas être au même 'niveau' que le sujet N0. Et il ne peut pas devenir le datif. Dans la construction non-locative, le complément directionnel non-humain ne peut devenir un datif que lorsque le sujet est moins 'saillant' que lui. Cette contrainte sur la 'dativation' nous fait formuler l'hypothèse que arriver est essentiellement un verbe de déplacement qui demande comme complément une destination. Un tel complément ne peut pas facilement se trouver au même 'niveau' que le sujet. De ce point de vue, le complément direc tionnel peut être conçu ainsi: quand un N humain est directionnel, il apparaït normalement comme un datif (lui). C'est seulement quand il est considéré comme moins 'saillant' que le sujet dans l'énoncé qu'il apparaït comme locatif (jusqu'à lui). Par contre, quand un N non-humain est directionnel, il apparaït normalement comme un locatif. C'est seulement quand on veut le rendre 'saillant' dans la valence verbale, aussi 'saillant' que le sujet, qu'il apparaït comme datif (lui, leur). La diversité des emplois d'arriver peut être considérée comme la possibilité d'extension d'une unité lexicale: du déplacement spatial a la destination déictique et l'apparition d'un événement sur un axe temporel. Le test de compatibilité par de N source met en évidence surtout le degré de locativité. Les constructions qui ne l'admettent pas ne sont pas locatives, mais elles n'en sont pas moins dénuées de directionnalité. C'est le datif même qui fait intervenir une directionnalité.
484
KOZUÉ OGATA
Références Barnes, Betsy. K. 1979. The Notion of 'Dative' in Linguistic Theory and the Grammar of French Indiana University. Gaatone, David. 1984. Une allergie syntaxique en français - réflexions sur sition lui/à lui. Revue de Linguistique Romane 48. Gross, Maurice. 1975. Méthodes en Syntaxe. Paris: Hermann. Gross, Maurice. 1995. La notion de lieu argument du verbe. In Tendances récentes en linguistique franqaise et générale, H. Bat-Zeev Shyldkrot et L. Kupferman (eds.), Amsterdam: John Benjamins. Lamiroy, Béatrice. 1983. Les verbes de mouvement en franqais et en espagnol. Amsterdam: John Benjamins. Leclère, Christian. 1995. Sur une restructuration dative. Language Research, Vol.31, n°l, Seoul: Language Research Institute, Seoul National University. Nishimura, Makio. 1997. Complément indirect: vs à lui vs lui (en japonais). In Furansugo-o kangaeru, groupe Semeion (ed.), Tokyo: Sanshûsha. Sandfeld, Kristian. 1965. Syntaxe du français contemporain. Genève: Droz.
Summary This paper examines the relationship between the directional locative and dative in the constructions of the verb arriver in French. These elements have points in common: semantically, they are both directional, syntactically, they can have the forme à N. Comparing two types of constructions for arriver: the locative and non-locative, we observe different co-occurrence restrictions between the dative and locative (directional and non-directional) in these constructions. Our analysis shows us that the dative and the directional locative are mutually exclusive, in that a verb can only take one directional object which is strongly related to it. The locative and the dative appear to be compatible in cases where the former is included by the latter, because according to the hierarchy between them the dative has a priority over the directional locative when they are in the same construction.
LA CONJUNCTION MÊME SI N'EXISTE PAS ! MIREILLE PIOT Université Stendhal - Grenoble 3, J. E. « T.L.N-L.C. »
Introduction Dans le chapitre des idées reçues, il semble devenu habituel1 de présenter la séquence ê si comme correspondant a une conjonction de subordination {Conjs) "concessive", classée titre, sans discussion,2 parmi des items comme bien que, quoique, etc, le plus souvent sous des prétextes de synonymie des phrases dans lesquelles ces différents items interviennent, ce qui se révèle parfaitement faux a l'examen. En effet, dans: Même s 'il me l 'avait juré, je ne le croirais pas ?Bien qu 'il me l 'ait juré, je ne le croirais pas bien que et même si ne sont pas interchangeables sémantiquement (ni, d'ailleurs, syntaxiquement: ce que marque notre point d'interrogation sur l'emploi du conditionnel dans la principale en cooccurrence avec bien que). Notre intention sera ici, au contraire, de démontrer que: - les propriétés syntactico-sémantiques de la séquence même si diffèrent des propriétés des Conjs "concessives", type bien que, et sont, au contraire, celles des Conjs "hypothético-conditionnelles": particulièrement celles de la Conjs si(6);3 1
Pour la quasi-totalité de la littérature consacrée au sujet (cf. e.g. Sandfeld 1965, Morel 1980 et 1996, Eriksson 1985, Léard 1985 et 1987, Sundell 1985), a l'exception notable de A. Goosse (e.g. Bon Usage 1991, 12ème édition) qui, d'une part, signale: "La présence de même donne a des propositions temporelies ou conditionnelles une nuance de concession, mais ces propositions gardent le mode qu'elles ont en tant que temporelles ou conditionnelles. C'est le mot même qui est chargé d'exprimer la nuance concessive" et surtout exclut de la liste des conjonctions de "concession" même si (qui figurait a ce titre dans les listes présentées par Grevisse (Cf. Bon Usage, 1955, 6ème édition). 2 Certains hésitent parfois, cf. Grevisse (op.cit): cette conjonction (et d'autres) "pourrait se rattacher aussi aux conditionnelles"; Togeby 1982, T.l "concessive", mais T.2 "hypothétique"; T.L.F., T.l 1, article même (distinguant même si / même quand vs quand même / alors même); Bonnard dans G.L.L.F., article même vs article concession. 3 Les chiffres associés entre parenthèses aux items conjonctifs représentent les numéros des classes syntactico-sémantiques de nos Conjs (Piot 1978 et 1995); ainsi Conjs(4) = Conjs "concessives", Conjs(6) = Conjs "hypothético-conditionnelles", etc.
486
MIREILLE PIOT
- en revanche, une autre Conjs si(4)4 possède les propriétés syntactico-sémantiques des "concessives-oppositives" du type de bien que, etc., sans aucune analogie en sens ou dans ses propriétés syntaxiques avec si(6), non plus qu'avec même si. Nous opposerons ces items par un ensemble de propriétés syntactico-sémantiques, démontrant ainsi leur appartenance a l'une vs l'autre classe. Les propriétés qui différencient l"'hypothético-conditioimelle" si(6) (et la séquence même si) des "concessives-oppositives" (si(4), bien que, quoique, etc.) Ce sont des propriétés d'apparence distributionnelle (nature des temps-modes, présence de modifieurs adverbiaux) ou de nature apparemment plus syntacticosémantique ("portée" de la négation ou de l'interrogation), et enfin l'analyse de la coordination de deux subordonnées introduites chacune par même si qui vont nous permettre de mettre en évidence cette différenciation. 1) L'existence ou non de contraintes en temps-modes. En ce qui concerne le français standard (et contrairement aux autres conjonctions appartenant a cette même classe), de fortes contraintes excluent le futur et le conditionnel pour la phrase introduite par si(6) ou par même si: *Si(6) tu m '(aideras + aiderais), je te récompenserais(s) *Même si tu m '(aideras + aiderais), je n 'y arriverai(s) pas alors que de telles contraintes n'existent pas en présence de si(4) et des autres "concessives": S'(4) il ne vous écoutera pas, il m 'écoutera bien Si(4) la scène aurait pu se dérouler a Cannes, elle aura bien lieu a Menton5 Bien qu'il ne vous écoutera pas, il m 'écoutera Bien que la scène aurait pu se dérouler a Cannes, elle aura lieu a Menton qui admettent subjonctif et/ou futur, conditionnel, indifféremment. 2) La possibilité ou non d'une présence des modifieurs usuels des Conjs (seulement, même, précisément, justement, etc.) à gauche de ces items. 4
5
Conjs "concessive-oppositive" caractérisée, comme un certain nombre d'items de la même classe, par l'existence d'une contrainte de double parallélisme syntactico-sémantique associée a une double différence minimale de sens entre les phrases qu'elles conjoignent. L'interpretation de si(4) comme "oppositive-concessive", ainsi que celle d'autres Conjs de cette classe, apparaît renforcée par la présence de l'Adv bien dans la principale, outre, évidemment, l'existence des contraintes de double parallélisme syntaxique associées a des oppositions sémantiques de la subordonnée a la principale: pour le premier exemple, la différence entre les éléments vous vs m' d'une part, et la presence vs l'absence de la négation d'autre part; et, pour le second exemple, la différence entre les temps conditionnel et futur d'une part, et les eléments Cannes vs Menton d'autre part.
LA CONJUNCTION MÊME SI N'EXISTE PAS !
487
Tous ces modifieurs sont interdits en présence des items appartenant a la classe des "concessives-oppositives": * Settlement (bien + au lieu) qu 'un parvenu affiche ses richesses, un grand seigneur ne montre rien *Mêrne (bien + au lieu) qu'un parvenu affiche ses richesses, un grand seigneur ne montre rien de même en présence de si(4): *(Seulement + Même) si(4) la scène aurait pu se dérouler a Cannes, elle aura bien lieu a Menton6 En revanche, la présence de ces modifieurs associés aux Conjs "hypothéticoconditionnelles" dont si(6): (Seulement + Même + Précisément) si(6) je suis là, tu pourras venir (Seulement + Même + Précisément) avec la réserve que je (sois + serai) là, tupourras venir (Seulement + Précisément) a la condition que tu m '(aides + aideras), j'ac cepterai que tu viennes produit des énoncés naturels. 3) La portée de la négation. La présence de la négation dans la principale (première dans l'ordre linéaire) permet apparemment deux lectures en présence des "hypothético-conditionnelles" dont si(6): Pierre ne viendra pas si(6) cela m 'ennuie a) = qu 'il ne vienne pas b) = qu 'il vienne comme en présence de la séquence même si: Pierre ne viendra pas même si cela m 'ennuie a) = qu 'il ne vienne pas b) = qu 'il vienne alors qu'une seule lecture est possible en présence des "concessives-oppositives": Pierre ne viendra pas bien que cela m 'ennuie a) = qu 'il ne vienne pas b) * = qu 'il vienne Le fait que la lecture (b) se révèle exclue en présence de bien que et des 6
Nous avons conservé ici un exemple avec des temps-modes spécifïques pour la subordonnée introduite par si(4) qui permettent d'exclure toute interprétation correspondant a la presence de si(6).
488
MIREILLE PIOT
"concessives-oppositives" est a corréler a l'impossibilité de modifier ces Conjs, qu'il s'agisse d'un Adv modifieur ou, comme ici, de la négation. En revanche, toutes ces possibilités existent en présence des "hypothético-conditionnelles" qui (comme nos tables de construction l'attestent) sont susceptibles de telles modi fications. 4) La possibilité de réaliser une interrogation totale portant sur l'ensemble des phrases conjointes (P1 Conjs P2) Cette possibilité est vérifiée dans le cas de si(6) et des "hypothéticoconditionnelles": Est-ce que Pierre sera hospitalisé s 'il n'est pas gravement malade ? Est-ce que Pierre sera hospitalisé s 'il n 'est pas gravement malade ? c'est-a-dire sans pause entre P1 d'une part et Conjs P2 d'autre part; alors qu'il ne semble pas possible de réaliser avec bien que, par exemple, et les "concessivesoppositives" en général une telle interrogation, sans pause entre la principale et la séquence Conjs P2: Est-ce que Pierre sera hospitalisé bien qu 'il ne soit pas malade ? L'impossibilité d'interroger sur l'ensemble de la phrase complexe indique dans ce dernier cas que chacun de ses constituants est indépendant sous la conjonction. 5) Dans le cas de coordination de deux subordonnées introduites par la même conjonction. Pour Pensemble des conjonctions de subordination du français, la possibilité d'une substitution en ce cas de la seconde occurrence de la Conjs par Pitem que7est une propriété définitionnelle vérifiable pour tous ces items compris quand, comme et si8 = Conjs. Ainsi: Si(6) Pierre vient et s'(6) il ne me trouve pas, il ne sera pas content = Si(6) Pierre vient et qu 'il ne me trouve pas, il ne sera pas content9 Dans le cas de la séquence si cette possibilité n'est pas observée par exemple pour: Viens, même si cela t'ennuie et (même) si tu avais décidé de ne pas venir = Viens, même si cela t'ennuie et (*même) que tu avais décidé de ne pas venir la substitution par la pro-forme que précédée de même est exclue, d'ailleurs, en présence de la séquence même quand (ou même modifie une Conjs "temporelle"): 7
Que nous avons défini ailleurs comme une pro-forme conjonctive (M. Piot 1995). Qui permet également de les distinguer des formes homonymes non-Conjs. 9 Contrairement a ce qu'indique la norme, le subjonctif n'est pas le seul mode autorisé derrière le que, pro-forme de la Conjs si(6), et l'on trouve couramment des exemples avec l'indieatif: Si je décroche un téléphone et que je fais ce numéro,il va sonner occupé, etc. 8
LA CONJUNCTION MÊME SI N'EXISTE PAS !
489
Parle, même quand cela t'ennuie et (ê) quand cela te demande des efforts = Parle, même quand cela t'ennuie et (*même) que cela te demande des efforts L'impossibilité d'une modification par même, comme par tout autre modifieur adverbial, e.g.: Parle, précisément quand cela t'ennuie et (précisément) quand cela te demande des efforts = Parle, précisément quand cela t'ennuie et (*précisément) que cela te de mande des efforts en présence de la pro-forme ne se présente pas comme en contradiction avec notre analyse de ces séquences comme constituées d'une Conjs précédée du modifieur même. Simplement, l'interdiction de même devant que montre que la seule opéra tion de coordination possible en cas se produit entre des phrases de compo sition différente. Dans les phrases avec répétition de la Conjs précédée a chaque fois de son modifieur, la suite complexe a pour schéma de construction: P1, [Modif Conjs P2 Conjco Modif Conjs P3]; alors que dans le cas ou la seconde occurrence de la Conjs correspond a la pro-forme (excluant le modifieur), la suite complexe correspond au schéma suivant: P], Modif [Conjs P2 Conjco Conjs P3], i.e. le modifieur porte sur les deux subordonnées coordonnées. Un exemple éclairant de cette situation peut être apporté par l'existence de suites comme: Pierre ne viendra pas, même si cela m 'ennuie et même si on ne peut pas travailler sans lui = Pierre ne viendra pas, même si cela m 'ennuie et si on ne peut pas travailler sans lui = Pierre ne viendra pas, même si cela m 'ennuie et qu 'on ne peut pas tra vailler sans lui L'interpretation des deux dernières suites complexes correspond bien a celle de la première; et donc a deux subordonnées conjointes introduites chacune par si(6) modifiées conjointement par même, et non a une coordination de subordon nées dont la première serait introduite par si(6) modifiée par même alors que la seconde si(6) ne le serait pas. La comparaison des deux séquences (comprenant la seconde subordonnée) qui répondraient aux différences de coordination: ? Pierre ne viendra pas, si on ne peut pas travailler sans lui Pierre ne viendra pas, même si on ne peut pas travailler sans lui i.e. avec modification par même vs absence de modification par même, montre une interprétabilité plus difficile de la première séquence par rapport a la seconde (qui est tout a fait naturelle): phénomène qui irait également dans le sens de notre analyse des deux dernières suites complexes comme d'une coordination de deux subordonnées introduites par si(6) modifiées conjointement par même.
MIREILLE PIOT
490
Et la même analyse vaudrait pour une séquence telle que: On n 'oublie pas, même si sa voix devient moins précise et si la mémoire modifie le souvenir dans la mesure où parmi les séquences candidates comme seconde subordonnée selon les deux types d'analyse: On n 'oublie pas, même si la mémoire modifie le souvenir ?* On n'oublie pas, si(6) la mémoire modifie le souvenir la première avec même si apparaït tout a fait naturelle et correspondre l'inter prétation de la suite complexe, alors que la conjonction représentée par la seconde (sans modification par même) est exclue dans l'interprétation d'une Conjs si(6) "hypothético-conditionnelle".10 Conclusion L'examen de ces cinq propriétés nous a amenée a préciser les traits des "conditionnelles"11 vs des "concessives", et donc a définir le comportement de la séquen ce même si comme relevant de la première de ces classes. Il devenait alors naturel de considérer cette séquence, non comme un item conjonctif a part entière mais comme une propriété de si(6) d'être modifiée par même ainsi qu'elle peut l'être par seulement (ou encore précisément) formant alors une séquence seulement si (ou encore précisément si, sans doute statistiquement moins fréquente). Or, même, ce modifieur de Conjs joue un rôle privilégié, dans cette position notamment, auprès de la quasi-totalité des Conjs appartenant a cette classe d'"hypothético-conditionnelles". En effet, on le retrouve associé aux Conjs(6): avec la réserve que, dans l 'hypothèse ou, dans le cas ou, au risque de, etc.; et , notamment, les séquences ainsi composées: même dans l'hypothese ou, même dans le cas ou peuvent être proposées en paraphrases a même si. La différence sémantique observable entre les phrases conjointes par si(6) et même si: S'il me le juraitje ne le croirais pas Même s 'il me lejurait, je ne le croirais pas comme entre celles conjointes par dans le cas ou et même dans le cas ou, par exemple, est donc a mettre au compte de la présence de même en contexte gauche de si(6), ou de dans le cas ou, tout a fait naturellement.12 Nous avons, de ce fait, choisi de ne pas lister même si parmi les items conjonc10
I.e. paraphrasable par dans le cas ou ou à condition que. En revanche, cette séquence serait interprétable avec si(4) "concessive-oppositive". 11 Cf. Piot (1978, chapitre IV, 6). 12 Sur la valeur "renchérissante" et argumentative de même , cf. notamment Anscombre (1973) et Martin (1975).
LA CONJUNCTION MÊME SI N'EXISTE PAS !
491
tifs de cette classe mais opté pour représenter, dans nos tables de construction des Conjs "hypothético-conditionnelles", la possibilité d'une modification par même (comme celle par seulement) pour toutes ces Conjs (et non pas uniquement pour si(6)): possibilité indiquée par la propriété '+' figurant dans la colonne correspondante a gauche de celles-ci.13 Une seule exception a été faite dans cette classe pour la Conjs même sans(6), a distinguer de 'Nég sans(6) ': en effet, il n'existe plus en français contemporain de Conjs(6) sans14 hors la présence de même ou bien d'un élément négatif en contexte précédent;15 ce qui excluait de pouvoir représenter la présence de même dans ce cas précis sous la forme d'une propriété associée a un item conjonctif sans inexistant Il est a remarquer que, si même si apparaït généralement paraphrasable par même dans le cas où, en revanche tous les exemples avec si(6) ne sont pas forcément paraphrasables de façon univoque par dans le cas ou puisqu' apparaît parfois une interprétation concurrentielle au moyen d'une paraphrase en à condition que pour certains exemples:16 Si ce garqon eüt été de monde, je l'aurais fréquenté = A condition que ce garqon eüt été de monde, je l'aurais fréquenté = Dans le cas ou ce garqon eüt été de monde, je l'aurais fréquenté Nous signalerons alors pour conclusion qu'il semblerait que, parmi les interpré tations couvertes par si(6), même sélectionne l'expression de l'"hypothese" plutot que celle de la "condition" puisque l'on observe les contrastes: Même si ce garqon avait été de monde, je ne l'aurais pas fréquenté Même dans le cas ou ce garqon eüt été de monde, je ne l'aurais pas fréquenté = ?Même a la condition que ce garqon eüt été de monde, je ne l'aurais pas fréquenté =
i.e.: la paraphrase en même dans le cas ou est ici naturelle, alors qu'une para phrase avec même a la condition que (formation syntaxiquement et sémantiquement non-inacceptable, puisque: Même a la condition que tu m 'aides, je ne le ferai pas) se révèle ici difficilement interprétable. Donc, la présence de même 13
Cf. document joint en annexe. En français classique, cette Conjs(6) n'imposait aucune contrainte sur le contexte précédent, aussi bien assertif que négatif: Sans que son équipage était bien fatigué, il serait venu me voir (Mme de Sévigné, in N. Fournier 1998), i.e. = Si son équipage n 'était pas bien fatigué, il serait venu me voir. 15 Il ne le fera pas sans que je l'aide (= Si je ne l'aide pas) I Il le fera même sans que je l'aide (= ê si je ne l'aide pas) / Il le fera sans que je l'aide (≠ il le fera si je ne l'aide pas) 16 Au contraire, l'exemple precédent: S'il me le juraitje ne le croirais pas admet pour paraphrase: Dans le cas ou il me le jurerait, je ne le croirais pas; mais non: *A condition qu 'il me l'aitjuré, je ne le croirais pas. On remarquera ici que la presence de même a gauche de si: Même s 'il me le jurait, je ne le croirais pas confirmerait la différence d'acceptabilité entre les deux interpré tations puisque l'on peut avoir: Même dans le cas ou il me lejurerait, je ne le croirais pas , alors que: ?*Même a la condition qu 'il me l'ait juré, je ne le croirais pas.
14
MIREILLE PIOT
492
pourrait aider a sélectionner préférentiellement l'interprétation correspondant a Tune des sous-classes a l'intérieur de cette même classe. En revanche, la séquence seulement si en même contexte syntactico-sémantique ne semble pas privilégier Tune des interprétations puisque: = =
Seulement s 'il avait été de monde, j'aurais fréquenté ce gargon Seulement a la condition qu 'il ait été de monde, j'aurais fréquenté ce gargon Seulement dans le cas où il aurait été de monde, j'aurais fréquenté ce gargon.
Références Anscombre, Jean-Claude. 1973. Même le roi de France est sage. Un essai de description sémantique. Communications 20, pp. 40-82. Ericksson, Olof. 1985. L'emploi de même si dans les propositions concessives a valeur réelle. Studia Neophilologica 57, pp. 69-78. Fournier, Nathalie. 1998. Grammaire du français classique. Paris: Belin. Gross, Maurice. 1977. Grammaire transformationnelle du frangais. Syntaxe du . Paris: Larousse (réimp. Cantilène, 1986). Harris, Zellig S. 1968. Mathematical Structures of Language. New York: Wiley Interscience. Léard, Jean-Marcel; Michel-Francis Lagacé. 1985. Concession, restriction et opposition: l'apport du québécois a la description des connecteurs fran9ais. Revue Québécoise de Linguistique 15-1, pp. 11-50. Léard, Jean-Marcel. 1987. La syntaxe et la classification des conditionnelles et des concessives. Le frangais moderne 55, 3/4, pp. 158-173. Martin, Robert. 1975. Sur l'unité du mot même. Travaux de Linguistique et de Littérature, pp. 227-243. Morel, Marie-Annick. 1980. Étude sur les moyens grammaticaux et lexicaux propres a exprimer une concession en frangais contemporain. Thèse d'État, Université Paris III. Morel, Marie-Annick. 1996.La concession en frangais. Paris: Ophrys. Piot, Mireille. 1978. Études transformationnelles de quelques classes de conjonctions de subordination du français. Thèse de 3ème cycle, Université Paris 7 et LADL, 455 p.. Piot, Mireille. 1995. Composition transformationnelle de phrases par subordina tion et coordination. Thèse d'Etat, Université Paris 7 et LADL, 426 p. Publi cation 1998, Lille: Editions du Septentrion. Sundell, Lars-Goran. 1985. La coordination des propositions conditionnelles en frangais contemporain. Studia Romanica Upsaliensia, 37. Stockholm: Almqvist et & Wiksell.
LA CONJUNCTION MÊME SI N'EXISTE PAS !
493
Togeby, K. 1982. Grammaire Frangaise. T.I, .. In Études Romanes de l'Université de Copenhague. Copenhague: Akademisk Forlag.
Summary In this paper, we reject the usual definition of même si {even if) as single conjunction and meaning as 'concessive' one. Même si share similar syntactico-semantic properties with 'conditional', but not 'concessive', (class of) conjunctions. In fact, même si is a conjunc tive phrase including the si (if) conditional conjunction and the appropriate conditionalconjunction modifier: même (even). 'Concessive' effect is due to même insertion. Meaning of même si has been refined into two semantic interpretation subcategories according to paraphrastic conditional conjunctive phrases: même a (la) condition [que P] or même dans l'hypothese [ P].
à charge à la charge à condition à (la+cette) condition alors même à moins à peine à supposer avec (la+cette) réserve au cas au risque dans Ie cas dans (la+cette) hypothese [dans la supposition (des+quelque) fois len admettant (en supposant
-
+ + + + + +
-
+ + + + + +
- - + + + + -
+
-
-
- + + de - + + de - + + + + + de - + + de - + + de + + + de + + + de + + + de - + + - + + - + + -
-
- + + . + + - + +
- - - + +
-
-
- - de - + de - + de - + de -
+ -
-
+ + + - -
+ + + +
même Conjs seulement Conjs seul simple Conjs même Conjs seulement PREP
+ + + +
+ + + + +
+ + + +
Pronom.
+ + + + +
+ + + +
+ + + +
-
+ + + - + - - - + + + - - - - - _ + - + - - - + - - - - - - + - - - - + + + - - - + + + + + - - - + + - + + + + + + + - - - - - + - + - - - + + + + + + - + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + - + + + - + + + + + - + + + +
+ + + +
T-fut
COMPLEMENTATION Proposition subordonnée N subord
P T - cond Où P T - cond [pcz] Que P
MODIF
+ +
+ +
-
-
+
-
+
T - cond que Psubj VO W de VO W VI W de VI W de Vinf W Nhum lui V-nW Dét - E Dét - un quoi cela là [Pro z.] Prép ce N-là Adv Conjs quel N ?
CONJS
494 MIREILLE PIOT
ANNEXE: Table CONJ(6)
Ifaute lorsmême même sans moyennant nf(était+eüt été) posé (Ie cas de) pour Ie cas npour peu pourvu quand quand bien même quitte (Nég+ïnterrog) sans sauf si sitantest sous condition [sous (la+cette) condition
Où P
P T - cond
COMPLEMENTATION Proposition subordonnée N subord
- + - - + + de - - - - + - - - + + + + + + - - + + + + + + + + + + - - - - + + + - - - + + - - - + + - + + + + + + - + + + de - - + + - + + + + - - - - + + + - - - - + + + - - - + + - + + + + + - - - - + + a + + + - - - - + + a + + - - + + - + + + - + - . - - + + + + - - + + de - - - - + + + + + + + + + + + de - - - - + + + + +
même Conjs seulement Conjs seul simple Conjs même Conjs seulement PREP
MODIF
Pronom.
|
+ + - - + - - - - + + + + + + - + + + + + + + + + +
+ - + - - - - - - + - + - + - - + - + - - - - - - + - + - - + - -
+ - + - - - - - - + - + - - - - + - + - - + + + + - + + - - - - + + - + +
+ - + - - + + + + - + + - + - - - +
T - cond [pcz.] Que P T-fut T - cond que Psubj V0 W de V0 W V1 W de V1 W de Vinf W Nhum lui V-nW Dét - E Dét - un quoi cela la [Pro z.] Prép ce N-la Adv Conjs quel N ?
CONJS
LA CONJUNCTION MÊME SI N'EXISTE PAS ! 495
sous (la+cette) réserve sous peine sous réserve supposé un coup une supposition
[pcz.]
P T - cond où P T - cond
Conjs
ê settlement Conjs seul simple Conjs Conjs seulement PREP
Pronom.
+ + + + - + de - - - - + + + + + + - + - - - - - - + - + - + - + - - - + + de - - - - + - - - + + - + - - - - - - + - + - - - - + + - - + + de - - - - + + + + + + - + - - - - - - + - + - - - - + + + + + + + - - - - + + + + - - + + + - + + + - + + |+| - - + + +
Que P
COMPLEMENTATION Proposition subordonnée N subord
T-fut
MODIF
]
T - cond que Psubj V0 W de V0W V1 W de V1 W de Vinf W Nhum lui V-nW Dét - E Dét - un quoi cela là [Proz.] Prép ce N-là Adv Conjs quel N ?
CONJS
496 MIREILLE PIOT
A R E M A R K ON ENGLISH DOUBLE NEGATIVES PAUL M. POSTAL New York University This article is dedicated to Maurice Gross as a token of respect and friendship.
Traditionally, starting in school, Americans are exposed to prescriptive prohibi tions on the occurrence of multiple negations within a certain sort of English clausal domain. The type of exclusion at issue is represented by comments such as (1) from Perrin and Smith (1962:135): (1) « A statement in which a second negative needlessly repeats the meaning of the first negative is called a double negative: "The trip will not cost you nothing". Such constructions, once acceptable in English, are now nonstandard idioms and should be avoided: "The trip will cost you nothing" or "The trip will not cost you anything".» Viewed descriptively, such prescriptions represent for present day standard English both a correct, albeit crude, perception about the structure of the language, and, I will argue, a conflation of two partially distinct structures, only one of which is ungrammatical. Focus on (2a): (2)
a. No student ate no cookies b. No student ate any cookies
The correct aspect of the prescription for standard English is that the sequence of words in (2a) is not properly usable to express the proposition that (2b) expresses. Discussion of the issue is motivated inter alia because in various varieties of substandard English, a pronunciation of (2a), notably one without strong stress on the second determiner no, is usable to express what (2b) expresses.1 So the pres cription addresses a real difference between standard English and various sub standard varieties. 1
Substandard cases like those in (1) instantiate the phenomenon of negative concord, widely attes ted crosslinguistically. For a recent survey and analysis with many references, see Giannakidou (in press).
498
PAUL M. POSTAL
However, typically, the prescription in (1) ignores a perfectly grammatical standard English use of sequences like (2a), one with an interpretation distinct from that of (2b). This usage normally involves a distinctive intonation with strong stress on the second determiner. With that specification, the example is equivalent to (3): (3)
Every student ate some cookies
This note is briefly concerned with the structure of cases like (2a) under the grammatical (in standard English) reading equivalent to (3). The straightforward view would be simply that such cases contain two logically equivalent negative DPs, each corresponding to a negation of an existential quan tifier. This certainly yields a logically correct analysis. Despite that, I suggest that it is incorrect and that the two negative DPs in grammatical cases like (2a) have distinct structures. The overall analysis I suggest is a bit radical, partly programmatic and certainly cannot be fully justified here. But it runs like this. The first negative DP in a case like (2a), which I will call a small negative DP, has a determiner containing one negative and an element some corresponding to an existential quantifier. But the determiner of the second DP, which I will call a 'large' negative DP, contains two negatives and the element some. Since logically two negatives cancel, a large negative DP is semantically equivalent to a DP with no negative and the deter miner some. Mere combination of a small negative DP subject and a large negative DP object does not give a correct logical structure for (2a). Rather, it would yield an interpretation equivalent to 'nobody ate some cookies', in turn equivalent to (2b) and distinct from that of (2a). I thus propose that the structure of (2a) at issue includes a third non-DP-internal negative, schematically: (4)
Structure of (2a) [[NEG1 some] student] NEG2 ate [[NEG3 NEG4 some] cookies]
This does yield the right logic for (2a), in which it involves an assertion that there is no student who did not eat some cookies. Evidently, postulation of four distinct underlying negatives for a sentence like (2a) in which only two manifest at the surface raises the issue of the principles which guarantee the invisibility of the others. I cannot treat this crucial web of issues in these remarks, whose more mo dest goal can be viewed as arguing the problem is a real one. What considerations suggest that the different DPs in (2a) have different struc tures and, further, structures differentiated in the way specified in (4)? A major part of the answer to the first question is that the different DPs behave differently with respect to various sorts of 'modifiers'. Consider e.g. exceptives like those highlighted in (5):
ENGLISH DOUBLE NEGATIVES
(5)
499
a. No student but Ted called no professor b. Ted called no professor but Sandra . No student called no professor (*but Sandra)
While nothing bans e.g. an exceptive in a no object, as (5b) shows, this is not possible on the rightmost negative DP in the double negative cases. However, there is no bar to an exceptive on the leftmost negative DP in a multiple negative clause. These facts are a first support for distinguishing the structure of the two negative DPs. But they do much more, given a generalization about the type of DPs which accept an exceptive bul phrase. Roughly, a necessary condition is that the DP must involve semantically the equivalent of a universal quantifier not under the scope of DP-internal negation; see (6): (6)
Moltmann (1992:377), The Quantifier Constraint: "The associate of an exception phrase must be a universal or a negative universal quantifier."
Thus the 'modified' DP can be e.g. every, or no (= all not) but not not every nor, of course, some, many, seven, etc., as illustrated in (7): (7)
a. Every student (but Ted) called her b. No student (but Ted) called her . Not every student (*but Ted) called her d. Some student (*but Ted) called her e. Many students (*but Ted) called her
Under the double negative analysis of the second DP, the ungrammaticality in (5 c) falls under the universal quantifier generalization, since the second DP in (4) is equivalent to an existential, not to a universal, and thus can be taken to preclude the exceptive for the same reason as the DP in (7d). That is, while the contrasts in (5) initially seem to indicate positional/functional restrictions on the distribution of the exceptive, the conditions are significantly independent of positions/func tions and depend instead on the logical structure of DPs, in turn determined by their syntactic components. This argument can be strengthened because other 'modifiers' behave in a par tially parallel way. So, as with exceptives, the condition on the distribution of not even is not strictly positional or functional but depends on the logical structure of the 'modified' DP: (8)
a. Some/Many/All jurors (*not even Tom) protested b. They criticized some/many/all jurors (*not even Tom) . Not many jurors (*not even Tom) protested d. Not every juror (*not even Tom) protested e. Nowhere near every juror (*not even Tom) protested f. No jurors (not even Tom) protested g. Zero jurors (*not even Tom) protested
500
PAUL M. POSTAL
The condition seems to be that not even phrases only append to DPs which are (i) negative forms, and, (ii) moreover, where the negative determiner of the DP is of the strong negative sort referred to in the formal semantic literature as antiaddi tive, as specified in (9):2 (9)
In a structure [DP1 DP2 <not even DP3>], DP2 must be a syntactic negative phrase which denotes an antiadditive operator.
The key point then is that under the large DP analysis of the second negative DP of double negative cases like (2), the large NP is not antiadditive; in fact, it does not even meet the weaker condition of being downward entailing (monotonically decreasing). This then entails that while the first negative DP is 'modifiable' by not even, the second is not, which is correct: (10) No student (not even Tom) called no professor (*not even Dr. Jones) Moreover, a third 'modifier' argument can be based on what one can call 'con joined (negative) afterthoughts', like 'not Bob, not Bill and not Brian'. These also seem independently limited to negative antiadditive phrases, as (11) claims and (12) supports: (11) In a structure [DP1 DP2 ], DP2 must be a syn tactic negative phrase which denotes an antiadditive operator. (12) a. Some jurors (*not Tom, not Tim and not Tab) protested b. Every juror (*not Tom, not Tim and not Tab) protested . Many jurors (*not Tom, not Tim and not Tab) protested d. Not many jurors (*not Tom, not Tim and not Tab) protested e. Not every juror (*not Tom, not Tim and not Tab) protested f. Nowhere near nine jurors (*not Tom, not Tim and not Tab) protested g. Nothing like every juror (*not Tom, not Tim and not Tab) protested h. Zero jurors (*not Tom, not Tim and not Tad) protested i. No jurors (not Tom, not Tim and not Tad) protested Again then an asymmetrical prediction is made: with respect to cases like (2a), the first negative DP should allow conjoined afterthoughts but the second should not. This is also true: (13) No student (not Tom, not Tim and not Tad) called no professor (*not Dr. Jones, not Dr. Smith and not Dr. Jekyl) 2
For accounts of the semantic notions antiadditive, downward entailing, upward entailing, etc. cited here and below and especially their role in licensing NPIs, see e.g. Déprez (1997), Giannakidou (1997), Hoeksema (1986), Horn (1995), Keenan (1996), Ladusaw (1980, 1996), Partee, Meulen and Wall (1993), Zwarts (1996, 1999).
ENGLISH DOUBLE NEGATIVES
501
I believe these three 'modifier' arguments provide a reasonable initial basis for the twin claims that the structures of double negative cases like (2a) (i) differ and (ii) differ in the way that (4) indicates. Moreover, other 'modifiers' including almost and just about and those of (14) support similar arguments (thanks to Christopher Potts for some of this data): (14) a. Absolutely no lions ate no zoo visitors b. No lions ate (*absolutely) no zoo visitors . Virtually/Practically no one attended none of the parties d. No one attended (*virtually/practically) none of the parties Different kinds of arguments for these conclusions can be based on negative polarity items (NPIs). Roughly, such items can only occur if linked to a so-called licensing expression. While fully characterizing these is an enormously complex and so far elusive task, it is clear that for almost all NPIs, an antiadditive phrase such as an English no form is a proper licenser. Given that, under standard assumptions, the two negative DPs of cases like (2a) should not be differentiated with respect to their ability to license NPIs. Consider though the NPI at any time. (15) a. No student at any time criticized Martha b. Martha criticized no student at any time . No student at any time criticized no professor d. * No student criticized no professor at any time e. Some professor (*at any time) criticized that student (*at any time) Under analysis (4), the failure of NPI licensing in (15d), can be explicated as follows. The NPI at any time cannot be licensed by the second DP, no professor, because, although syntactically negative, this is, given its two logically canceling negatives, semantically upward entailing (monotonically increasing). And a mini mal condition on an NPI licenser is that it not be upward entailing. That is, licensing in (15d) can be taken to fail for the same reason as that in (15e). However, this explication is incomplete. It must also be indicated why the downward entailing (in fact, antiadditive) subject no phrase in (15d) cannot license the post object at any time, while it can license a preverbal one, as in (15c). Much of the answer is provided by the observation due intially to Linebarger (1980) that NPI licensing is subject to an intervention constraint. Specifically, for a form to satisfactorily license a particular NPIx, the licenser must not be separated from NPIx by an intervening quantificational expression of a type which is not an appropriate licenser. This constraint is seen at work in (16): (16) a. No professor said that John copied any software b. * No professor said that some student copied any software The star on (16b) indicates the absence of an analysis of the form (17); it may, for some speakers, be analyzable as in (18), where there is no intervention:
502
PAUL M. POSTAL
(17) (18)
no professorX (some studentY (X said that Y copied any software)) some studentY (no professorX (X said that Y copied any software)
Given the intervention constraint, the subject no phrase in (15d) could only legitimately license the post-object NPI if the object no phrase could take higher scope than the subject, analogous to the way some student does in (18). In general though, it is well-known that inverse scope over negation is often not possible in English and apparently some constraint whose nature I cannot consider here pre cludes such inverse scope for a double negative DP. A different sort of NPI argument makes the asymmetry point for the no phrases of cases like (2a) even more clearly. A negative DP head can typically license an NPI inside a restrictive relative clause on that head, as in (19), where the NPIs are highlighted: (19) a. b. . d.
Not every gorilla who ever learned English was happy Nowhere near every gorilla who learned anything was happy about it No gorilla who gesticulated in any way was convincing Jim trained no gorilla who gesticulated in any way
Nonetheless, in multiple negative clauses like (2a), the two no phrases again reveal an asymmetry; such relative clause-internal NPIs are possible only on the subject: (20) a. b.
No gorilla (who ever learned English) criticized no trainer (*who ever learned French) No trainer (who ever learned French) abused no gorilla (*who ever learned English)
Under the proposal in (4), the failures of NPI licensing in (20) can be attributed to the same factors operative in (21): (21)
Every trainer abused some gorilla who (*ever) learned French
The basic generalization (due to Ladusaw 1980) is that such restrictive relative internal NPIs are only licensed when the head of the relative is an expression which is downward entailing. A parallel argument can, evidently, be based on the facts in (22): (22) a. b. . d.
Jerome bought no bags of any bird seed No friends (of any birds) bought that No friends (of any birds) bought no bird seed No friends (of any birds) bought no bags of(*any) bird seed
My discussion of permitted English double negatives has involved cases of two negative DPs. Cases like (23b) where one such DP combines with a phrasal negation have similar implications:
ENGLISH DOUBLE NEGATIVES
503
(23) a. I said nothing, not even hello b. (I did not say much but) I did not say nothing, (*not even hello) either . I did not say anything Cases like (23b) are also barred by the tradition underlying (1). But again this is only true of standard English for the reading where (lb) is equivalent to (23c). A proper pronunciation of (23b) is grammatical where it means 'I said something'. I would analyze this as in (24): (24)
I
did say [[NEG1 NEG2 some] thing]
In this case, rather than vanishing, the first negative raises to become the verbal phrase negation. The distribution of the not even 'modifier' in (23) already supports the analysis in (24); space precludes documenting that the other 'modi fiers' behave in the same way. NPI facts also show that the no form in (23b) is distinct from that in e.g. (23a): (25) a. I said nothing (of any interest) b. I did not say nothing (*of any interest) I hope to have shown that the motivation for an asymmetrical treatment of the two negative DPs of cases like (2a) is real and substantive. Even acceptance of the conclusion that structures like (4) are essentially correct would though barely scratch the surface of an account of the facts of multiple negatives in English. First of all, it is necessary to specify the principles determining the distribution of multiple négative DPs containing no forms like the object in (4). If this were free, nothing would account for the asymmetries which have been documented; that is, for example, nothing known would block clauses containing the large DP as subject and the small one as object, or one with large DPs as both subject and object, which the 'modifier' and NPI facts show is not possible. I have not studied this matter carefully but I suspect that there is a constraint which requires the large DPs to occur in combination with a finite verbal phrase and some other preceding clause-internal negative. This allows verbal phrase negation or a preverbal negati ve phrase. So, for instance, the verbal negation cases in (26) involve large negative DPs, as the 'modifier' and NPI facts suggest: (26) a. I did not see no professor (*not Dr. Jones, not Dr. Smith and not Dr. Jekyl) b. Helen wouldn 't visit no museum (*she ever contributed to) The cases in (27) are grammatical though without verbal negation: (27) a. b.
No student did they assign no readings (*not even foreign ones) to No student did they assign no readings (*which contained any errors) to
504
PAUL M. POSTAL
. Francine at no time assigned no readings (*not Aristotle, not Plato and not Descartes) to those students And again the tests established indicate that the rightmost no phrase is a large DP. The specification that there must be clause-internal negation preceding a large negative DP would allow the preceding negation to be post-verbal, as in: (28) a. Phillip sent some roses / *no roses to no starlets b. Phillip sent some / ?no starlets no roses . Phillip talked to no starlet about no film (*he ever saw) This may be possible, as the double negative variant of (28b), while perhaps not perfect, is distinguished from the impossible double negative variant of (28a). And (28c) seems acceptable. Reference to finite clauses is intended to represent the fact that double nega tives in non-finite clause just seem to me ungrammatical: (29) a. * For no professor to assign no readings would be unusual b. * For Jerome not to assign no readings would be unusual c. * No professor's assigning no readings would be surprising d. Claudia is opposed to John('s) / *no professor ('s) reading no poem e. * Herb doesn Y know how to tell no investigator nothing Reference to finiteness also indicates, correctly, that large negative phrases do not occur with other negatives in e.g. DPs: (30) a. John's (*non-) assignment of no readings (was illicit) b. * No (professor 's) discussion of no readings (was illicit) In any event, it should be clear that a major task is to properly constrain the distribution of what I have called large DPs. A second issue is of course implicit in the posit of large DPs for cases like (2a). Namely, this grants implicitly the correctness of part of the traditional view (seen in (1)) banning multiple negatives in a single clause. Because the implica tion is that while this is sometimes possible, it is so only when one of the nega tives is of the large DP type. Thus the grammar of standard English still needs constraints to block combinations of small negative DPs with other negatives. Again, I have not studied this issue in detail. It may, however, be appropriate to formulate what is correct in the traditional view in terms of the fact that the small negative DPs are downward entailing while the large ones are not (but are in fact upward entailing). That is, where the constraint on large, upward entailing negative DPs seems to require another (preceding) negative in the same minimal (finite) clause, the constraint on the small, downward entailing negative DPs would seem to exclude any other downward entailing negative phrase internal to some type of domain X. I state the condition in this incomplete and vague way because I do not know how to specify the sort of constituents X of relevance. One
ENGLISH DOUBLE NEGATIVES
505
cannot, for instance, simply say 'same clause' as tradition seems to, because, first, that would not indicate that DPs are also proper realms of multiple small negative DP exclusion, as shown by cases like (27b). Moreover, while (31a) can be inter preted with two small DPs, (31b) requires the second to have a large analysis; and the facts in (32) are parallel: (31) a. b. (32) a. b.
No doctor wishes that they would admit no patient (not even Mary / but Mary / not Mary, not Marilyn and not Maureen) No doctor wishes to admit no patient (*not even Mary / *but Mary / *not Mary, not Marilyn and not Maureen) No doctor claimed that they had examined no patient (not even Mary / but Mary / not Mary, not Marilyn and not Maureen) No doctor claimed to have examined no patient (*not even Mary / *but Mary / *not Mary, not Marilyn and not Maureen)
As a concluding remark in support of the postulation of large negative DPs as in (4), consider the phenomenon of verbal phrase ellipsis as in (33), where mate rial in '<...>' represents the analysis of the elided constituent and material in '{...}' the antecedent. (33) a. b.
Kim {cooked some eggs} and Celia did too Kim {cooked every egg} and Celia did too
In general, it is clear that some kind of identity condition links the elided constituent to its antecedent; see Fiengo and May (1994) for extensive discussion. Normally, this determines a kind of semantic identity. Amazingly, however, in cases where the antecedent involves a no form, the condition allows the elided form to be the non-negative correspondent (e.g. the equivalent of a some form) under certain conditions:3 (34) a. b.
Kim {cooked no eggs} but Celia did Although Kim {cooked no eggs}, Celia did
I believe the concept of large negative DPs facilitates understanding this apparent anomaly, as it would permit representation of (34) along the schematic lines of (35):4 3
I am indebted to Christopher Potts for awakening my awareness of this fact. The existence of this phenomenon is noted in Johnson (2001:468). 4 Notably, it is not possible for a non-negative in the antecedent to permit the elided constituent to be interpreted as its negative correspondent. (i) * Kim {cooked [some eggs]} but Celia did (ii) *Although Kim {cooked [some eggs]}, Celia did The proposal made here contributes to understanding this asymmetry, since the independently motivated elimination of one negative from e.g. the elided portion of a structure like (iii) fails to establish identity with the antecedent in the way that it does in (32b). (iii) Kim {cooked [some eggs]} but Celia did
506
PAUL M. POSTAL
(35) a. b.
Kim {cooked [[NEG1 some] eggs]} but Celia did Although Kim {cooked [[NEG1 some] eggs]}, Celia did
Making analysis (35) work requires accounting for the elimination of one of the negatives in the elided constituent so that an identity condition can hold. But this elimination is independently required; for, while the second DP in structures like (4) contains two underlying negatives, only one manifests in the surface form. Still, it cannot yet be said that nothing special linked to ellipsis is required to explicate how the posit of large negative DPs applies to the otherwise puzzling identity properties of cases like (34). For the structure of the rightmost clauses in (35) cannot manifest as an independent clause. If it could, (36) could, counterfactually, mean 'Celia cooked some eggs'. (36)
Celia cooked no eggs
The unusual ellipsis equivalence phenomenon at issue here also manifests in cases like (23b), as in (37a), which I would analyze as in (37b): (37) a. b.
I didn 't {chase no gorilla} but Bob did I did {chase [[NEG1 NEG2 some] gorilla]} but Bob did
In this kind of case, there is no real asymmetry of the sort seen in note 4, since (38a) is a bit strange but not ungrammatical. (38) a. ? Although I {chased no gorilla}, Bob did not b. Although I {chased [[NEG1 some] gorilla]}, Bob did
References Baltin, Mark and Chris Collins. 2001. The Handbook Of Contemporary Syntactic Theory. Oxford, England: Blackwell. Déprez, Viviane. 1997. A Non-Unified Analysis of Negative Concord. In Forget et al. (1995). Fiengo, Robert and Robert May. 1994. Indices and Identity. Cambridge, Mass.: The MIT Press. Forget, Danielle, Paul Hirschbühler, France Martineau and Maria-Luisa Rivero (eds.). 1995. Negation and Polarity. Current Issues in Linguistic Theory 155, Amsterdam/Philadelphia: John Benjamins Publishing Co. Giannakidou, A. 1997. Polarity Sensitivity As Non Veridical Dependency. Ams terdam/Philadelphia: John Benjamins Publishing Co.
ENGLISH DOUBLE NEGATIVES
507
Giannakidou, Anastasia (in press). Negative...Concord? Natural Language and Linguistic Theory. Hoeksema, Jack. 1986. Monotonicity Phenomena in Natural Language. Lin guistic Analysis 16, 25-40. Horn, Laurence. 1995. Negative Polarity and the Dynamics of Vertical Infe rence. In Forget et al. (1995). Johnson, Kyle. 2001. What VP Ellipsis Can Do, and What it Can't, but not Why. In Baltin and Collins (2001). Keenan, Edward. 1996. The Semantics of Determiners. In Lappin (1996). Ladusaw, William. 1980. Polarity Sensitivity as Inherent Scope Relations. New York: Garland. Ladusaw, William. 1996. Negation and Polarity Items. In Lappin (1996). Lappin, Shalom (ed.). 1996. The Handbook of Contemporary Semantic Theo ry, Oxford, England: Basil Blackwell, Linebarger, Marcia. 1980. The Grammar of Negative Polarity. MIT Doctoral Dissertation, Cambridge, Mass. Moltmann, Friederike. 1992. Coordination and Comparatives. MIT Doctoral Dissertation, Cambridge, Mass. Partee, Barbara, Alice ter Meulen and Robert E. Wall. (eds.). 1993. Mathema tical Methods in Linguistics, Dordrecht, Holland: Kluwer Academic Publi shers. Perrin, Porter G. and George H. Smith. 1962. The Perrin-Smith Handbook of Current English. Chicago: Scott, Foresman and Company. van der Does, J. and J. van Eijck (eds.). 1996. Quantifiers, Logic, and Langua ge. Stanford, California: CSLI. Zwarts, Frans. 1996. Facets of Negation. In van der Does and van Eijck (eds.). Zwarts, Frans. 1999. Polarity Items. In Keith Brown and Jim Miller (eds.), Concise Encyclopedia of Grammatical Categories, New York: Elsevier.
Summary This article claims that there are two partially distinct analyses for English no forms like no dog, nothing, no one, no philosopher. Each analysis involves recognition of a syntactic negative + a determiner some as a representation of no; but one analysis invol ves a second syntactic negative as well. It is suggested that a factually viable version of the traditional English prescriptive rule banning two or more instances of no forms in a single clause must distinguish the two distinct analyses. For while e.g. No gorilla wrote no symphony is indeed ungrammatical on a reading with weak stress on the second no, where it means No gorilla wrote any symphony, it is grammatical on a reading with strong stress ont the second no. This reading is equivalent to Every gorilla wrote some symphony, taken here to instantiate the double negative (hence logically positive) reading of the second no. A variety of arguments are presented to support the view that the
508
PAUL M. POSTAL
grammatical status of the two no forms of the grammatical reading have distinct struc tures and various implications and problems arising from this conclusion are briefly considered.
DÉVERBATIF1 ET DIATHÈSE EN MALGACHE ROGER-BRUNO RABENILAINA Université d'Antananarivo
On sait qu'en lexique-grammaire la nominalisation est une transformation qui consiste a substantiver le verbe (ou l'adjectif) d'une phrase, ou plutôt a relier une phrase P2 a une autre phrase P1, lesquelles ne diffèrent que par la classe lexicale a laquelle appartient leur élément prédicatif respectif. Celui-ci est ici un verbe dans P1 et un déverbatif ou nom lié morphologiquement verbe dans P2. La mise en relation se fait au moyen de verbes spéciaux appelés "verbes supports" par M. Gross (1981), ou Vsup, dont la fonction essentielle est, en malgache, de porter les expressions morphologiques des catégories de temps, d'aspect, de voix et de mode. Or, la grammaire traditionnelle du malgache répartit les noms en quatre caté gories: les radicaux, les dérivés, les composés et les duplicatifs (R. RajemisaRaolision 1969:30-37). Sur le plan distributionnel, un nom est, en linguistique structurale, reconnaissable par son aptitude a occuper la position qui suit immédiatement le verbe ou, en termes de fonction, a assumer le role d'objet direct sans déterminant (S. Rajaona 1972:6.1.10 et 6.2.42). Il va sans dire qu'un nom peut aussi assumer la fonction de prédicat. Nous ne nous occuperons ici que des noms dérivés associés a un verbe, appelés aussi déverbatifs. Ces derniers sont soit de la forme fx-V-a(na), soit de la forme fx-V-E. Ces formes peuvent aussi concerner des éléments verbaux et ainsi renvoyer a des transformations qualifiées de "diathétiques" et que B.S. Ralalaoherivony (1995:2.2.2.1), que nous suivrons ici, abrège et généralise en [Diathèse] ou simplement diathèse.
1. Transformations diathétiques et non diathétiques C'est dans ma thèse d'État (R.B. Rabenilaina 1985), préparée sous la direction de Maurice Gross et soutenue le 24 Juin 1985, que j'ai séparé les transformations du 1
La dénomination déverbatif utilisée ici correspond a la terminologie usuelle déverbal (i.e. substantif lié morphologiquement a un verbe) et non a celle de Benveniste ou déverbatif désigne un verbe dérivé d'un verbe [NDLR].
510
ROGER-BRUNO RABENILAINA
malgache en deux catégories: les transformations "diathétiques" (1.3.2.1) et les autres transformations (1.3.2.2). Les premières, qui font appel a l'addition, au niveau du verbe, d'affixes spécifiques appelés "morphemes de voix" ou "morphèmes diathétiques", ont été, de plus, distinguées en deux types: a) celles qui «font, en outre, intervenir la permutation des actants..., Peffacement éventuel de la préposition du type de Prép =: amina et Paddition de la préposition "enclitique" -na à gauche de N0 permuté », b) celles qui « mettent systématiquement en jeu l'opération d'addition qui consiste, ici, en Padjonction a la phrase d'un "opérateur" (au sens de M. Gross 1981:4.5-6) a deux termes Affixe - Nom (agent extérieur) noté Afx Ne » (voir ma thèse, p. 60, §2). Les autres transformations, qualifiées plus tard de "non diathétiques" et groupées dans la seconde catégorie, sont l'extraposition, la mise en valeur ou en contraste (antéposition, extraction) et la substantivation. Conscient du fait « qu'a une forme verbale ne correspond pas toujours une structure orientée sémantiquement par rapport a l'un des arguments », j'ai exposé devant l'Académie Malgache, en sa séance plénière du 16 Mars 1989, qu'il convenait d'opposer, dans une phrase verbale, « la forme (qui) est du domaine de la voix et le sens (qui) est du domaine de la diathèse » (R.B. Rabenilaina 1989, 1991). 'est ainsi qu'est venue l'idée de distinguer les phrases verbales malgaches en phrases a diathèse de base et phrases a diathèse dérivée. Les premières (transitive, intransitive, factitive, réciproque) sont a la voix active, indiquée par le préfixe mx/ x-=: zéro, a-, an-, i-, etc., et les secondes (objectives: passive, instrumentale, destinataire, dative, locative et de moyen, et circonstancielles) a la voix passive, signifiée par le préfixe a- ou voa-, ou le suffixe -ana ou -ina, ou l'infixe -in, et/ou à la voix relative, indiquée par le circonfixe x-...-ana/ =: zéro, a-, an-, i-, etc. Cette distinction entre voix et diathèse (ou fiendrika et fitodika, d'après R.B. Rabenilaina et alii 1989: Lesona 2) a entraïné, a son tour, une nouvelle typologie des transformations. Ce qui fut explicité en 1991 dans mon livre Le verbe malga che, publié en 1996 a Montréal par les soins du Réseau LTT de l'AUPELF-UREF. L'opposition entre transformations diathétiques et transformations non diathé tiques est définitivement établie: le premier type, et non le second, focalise un complément en le plaçant en position de sujet grammatical par application sur une phrase active des opérations formelles suivantes: a) permutation de N0 - avec le premier objet direct ou indirect N1 à focaliser, dans une phrase a deux arguments ou plus, - avec le second objet indirect ou (rarement) direct N2 a focaliser ou avec le circonstanciel a focaliser et ensuite avec le premier objet, dans une phrase a trois arguments ou a deux arguments en cooccurrence avec un circonstanciel;
DÉVERBATIF ET DIATHÈSE EN MALGACHE
511
b) changement de voix par effacement du préfïxe d'actif mx-, et son rempla cement par un affixe de passif a-, voa-, -ana, Ana ou -in- ou par le circonfixe de relatifx-...-ana; c) insertion de la préposition enclitique E + -na entre N0 permuté et verbe. Les transformations non diathétiques, caractérisées négativement par l'absence de changement de voix, ont été, en outre, distinguées en: a) celles qui relient une phrase simple a une phrase complexe: l'antéposition, l'extraction, l'emphase, la transformation par application d'un opérateur, la neutralité, la transformation moyenne et la transformation réciproque; b) celles qui relient deux phrases simples ou deux phrases complexes: l'extraposition, la restructuration, la nominalisation, la transformation de longueur et la symétrie.
2. Transformation de nominalisation La nominalisation, ou [Support], classée parmi les transformations non diathé tiques associant deux phrases simples, a reçu une première explicitation en 1991 par le recours aux verbes supports manao (faire) (R. B. Rabenilaina 1991, 1996: 1.3.2.2.B3) et manana (avoir) (ibidem: 2.1), suivant les exemples (1) et (2): (1)
Manasa ny fiara i Be Laver Prés la voiture Be (Be lave la voiture) [Support] = Manao fanasana ny fiara i Be Faire Prés lavage la voiture Be (Be fait le lavage de la voiture) [Passif]
= Atao-n'i Be ny fanasana ny fiara Être fait Prés par Be le lavage la voiture (Le lavage de la voiture est fait par Be)
[Relatif]
= Ny fanasana izay atao-n 'i Be ny fiara Le lavage qui être fait Prés par Be la voiture (le lavage de la voiture qui est fait par Be)
[Réduct]
= Ny fanasa-n 'i Be ny fiara Le lavage par Be la voiture (le lavage de la voiture par Be)
ROGER-BRUNO RABENILAINA
512 (2)
Mihevitra izy Penser Prés il (Il pense) [Support] = Mariana hevitra izy Avoir Prés pensée il (Il a une pensée) [Passif]
= Anàna-ny ny hevitra Avoir passif Prés par lui la pensée (De la pensée, il en a)
[Relatif]
= Ny hevitra izay anàna-ny La pensée qui avoir passif Prés par lui (la pensée qu'il a)
[Réduct]
= Ny hevi-ny La pensée à lui (sa pensée)
La nominalisation constitue surtout un point de départ pour expliquer la dériva tion des groupes nominaux a complément déterminatif Na-na Nb, ou Na =: V-n =: V-E, fa-V-E, fa-V-a(na), un nom prédicatif, et Nb =- N0, un sujet appelé génitif subjectif. Une phrase élémentaire a nom prédicatif supporté par Vsup =: manao, rnanana... est, de fait, comme le montrent les exemples (1) et (2), susceptible d'être soumise a la transformation passive ou [Passif], puis a une relativisation ou [Relatif]. L'effacement ou [Réduction] du verbe support passivé et du pronom relatif isole ensuite le groupe nominal dérivé, ou la préposition enclitique -na (par) introduit un argument, ici le sujet ou l'agent. Les groupes nominaux Ny fanasa-n 'i Be ny fiara (le lavage de la voiture par Be) et Ny hevi-ny (sa pensée) sont ainsi reliables respectivement aux phrases a support associées a (1) et (2). Ce qui veut dire, en d'autres termes, que ces groupes nominaux sont, en fait, des phrases pour autant qu'ils sont constitués d'un prédicat (le déverbatif V-n =: fa-V-a(na), V-E), d'un sujet (le N0 attaché au prédicat par Prép =: -na) et, éventuellement, d'un objet (l'objet direct N1 =: ny fiara (la voiture)) en (1). Or, du moins en ce qui concerne les groupes nominaux du type de Ny fanasan'i Be ny fiara (le lavage de la voiture par Be), où le déverbatif, de forme fx-V-a (na), comporte un objet direct, il est possible de faire appel a une transformation diathétique ou [Diathèse], pourvu qu'on efface le déterminant ny (le) devant V-n et qu'on ajoute un objet indirect instrumental comme ny vovo-tsavony (le savon en poudre) ou un circonstanciel de lieu, comme eo an-tokotany (dans la cour), ou de temps, comme ny tolakandro (l'après-midi). Le déverbatiffx-V-a(na) =: fanasana se comporte alors a la manière du verbe a la voix (ou forme) relative x-V-a(na) =: an-asa-ana = anasana, comme dans les exemples (3a), (3b) et (3c):
DÉVERBATIF ET DIATHÈSE EN MALGACHE
(3)
513
a.
(Anasa + Fanasa)-n'i Be ny fiara ny vovo-tsavony Avec quoi laver {Prés + Habit) par Be la voiture le savon en poudre (Le savon en poudre est ce avec quoi Be lave (E + habituellement) la voiture
b.
(Anasa + Fanasa)-n 7 Be ny fiara ao an-tokotany Ou laver {Prés + Habit) par Be la voiture dans la cour (La cour est où Be lave (E + habituellement) la voiture)
c.
(Anasa + Fanasa)-n 7 Be ny fiara ny tolakandro Ou laver {Prés + Habit) par Be la voiture l'après-midi (L'après-midi est où Be lave (E + habituellement) la voiture)
3. Transformation diathétique Sachant que l'expression morphologique des temps est assurée: - a la voix active, par l'alternance m (présent), n (passé), h (futur) et mp- (habituel), à l'intérieur du préfixe mx-, - à la voix passive et a la voix relative, par Palternance zéro (présent), n(o) (passé), h(o) (futur) et f(o) (habituel) en début de mot (voir S. Rajaona 1980:4.15, et S. Rajaona 2000: note 5, 14221), nous trouvons les exemples (4a), (4b) et (4c) comme phrases actives au présent et a Phabituel, auxquelles sont respectivement associées (3a), (3b) et (3c): (4)
a.
(Manasa + Mpanasa) ny fiara amin 'ny vovo-tsavony i Be Laver {Prés + Habit) la voiture avec le savon en poudre Be (Be lave (E + habituellement) la voiture avec le savon en poudre) = (3a) (Anasa + Fanasa)-n 7 Be ny fiara ny vovo-tsavony Avec quoi laver {Prés + Habit) par Be la voiture le savon en poudre (Le savon en poudre est ce avec quoi Be lave (E + habituellement) la voiture)
(4)
b.
(Manasa + Mpanasa) ny fiara ao an-tokotany i Be Laver {Prés + Habit) la voiture dans la cour Be (Be lave (E + habituellement) la voiture dans la cour) = (3b) (Anasa + Fanasa)-n 7* Be ny fiara ao an-tokotany Ou laver {Prés + Habit) par Be la voiture dans la cour (la cour est ou Be lave (E + habituellement) la voiture)
(4)
(Manasa + Mpanasa) ny fiara ny tolakandro i Be Laver {Prés + Habit) la voiture l'après-midi Be (Be lave (E + habituellement) la voiture l'après-midi)
ROGER-BRUNO RABENILAINA
514
= (3c) (Anasa + Fanasa)-n 7 Be ny flara ny tolakandro Ou laver {Prés + Habit) par Be la voiture l'après-midi (L'après-midi est où Be lave (E + habituellement) la voiture) Nous avons bien affaire ici a des transformations diathétiques définies par le changement morphématique du verbe, la permutation des arguments en () = (4a), laquelle est suivie de celle de l'objet direct avec le circonstanciel en (3b) = (4b) et (3c) = (4c), et l'ajout de la préposition enclitique -na attachant le N0 permuté au verbe. Si les phrases dérivées en (3a) sont a la diathèse instrumentale, celles en (3b) et en (3c) sont a la diathèse circonstancielle de lieu et de temps. Nous pouvons encore associer aux phrases actives en (3) des phrases a la diathèse passive; dans ce cas, le verbe est a la voix passive a suffixe -ana =: -a au présent et a la voix passive a préfixe f(o)x-=:fan- à l'habituel: (4)
d.
(Sasa + Fanasa)-n 7 Be amin 'ny vovo-tsavony (ao an-tokotany + ny tolakandro) ny fiara Être lavée {Prés + Habit) par Be avec le savon en poudre (dans la cour + l'après-midi) la voiture) (La voiture est lavée (E + habituellement) par Be avec le savon en poudre (dans la cour + l'après-midi))
S'il est ainsi possible d'associer une phrase a l'habituel a une phrase dérivée a diathèse quelconque, c'est qu'une forme a préfixe fx- ou a circonfixe fx-...-a(na) en position de prédicat est un verbe ayant subi une transformation diathétique. Par contre, une forme a préfixe fx- ou a circonfixe fx-...-a(na) en position d'argument est un nom prédicatif résultant de la transformation de nominalisation. Il a, en effet, une différence de "portee" entre une phrase telle que: Fanasan 7 Be ny fiara ny vovo-tsavony (Le savon en poudre est ce avec quoi Be lave habituellement la voiture) et un groupe nominal comme: Ny fanasan 7 Be ny fiara amin'ny vovotsavony (le lavage de la voiture par Be avec le savon en poudre). Dans la phrase, l'attention est focalisée sur l'instrument habituel utilisé dans l'exécution du procès; elle est, par contre, focalisée sur le procès lui-même, dans le groupe nominal. En résumé, la formation des dérivés appelés déverbatifs fait intervenir aussi bien la nominalisation que la transformation diathétique. De tels éléments se comportent donc a la fois comme des noms et des verbes. Ainsi, en tant que nom, un déverbatif comme fanasana (lavage) constitue la tête d'un groupe nominal tel que: Ny fanasa-n 7 Be ny fiara amin 'ny vovo-tsavony (le lavage de la voiture par Be avec le savon en poudre), qui est lui-même associé, par [Support], a la phrase active au présent: Manasa ny fiara amin 'ny vovo-tsavony i Be (Be lave la voiture avec le savon en poudre). Mais, en tant que verbe, le même déverbatif fanasana (action de laver habituellement) constitue le prédicat d'une phrase a l'habituel telle que: Fanasà-n 'i Be ny fiara ny vovo-tsavony (Le savon en poudre est ce avec quoi Be lave habituellement la voiture), qui est elle-même associée, par [Dia-
DÉVERBATIF ET DIATHÈSE EN MALGACHE
515
thèse], a la phrase active a l'habituel: Mpanasa ny flara amin 'ny vovo-tsavony i Be (Be lave habituellement la voiture avec le savon en poudre). Le titre implique donc qu'en malgache le déverbatif est catégoriellement ambivalent: il s'agit a la fois d'un nom dérivé d'un verbe et d'un verbe diathétiquement marqué.
Références Gross, Maurice. 1981. Les bases empiriques de la notion de prédicat sémantique. Langages 63, Paris: Larousse. Rabenilaina, Roger-Bruno. 1985. Lexique-grammaire du malgache. Constructions transitives et intransitives. Thèse de doctorat d'État, Paris: Université Paris 7, DRL - LADL. Rabenilaina, Roger-Bruno. 1989. Voix et diathèse en malgache. Bulletin de l'Académie Malgache, Nouvelle série, T. LXVII/1-2, Antananarivo: CIDST. Rabenilaina, Roger-Bruno. 1991a. Voix et diathèse en malgache. Linguisticœ Investigationes XV: 2, Amsterdam: John Benjamins. Rabenilaina, Roger-Bruno. 1991b. Le verbe malgache. Constructions transitives et intransitives. Publié en 1996, Montréal: Réseau LTT, AUPELF-UREF. Rabenilaina, Roger-Bruno, Razafindrakoto, Placide Rajaonson, Florine Rasoazananivo, Clément Luc Andrianierenana, Baholisoa Simone Ralalaoherivony, Lucie Raharinirina Rabaovololona. 1989. Ny fitsipiky ny teny T.11, Antana narivo: FOFIPA. Rajaona, Siméon. 1972. Structure du malgache. Étude des formes prédicatives. Fianarantsoa: Librairie Ambozontany. Rajaona, Siméon. 1980. Alternance en malgache. Hiratra 2, Antananarivo: SNIC. Rajaona, Siméon. 2000. Éléments de morphologie inflexionnelle du malgache. Les phénomènes morphologiques, Antananarivo: Éditions Ambozontany. Rajemisa-Raolison, Régis. 1969. Grammaire malgache. Fianarantsoa: Librairie Ambozontany. Ralalaoherivony, Baholisoa Simone. 1995. Lexique-grammaire du malgache. Constructions adjectivales. Thèse de doctorat, Paris: Université Paris 7 - Denis Diderot, UFR de Linguistique, LADL. Summary The nominalization or [Support] associates a sentence S2 which has nominal predicate with a sentence S1 which has verbal predicate by means of a Suppport verb. It concerns the non diathetic transformation, defined negatively as opposed to the diathetic transfor mation or [Diathesis]. The latter consist of focussing on the complement which is followed by the change of the voice of the verb and the link of the subjectN0transposed to the verb with the help of the enclitic preposition -na. But, the formation of derivatives
516
ROGER-BRUNO RABENILAINA
called deverbal nouns calls out the nominalization as well as the diathetic transfomation. Such elements both behave like nouns and like verbs. So, as noun, a deverbal noun like fanasana (washing) represents the head of the nominal group: Ny fanasan'i Be ny fiara amin 'ny vovo-tsavony (The washing of the car with the soap powder by Be), which can be derived from the active sentence in the present by [Support]: Manasa ny fiara amin'ny vovo-tsavony i Be (Be washes the car with the soap powder). But, as verb, the same deverbal noun fanasana (act of washing habitually) represents the predicate of a sentence expressing the habitual action: Fanasàn 'i Be ny fiara ny vovo-tsavony (The soap powder is with which Be washes habitually the car), which can be derived from the habitual active sentence by [Diathesis]: Mpanasa ny fiara amin 'ny vovo-tsavony i Be (Be washes habitually the car with the soap powder). The title implies then that in Malagasy the deverbal noun is categorially ambivalent: it concernes both a noun derived from a verb and a verb that the diathesis is marked.
LES TRAVAUX EN LEXIQUE-GRAMMAIRE DU MALGACHE ET LEURS EXTENSIONS LUCIE RAHARINIRINA-RABAOVOLOLONA Département Interdisciplinaire et de Formation Professionnelle BAHOLISOA SIMONE RALALAOHERIVONY Département de Longue et Lettres malgaches Faculté des Lettres et Sciences Humaines, Université d'Antananarivo
Introduction Cet article consacré aux recherches sur le malgache entrepris par l'équipe du Département Interdisciplinaire et de Formation Professionnelle (DIFP) vise surtout à mettre en valeur les apports des théories et méthodes du lexique-grammaire dans divers domaines d'enseignement et de recherche.
1. Les acquis en lexique-grammaire A partir du moment ou Maurice Gross a fait une mission d'enseignement au Département de Langue et Lettres Malgaches, alors dirigé par Roger-Bruno Rabenilaina, on peut dire que la description du malgache a avancé a pas de géant. Pour ne parier que des recherches diplömantes portant sur le lexique-grammaire, une thèse de Doctorat d'État, six thèses de Doctorat, treize mémoires de DEA, onze mémoires de CAPEN et plusieurs dizaines de mémoires de Maîtrise ont été soutenus depuis, alors que les travaux en linguistique dans ce cadre étaient rares auparavant. Les résultats de l'extension de ces recherches se présentent sous forme de communications, de rapports de recherche et d'autres réalisations scientifiques. Malheureusement, la grande majorité de ces travaux est restée inacces sible au grand public. La thèse de Doctorat d'État de Roger-Bruno Rabenilaina intitulée: Lexiquegrammaire du malgache. Constructions transitives et intransitives, préparée sous la direction de Maurice Gross, a pu être éditée en polycopie en 1987 et publiée en 1996; elle a été mise a jour en 1991 sous le titre: Le verbe malgache. Cons tructions transitives et intransitives. Il également deux autres thèses de Doctorat encadrées par Maurice Gross qui ont été soutenues a l'Université de
518
L. RAHARINIRJNA-RABAOVOLOLONA & . S. RALALAOHERIVONY
Paris 7: Lexique-grammaire des composés du malgache. Les adverbes de temps de Lucie Raharinirina-Rabaovololona en 1991 et Lexique-grammaire du malgache. Constructions adjectivales de Baholisoa Simone Ralalaoherivony en 1995. C'est ainsi que le malgache est entré dans la catégorie des langues pour lesquelles le point de vue théorique et les méthodes en syntaxe transformationnelle élaborées par l'équipe française ont donné des résultats positifs. L'hospitalité scientifique et technique dont nous avons bénéficié auprès des linguistes et informaticiens du LADL (Que toute l'équipe trouve ici la sincère grati tude que nous leur témoignons !) a profité aux linguistes malgachisants. La constitution d'une équipe dénommée GLUA (Groupe Lexico-grammairien de l'Université d'Antananarivo) a permis aux chercheurs de travailler plus efficacement et plus rapidement. Trois de ses membres ont mené a bien des recherches doctorales, sous la direction de Roger-Bruno Rabenilaina: Clément Luc Andrianierenana a travaillé sur les phrases a operateur affixal man(a)-, Jeannot Fils Ranaivoson sur la nominalisation par manaoV-n et Jean Paulin Razafimamonjy sur les constructions symétriques et réciproques, Ils ont soutenu leurs thèses de Doctorat de 3 ème cycle devant l'Université d'Antananarivo. Jeannot Fils Ranaivo son a fait, de plus, sous la direction de Gaston Gross, une autre thèse sur les noms prédicatifs, qu'il a soutenue a l'Université Paris XIII. L'enseignement secondaire a également bénéficié de ces travaux grace a l'intégration de la syntaxe transformationnelle dans le programme d'enseignement du malgache en classes de seconde et de première. L'équipe a alors confectionné des manuels de grammaire (Rabenilaina et alii 1986 et 1987) qui ont largement contribué a la vulgarisation de la syntaxe transformationnelle a Madagascar. Onze (11) mémoires de APEN ont été dirigés par Roger-Bruno Rabenilaina. La thèse de Doctorat que Florine Rasoazananivo a préparée a l'Université Paris XIII, sous la direction de Gaston Gross, consiste surtout en une application pédagogique des travaux effectués jusqu'ici sur le lexique-grammaire du malgache. L'ensemble de ces résultats conforte l'idée que l'élaboration du lexiquegrammaire d'une langue est non seulement un mode d'investigation très perfor mant en soi mais a, en plus, une portée universelle en rapprochant des langues de systèmes très divers. Depuis que le CERM s'est transformé en Département Interdisciplinaire et de Formation Professionnelle (D.I.F.P.) en 1996, les études du Centre telles que l'enseignement du malgache pour les étudiants non malgachisants (GLUA 1987 et 1988) et l'élaboration d'un dictionnaire bilingue franqais-malgache dénommé VITASOA ont connu un nouvel essor. Le GLUA devenu Jeune Equipe de Recher che travaille sur les terminologies bilingues français-malgache dans le cadre de son contrat de recherche avec PAgence Universitaire Francophone (JER-1001 2000). Le département collabore également avec d'autres institutions universitaires nationales et étrangères; l'équipe a ainsi pu s'épanouir dans le double cadre de l'enseignement et de la recherche. Les UFR de Traduction et de Journalisme créées au sein du D.I.F.P fonctionnent pleinement avec l'appui des membres de
LEXIQUE-GRAMMAIRE DU MALGACHE
519
cette équipe. Une nouvelle filière de Langues Appliquées au Tourisme et aux Affaires est une initiative menée conjointement avec les filières de langues étrangères. A partir des travaux issus de cette description formelle systématique, en collaboration avec nos partenaires et particulièrement les chercheurs du LADL (Université Paris 7, France), du LLI (Université Paris-Nord, France), de l'IRÏN (Université de Nantes, France), de l'Université de Montréal (Québec, Canada), nous nous sommes engagés dans divers contrats de recherche qui ont bénéficié grandement a notre équipe aussi bien en linguistique théorique et appliquée qu'en traitement automatique. On notera parmi les réalisations: - une base de données syntaxiques et lexicales (tables établies par les membres de l'équipe dans le cadre des recherches personnelles); - un logiciel de reconnaissance de phrases malgaches fait par un étudiantingénieur de l'ENI de PUniversité de Fianarantsoa. (Razafinimanana 1993) dans le cadre de son mémoire de fin d'études; - un programme d'extraction automatique de termes (Daille et alii 1996 et 1997) avec des membres de l'équipe «langage naturel » de l'IRIN Université de Nantes, France; - une base de données sur les formes composées Préd comme X (Andrianierenana et alii 2000) avec des chercheurs du LLI Université ParisNord, France; - un programme conçu avec le Professeur Jean-Yves Morin de PUniversité de Montréal pour la lexicographie bilingue. 2. Travaux en cours et perspectives d'avenir Nous cherchons a étendre nos recherches à l'ensemble du lexique, en particulier a la composition verbale, nominale, adjectivale, etc. Il existe des thèses en chantier a PUniversité d'Antananarivo comme celle de Lakoarisoa Andriamise sur les noms de sentiments et d'autres a PUniversité de Tuléar dont celle de Bertin Jaonarisaona sur les verbes composés, celle de Dimby Vaovolo sur les noms composés et celle de Claire Rasoamalalavao sur l'objet direct du verbe. De nombreuses études syntaxiques restent a faire, les travaux lexico-sémantiques ne sont qu'a leur début. Mais un problème prend de l'ampleur: les étudiants de maïtrise et de diplöme d'études approfondies en langues, pour ne pas parier de la linguistique, se font rares. 'est pourquoi, ces dernières années, en complément des recherches sur le lexique-grammaire, l'équipe malgache a lancé une mise en application des acquis obtenus a partir de ces recherches dans divers domaines pratiques touchant la langue. Divers domaines interférant avec la syntaxe ont été concernés: la lexico logie, la traduction, l'investigation informatisée de termes et la terminologie. Nous nous contenterons d'un aperçu des deux premiers domaines dans cet article.
520
L. RAHARINIRINA-RABAOVOLOLONA & . S. RALALAOHERIVONY
2.1. En lexicologie Les principes théoriques du lexique-grammaire et leurs résultats conerets ont permis l'équipe de reprendre sous une forme plus accessible, plus complète et moins lexématique la confection du dictionnaire français-malgache VITASOA. Trois points d'innovation prennent leur source dans les acquis des lexiquesgrammaires du français et du malgache. a) L' organisation des entrées Se référant au principe fondamental qu'« un sens suppose une grammaire spécifique », la notion d'entree ne s'entend plus en termes morphologiques mais comme des constructions et sens différents pour un même item. Ainsi, pour un lexème donné, plusieurs entrées ont été ainsi « repêchées » et ce d'autant que « la phrase constituant Punité minimale », des constructions plus larges incluant les items associés aux différenciations en sens figurent comme entrée. C'est le cas des formes prépositionnelles, des constructions a verbe support et des collocations comme: avoir connaissance de, perdre connaissance, ma connaissance, de connaissance, perdre connaissance, en toute connaissance de cause, etc. Les problèmes des catégories grammaticales sont également résolus par cette approcher'est la construction réelle d'un mot qui est considérée et non un usage normatif. Ex: Adj/Adv de tsara « bon », tsara « beau » et tsara « bien »,..., Adj/V des exemples miteraka « fécond » et miteraka « accoucher », N/V defanao « usage » et fanao « être fait habituellement »,... Ainsi les acquis du lexique-grammaire sont utilisés par l'équipe malgache pour produire des outils qui décrivent mieux le fonctionnement des deux langues et sont plus accessibles aux apprenants puisque plus complets et plus concrets. b) Les informations sémantico-syntaxiques Dans la réalisation de l'article d'une entrée, une place importante est réservée aux informations sémantico-syntaxiques qui proviennent des résultats des travaux en lexique-grammaire. C'est ainsi que sont notées des indications comme humain, partie du corps, ... pour les substantifs ou encore symétrique, mesure, ... pour les verbes, même si ce n'est pas systématique. Des remarques sur la classe sémantique sont même données parfois: temps, alimentation, commerce... Tout cela est présenté sous forme d'explication et/ou de remarque a part. c) Les exemples d'emplois Le choix des exemples est motivé par les même principes que ceux du lexiquegrammaire: ce sont des phrases naturelles, et pas seulement grammaticales. Ainsi, la catégorisation en niveaux de langue a été quelque peu délaissée au profit de la représentation d'un sens. A chaque sens est attribué un exemple de réalisation qui devrait rendre et le sens donné et la construction étayant ce sens. L'exemple peut être littéraire ou argotique, il représente les grammaires des langues décrites.
LEXIQUE-GRAMMAIRE DU MALGACHE
521
Voici quelques exemples dans le traitement du mot COTON pour illustrations: choisir un tissu de coton, chercher du coton a broder, acheter du coton hydrophile, se sentir tout coton, élever un enfant dans du coton, filer un mauvais coton, avoir les jambes en coton, 'est du coton, ce problème. Ceci est une innovation dans la lexicologie et la lexicographie fran9ais-malgache. La réalisation d'une large partie de la description dans les lexiques-grammaires du français et du malgache a donc permis de contribuer a l'amélioration de la confection d'un dictionnaire bilingue. Ceci est un acquis non négligeable pour la maïtrise des langues et le plurilinguisme. 2.2. La traduction Généralement, le lexique-grammaire est présenté comme une méthode menant au traitement informatique des langues. Mais en fait, la traduction humaine a des perspectives intéressantes si ses outils sont exploités. Quelques cas concrets puisés dans la pratique de la filière Traduction du DIFP peuvent illustrer cet apport. Le DIFP compte plusieurs lexico-grammairiens et le profil du cursus de la filière lui-même a été discuté avec Maurice Gross lors de ses deux passages a la Faculté des Lettres et Sciences Humaines. a) Analyse du texte de départ Dans la compréhension analytique d'un texte a traduire, la connaissance de la description sémantico-syntaxique est d'une aide considérable. Si on ne considère que les cas: - de la délimitation de la notion de prédicat sémantique qui dans la théorie harrissienne n'est pas limitée a la catégorie verbale mais peut correspondre aussi a un élément nominal ou adjectival (ce qui ouvre d'emblée les potentialités offertes au traducteur); - du repérage des liens de détermination avec les innovations descriptives en termes de prédéterminant, de déterminants nominaux, ainsi que les transforma tions potentielles données par les lexiques-grammaires: des tonnes de ciment / du ciment en tonnes, des tonnes de livre/ des livres (les perspectives de traduction se présentent ainsi mieux a l'esprit); - de la considération des collocations et constructions figées comme aussi importantes que certaines formes composées consacrées par les dictionnaires: café noir = café sons lait, colère noire = très forte colère, noir de monde = plein de monde, etc. nous pouvons affirmer que la formation des traducteurs gagne a s'appuyer sur la connaissance et la mise en pratique des lexiques-grammaires. b) La recherche d'équivalences Initiés préalablement aux relations entre phrases et transformations, les traduc-
522
L. RAHARINIRINA-RABAOVOLOLONA & . S. RALALAOHERIVONY
teurs dépassent Punité traductionnelle traditionnelle pour faire de la phrase Punité minimale. Ainsi les techniques classiques de modulation, transposition s'appuient sur la pratique des transformations courante en lexique-grammaire. Il est plus facile de gérer une équivalence appropriée quand l'on sait que des cageots de bière peut être transformé en des bières en cageots, des cageots contenant de la bière, des bouteilles de bière mises en cageots etc. ou encore faire 3 heures de route est en relation avec rouler 3 heures durant sur la route, rouler durant 3 heures sur la route, rouler 3 heures sur la route. La compréhension syntaxique qui passe par une lecture des transformations envisageables donne au traducteur plus de choix dans sa recherche d'équivalences. Ceci se retrouve aux niveaux syntagmatiques et phrastiques, en dépendance des phrases mises en relation. Ces mises en application des acquis ne minimisent cependant en rien les apports du lexique-grammaire dans la grammaire malgache.
Conclusion Avec cette nouvelle vision de la grammaire malgache (Rabenilaina 1984b), nous sommes arrivés a améliorer considérablement l'analyse traditionnelle. La consti tution du lexique-grammaire du malgache nous a en effet permis: - de dégager les règies syntaxiques de base et de décrire divers types de phrases; - d'intégrer dans les études linguistiques les différents pariers qui constituent le malgache et par la d'enrichir notre langue; - d'améliorer ainsi nos performances en traduction et en lexicologie; - d'élaborer des bases de données en vue du traitement automatique. Ces apports considérables avec Pélargissement de l'application du lexiquegrammaire a d'autres langues que les langues européennes sont dus l'initiative de Maurice Gross et doivent lui revenir en hommage.
Références Andrianierenana, Clément Luc, Denis Le Pesant, Lucie Raharinirina-Rabaovololona, Baholisoa Simone Ralalaoherivony, Jeannot Fils Ranaivoson, Robert Vivès. 2000. Problème de traduction des expressions figées: un exemple frangais-malgache, malgache-francais. Projet ARP de l'Agence Universitaire Francophone. Andrianierenana, Clément Luc. 1996. Phrases a opérateurs affixal "man(a)". Thèse de troisième cycle, Université d'Antananarivo: Département de Langue et Lettres Malgaches et Département Interdisciplinaire et de Formation Professionnelle. Andrianierenana, Clément Luc, Denis Le Pesant, Lucie Raharinirina-Rabaovo-
LEXIQUE-GRAMMAIRE DU MALGACHE
523
lolona, Baholisoa Simone Ralalaoherivony, Jeannot Fils Ranaivoson, Robert Vivès. 2000. Problèmes de traduction des expressions fïgées: un exemple bilingue frangais-malgache, malgache-frangais. A paraïtre dans Actes du Colloque international sur Traduction humaine, traduction autornatique, interprétation, Tunis. Daille, ., Enguehard, Jacquin, Lehman, L. Raharinirina-Rabaovololona, Baholisoa S. Ralalaoherivony. 1997. Traitement automatique de la termino logie en langue malgache. In Actes des Premières journées scientifiques et techniques «JST 97» du réseau FRANCIL, Avignon. Daille, ., . Jacquin, . Lehman, L. Raharinirina-Rabaovololona, Baholisoa S. Ralalaoherivony. 1996. Acquisition automatique de terminologie dans un cor pus en langue malgache. In Actes ILN96, colloque «Informatique & Langues Naturelles», Université de Nantes. GLUA (Groupe Lexico-grammairien de l'Université d'Antananarivo). 1987. Dinika sy Karoka Haiteny 1. (Études et Recherches Linguistiques 1), pp. 45-50, Antananarivo: FO.FI.PA. GLUA (Groupe Lexico-grammairien de l'Université d'Antananarivo). 1988. Dinika sy Karoka Haiteny 2 (Études et Recherches Linguistiques 2). Antananarivo: FO.FI.PA. JER 1001. (Jeune Equipe de Recherche, programme de l'Agence Universitaire Francophone). 2000. Lexique terminologique frangais-malgache des sciences du langage. Antananarivo: FTM. Rabenilaina, Roger-Bruno. 1977. Tsikera ara-tarika sy ara-piofohana 1. Andrana momba ny fifehezan-teny malagasy (Grammaire distributionnelle et transformationnelle 1. Essai sur la syntaxe du malgache). Antananarivo: FO.FI.PA. Rabenilaina, Roger-Bruno. 1979a. Double diathèse en malgache. Hiratra 1, pp. 41-66, Antananarivo: S.N.I.C. Rabenilaina, Roger-Bruno. 1979b. La neutralité de la diathèse en malgache. Lingvisticœ Investigationes III:1, pp. 295-321, Amsterdam/Philadelphia: John Benjamins (Résumé dans Language and Language Behavior Abstracts 15-2, San Diego: Leo P. Chall, 1981). Rabenilaina, Roger-Bruno. 1981. Classes syntaxiques des intransitifs intrinsèques et vides malgaches en betsileo. Hiratra 3, pp. 11-80, Antananarivo: S.N.I.C. Rabenilaina, Roger-Bruno. 1982. Tsikera ara-tarika sy ara-piofohana 2. Amboaran-dahateny momba ny fifehezan-teny malagasy. (Grammaire distribution nelle et transformationnelle 2. Recueil d'articles sur la syntaxe du malgache), Antananarivo: FO.FI.PA. Rabenilaina, Roger-Bruno. 1984a. Verbes a instrumental et destinataire en malga che. Lingvisticae Investigationes VIII:1, pp. 135-150, Amsterdam/Philadelphia: John Benjamins. Rabenilaina, Roger-Bruno. 1984b. Une nouvelle vision de la grammaire mal gache. La syntaxe transformationnelle. Lakroan'i Madagasikara 2400, 2402 et 2403, Fianarantsoa: Librairie Saint Paul.
524
L. RAHARINIRINA-RABAOVOLOLONA & . S. RALALAOHERIVONY
Rabenilaina, Roger-Bruno. 1985a. Lexique-grammaire du malgache. Construc tions transitives et intransitives. Thèse d'Etat, DRL et LADL, Université Paris 7, publiée en 1987, Antananarivo: FO.FI.PA. Rabenilaina, Roger-Bruno. 1985b. Présentations du "Lexique-grammaire du mal gache". 1: Hiratra 4, pp. 11-15, Antananarivo: FO.FI.PA; 2: Lingvisticce Investigationes IX:2, pp.455-457, Amsterdam/Philadelphia: John Benjamins; 3: 1988, Études Océan Indien 9, pp. 249-252, Paris: Institut des Langues et Civi lisations Orientales. Rabenilaina, Roger-Bruno. 1985c. Intransitifs a instrumental. Hiratra 4, pp. 4978, Antananarivo: FO.FI.PA. Rabenilaina, Roger-Bruno. 1987b. Structures syntaxiques dans les "Exercices" de P. Dalmond. Recherches et Documents 3, XII-XV, pp. 1-99, Antsiranana: I.S.T.P.N. Rabenilaina, Roger-Bruno & membres du DIFP. 1988. Ny fitsipiky ny teny T.10 (La grammaire pour la classe de seconde). Antananarivo: FO.FI.PA. Rabenilaina, Roger-Bruno & membres du DIFP. 1989. Ny fitsipiky ny teny T.ll (La grammaire pour la classe de première). Antananarivo: FO.FI.PA. Rabenilaina, Roger-Bruno. 1989. Voix et Diathèse en malgache. Bulletin de l'Académie Malgache, Nouvelle Série-Tome LXVII/1-2, Antananarivo. Rabenilaina, Roger-Bruno. 1990. Construction du dictionnaire électronique du malgache parallèlement a celui du fran9ais. Recensement des formes verbales. Communication au Colloque international sur les industries de la langue du 21 au 24 nov. a Montréal. In Actes du Colloque t.1, pp. 253-264. 1991. Montréal: Office de la langue française et Société des traducteurs du Québec. Rabenilaina, Roger-Bruno. 1991a. Voix et diathèse en malgache. Lingvisticce Investigationes XV:2, pp. 325-335, Amsterdam/Philadelphia: John Benjamins. Rabenilaina, Roger-Bruno. 1991b. Le verbe malgache. Constructions transitives et intransitives, Paris: AUPELF/UREF et L.L.I.de l'Université de Paris XIII. Rabenilaina, Roger-Bruno. 1994. L'enseignement de la traduction francomalgache assistée par ordinateur ou appuyée par la traductique». In AS actualité scientifique TA-TAO: Recherches de pointe et applications immédiates, Actes du Colloque de Montréal 1993, André Clas et Pierrette Bouillon (eds.), Beyrouth: FMA. Rabenilaina, Roger-Bruno. 1996. Le verbe malgache. Constructions transitives et intransitives, AUPELF-UREF, Réseau LTT, Montréal: GRESLET. Rabenilaina, Roger-Bruno. 1998. L'enseignement du malgache en tant que langue maternelle. Raki-pandinihana - Études offertes au Professeur Siméon Rajaona, Noël J. Gueunier et Solo Raharinjanahary (eds.), Fianarantsoa Ambatomena: Imprimerie Saint Paul. Rabenilaina, Roger-Bruno. 2000. Déverbatifs et Diathèse en malgache. Université d'Antananarivo: DIFP. Antananarivo. Raharinirina-Rabaovololona, Lucie. 1991a. Lexique-grammaire des composés du malgache. Les adverbes de temps. Thèse de doctorat, Université Paris 7: UFR
LEXIQUE-GRAMMAIRE DU MALGACHE
525
de Linguistique et CERIL-LADL. Raharinirina-Rabaovololona, Lucie. 1991b. Lexique-grammaire des composés du malgache. Les adverbes de temps. Résumé de la thèse. Lingvisticœ Investigationes XV:2, p.437, Amsterdam/Philadelphia: John Benjamins. Raharinirina-Rabaovololona, Lucie. 1997. Problèmes posés par les expressions ou idiomes dans la construction d'un dictionnaire d'usage bilingue. Cas de VITASOA, dictionnaire français-malgache confectionné par le DIFP de l'Université d'Antananarivo, Méta vol. 42, n° 2. Raharinirina-Rabaovololona, Lucie. 1999. Tendances de l'Autre dans la mise en parallele des collocations (Adj+V) comme Dét N du franqais et du malgache. A paraïtre dans les Actes des VIèmes Journées LTT, Beyrouth-Liban. Raharinirina-Rabaovololona, Lucie, Baholisoa Simone Ralalaoherivony. 1997. Dénomination dans deux longues en contact. Communication aux Vèmes Journées LTT, Tunis. Ralalaoherivony, Baholisoa Simone. 1995. Lexique-grammaire du malgache. Constructions adjectivales. Thèse de doctorat, Université Paris 7: UFR de Lin guistique et CERIL-LADL. Ralalaoherivony, Baholisoa Simone. 1997. Corpus des adjectivaux du malgache. Université d'Antananarivo: DLLM. Ranaivoson, Jeannot Fils. 1996. Étude des constructions a prédicat mx-N en malgache. Thèse de doctorat en sciences du langage, Université Paris Nord Paris 13: LLI. Ranaivoson, Jeannot Fils. 1996. Les noms prédicatifs en malgache. Les constructions manao V-n. Thèse de troisième cycle, Université d'Antananarivo: UFR de Langue et Lettres Malgaches et Département Interdisciplinaire et de Formation Professionnelle (D.I.F.P.). Rasoazananivo, Florine. 1995. Didactique de la langue malgache. Application au premier cycle du Second Degré. Thèse de doctorat en sciences du langage. Université Paris Nord - Paris 13: LLI. Razafimamonjy, Jean Paulin. 1998. Lexique-grammaire du malgache. Construc tions symétriques et réciproques. Thèse de troisième cycle, Université d'Anta nanarivo: Département de Langue et Lettres Malgaches et Département Inter disciplinaire et de Formation Professionnelle (D.I.F.P.). Razafinimanana, Nirina. 1993. Contribution a la création de dictionnaires électroniques du malgache. Mémoire d'Ingéniorat en Informatique, Université de Fianarantsoa: Ecole Nationale d'Informatique.
Summary As a visiting professor at the Department of Malagasy Studies at the University of Anta nanarivo in 1989, Maurice Gross gave an unprecedented impetus to the descriptive study of the Malagasy language. He contributed so much, mainly through the development of Lexicon-Grammar, that we have him to thank for one state doctoral thesis, four new
526
L. RAHARINIRINA-RABAOVOLOLONA & . S. RALALAOHERIVONY
doctoral theses, thirteen DEA theses, eleven CAPEN theses, and several dissertations or master's theses. The following achievements, completed by members of the DIFP (Inter disciplinary and Vocational Training Department) benefited particularly from his help: Lexique-grammaire du malgache. Constructions transitives et intransitives by RogerBruno Rabenilaina (1987), Lexique-grammaire des composés du malgache. Les adverbes de temps, by Lucie Raharinirina-Rabaovololona (1991) and Lexique-grammaire du malgache. Constructions adjectivales by Baholisoa Simone Ralalaoherivony (1995). Thanks to this progress in Lexicon-Grammar, the DIFP team was able to launch projects in fields with a more applied focus. These include Lexicology, Terminology and Translation. The new insights and tools offered by Lexicon-Grammar brought about tre mendous developments in those fields. In addition, there is continuity in our fundamental linguistic activity: the research into Lexicon-Grammar is the common interest of the members of DIFP. For all this, we are most grateful to Maurice Gross.
SHALL WE HORS D'OEUVRES ? *
THE ASSIMILATION OF GALLICISMS INTO ENGLISH ANTOINETTE RENOUF Research and Development Unit for English Studies, University of Liverpool
1. Introduction My interest in this topic is as an English linguist who, in the course of communi cating over recent years with French Romance linguists, largely within the framework of the LADL research network of Maurice Gross, has become more aware of the treasury of French vocabulary and phraseology in my own language. So it is curiosity that has led to this initial study. My intention is to look into the linguistic treatment of Gallicisms in current English text, more specifically in British broad-sheet journalism, and to unearth some of the principles and issues involved. This paper was conceived as a tribute to Maurice Gross, and is addres sed to him and his team. Brief History of Gallicisms in English Gallicisms, by which I mean French loan words, have been entering the English language since before the Norman Conquest. Precise figures are impossible to ascertain, since early evidence lies solely in the relatively few extant English manuscripts, the practice of writing in English virtually dying out between 1100 and 1200. The biggest single influx of French loans took place between 1200 and 1400. The earliest borrowings were Anglo-Norman, the later ones tended to be Central French.1 It is estimated that over 10,000 French words were adopted during the Middle English period, 75% of which survive in English today. The actual figure must be much larger, bearing in mind that written sources are the only available basis for calculation, and that most 'words' involve several inflexions and derived forms. In subsequent centuries, the climate continued to favour French borrowing. Caxton's press of 1476 helped to make the French component of English a permanent fixture. The Renaissance, 1500-1650, fostered * Sic. See § 5.2.2. and 5.2.3.ii. 1 Linguists and lexicographers are in dispute over the precise etymologies of French loans over the centuries.
528
ANTOINETTE RENOUF
scholarly translation requiring hundreds of foreign borrowings, many from French. The Age of Exploration, beginning in 1650, added further French words in spite of the new colonial focus, and in the eighteenth century, French was a highly popular source of loans, being at the height of prestige among the English upper class. From the nineteenth century until today, French loan words have continued to accompany cultural imports or add a gloss to aspects of English culture. In the mediaeval era, France contributed to English much of the terminology of government, religion, law, military, sport, social life, etiquette, morals, fashion and cuisine; also much of the vocabulary of art, learning and medicine (Geipel 1971; Baugh & Cable 1997; Freeborn 1998). It even made a significant early contribution to the basic vocabulary of English, many of the "simple, forceful" words in English being French, such as: "beak, cry, fool, frown, fury, glory, horror, humour, isle, pity, river, rock, ruin, stain, stuff, touch, wreck and calm" (Baugh & Cable, ibid.). Thereafter, France remained until the 19th century a model of civilisation for England and English writers, both in terms of its philosophy and its manners. Today, France still retains an aura of style and sophistication in the English imagi nation, and this is reflected in more recent French loan vocabulary, and in the stylistic roles to which it is put.
2. Some Reasons for the Loan of French words in English Fowler (1908) gave a prescriptive account of the uses of Gallicisms at the turn of the century. He saw pretension as the chief motivation (e.g. in saying distrait instead of 'absent-minded'; bien entendu for 'of course'). He allowed, however, that it was 'defensible' to borrow a French (or foreign) word if it possessed 'a definite meaning that no existing English word had' {entente being preferable to 'good understanding'). He also conceded that 'giving an atmosphere' through the use of a French word, might be 'praiseworthy' under some circumstances (e.g. using the French word déjeuner instead of English 'lunch' in the context of inviting the officers of the French Fleet to lunch). The source of Fowler's attesta tions was largely the Times newspaper of the day. My language data are late 20th century Independent newspaper texts. Here, I still find evidence of the same appli cations and motivations as Fowler, though not of all the Gallicisms he cites (e.g. no cases of démarche, démenti, dérouté). I would characterise the reasons for their use as follows. One purpose is to fill 'lacunae' or gaps in English. A second is the need or desire to indicate membership of a social or educational elite. A third motivation is to exploit the loan as a stylistic device: to create humour, or to evaluate and indicate authorial attitude. Of course, the same Gallicism may be employed in more than one role at any point.
GALLICISMS IN ENGLISH
529
2.1. Gallicisms used to fill lacunae in English A lacuna is a gap in a language where no word exists that is adequate to convey a particular denotation or connotation, reference or nuance. Lacunae exist in En glish for imported French cultural concepts, inventions and institutions. If we have no indigenous term for chemin de fer (card game), nouvelle cuisine and so on, we use the French one. Equally, if there is sometimes no single, neat word in English to express an English concept, and if the gap can be better filled by a French term, we will adopt it. Such loans include carnet, faux ami, joie de vivre, poignant and RSVP. Signs that a loan word has achieved bona fide status as an English word can include some degree of modification in spelling, accentuation and pronunciation; also some metaphorical extension of meaning. Another indica tion is likely to be its inclusion in the English headword list of a dictionary such as the Collins English Dictionary (2000); or as a head word in the English section of bilingual dictionary such as the Collins-Robert French-English Dictionary (1998). In some cases, English may actually have a native word which serves the purpose, but a French equivalent is nevertheless more resonant or apt, and is employed in preference on a fairly regular basis. A Gallicism with this intermediate status may be offered in the French section of Collins-Robert as an English translation of the identical French word, but it will not feature as a headword in the English section. French terms have also come into English, as well as other languages, as part the globalisation in language use. Globalisation has been in progress since the first man set sail, and is evident in the cognate and shared vocabulary across many languages. Dunn (2000) has a particular focus; he sees globalisation reflected in the recent spread of words which "derive from Britain's membership of the European Union: these include the adjective communautaire, as in the phrase2 acquis communautaire, which appears to have no English equivalent...1'. Thus, we begin to find in EU documents somewhat incongruous phraseology such as: the state of the citizenship acquis communautaire, as well as the infiltration into popular use of French words or new French meanings for existing English words; these include communautaire (meaning 'EU-spirited'), derogation, (meaning 'dispensation' rather than 'denigration'), and competence (newly used to mean 'jurisdiction', not 'skill'). 2.2. Gallicisms used to indicate membership of educated, cosmopolitan English elite The use of Gallicisms in English is something that comes naturally to many native English speakers, but perhaps more so, the more educated and more au fait with French they are. It is evoked naturally in some contexts, particularly those asso ciated with Frenchness and style, as I have said. However, it would seem that 2
In this paper, a 'phrase' means 'une expression' (une expression figée, un nom composé, un syntagme, etc.).
530
ANTOINETTE RENOUF
there is also a desire, or a need, to impress through the use of Gallicisms; to asso ciate oneself with the sophistication and cosmopolitanism attached to the term, sometimes laying oneself open to the charge of pretension or snobbery, whether social or intellectual. Modern-day use is, it should be said, very measured and mild in comparison with some of the overblown, ridiculous posturing cited by Fowler (ibid) and others in the early 20th century. 2.3. Gallicisms used to make allusions, add connotations, evaluate, create humour The use of Gallicisms is partly the consequence of a state of mind, which is triggered by the real-world and/or textual context to employ this manner of speaking, perhaps somewhat akin to switching into repartee. The stylistic motiva tion for using Gallic quote in English is to inject a connotation of France or Francophony (e.g. an allusion to Belgium) into the text. The stylistic impetus is particularly marked in journalistic text, as might be expected. According to our data, journalists in the Independent newspaper chiefly employ Gallicisms in the context of style, fashion, cuisine, sophistication and licentiousness; also of rele vant institutions (e.g. Channel Tunnel), matters of water and sea, as well as for the fairly predictable gamut of daily life and culture. Gallicisms are also used ironi cally of self-important businessmen and politicians, and of political, especially EU, deviousness. The effects created by journalists vary from humour and irony to ridicule and criticism. They are achieved in various ways. In general terms, irony is created through the use of oxymoron: by juxtaposing sophisticated Gallic terms with down-to-earth English vocabulary. The corollary is that where irony or ridicule is not desired, or where mannered writing is inappropriate, Gallicisms will be avoi ded. Thus, they are not used in texts about Anglo-Saxon culture or mores, nor about other non-Romance topics, nor to discuss serious topics, nor in texts where the affected behaviour of a celebrity is the object of criticism.
3. Definition of the Term 'Gallicism' As said, a Gallicism is a word or idiom borrowed from the French language at some stage in its history. The entire body of French loans embedded in current English, ranging from words that have been part of English since the Middle Ages to brand new, neologistic borrowings, would ultimately qualify for consideration in this study. One might reasonably add to these the many French translation equivalents, both semantic and literal, that exist in English. In this paper, however, I shall focus primarily on French loans from the seventeenth century and later. These are well on the way to being assimilated into English, but have not disappeared entirely in the manner of the earliest French loans, having retained their original pronunciation and spelling, and thus something of their potential for
GALLICISMS IN ENGLISH
531
allusion to aspects of Frenchness. I want to look at the linguistic treatment they receive in English text, and, in so doing, to discover some of the linguistic manoeuvres that can extract stylistic effects from them.
4. Methodology and Data used in the Study My point of departure was to have been a sub-set of Gallicisms extracted by semi automatic means from journalistic text. As a matter of practicality, I took 'the English language' to be co-extensive with these data. Clearly, a full investigation could be expected to reveal quantified evidence as to how Gallicisms occur and behave differently according to the particular medium or textual domain. The 'journalism' referred to consists of 10 years of The Independent news paper, from 1989-1999, mentioned above. French words are in principle automa tically identifiable in English text by a variety of means. However, our approach, involving a series of matching techniques devised by Mike Pacey and based on our APRIL text analytical tool (Pacey et al, forthcoming), is still under develop ment. Consequently, my data selection method involved personal introspection, informal enquiry and manual text study. The selectional criteria employed were thus less than rigorously scientific, but as stated earlier, they involved conside rations of form and style. Formally, the chosen Gallicisms should consist both of words and phrases (compounds, idioms, quotations, proverbs and slogans), which have not been translated or completely Anglicised. Stylistically, they should be words and phrases which, whether partly or even totally assimilated into English, are still capable of evoking Frenchness. Extended concordances as well as statis tical information were generated for selected Gallicisms - words, word pairs and strings - so that the nature of their collocation, semantics, grammar, pragmatics, style and semantic prosody could be observed. News data are received by us as plain ascii code, omitting accents and dia critics, italicisation and other highlighting. Such information, whilst intrinsic to the study of Gallicisms, is anyway not quantitatively interpretable at the present time. The vast numbers of French words in the Middle English period settled into English without trace, but for most of this century the orthographic treatment of foreign loan words has been in flux. Mencken (1921) commented on the contem porary "preciosity" of English editors in carefully italicising and accentuating all foreign loans in publications, dictionaries and journals, stating that even "good old English words [i.e. of French origin, but anglicised centuries previously] have been displaced by foreign analogues thought to be more elegant, e.g. repertory by répertoire...". By contrast, today we find Speake (2000), in the preface to the Oxford Dictionary of Foreign Words and Phrases, remarking on the non-retention of accents, saying that "the native English writer has a strong tendency to drop them". Recently, the Independent Editorial section (personal communication, 2001) stated that accented foreign words had only recently been introduced into
ANTOINETTE RENOUF
532
Independent text; my own observation of newspapers reveals that accents are not consistently applied even within the same issue. These factors, together with my sense that most users of English are uncertain as to their use, led me to proceed with this initial study, leaving the matter of accents for another occasion. However, it should be acknowledged that accents which English speakers per ceive as affecting pronunciation, notably the acute accent on a final syllable e, as in fiancé, manqué or arrivée, will normally be employed. Gallicisms used in this Study From a larger list of Gallicisms, I selected the following sub-set of items:3 Word/Phrase adieu apropos avant-garde bijou bon mot bon viveur cause celebre comme il faut coup de foudre critique cul de sac déjà vu de rigueur de trop double entendre enfant terrible ennui
Word/Phrase faute de mieux faux pas
gaffe
hors de combat hors d'oeuvre je ne sais quoi joie de vivre liaison manque nouveau (riche) nouvelle (cuisine) nuance pied-a-terre pirouette portmanteau quel/quelle (horreur) rendezvous
Word/Phrase RSVP savoir-faire savoir-vivre soi-disant soupcon tete-a-tete Quotations/Sayings apres moi le deluge 'est la vie honi soit qui mal y pense la belle dame sans merci le beaujolais nouveau est arrive medecins/jeux sans frontieres noblesse oblige plus ca change, plus 'est la chose sans culottes
5. Findings of the Study My observations on the behaviour of this sample of Gallicisms in context are presented below. They relate to the semantics, conventional and creative use, and processes of assimilation, of Gallicisms in English.
3
The sub-word Gallicism, the suffix -ette, is very productive in English; apparently less so in French. This and other sub-word French loans will be the subject of future reporting. See also Renouf & Baayen (forthcoming).
GALLICISMS IN ENGLISH
533
5.1. Semantics: Discrepancies between Gallicisms and French Source Terms The long history of borrowing from French would explain why several popular Gallicisms used today are old-fashioned or obsolete in modern French; it also explains why mismatches have evolved in the denotative or connotative meaning or range of meaning for the same word in English and in French. It is interesting to see the processes of language diversification at work. It is rather the exception than the rule that a Gallicism has retained its original French meaning and use. The discrepancies associated with Gallicisms found in my sample data are of several kinds. - They have never existed in French. In this category is bon viveur, expressed as bon vivant in French, the latter variant existing but rarely in English. Another absence in the French language is the English double(-) entendre, denoting an ambiguity where one meaning is indelicate; also the type of humour depending on this ambiguity. The expression double entente apparently existed in 17th French, but lacked the implication of naughtiness. The modern French semantic equiva lent of double entendre is mot a double sens or mot en sous-entendu. - They no longer occur in current French. In the obsolete category is jeu d'esprit, meaning 'a light-hearted display of wit or cleverness' (CED, 2000). The closest to this in current French is ce sont des jeux d(e l)'esprit, which means 'intellectual constructs with no basis in reality'. - They exist in French in a restricted concrete sense, where in English they have evolved further senses and metaphorical extensions. The term portemanteau in French denotes a coat hanger, coat rack or hat stand, whilst in English, the Angli cised portmanteau denotes a travelling case, but moves metaphorically into the sense of 'embodying several uses or qualities', and denoting a superordinate term in linguistics, or a linguistic blend. The word bijou simply denotes a jewel in French, whereas in English its additional and primary use is metaphorical, in characterising types of domicile, often ironically, as 'small but elegant and tasteful'. The phrase hors de combat is a sporting reference in French that has been generalised in English to encompass any circumstance of incapacity, physical or metaphorical. - There can be both formal and semantic conflation, as with the Gallicism savoir-faire. This lexeme seems to encompass the meanings both of French savoir-faire, denoting know-how, and of savoir-vivre, denoting mannerliness. The latter loan does exist in English but is rarely used. 5.2. Uses of Gallicisms 5.2.1. Conventional Uses of Gallicisms by French Standards Gallicisms are employed 'conventionally' in English to some degree; that is to
534
ANTOINETTE RENOUF
say, in a manner that equates to the normal use of these words in French. The contexts below illustrate some 'conventional' uses: Contextualised Gallicisms: a propos of nothing in particular the little airport is bijou chacun a son gout, of course the service is comme il faut it was the coup de foudre his critiques of modern art are superb she lived in a cul de sac chocolate sauce is a little bit de trop shirt and tie are de rigueur the enfants terribles of German politics she studied, faute de mieux, in London she made a serious faux pas
it is a major social gaffe he was hors de combat for weeks just an hors d'oeuvre on the political menu it lacked a certain je ne sais quoi a fine wit and great joie de vivre you're a priest manque pirouettes of verbal brilliance his savoir faire on the golf course she had a proper tete-a-tete with her fiance
However, the types of correspondence with normal grammatical French use that are shown here happen to occur because these are also perfectly conventional in English grammar, even down to the post-positional manque. The treatment that French loans receive in English is essentially a series of processes by which they are converted into workable approximations of conventional English words. By workable, I do not mean that they lose all sign that they were French. One type of conversion occurs where English speakers, in the absence of English rules to cope with French grammar and spelling, adopt a somewhat adhoc approach to repre senting French words orthographically and in incorporating them into English syntax, producing forms which are 'incorrect' by French standards. Since this paper is addressed to French speakers, I shall call these 'unconventional uses', though they are really 'standard English strategies for dealing with foreign objects' - provisional measures which must nevertheless be fairly established, since the objects have been part of English for centuries. 5.2.2. Misuses of Gallicisms by French Standards This section deals with English treatment of grammar and spelling of Gallicisms. We shall begin with an exposition of two aspects of French grammar that find virtually no correspondence in English morphology today. The first of these involves concord in number. In English, we do have plural markings for nouns, but we do not for adjectives. Moreover, English plurals are usually audible; that is to say, they generally involve a pronounced suffix, whereas the equivalent morphemes in French are, to English ears mysteriously, silent. The English treatment of French number agreement is thus somewhat un-French. Some exam ples are provided in the set below:
GALLICISMS IN ENGLISH
535
i) Lack of Concord in Number in the Use of Gallicisms E sing Det + Gall pl NP:
a spicy hors d'oeuvres of an innings this ultimate ieux sans frontieres
Gall sing N functioning as Mod + E pl N:
the nouveau riche working classes Pop stars manque its window display of bijou, rezzes the old pied noir apartments avant-garde chairs
Gall pl Adj/N+E sing N :
a rather bijoux corner of Knightsbridge
Gall generic NP + E pl V:
The nouveau riche are top of the league table
Gall [pl N + sing Adj] NP:
Mrs Clinton's bon mots occasional causes celebre from enfants terrible to mid-life crisis the Roman nouveau riches
Gall NP [pl 2nd element]:
cases which have become cause celebres the ageing enfant terribles a reunion ƒ pied noirs a collection of double-entendres family homes rather than pied-a-terres long, intimate tete a tetes
Gall Mass not pl N:
The trottoirs steaming with coup de foudre eyes that look like hors d'oeuvre to recover some ieu d'esprit my bravado and some tete-a-tete
ii) Lack of Gender Agreement in the Use of Gallicisms The second problem for English in dealing with French loans lies in the matter of gender agreement. We do have morphological marking for the semantics of gender (e.g. -ess in princess), but no morpheme for adjectival gender agreement. The following examples show a lack of gender agreement in noun phrases, either within the Gallicism or between the Gallicism and the English or French noun it modifies. (There may well be cases of a French noun wrongly modified by an English adjective or modifier elsewhere in the data.) Gall masc. N +E/Fr fern. N:
she was more nouveau than the supposed arriviste the princess manque Dani, the Spice Girl manque
536
ANTOINETTE RENOUF
Gall masc. Mod + Fr fem N:
the nouveau gauche approach she ran off with (quel horreur) an English officer grand passion and petite amour
Gall fem. Mod + Fr masc N:
an embassy aide said: 'Quelle jour' grand passion and petite amour
Gall masc sing Adj + E fem pl N: the nouveau princesses Gall masc sing Adj + fem pl N:
The French nouveau realistes new-newer-newest nouveau romantiques Boston's fashionable nouveau cuisine cafes
Gall agreement on invar. Adj:
the Philadelphia soi-disante feminist
In the examples above, we see both absence of gender agreement and wrong gender agreement. The adjective nouveau is perhaps conceived emblematically and so not inflected for agreement with its feminine nouns, but treated as though it were invariable. Meanwhile, the adjectives grand and manque are masculine and do not agree with their feminine nouns. By 'feminine nouns', I mean nouns that are semantically gendered (e.g. she, girl), or morphologically marked as female (e.g. princess), or are gender-neutral nouns in English but feminine in French translation (e.g. Engl. approach - Fr. approche, f). In contrast, the invariable adjective soi-disante, and the adjective petite and intensifier quelle, are feminised to match nouns which are in fact masculine. The latter gesture may indicate know ledge of the feminine V inflexion in French, or it may echo the whim that Talman scorned in the American treatment of Gallicisms in 1915: "the public taste seems to favour dansante (as in the dansante), which doubtless has a Frenchier appearance, provided you are sufficiently ignorant of the Gallic tongue". Either way, such strategies for dealing with number are likely to stay. iii) Misspelling of Gallicisms4 French native speakers, and indeed English speakers of French, would find many instances of misspelling of Gallicisms in English journalistic data (though not in English dictionaries). For some English speakers, however, these errors simply constitute different strategies for coping with strange words and sounds. As with any printed text, misspellings can be due to slips of the finger or slips of the brain. Some words are intrinsically mis-typable in English: liaison and hors-d'oeuvre, which figures prominently in the error list below, must be prime cases. But these are also good examples of the many French words which combine letters in ways 4
We shall not consider here cases where the English spelling has been Anglicised for centuries, or has retained the original Old French form, as with 'honi soit qui mal pense' - in modern French, 'honni soit qui mal y pense'.
GALLICISMS IN ENGLISH
537
that are not easy for an English speaker to visualise, so that accuracy (in French terms) may be something achieved on one occasion but not another by the same writer. However, the cases of misspelling (in French terms) that I have observed in our data seem to fall into four categories (though there may well be more). The first type of misspelling occurs where a French (or come to that, English) homophone exists for the French loan, as is the case with French vous versus -vu in deja-vu; English gaff versus gaffe. This type of confusion produces deja-vous and the erroneous gaff below. A second category of misspelling, or rather strategy for handling French spel ling, comes about when the Gallicism ends in a consonant, which would be silent in French but pronounced in English, as with avant in avant-garde, and coup in coup de grace. Here, the English speaker perhaps sometimes over-compensates by adding a final 'e' to be on the safe side, writing avante-garde and coupe de grace. (Added to which, of course, coup and coupe (and coupé) all exist in English). A third category of spelling error, or strategy, occurs in similar circumstances to the previous one, except that this time the English speaker opts not to provide a particular letter, perhaps because the word looks to have more or less the right number of letters; at any rate sufficient, according to English phonology, to be pronounceable. Such cases are faut in faut de mieux, gaff joi in joi de vivre, liasons, rendezvouing, rendevous and rigeur in de rigeur. The fourth category of spelling error occurs in conjunction with what I shall call 'the silent something' syndrome. An Egyptian friend once explained that the word he had written as pnuckle was intended to be the word knuckle, with the silent 'p'. The English speaker is dimly aware that there are many cases in French of unpronounced letters and silent endings. However, if s/he does not know the spelling of the word, s/he often also has no other means (e.g. etymological) of guessing what the appropriate letter to represent a given silence might be. In this situation, they sometimes adopt the 'what the heck' strategy, inserting their best guess into the space in question. This leads (in our data) to spellings such as: adieus, jois in jois de vivre, and rendezvouzing. final adieus the avante-garde Gallery the coupe de grace a sense ƒ deja-vous denim was de rigeur they will win faut de mieux a historical gaff a free hors d'oeurve followed by hors d'oevres goat's cheese hors d'ouevres
served as hors d'ouvres relegated as hors d'uvre more joi de vivre innocent jois-de-vivre liasons amoureux a rendevous with his mistress arrived at the rendevouz rendezvouzing in a car park rendezvouing off Sharjah an undisclosed rendezvouz
538
ANTOINETTE RENOUF
5.2.3. Conventional English Treatment of Assimilated Foreign Loans Another set of linguistic procedures that English speakers apply to Gallicisms results in usage that, whilst it may not be conventional according to French gram mar rules, does accord with the standard English treatment of indigenous neologistic coinages. We shall call this usage 'conventional'. The procedures will now be considered under the following categories: simplification, derivation and grammatical shift, lexico-grammatical frameworking, abbreviation, the use of Gallicisms as English translation equivalents, and finally, word play. i) Formal and Orthographic Simplification of Gallicisms Established Gallicisms, whilst still recognisable, have often undergone a degree of formal and orthographic simplification in English, losing anything from particles to accents, as discussed earlier, and being written as single words where they were originally compounds or even phrases. One example in our data is the all-purpose apropos (Very rarely, a propos), which in French is written as a-propos, à propos de, and à propos, demonstrating its different grammatical functions of noun, preposition and adjective. Tete-a-tete (occasionally unhyphenated, tete a tete) is another instance, which in English retains the same whether it is grammatically a noun, noun modifier or adverb, whereas in French the form varies between tete-atête as noun, and en tête-a-tête as adverb. ii) Derivation, Inflexion and Change in Syntactic Function of Gallicisms English, with its few inflections, is particularly conducive to grammatical and syntactic variation. Baugh and Cable (ibid.) remarked of 13th century English that "the rapidity with which the new French words were assimilated is evidenced by the promptness with which many of them became the basis of derivatives". This seems to be the case today, although Baugh and Cable were referring to conven tional formations, such as the attachment of English suffixes to French roots, whereas what I particularly notice in the data, in addition to these, are the creative formations which regularly occur, which would be unthinkable to the French reader. Some of the more established Gallicisms, such as hors d'oeuvre and tete-atete, seem to move freely between most grammatical classes. The following sample of the many instances gives a fairly representative impression: N to V:
contemporary art has avant-garded itself Clive Jenkins, a man who bon viveurs for Wales It had deja been vued Shall we hors d'oeuvres now? cosmonauts pirouetted and rendezvoused He has portmanteau-ed a number of assumptions her staff are RSVP-ing in the negative He's been tete-a-teting with foreign diplomats
GALLICISMS IN ENGLISH
539
N to VN/non-fin V: His new kitchen tome makes "hors d'oeuvring" look easy Ifound myself portmanteauing one sentence to the next Would you expect to go to a wedding without RSVPing ? a private corner for a little tete-a-teting N to Adv:
ministers were allowed to lunch tete-a-tete* with journalists
N to N:
the pirouettings when UK groups linked up with the US giant others are pushing avant-gardery to the limit that rather forlorn band of Sixties avant-garders the viewer is a deja vue-er
N to Nmod:
famous in avante garde circles elevation to cause celebre status a quick coup-de-grace chop deja-vu country folie de grandeur exoticism the hors d'oeuvre stage on sartorial and joie de vivre grounds a perfect pied-a-terre property regular tete-a-tete exposes
N to V to Adj:
an avant-garded type composer a terrace house now bijoued up a few ennui-ed lunchtime shoppers
N to Adj/Compl:
the meetings were tete-a-tete
N to adj/mod:
a bit deja vu-ish very deja vu-esque a deja vu-like pleasure risky or double-entendre-ish a bit subtexty and double-entendry disappointingly hors d'oeuvre-ish tiny little nuancey details
AdvPhr to N:
the comme il faut of short fiction
Adj post to premod: a manque Kate Bush AdvPhr to Compl: her homosexuality was faute de mieux Quantifier as mod: doubts, albeit of soupcon proportions Prep as mod:
spectacular if de trop designs my current hors de combat accomplice
Phrase as mod:
chacun a son gout telly
540
ANTOINETTE RENOUF
iii) Gallicisms in Lexico-Grammatical Frames Established Gallicisms can sometimes be marked as such by their insertion into a series of lexico-grammatical frameworks which are used in English to indicate the awareness of the writer of the possibly hackneyed nature of a phrase, proverb or quotation if used in full. Some examples are: it was a case of 'est la vie a classic case of coup de foudre it was a case of faute de mieux the faute de mieux factor The score seems to be heading for the proverbial nul points This flagging extends to metalinguistic interpolation or comment of the kind: Chacun, as they say a son gout As Orlofsky would say, 'chacun a son gout' iv) Abbreviation of Gallicisms A lexical item in English must be familiar to its audience for it to be abbreviated. This is not often the case with Gallicisms, though the following example was found: The details got more grown-up and serious as dinner went from hors to pud v) Gallicisms as English translation equivalents of foreign terms Some Gallicisms have been assimilated into English to the point where they can be offered as the English translation of a foreign term. We noted some entries in the Collins English Dictionary earlier. An example from our data is hors d'oeuvre, in the following culinary contexts: tapas, Spanish hors d'oeuvres the zensai, or hors d'oeuvres a table was laid with zakuski (hors d'oeuvres) 5.2.4. Word Play with Gallicisms Consistent with their role as sources of humour and irony in text, and in evoking things French, Gallicisms that are familiar features of English are ready targets for word play, whether subtle or groaningly obvious, among the chattering classes. The kinds of linguistic treatment this punning and allusion involves are similar to those routinely applied to English phrases with the relevant potential. Below, we see a fair range of the standard types of English exploitation of a set expression or idiom, based on the manipulation of sound, rhyme, onomatopoeia, semantics, reference, connotation, grammar, and usually a combination of these.
GALLICISMS IN ENGLISH
541
apres moi le deluge: Apres le Chunnel, le deluge [ref. to anticipated tourist influx] After us that shower takes over [joke translation in retirement speech] Apres the bonfire came le deluge [ref. to financial success of film 'Bonfire of the Vanities'] avant garde: It is reckoned to be thoroughly deriere garde (sic) Garden ornaments: Art for the avant-gardener La Belle Dame Sans Merci: Cleopatra - a kind of belly-dancer sans merci a beldam sans merci equipped with an all-powerful handbag [ref. to Marga ret Thatcher] Le beaujolais nouveau est arrive: Le nouveau satellite, 'est arrivee Le nouveau Labour /budget est arrive la premiere neige est arrivee bon mot: With a Scots burr, Norman dispensed bonny mots The normally urbane Frenchman mouthed les mal mots His mots must not only be bons, but tres petits too chacun a son gout: Shagan a son gout coup de foudre: Un amitie de foudre between our Tony and Bill Clinton deja vu: the US may be headedfor 'deja voodoo' a strong sense of deja claret and blue [rhyming slang for Aston Villa foot ball colours] double entendre: single entendre films were a peculiarly British concoction Most of the entendres are distressingly singular one-and-a-half-entendre DIY advice about drilling deep more multiple entendres in a phrase than you can take in So careful to avoid ambiguity that it had no entendres at all Jokes with ever-increasing doubles, often singles, entendres ennui: is severe millennui to blame? faux pas: It was a fax pas as much as a faux pas
542
ANTOINETTE RENOUF
Honi soit qui mal y pense: Honey, your silk stocking's hanging down [joke translation] hors-d'oeuvre: ordure (with French intonation, sounds like 'hors d'oeuvre') je ne sais quoi: Theatre: That old Genet sais quoi manque: Monkeys are evolved; the diarist manque is a simple beast Travis looks like a musician rather than a manque cow-poke You're a scientist manque - Don't call me a manque Don't make a manque out of me medecins /jeux sans frontieres: the cliches of the peur sans frontieres thriller Making the piece a fiasco sans frontieres the Levi commercial, 'Jeans sans frontieres' Cantona's status as a joueur sans frontieres noblesse oblige: A philosophy of life that can be summed up as richesse oblige nouveau riche: The exuberance of the nouveau very riche indeed plus ca change, Plus ca change, plus 'est la show plus 'est la chose: plus ca change, plus 'est la World Cup sans culottes: the poseurs and 'sans socks' who meet in the bar she turned up at a Bastille Day reception sans culottes tete a tete: A Tate a tete. The future of London's Gallery
6» Frequency of Use of Gallicisms in English We have indicated here that established Gallicisms are widely used to contribute to the style and sophistication of English writing. It is known that thousands of early French words and phrases form an integral and nowadays undetectable part of the English language. We know that new French words and phrases regularly enter English text, particularly journalistic and other ephemeral text, the majority
GALLICISMS IN ENGLISH
543
departing again as current affairs change their focus, but some settling. What is not known is precisely how common or how stable is the use of Gallicisms in English. My own impression, perhaps reflecting my idiolect, is that it continues unabated. Clearly, as mentioned earlier, textual domain and social context have an effect on the degree of borrowing. An issue of The Independent newspaper for 8th Feb. 2001, providing a 150,000 word sample, reveals pretty thin pickings: a total of 7 Gallicisms, all but one in the 'Review' section: son et lumiere (sic), ancien régime, sang-froid, a la, oeuvre, clickéd and clichés. If this were to imply that Gallicisms account for a mere 004% of the running words in English journalistic text, it would not be significant. (A calculation based on word types would of course boost their percentage contribution). At the other extreme, a recent article in the English-language 'Time Out' section of the weekly Pariscope, fortuitously found, demonstrates a far livelier use. Film: Moulin Rouge (Pariscope / Time Out, 10-16 October 2001) "What do you get when you purée fin-desiecle Montmartre with a Gloria Estefan/Nirvana soundtrack? The new film from Oz director Baz Luhrmann. Satine (Nicole Kidman), the world-weary courtesan with a heart of gold, and Christian (Ewan McGregor), the uncompromising English romantic, sing their way through incongruous top-40 numbers, past and present. The techno-opera grand finale is excellent, but the film walks a long, contrived path to get there: 100 minutes of grinding exposition, tortured romance, Benny Hill slapstick, confused clichés, 2D characters that we are asked to care about and witless double entendres". Over 6 % of the words in the text are Gallicisms. This figure is explained by the topic, journalistic co-text, and strong Gallic influence on the writer, all of which surely put him into that associative frame of mind that I mentioned earlier. Within these two extremes lie a range of text types, purposes and associated frequencies. With automated help, a quantified picture of these phenomena can also be established over a longer period of our journalistic database, revealing their chan ging patterns of frequency and use in text over time.
7. Concluding Remarks Gallicisms continue to be treated much as they have been since about the thir teenth century. That is to say, welcomed into English on condition that they behave themselves. Nobody expects them to lose all identity; on the contrary, they are appreciated for their rather charming foreign eccentricities, even brought out and paraded around on occasion. However, they must expect to be subject to the
544
ANTOINETTE RENOUF
same rules of conversion that are applied to all upstarts and alien elements in English, and to undergo such modification as renders their native spelling and grammar (and pronunciation) less troublesome to the average English speaker. This study has raised questions for the future as to the kinds of words and phrases that have been adopted, the relative frequencies of these phenomena, the change in their use over time, the functions of sub-word Gallicisms, and a detailed look at the stylistic and other roles that Gallicisms play. In this study, I have for instance, mentioned the use of Gallicisms to fill lacunae in English, but not inves tigated it in operation. There may be a difference in the balance of purposes of borrowing between France and England at this point in history. This possibility notwithstanding, one is tempted (if not entitled) to draw a provisional conclusion that, all in all, modern English appears to be assimilating French every bit as much as modern French is being 'invaded' by English.
References Atkins, Beryl, Alain Duval & Rosemary Milne. 1998. Collins-Robert EnglishFrench Dictionary. 5th Edition. Glasgow: HarperCollins. Baugh, Albert & Thomas Cable. 1997. A History of the English Language. London: Routledge. Chartier, Alain. 1424. La Belle Dame Sans Mercy (via Keats, John (1820), La Belle Dame Sans Merci). Dunn, John, A. 2000. The Slavonic Languages in the Post-Modern Era. Epicentre Electronic Publishing, Vol 3: Informal Working Papers from Departmental Research. University of Glasgow: Dept.of Slavonic Studies. Freeborn, Denis. 1998. From Old English to Standard English. Basingstoke: MacMillan Press. Geipel, John. 1971. The Viking Legacy: the Scandinavian Influences on the En glish and Gaelic Languages. David & Charles: Newton Abbot, pp. 13-14. Knowles, Gerry. 1997. A Cultural History of the English Language. London: Arnold. Mencken, H.L. 1921. The American Language. New York: Alfred A. Knopf. (Also, 2000, New York: Bartleby.com, Chapter 8:6). Pacey, Mike, Antoinette Renouf, Paul Davies & Andrew Kehoe (forthcoming). Ten Years of Monitoring Morphological Change in News Text (provisional title). Renouf, Antoinette & R. Harald Baayen (forthcoming). On mock-scholarly, fauxcasual, and cod philosophy: patterns of diachronic change in a British news paper. Talman, Charles Fitzhugh. 1915. Accents Wild. Atlantic Monthly, Dec., pp.807ff. Treffry, Diana, Sheila Ferguson & Alan Isaacs (eds). 2000. Collins English Dictionary. 5th Edition, Glasgow: HarperCollins.
GALLICISMS IN ENGLISH
545
Acknowledgement I wish to express my gratitude to Christian Leclère, co-editor of this volume, for his generous help and advice throughout this linguistic study.
Summary The dialects of the region now known as France have been contributing words and idioms to the English language for the last millennium. These Gallicisms serve a number of purposes, from filling lacunae, to associating the writer with French sophistication and style, to creating particular stylistic effects in writing and speech. This study takes a subset of established Gallicisms, which are formally and stylistically capable of evoking Frenchness, and examines their linguistic treatment in English. Sometimes they are used just as they are in French. Some uses are simply inaccurate by French standards: in relation to gender and number agreement, and to spelling. Other uses are unconventional by French standards but represent the standard English practices of modifying foreign loans to fit English norms; these include the possible conflation of formal and orthographic variants of a Gallic phrase, the tendency to employ a word across a range of grammatical and syntactic classes, and the use of word play. The study concludes with the impressionistic observation that English seems to assimilate French as much as modern French is 'invaded' by English.
THE SYNTAX OF EMPHASIS - A BASE CAMP HAJ ROSS Linguistics Department, University of North Texas
This paper is intended as a contribution to the understanding of the structure of emphatic sentences in general, in particular of those sentences which are now referred to in the English grammatical tradition as cleft and as pseudocleft sen tences, as exemplified in (la) and (lb), respectively: (1) a. b.
It was Atibaia that I visited What I visited was Atibaia
I am aware of the vastness and sheerness of the slope that looms above us, and the ridiculousness of even surveying the major problems in a short paper, but one has to start somewhere, and perhaps a good place to pick up the trail is around the issue of the source of such sentences. Accordingly, I will propose a remote struc ture for pseudoclefts, and, with a good deal more diffidence, I will second Adrian Akmajian's suggestion (in A. Akmajian 1970) to the effect that cleft sentences should be derived from pseudoclefts. I have in the past proposed (cf. J. R. Ross 1972:88; cf. also J. R. Ross in press, for much more detail) a source for pseudocleft sentences which I will refer to as the bisentential analysis. Under this analysis, a sentence like (lb) would derive from some such structure as the one shown schematically in (2): (2)
I visited wh + something
I visited A tibaia
HAJ ROSS
548
Necessary for any such derivation would be a rule which deletes that part of S2 which repeats a corresponding part of S1 - namely, in (2), I visited. Let us refer to this rule, which will be discussed at length presently, as Pseudocleft Formation. A fundamental insight which (2) incorporates is due to Robert Faraci (cf. R. Faraci 1971), who argued that the initial subordinate clause in pseudoclefts can most profitably be taken to be an embedded question (that is, a clause such as would function as the subject of a predicate like is a mystery or the object of I wonder , rather than the kind of clause which would function as the subject of is 72 kilometers north of São Paulo, which is a card-carrying free relative clause). Faraci observes that embedded questions can have cleft sentences as their highest clauses (as indicated by the boldface sections of (3)), (3) a. b.
What (it was that) I visited is a mystery I wonder what (it was that) I visited
while free relative clauses cannot (indeed, (almost) no relative clauses can) - cf. the asterisked versions of (4a), which contains a free relative clause, and (4b), which contains a garden-variety relative clause: (4)
a. b.
What (*it was that) I visited is 72 kilometers north of Sao Paulo The city that (*it was that) I visited is 72 kilometers north of Sao Paulo
Faraci then goes on to show that pseudocleft sentences can also have cleftsentences inside of the highest clauses of the clauses that function as their subjects: (1) b'. What (it was that) I visited was Atibaia Therefore, he concludes, any structure, like (2), which intends to generate the full range of pseudocleft sentences, must contain, as the subtree in the position of S1 in (2), whatever kind of structure underlies other embedded questions. In (2), I have appended a capital "Q" to suggest this aspect of Faraci's ground-breaking work. Naturally, therefore, whatever transformations have to apply inside of embedded questions, such as the fronting operation that I refer to as Question Formation in J. R. Ross (1972), will also apply in (2). We can extend Faraci's insight so that it applies to cleft sentences as well. Although there has not been the same amount of controversy surrounding the categorization of the postcopular sentence in cleft sentences, perhaps because these sentences are most frequently found to start with that or nothing (cf It was Eddie (that) I gave the book to), rather than with a wh-word (as in (?)It was Eddie who I gave the book to), still the fact that wh- can head clauses here forces upon us the question as to what kind of wh-clauses such clauses as these might be (free) relatives of some kind, or question clauses. Thus the fact that Faraci-type cleft sentences can be found seems to suggest that the embedded sentence of a cleft should also be seen as a question:
THE SYNTAX OF EMPHASIS
(5)
549
It is Eddie to whom it must have been that they gave the book
Returning now to (2), assuming it established that Question Formation will apply in the sentence embedded to the left of the copula, what other transfor mations need we assume the existence of ? One of the most obvious is the rule I call Copula Switch, which is responsible for such alternations of non-emphatic sentences, such as these: Tom is the villain → The villain is Tom; Some wine was on the table → On the table was some wine; The ones who passed were happy → Happy were the ones who passed. For an excellent in-depth discussion of the problems surrounding the syntax of "inverted" copular sentences, cf. . . Partee (1999). To be sure, though I have never studied the problem in any detail, I would be inclined to doubt that all of these inversions will best be analyzed as being perfor med by one unitary operation. I list them here in a group not in order to claim that there can be only one operation of inversion, but rather to call attention to the possibility of collapsing the rule that can be seen to be operating in (6) below with some other independently needed process(es) in the grammar: (6) a. b.
[(1b)] What I visited was Atibaia → (via Copula Switch) Atibaia was what I visited
The most radical of the suggestions that I wish to make in the bisentential analysis is that, aside from the obligatory movements involved in forming embedded ques tions and other minor operations, one of the options for a derivation from (2) is: nothing further need happen at all. If this option is chosen, sentences like (7) are produced (let us refer to them as "undeleted pseudoclefts"), sentences in which there is obviously a clause in surface structure on either side of the copula: (7)
% [ What I visited]s was [I visited Atibaia]s
I have prefixed (7) with the '%' sign, to indicate that not all speakers accept this sentence. A fairer way of presenting that fact would be to say that most speakers are appalled at my claim that there are any users of such structures whatsoever. Nonetheless, I continue, in fairly good cheer, to maintain the essential correctness of the bisentential analysis, because aside from speakers like myself, who do get undeleted pseudoclefts like (7), there are some sentences with all the important properties of (7) which a large majority of speakers, as far as I know, will accept, sentences the main verb of whose subject clause's wh-word (what) is the deep object of the (pretty) empty verb do, as exemplified in (8): (8)
[ What I was doing] s was [I was visiting Atibaia] s.
It would take me much too far afield here to recapitulate the abstract structures that I find most reasonable for such "agentive" do's (cf. J. R. Ross 1972 for some details), but in any case, whether or not the abstract syntax analysis of agentive do that I propose stands or falls, the relevance of such sentences as (7) for the correctness of the basic claim of the bisentential analysis - namely, that pseudo-
HAJ ROSS
550
cleft sentences are derived from structures in which there are embedded clauses both before (uncontroversial) and after (controversial) the verb be - is clear. A full analysis of pseudoclefts would then have to find ways of incorporating the obser ved facts - that is, that most speakers do not like sentences like (7), with two surface clauses, unless the relevant verb of the first clause is do - presumably to be accounted for by making obligatory the rule of Pseudocleft Formation, which sluices away those parts of S2 in (2) which are identical to corresponding parts of S1, except in the presence of this do. Note that undeleted pseudoclefts like (7) and (8) can also undergo Copula Switch: (7') (8')
% [I visited Atibaia]s was [what I visited]s [I was visiting Atibaia]s was [what I was doing]s
An extremely interesting class of sentences, previously unreported, to the best of my knowledge, can be derived from copula-switched pseudoclefts like these by Sluicing, the rule which shortens questions when the non-question-word part of them repeats part of an earlier clause. Some examples of the operation of this rule can be seen in (9) and (10): (9) a. b.
I visited someplace interesting: guess what I visited I visited someplace interesting: guess what
(10) a. b.
I was doing something interesting: guess what I was doing I was doing something interesting: guess what
In these sentences, since the boldface sequences are identical to each other, the second can be sluiced, as described in J. R. Ross (1969) (and now, in far greater detail, both within English and cross-linguistically, in J. Merchant 1999). Now note that (7') and (8'), under a bisentential analysis which incorporates Farad's insight, also end with embedded questions, and that furthermore, the question word what is in both cases followed by a repeated sequence. If we allow Sluicing to apply here, we derive the following sentences: (11) (12)
[I
visited Atibaia]s was what [I was visiting Atibaia]s was what
To be sure, these sentences are not found in writing, and may be preferred imme diately after a question, in sequences like the following: (13) a. b.
Where is he going? He's going to Rome, is where (he's going)
(14) a. b.
Who should I talk to ? You should talk to Paul is who (you should talk to)
For me, the sentences seem to require a comma intonation immediately before the copula, an oddity that I have no account for. But what is important here is the fact that such sentences exist at all, for they have a fairly natural account, given the
THE SYNTAX OF EMPHASIS
551
bisentential analysis, which thus strengthens the case for it. Moreover, they will be a real problem for any other analysis that I can think of, especially any analysis which proposes to make the deep structures of pseudoclefts be in essence their surface structure. Let us pause briefly to consider why. Suppose that the deep structure of a sentence like (15) is roughly like the structure shown in (16): (15)
What you need is a Fiat
(16)
you need what How could this structure be used, in any helpful way at all, to generate, for those speakers who accept such sentences, a sentence like (17), which is synonymous with (15)? (17)
You need a Fiat, is what
Sentence (17) appears to start with a plain tensed clause, presumably a subordinate one, because of the copula that follows, though there is no subordi nating conjunction of any kind to indicate the role of the initial clause. And what follows is worse yet - a question word, one which does not start a clause of its own. The solidest generalization concerning wh-words in English is that, except for cases produced by the operation of Sluicing, such as (9b) and (10b) above, or in clauses which contain multiple wh-words (e.g., who gave what to whom when?), or in echo questions, incredulity questions, and so on, every wh-word starts its own clause, due to the operation of the (normally) obligatory rule of Question Formation. (17) would have to be considered an exception to this other wise quite valid generalization. Note also that there is an alternate to (17): (18)
You need a Fiat, is all
If anything like (15) is what underlies pseudoclefts, we have no explanation of the mysterious occurrence of all, in the place of the wh-word what (and perhaps also who). However, if we postulate that (17) has, at an earlier stage in its derivation, a sentence like (19):
HAJ ROSS
552 (19)
What you need is a Fiat
and we also know that what alternates with all [NB: only in certain contexts, of which the subject clauses of pseudoclefts are one], by processes which I have no analysis of at present (cf. (20)): (20)
All you need is a Fiat
we have an possible solution to the mystery of all in (18): its immediate antecedent in the derivation would be (21): (21)
You need a Fiat, is all you need
To this structure, Sluicing can, optionally, for me, apply, deleting the second of the identical boldface sequences, and we have a derivation for (18) as a variant of (17), a variant produced by some independently needed process, whatever it might be, which optionally converts (19) to (20). I mention in passing that there remain is all sentences which escape handily the net cast above, such as I stood there - is all [in the meaning "The only place I stood is there" - note the non-existence of anything parallel to (20), such as *All [that/where] I stood was there]. To end this subtopic, it seems to me that even without a complete account of the is all phenomenon, the existence of sentences like (17) provides evidence of the strongest kind for the correctness of the bisentential analysis. Let me sum up what I have said thus far. I postulate bisentential sources, like (2), as the remote structures for pseudocleft sentences, structures which will pro duce a wide set of surface structures by the application of such rules as Question Formation, Pseudocleft Formation, Copula Switch, and Sluicing. Let us turn now to the other famous emphatic construction - the cleft sentence. As I noted at the outset, despite many differences that one encounters between pseudoclefts and clefts, I find Akmajian's 1970 arguments - t o the effect that the former underlies the latter - fundamentally sound. He points out, for instance, that first-person cleftees exhibit third-person verb agreement when they function as subjects in the clauses out of which they were clefted. Thus the correct agreement in (22) is given in (22a), not in (22b), which one might have expected, had its formation really simply involved a "cleaving" of the subject pronoun I from the sentence I am sick: (22) a. It is me that is sick b. * It is me that am sick However, let us turn briefly to a set of sentences which might lead one to conclude, contra Akmajian, that there is a fundamental difference between pseu doclefts and clefts, with respect to the kinds of constituents that can be focused by the two rules. In (23), I have arrayed all of the focus types that are possible for pseudoclefts, and in (24), the focus types for clefts:
THE SYNTAX OF EMPHASIS
(23) a. b. . d. e. f. g. h. i.
NP: that S: for NP to VP: Q: Acc Ing: Poss Ing: (volitional) VP: AP: Adverb phrases i. of manner: ii. of frequency: iii. of location: iv. of direction: v. of time: vi. of cause: j. *Non-adverbial PP:
553
What Ifound was grape What I said was that you were spooty What Al expected of us was for us to leave What he asked was where the barn was What I can't imagine is him howling What they resented was AVs buying this What we were doing is moving the piano What we have always been is kind to apes How he entered was stealthily How often Danes eat is six times a day Where he lives is in Krum Where we drove was to Bossington When we met you was in November Why we left was because of the rain (*Of) what I was thinking was ofyou %What I was thinking of was ofyou
Now let us examine each of these focus types for the corresponding cleft sen tences: (24) a. b. c. d. e. f. g. h. i.
j.
NP: It was a grape that I found that S: * It was that you were spooty that I said for NP t VP: * It was for us to leave that Al expected of us Q: * It was where the barn was that he asked Acc Ing: (?)It is him howling that I can't imagine Poss Ing: It was AVs buying this that they resented (volitional) VP: **It is moving the piano that we were doing AP: ** It is kind to apes that we have always been Adverb phrases i. of manner: * It was stealthily that he entered ii. of frequency: It is six times a day that Danes eat. iii. of location: It is in Krum that he lives iv. of direction: It was to Bossington that we drove v. of time: It was in November that we met you vi. of cause: It was because of the rain that we left Non-adverbial PP: It was ofyou that I was thinking
I suspect that some of these differences, real enough though they are, are more superficial than they appear. One piece of evidence that this is the case comes from the rule that I have referred to as Left Deictic Dislocation (cf. J. R. Ross 1995). The difference between the more frequently discussed rule of Left Dislo cation, which converts (25a) to (25b), and that of Left Deictic Dislocation, which converts (25a) to (25c), is in the type of "returning" pronoun (to borrow a term from Arabic grammar) which the rule introduces:
HAJ ROSS
554 (25) a. b. e.
I've never heard of Jed swimming in the canal Jed swimming in the canal - I've never heard of it Jed swimming in the canal - I've never heard of [that / this]
While there is no space in the present work to examine the many interesting properties of the latter process, we can make use of it to deictically dislocate the foci of the sentences in (24) - with the results seen in (26): (26) a. NP: b. that S: . for NP to VP: d. Q: e. Acc Ing: f. Poss Ing: g. (volitional) VP: h. AP: i.
Adverb phrases i. of manner: ii. of frequency: iii. of location: iv. of direction: v. of time: vi. of cause:
j.
Non-adverbial PP:
A grape - it was that that I found That you were spooty - it was that that I said For us to leave - it was that that Al expected of us Where the barn was - it was that that he asked Him howling - it is that that I can't imagine Al 's buying this - it was that that they resented Moving the piano - it is that that we were doing Kind to apes - it is that that we have always been Stealthily -it was [that way >?thus] that he entered Six times a day - it is that often that Danes eat. In Krum - it is \in that place > there) that he lives To Bossington - it was [to that place > *(??to) there] that we drove In November - it was [at that time > then] that we met you Because of the rain - it was [for that reason / because of that) that we left Of you - it was of that that I was thinking
While the claim that there is a unitary process responsible for the conversions of the sentences in (24i) to the cognate ones in (26i) is doubtless not uncontroversial, I suspect that the claim that the left deictically dislocated sentences in (26a) - (26h) arise from their often ungrammatical cognates in (24a) - (24h) will be seen as fairly straightforward. The conclusion, in that case, will be that the ungrammaticalities in (24a)-(24h) do not argue for any substantive distinction in source between pseudoclefts and clefts. A second argument arises from the fact that the focused constituent can be topicalized, as we see in the conversion of (27a) to (27b):
THE SYNTAX OF EMPHASIS
(27) a. b.
555
It was a T-bone steak that Rover made off with A T-bone steak it was that Rover made off with
Let me remark parenthetically that I believe that whatever fronting process is at work here to quite possibly be distinct from the garden-variety topicalization of sentences like This banana pizza I really can't eat. Two facts underlie my uneasi ness: first, this process works only in inner islands - negatives are excluded (cf. *A T-bone steak it wasn 't that Rover made off with). Normal topicalizees can leave negative clauses with impunity. Second, there is a characteristic intonational contour which is associated with topicalizing the focus of a cleft sentence: in (27b), the word was bears the highest pitch of the sentence, and is followed by the "flattened" intonation which one finds after contrastively stressed elements, as in I gave A COBRA to Donald outside the fieldhouse yesterday. Let us now examine how this (probably construction-specific) process of topicalization affects the grammaticalities of the ungrammatical clefts in (24b)(24i.i) - I have inserted a 'Ø' to mark the original location of the topicalized phrase: (28) b. c. d. e. f. g. h. i.
that S: for NP to VP: Q: Ace Ing: (?)Him Poss Ing: (volitional) VP: AP: Adverb phrases of manner:
That you were spooty it WAS Ø that I said For us to leave it WAS Ø that Al expected of us Where the barn was it WAS Ø that he asked howling it IS Ø that I can 't imagine Al's buying this it WAS 0 that they resented Moving the piano it IS 0 that we were doing Kind to apes it IS that 0 we have always been Stealthily it WAS 0 that he entered
It is clear that in each case, the topicalized version is much improved, which suggests to me that we will have to devise some kind of output condition to star the bad sentences of (24), rather than treating clefting as a process totally distinct from pseudoclefting. There are, however, facts which I see as more threatening to an identification of the two constructions. First, while pseudoclefts can never emphasize idiom chunks, as we see in (29), clefts have fewer misgivings about doing so, as (30) indicates: (29) a. * What they have made on this problem is quite significant headway b. * What is up is Horace's number . * What we all love to pull is the principal's leg (30) a. It is quite significant headway that they have made on this problem b. It is Horace's number that is up . It is the principal's leg that we all love to pull Second, it seems never to be possible to pseudocleft a sequence of constituents
HAJ ROSS
556
that are not dominated by a single node (i.e., only constituents pseudocleft) - cf. (31): (31) a. b.
[* Where / *When / *How long] I worked on this problem was [for four weeks in Munich / in Munich for four weeks} [*When / *Where] I worked on peanut toxicity was [in Toulouse in 1999/in 1999 in Toulouse]
I infer that the underlined words in (31) do not form constituents, on the basis of the fact that they do not pied-pipe, as we see in (32): (32) a. * The weeks for which in Munich I worked on this problem were deliriously happy ones b.'*In which city in 1999 to work on peanut toxicity was a mystery Nonetheless, some of these do seem to be able to cleft: (33) a. b.
It was [for four weeks in Munich / ?in Munich for four weeks] that I worked on this problem It was \in Toulouse in 1999 / in 1999 in Toulouse] that we attacked the final section
It should not be thought that just any old sequence of words can be clefted. For instance, while some sequences of adverbs, such as those in (33), seem cleftable, I have found no sequence that contains even one argument of a predicate that can be clefted (cf. *(34a)), to say nothing of the wretchedness of clefting both of the arguments of a predicate, even if one of them is an adverb (cf.*(34b)): (34) a.
*It was to him in Paris that I gave the leeks Indir Obj
b. ** It was the milk Dir Obj
Locative
onto the table that we chucked Directional
However, it is also not the case that just any sequence of two non-argumental adverbs can be clefted: (35) a. b.
*It was in 1983 because of the strike that we moved *It was during the night with a tuning fork that I cooked
The sequences that seem to work best for me involve specifications of location and time, though I have not lived with this phenomenon long enough to know whether this frail generalization will hold much water. Even if it should, it would require the postulation of "constituentoids" - loose aggregates of adjacent adverbials of the requisite type, which can be acted upon by the rule of Cleft Sentence Formation (and perhaps other, similar rules?). This whole area seems likely to open cans of worms within other cans, all the way down. I will mention in passing two other cleft-linked constructions, though there is space to do justice to neither. The first is produced by a rule I will refer to as Cleft Copula Zap, which, in a process suspiciously like that of the well-beloved Whiz
THE SYNTAX OF EMPHASIS
557
Deletion (which is responsible for alternations like somebody who was [from Waco / singing in Mandarin / blasted out of his mind] → somebody who was [from Waco / singing in Mandarin / blasted out of his mind]), gets rid of the initial that of a cleft and a following (auxiliary plus (?)) copula, before a PP or a V+ing (though not before an adjective phrase), to produce the truncated clefts seen in It was Trev that was [in the Toyota / singing in Mandarin / *blasted out of his mind]. These shorty clefts can have their foci topicalized (Trev it WAS in the Toyota / singing in Mandarin), and also left deictic dislocated: It was the eggbeater in the soup → The eggbeater - it was that in the soup. Note that Cleft Copula Zap requires that the focused element be a plain vanilla lexical NP, perhaps even only allowing concrete NP's, as we see from contrasts such as those in (36): (36) a. It was Terri on duty. b. ? It was her loyalty in question. .* It was whether she fell asleep in question. The other, more versatile, construction arises directly from clefts sentences, via the rule of Presupposition Zap, a rule which deletes the post-focal question clause under identity with a preceding clause, as we watch happen in (37) and (38): (37) a. b. (38) a. b.
Something seems to have gotten in -I bet it was a squirrel that got in Something seems to have gotten in -I bet it was a squirrel that got in Terry stole someone's wallet, but it wasn't Bob's wallet that she stole Terry stole someone's wallet, but it wasn't Bob's wallet that she stole
There is space here to mention two quick arguments to the effect that the final copular clauses of (37b) and (38b) are indeed clefts: first, note that just as the intensifiers even and also cannot "modify" (if that is the word I should be using here -cf. Cooper and Ross (1979) for some discussion of these and other inten sifiers) the focus of a (pseudo)cleft, so they cannot survive when their following presupposition has been deleted, as we see from (39): (39) a. * What got in was [even/ also] a squirrel b. * It was [even / also] a squirrel that got in c. * It was [even/also] a squirrel Second, note that the same baffling constraints regarding the kinds of sequen ces of constituents which can form "constituentoids" that we glanced at fleetingly above show up in these presuppositionless "bikini clefts," as we can see from the contrasts in (40): (40) a.
It was during the night [for f our hours / * with a tuning fork] that I cooked
HAJ ROSS
558 b.
It was during the night [for four hours / * with a tuning fork] that I cooked
I feel sure that future research on these shorties will lead us to interesting areas, but they will have to wait for another day. I will close this brief survey of emphatic constructions here. While some of the conclusions about pseudoclefts that I have advanced would seem to me to have a strongish claim to validity (especially the bisentential analysis, though I do not know how to refute the telling arguments against it that Higgins (1979) makes, I am considerably less sanguine about anything that I have said about clefts. I have been messing about with (pseudo)clefts for far too long now, I would have thought, to remain as much in the dark as I still am. But that is well and truly where I in fact am, which I take as a kindly hint from the universe to the effect that I should be a lot more cautious about anything that I try to say emphatically.
References Akmajian, Adrian. 1970. On deriving cleft sentences from pseudoclefts. Unguistic Inquiry 1:2, 149-186. Faraci, Robert. 1971. The deep question of pseudo-clefts. English Linguistic 6:4885. Higgins, Roger. 1979. The Pseudo-Cleft Construction in English. New York: Gar land Publishing Company. Merchant, Jason. 1999. The syntax of silence - Sluicing, islands, and identity in ellipsis. Ph. D. Dissertation, Santa Cruz: University of California at Santa Cruz. Partee, Barbara H. 1999. Copula Inversion Puzzles in English and Russian. In Formal Approaches to Slavic Linguistics: The Seattle Meeting 1998, Katarzyna Dziwirek, Herbert Coats and Cynthia Vakareliyska (eds.), Michigan Slavic Materials #44, Ann Arbor: Michigan Slavic Publications. Ross, John Robert. 1969. Guess who? In Papers from the Fifth Regional Meeting of the Chicago Linguistic Society, Robert I. Binnick, Alice Davison, Georgia M. Green, Jerry L. Morgan et al (eds.), Chicago: Chicago Linguistic Society, 252-286. Ross, John Robert. 1972. Act. In Semantics of Natural Languages, Donald David son and Gilbert Harman (eds.), Dordrecht: D. Reidel and Company, 70-126. Ross, John Robert. 1986. Infinite Syntax! Norwood: Ablex Publishing Company. Ross, John Robert. 1995. Defective noun phrases. In Papers from the Thirty-First Regional Meeting of the Chicago Linguistic Society, Audra Dainora, Rachel Hemphill, Barbara Lukas, Barbara Need and Sheri Pargman (eds.), Chicago: Chicago Linguistic Society, 398-440. Ross, John Robert. In press. The frozenness of pseudoclefts - towards an inequa lity-based syntax. In Papers from the Thirty-Sixth Regional Meeting of the Chicago Linguistic Society, John P. Boyle and Arika Okrent (eds.), Chicago:
THE SYNTAX OF EMPHASIS
559
Chicago Linguistic Society. Ross, John Robert; William E. Cooper. 1979. Like syntax. In Sentence Proces sing: Psycholinguistic Studies Presented to Merrill Garrett, Hillsdale: Law rence Erlbaum Associates, 343-418.
Summary This paper attempts a survey of the major emphatic constructions in English, and of the processes which derive them from a proposed bisentential source. The source for a garden-variety pseudocleft sentence like What Jeb hankers for is a smooth transition is argued to be What Jeb hankers for is he hankers for a smooth transition - the rule of Pseudocleft Formation, which is optional for some speakers, deletes the redundant struckthrough elements. Whether this ellipsis has occurred or not, a rule of Copula Switch can apply to transform the post-copular constituent into the subject of the resulting sentence: He hankers for a smooth transition is what Jeb hankers for. Copula-switched or not, and deleted or not, the subjects of all such pseudoclefts can be Deictic Dislocated, freely to the left, less so to the right. The returning pronouns which emerge in the course of these operations are the demonstratives that and this. Some examples of the resultant structures are: What Jeb hankers for- [that / this] is (? he hankers for a smooth transition): *[That /This] is (** he hankers for a smooth transition) - what Jeb hankers for; He hankers for a smooth transition - [that/ > this] is what Jeb hankers for; [This / >?That] is what Jeb hankers for - he hankers for a smooth transition. Akmajian's motion to derive cleft sentences from pseudoclefts is seconded, and it is argued that Deictic Dislocation can provide some evidence for the correctness of such an analysis, in the face of apparent counterexamples to it. Thus, since What Tony regretted was [the pizza / that Mildred loved Baryshnikov] are both grammatical, we would expect both clefts to be. But: It was [the pizza / *that Mildred loved Baryshnikov] that Tony regretted. However, leftdislocating both foci yields two good clauses: [The pizza / That Mildred loved Baryshnikov] - it was that that Tony regretted. Thus we conclude that the ungramma ticality of the clefted that-clause is merely due to a violation of a surface filter.
VERBS OF MENTAL STATES MORRIS SALKOFF1 Sinequa
1. Syntactic properties This paper is a brief summary of an investigation I have carried out on the syntac tic properties of verbs that can take a sentential clause as subject and a 'human' noun, Nh, as direct object, N1.2 (1)
That S V N1
These are verbs like exasperate, trouble, delight, or satisfy.3 A first group of these verbs refer to psychological configurations of the mind of the direct object Nh. I shall refer to these psychological configurations as 'mental states'. They appear in paradigm sentences like That Mary won second prize {delighted + troubled) Helen. A second group refers to a change in the physical state of Nh. This applies to verbs like exhaust, nauseate, traumatize, cripple in the sentences such as That John fell down the whole flight of stairs (crippled + traumatized) him. A third heterogeneous group of verbs does not refer to any mental or physical state of Nh. This is the case for verbs like demean, belittle, idealize, endanger in That John accepted such menial work {demeaned+ endangered) him. Finally, there are verbs that are not in the paradigm, even though the sentence That S V N\ exists, e.g., delay, retard, hold up. A sentence like That Mary forgot her handbag is {delaying + retarding + holding up) John can only mean that John's action is delayed, where the action in question may be indicated in the preceding context, or if there is no specific context, the action must be a departure or an arrival. If John is doing nothing, or has no intention of leaving or is not 1
I am indebted to Maurice Gross for his comments and criticisms of earlier versions of this paper. The full results of this investigation will be presented elsewhere. The French verbs satisfying (1) are found in Table 4 in M. Gross (1975). The indices of the noun phrases are assigned as follows. The subject of the sentence noted S is designated NO, the direct object N1, and the prepositional object N2. Then the sentence John gave the book to Jim can be represented schematically as NO V N1 Prep N2. In the examples that follow, the plus sign is a symbol of disjunction, and the sym bol E represents the empty sequence. 3 A short list of these verbs is available in P. Rosenbaum (1968).
2
562
MORRIS SALKOFF
expected to arrive, then the sentence is semantically incoherent. The human object N1 here, John, does not represent himself, but rather a reduction of a sentence, so that the sentence above is a reduction of That Mary forgot her handbag is delay ing John's (action + departure + arrival), 1.1. Object Length For verbs appearing in (1), the direct object is a noun phrase, and the latter must be the maximal possible extension of the object for this sentential subject clause. This means that exasperate is a verb of the paradigm, but disqualify is not: (2)
a. b.
That Mary refused his offer exasperated Jim That John failed the basic drug test disqualified him from (the race + some event) . That John failed the basic drug test disqualified him
The maximal extension of the object of disqualify is N1 from N2, as in (2b). Hence the apparent noun phrase object John in (2c) is not an independent property of disqualify, but is obtained by the deletion of the indefinite from some event in sentence (2b). 1.2. Adjectivization Many of these verbs have a morphologically related adjectival form, noted V-a, such that be V-a can replace V in (1). In that case, a preposition is required before N1, most frequently to ox for: (3)
That S V N1 ↔ That S be V-a Prep N1 That John plays poker bothers Jim ↔ That John plays poker is bothersome for Jim . That Jim arrived late annoyed us ↔ That Jim arrived late was annoying to us
a. b.
The adjectival suffix that can be attached to the verb varies with the verb; in a few cases, more than one suffix is available to a given verb, e.g., benefit → beneficial, beneficent. Many existing V-a forms are absent from the table of verbs. These forms can appear as noun modifiers, but they cannot enter into the adjectivization transformation of (3a), hence are not in the paradigm: (4)
a. b.
That John bought so many books (benefited + was beneficial to + * was beneficent for) the children too That John hid his anger so well (deluded + * was delusive to + * was delusory to) his wife
VERB OF MENTAL STATES
c.
563
That Mary insisted on speaking first (irritated + was particularly irritative to + * was irritant to) John
1.3. Verbs with a particle Some of the verbs in the study take an optional or required particle: (5)
a. b.
That Jim could recite poetry bowled Mary (*E + over) That Jim retracted his accusation calmed Paul (E + down)
When the particle is optional, as in (5b), it adds some aspectual meaning to the sentence that can be difficult to specify. When it is required, as in (5a), then the meaning of the verb-particle combination is different from that of the verb alone; in that case, the combination is an independent verbal form. Other verbs of this type are fence in, box in, or hem in: (6)
a. b.
That Mary refused any sort of a compromise fenced Max in That the speaker refused to apply article L32 (boxed + hemmed) Max in
Only a sampling of those verbs which behave like fence in, hem in, box in, etc., have been included in the paradigm. The work of searching for all of them in the lexicon systematically must be left for a later extension of the present study. 1.4. Reflexive; Passive The sentential clause in the subject and the human noun in the object can be inver ted in some cases, and the verb becomes a reflexive: (7)
a.
That Ida behaved maternally towards him (deluded + tormented + flattered) Max b. Max (deluded + tormented + flattered) himself that Ida behaved maternally towards him
Note that these verbs do not appear with the object N\ that S, so that the reflexive himself caxmot be obtained by the pronominalization of N1 in that object: (8)
*Max (deluded + tormented + flattered) Jim that Ida behaved maternally towards him
The passive is possible for most of these verbs only if that in the subject clause is replaced by the fact that. For some of the verbs appearing in the passive, both by and at are possible: (9)
a.
Max was (aggrieved + amazed + baffled + concerned + surprise...) (by + at) the fact that S
564
MORRIS SALKOFF
The prepositional phrase (by + at) the fact can be deleted for these verbs, yielding a reduced passive: (9)
b. Max was (aggrieved + amazed + baffled + concerned + surprised..) that S
1.5. The for ... to clause The sentential subject clause can always be replaced by a for N0 to V Obj clause. When the sentential clause in (1) is replaced by a for...to clause, we have: (10) a.
For Sbj toV0Obj V N1
in which the new verb, in the for...to clause, is distinguished from the main verb by its subscript. If the subject Sbj and object Obj of the for ...to clause are denoted by N00 and N10 respectively, we have: (10) b.
For N00 to V0 N10 V N1
Here, the important consideration is which of the nouns N00, M10 and N1 are coreferent or not. For some verbs, N00 and N1 must be coreferent: (11) a. For Mary to cut her hair short disfigured (her + *Jane) b. For John to accept the bribe misbecomes (him + *Paul) . For John to speak with a lisp individualizes (him + *Paul) For others, N00 and N1 cannot be coreferent, except in the context of a joke or a split personality: (12) a.
For Mary to sing so beautifully charmed (Paul + Jane + her [≠Mary]) b. For John to arrive so late disobliged (Paul + her + him [≠John]) . For John to speak so rudely affronted (Paul + her + him [≠ John])
And for the third and largest group, N00 can be indifferently coreferent to N\ or not: (13) a. For John to have to punish the girl flustered (Paul + him) b. For Mary to dress so elegantly flattered (the audience + her) . For John to have to dismiss his secretary irked (the council + him) Here, him or her can refer to John or Mary, or to a third party, noted Nj in the annexed table. The interesting case occurs when N1 must be coreferent with N10, and cannot be coreferent with N00. With just two exceptions, all of these are the verbs of the third group, which do not refer to any change of state in the direct object. Such verbs are, for example, idealize, vilify:
VERB OF MENTAL STATES
565
(14) a. N00 ≠ N1: * For the artist to copy sacred art idealizes him b. N10 = N1: For the artist to depict Mary as another Joan of Arc idealizes her . N00 & N1: * For the artist to publish pornographic pictures vilifies him 0 d. N1 =N1: For the artist to depict those merchants as 'fat cats' vilifies them 1.6. Psychological Nouns For some verbs, the direct object N\ can be either a human noun Nh or a 'psycho logical' noun, i.e., a noun referring to some mental state of Nh, symbolized as Np of Nh. Some of the words classified in Np are: spirit, soul, mind, brain, ego, courage, pride, outlook, attitude, nature, intelligence, intellect, morale. Each verb taking Np of Nh as object selects a different set of the words in Np, and for a small group of verbs, only the object Np of Nh is possible: (15) a.
That Mary spoke so well of his work flattered (John + John's [pride + ego]) b. That his mother remained at home quieted (the boy + the boy's [anguish + mind]) . That the officer treated his men so curtly blunted (*them + their [morale + courage]) d. That Jim reacted so cynically dashed (*John + John's [pride + morale + spirit])
2. The verb table In the extract given below of the table of verbs of the paradigm, each verb constitutes a single-line entry in the table. The syntactic properties of a verb are detailed in the columns: the properties of its subject are placed on its left, and those of its complements on its right. The headings on the columns describe the property associated with that column. Each such property is a sentence, and a verb of the paradigm either can or cannot appear in that sentence. This is indicated by a + or a - sign, respectively. The verb is printed in the central column of the page, with its properties on its left and on its right. A two-letter semantic code which refers to the affected state of the direct object Nh is printed on the right of the verb column as follows: change in physical state (P); change in mental state (M); change in both states (B); no change of state (N). Some verbs take an adverbial particle {up, down, off etc.) which is printed next to it in the verb column. The particle may or may not be required, and this is indicated in the first two columns
566
MORRIS SALKOFF
to the right of the verb, which are headed N0 V N1 and N0 V Particle N1. For the majority of verbs, which appear without any particle, these first two columns contain '+ -', in that order. Verbs that appear with particles are coded '- +' when the particle is required, or '+ +' when the particle is optional. 2.1. The Subject The first two columns of subject properties are headed the fact that S and for N00 to V Obj. The second column is coded '+' for the entire paradigm, for the subject complement clause of (1) can always be replaced by an equivalent for ...to clause. The column headed the fact that S is coded '+' for the majority of verbs of the paradigm. The third and fourth columns of the subject encode the possible coreference of 0 N0 , the subject of the sentential clause. For the majority of the verbs of the paradigm, these columns are coded in one of three ways (Nj below is a third party unrelated to N00 or N1): as in(11) (16) a. N00=N1 →'+'; N00= Nj → '-' 0 0 b. N0 =N1 → '-'; N0 = Nj → '+' as in(12) 0 0 N0 =N1 →'+ VN0 =Nj →'+' as in (13) For a small number of verbs, the coreference between N1 and N10 is obligatory, and N1 cannot be coreferent with N00. These are verbs like those in (14), i.e., verbs like deify, idealize, etc. For such verbs, both the third and fourth columns are coded'-'. The fifth column under 'Subject' encodes the possibility for a human noun to be the subject of the verb. Many verbs have an abstract, or metaphorical, meaning when the subject is a sentential clause, but a more 'concrete' meaning when the subject is a human noun. In this case, the column 'human subject' is coded nega tive. The verb disarm behaves in this way: (17) a.
For John to belittle his own quite genuine prowess disarmed his rival
Here, disarm means something like 'to remove any reason to be hostile', which refers to a change of mental state. But if the subject is a human noun, then disarm has its concrete meaning of divesting of weapons: (17) b. John disarmed his rival 2.2. The Complement The three columns under 'Direct object' encode three possible sub-classes of the object N1: a human noun, Nh, a plural or collective noun, and the psychological noun Np (of Nh). The great majority of verbs in the paradigm are coded '+' only
VERB OF MENTAL STATES
567
for Nh, which can be either a singular or a plural noun. A very small number of verbs require a plural or collective noun as object, e.g., annihilate, deteriorate: (18) a.
For the government to increase taxes so greatly almost annihilated (the middle class + the peasantry + ?? my neighbor) b. That aristocrats frequently intermarry has deteriorated (the royal family + *the monarch); For these animals to in-breed regularly is deteriorating the herd
When the next column, 'Nh V-self that S', is coded positive, then the following one, the reduced passive 'Nh is V-en that 5" is also positive: (19) a. b. . d.
John demeaned himself that he accepted a menial service job John feels demeaned that he accepted a menial service job John (comforted + satisfied) himself that prices were coming down John was (comforted + satisfied) that prices were coming down
Only 24 verbs of the paradigm appear in the sentence 'Nh V self that S'; many more verbs, 228 in all, appear in the reduced passive sentence. 2.3. The adjectival suffixes The suffix -ing can be attached to many more verbs of the paradigm than just those marked '+' in the column headed 'V-ing to/for N1'. However, most of these V-ing forms appear only as noun modifiers, and are not in the paradigm. (20) a. b.
It was an affecting (sight + moment + reunion) That Mary excused herself so nicely (affected + *was affecting to) John . That was a stinging (remark + retort) d. For Mary to mention her broken promise (stung + *was stinging to) John
The same is true of other suffixes, for which the V-a form appears mostly as a noun modifier. The suffix -able appears on only six verbs of the paradigm: discredit, dishonor, favor, honor, profit, and suit. The preposition after these adjectives can be for, of or to. Three semantically related suffixes are grouped together in the next column: -ive, -ic, and -icial. These suffixes add a sense of 'giving' to the verb: (21) a. That John exercised daily (benefited + was beneficial to) him b. That John lost his credit cards (traumatized + was traumatic to) him . That the old man slobbered into his soup (repulsed + was repulsive to) John The suffixes -ous, -ful, and -some are grouped together in the next column, for they all add a meaning such as 'full of to the verb:
568
MORRIS SALKOFF
(22) a.
That John was not a tall man (disadvantaged + was disadvan tageous to/for) him b. That John succeeded in all his exams (delighted + was delightful to) him c. That John had to stay home that day (bothered + was bothersome for) him
The adjectival forms related to endanger and imperil are exceptional; the causa tive prefixes en- and im- are dropped in order to form the adjectives dange rous and perilous: (22) d. e.
That John did that (endangered + imperiled) (him + his family); That John did that was (dangerous to + perilous for) (him + his family)
The suffixes -ant {-ent) and -ory in the next column add a meaning of 'tending to' to the verb. (23) a. b.
For John to forget his house keys (inconvenienced + was inconve nient for) him For the negotiators to accept the compromise (conciliated + was conciliatory to) the board of directors
3. Conclusions The complete table of the verbs of the paradigm contains 658 verbs, of which 44 take only the object Np of Nh. The remaining 614 verbs, which are in the para digm, can be divided into three groups, two of which refer to the mental or physi cal state of the human object, and a third which refers to no change of state. The results of this study can be summarized in the following table. Each row of the table defines one of the semantic classifications, abbreviated as a one-letter semantic code, that was used to sub-categorize the verbs. Type of verb Change in physical state (P) Change in mental state (M) Change in both states (B) No change of state (N) Total Table 1
Number 75 360 18 161 614
%
12 59 3 26 100
VERB OF MENTAL STATES
569
What is remarkable about Table 1 is that it is in fact possible to draw it up, which is to say that it is possible to characterize the verbs of the paradigm semantically with a great degree of confidence. Such confidence is well founded because a semantic judgment can in fact be given for each verb, and because the nearly complete lexical coverage of the phenomenon assures us that no group of difficult cases has been left aside. If we group together the first three categories of Table 1, we find that a majority of the verbs of the paradigm, about 75%, refer to a change in the physical or mental state of the human noun object. Only the last category, containing those that do not refer to any change in state of the object, cannot be further sub-categorized semantically in a coherent fashion.
References Gross, Maurice. 1975. Méthodes en Syntaxe. Paris: Hermann. Rosenbaum, Peter. 1968. The Grammar of English Predicate Complementation. Boston: MIT Press
Summary This article is a summary of a longer investigation of the so-called psych verbs that have been much studied in the literature. I have defined a psych verb as one that takes a complement clause subject that S and Nh, a human noun object. These are sentences like That John was so stingy (troubled + annoyed) Helen. It turns out that psych verbs so defined are heterogeneous: one group refers to a change in the mental state of Nh, a second to a change in the physical state of Nh, and a third group refers to no change of state at all in Nh. Some of these verbs take an optional or required particle, e.g., calm takes down optionally, but only bowl over is a psych verb as defined here. Others do not appear with Nh, but rather with a noun referring to some mental state of Nh, as in That the officer treated his men so curtly blunted (*them + their morale). A lexical study of these verbs shows that there are more than 600 in English. Various syntactic properties of these groups of psych verbs have been studied, and the results have been collected into a table, an extract of which is appended here.
MORRIS SALKOFF |
to V Obj
570
ous - ful - some
ant - ory
+ + + + + + + + + + + + + + + + + + + + + + +
ive - ic - icial
+ + + -
able
+ + + +
+ -
+ -
-
+ + + +
+
-
-
-
" " -
+ + -
-
+ + + + +
+ + + -
-
+ -
+ -
-
-
+ + +
+ + -
+ + + -
+ + +
-
-
-
-
+ -
-
-
-
+ -
+ -
+ + -
+ + -
+ + + + -
-
-
-
+
-
+ + + -
+
-
+ -
-
-
-
-
-
+
+
-
-
-
Npl - Ncoll
-
V-ing to/for N1
+ + + + + + + + + + + + + + + + + + + + + + + + + + +
Nh is V-en that S
M M M M P M M N N M M M M M M M M p N M M N P N M N P N
Nh V -self that S
AFFECT AFFRONT AGGRIEVE AMAZE ANNIHILATE ANNOY BAFFLE BELITTLE BENEFIT BETTER BOTHER BOWL OVER BOX IN CALM DOWN CHARM COMFORT CONCERN CONCILIATE CRIPPLE DEIFY DELIGHT DELUDE DEMEAN DETERIORATE DISADVANTAGE DISARM DISCREDIT DISFIGURE - DISHONOR
Np of Nhum
+ + + + + + + + + + + + + + + + + + + . . . + +
Nhum
+ + + + + + + + + + + + + + + + + + + + + +
N0 be V-a Prep N l Suffix -a |
COMPLEMENT Dir Obj
N0
+ + + + + + + + + + + + + + + + + + +
N0 V N1
+ + + + + + + + + + + + + + + + + + + + + + + + + + + + +
VERB
Nhum
N00 = Nj
+
N00 = N1
+ + + + + + + + + + + + + + + + + + + + + + + + -
ForN00
The fact that S
SUBJECT
V Particle N1
ANNEX : Psych verbs (extract)
"
571
ant - ory
+ + + + + + + + + + + + + + + + + + + + + + + + + + + + +
ous - ful - some
+ + -
ive - ic - icial
+ + + + + + + + + + + + + + + + + + + + + + + + + + +
able
M N M P N M M M M N N N M N M M N P N M M M M N M M p M N
V-ing to/for N1
DISOBLIGE ENDANGER EXASPERATE EXHAUST FAVOR FENCE IN FLATTER FLUSTER HEM IN HONOR IDEALIZE IMPERIL INCONVENIENCE INDIVIDUALIZE IRK IRRITATE MISBECOME NAUSEATE PROFIT QUIET REPULSE SATISFY STING SUIT SURPRISE TORMENT TRAUMATIZE TROUBLE VILIFY
Nh is V-en that S
+ + + + + + + + + + + + + + +
Nh V -self that S
Nhum
+ + + + + + + + + + + + + + + + + + + + -
Np of Nhum
N00 = Nj
+ + + + + + + + + + + + + + + + + + + + + + + -
Nhum
N00 = N1
+ + + + + + + + + + + + + + + + + + + + + + + + + + + + +
N0
ForN00to V Obj
+ + + + + + + + + + + + + + + + + + + + + + + + + [ +
N0 be V-a Prep N l Suffix -a
COMPLEMENT Dir Obj
N0 V N1
The fact that S
VERB
Npl - Ncoll
SUBJECT
V Particle N1
|
|
VERB OF MENTAL STATES
-
+ -
-
+ + -
+ + + + -
+
-
-
-
-
+ -
+ -
+ +
+ +
-
-
-
-
-
-
-
+
-
+
-
-
-
-
-
-
+
-
-
-
+ -
+
-
+ + + + +
+ + -
+ + + + + + + + + + -
+ + + + + + + + + +
+ + -
+ + + -
+ +
-
-
+ -
DIPHTONGUES VOCALIQUES ET DIPHTONGUES CONSONANTIQUES SANFORD SCHANE University of California, San Diego
1. Introduction Dans cette étude j'examine la nature des diphtongues et leurs fonctions a l'intérieur de la syllabe. Il faut distinguer diphtongues phonétiques et diphtongues phonologiques. Il a deux types de diphtongues phonologiques - ce que j'appelle "diphtongues vocaliques" et "diphtongues consonantiques". Chaque type a des propriétés spéciales et sa propre structure syllabique et je vais énumérer les divers critères de cette classification. Mais nous verrons que ces critères peuvent mener à des contradictions, et je vais suggérer comment elles peuvent être résolues. Définitions et représentations 1) Une syllabe est composée de trois parties: une attaque, un noyau et une coda (Clements & Keyser 1983). 2) Une diphtongue contient toujours deux éléments: un segment non syllabique typiquement du type i ou ("glide" en anglais) - et un segment syllabique adjacent, la voyelle. 3) Si l'élément non syllabique se trouve avant la voyelle, nous avons affaire a une diphtongue ascendante; s'il est placé après, a une diphtongue descendante. De plus, il faut distinguer soigneusement diphtongues phonétiques et diph tongues phonologiques. Je considère une diphtongue phonétique comme une séquence composée de n'importe quelle voyelle précédée ou suivie d'un glide quelconque. Je représente les glides phonétiques par les symboles [y] et [w] entre crochets. Une diphtongue phonétique n'a pas de structure particulière. Par contre, une diphtongue phonologique joue toujours un rôle précis vis-a-vis de la structure de la syllabe d'une langue particulière. Deux situations se présentent: dans un cas - ce que j'appelle une diphtongue vocalique - les deux parties de la diphtongue se trouvent entièrement a l'intérieur du noyau de la syllabe. Dans l'autre cas - ce que j'appelle une diphtongue consonantique - seule la partie syllabique, c'est-adire la voyelle, se trouve a l'intérieur du noyau, tandis que la composante non
574
SANDFORD SCHANE
syllabique, le glide, fait partie de l'attaque ou de la coda. Pour distinguer ces deux types de glides j'emploierai le terme semi-voyelle pour un glide phonologique qui se trouve dans le noyau et semi-consonne pour un glide phonologique hors du noyau, précisément parce que dans le premier cas le glide a le comportement d'une voyelle et dans le second celui d'une consonne. En ce qui concerne leurs représentations je vais représenter les semi-voyelles par /┐/ et /u/ entre lignes diagonales, et les semi-consonnes par /y/ et /w/. Je constate que la distinction entre diphtongues vocaliques et diphtongues consonantiques est purement phono logique et non pas nécessairement phonétique. Il est question maintenant de trouver des critères pour décider si une diphtongue phonétique doit être analysée, d'après la structure de la langue ou elle se manifeste phonologiquement, comme une diphtongue vocalique ou consonantique. Le français nous en donne un bon exemple. Les segments initiaux des mots iode et yod sont phonétiquement similaires; les deux mots commencent avec le même son non syllabique [y]. La paire ouate et watt est analogue; ici les deux mots commencent avec le non syllabique [w]. Mais le membre de chaque paire a un comportement différent en ce qui concerne l'ision et la liaison: l'iode et l'ouate se comportent comme des mots a initial vocalique et le yod et le watt comme des mots a initial consonantique (Milner 1973). La figure 1 représente cette distinction structurelle.
Dans ce schéma, l'étiquette σ signifie une syllabe, N un noyau et x un segment. Notez que dans ces représentations, les glides initiaux de chaque paire ont le même contenu phonétique - c'est-a-dire qu'ils porteront les mêmes traits distinctifs que les voyelles [i] et [u]. La distinction entre semi-voyelle et semi-consonne se fait par la structure supérieure. Un x dominé par N indique que le glide fait partie du noyau, tandis qu'un x attaché directement au σ montre que le glide fonctionne en tant qu'attaque ou coda.
DIPHTONGUES VOCALIQUES ET CONSONANTIQUES
575
2. Analyse C'est à partir de cette perspective de deux types de diphtongues phonologiques que nous allons examiner quelques-unes des diphtongues de l'anglais, du français et de l'espagnol. 2.1. Classification des diphtongues phonologiques Les critères sont divers: phonétiques, phonotactiques et morphologiques. 2.1.1. Critères phonétiques 1) Identité des deux composantes d'une diphtongue phonétique descendante, non pas diphtongue vocalique, mais voyelle longue Il se peut que les deux membres (voyelle et glide) d'une diphtongue soient phonétiquement identiques en hauteur et timbre - par exemple, la diphtongue descendante [iy] ou [uw]. Pourtant, cette combinaison ne peut jamais fonctionner phonologiquement comme une diphtongue vocalique. Dans ces conditions, la diphtongue phonétique a toujours le comportement phonologique de la voyelle longue correspondante. On trouve cette situation en anglais. Il a des dialectes qui ont des diphtongues phonétiques [iy] et [uw] dans les mots comme beet et boot; mais dans le système vocalique de l'anglais, avec ses paires de voyelles longues et brèves, ces prétendues diphtongues fonctionnent exclusivement comme les voyelles longues correspondantes /i:/ et /u:/ opposées aux voyelles brèves des mots comme bit et put, et doivent être analysées telles quelles. 2) Identité des deux composantes d'une diphtongue phonétique descendante = diphtongue consonantique Nous venons de voir qu'une diphtongue vocalique a deux parties identiques n'existe pas phonologiquement et ne fonctionne que comme la voyelle longue correspondante. Mais ce n'est pas du tout le cas pour la diphtongue consonantique. Dans les langues qui n'ont pas de paires de voyelles longues et brèves, mais qui ont des diphtongues phonétiques descendantes du type [iy] ou [uw] opposées aux voyelles simples [i] et [u], la partie non syllabique de la diphtongue ne peut fonctionner que comme une semi-consonne - c'est-a-dire comme une coda. En français, il a une diphtongue descendante phonétique [iy] qui contraste avec la voyelle simple dans des mots comme fitte et (il) fit. La diphtongue est conso nantique; son glide fonctionne en tant que coda. 3) Identité des deux composantes d'une diphtongue phonétique ascendante = diphtongue consonantique Si, au contraire, le glide précède la voyelle avec laquelle il s'accorde en qualité et hauteur, ce type de diphtongue ascendante fonctionne uniquement comme diph-
576
SANDFORD SCHANE
tongue consonantique. En anglais, nous avons le contraste de Yeats et eats et de woozy et oozy. En fait, il a des dialectes ou Yeats et woozy ont trois segments phonétiques de qualité similaire - [yiy] et [wuw], mais phonologiquement il s'agit d'une semi-consonne suivie d'une voyelle longue - /yi:/ et /wu:/. 4) Endurcissement du glide = diphtongue consonantique Si un glide, dans certains contextes, peut être réalisé phonétiquement comme une "vraie" consonne (en général une fricative ou affriquée), il fonctionne en tant que semi-consonne. Il a des dialectes ou des styles de l'espagnol ou le glide [y], en position initiale de la syllabe, s'endurcit en [z] ou [dz]. Par exemple, dans ces styles, les mots yo et reyes ont les réalisations phonétiques [dzo] et [re.zes]. Nous savons qu'une vraie consonne normalement fait partie de l'attaque ou de la coda de sa syllabe. Par conséquent, si un glide peut se réaliser ainsi, c'est que la langue le traite phonologiquement en tant que semi-consonne. 5) Non-vocalisation d'une voyelle = diphtongue vocalique Si une séquence de deux voyelles peut fusionner en diphtongue, celle-ci joue le rôle de diphtongue vocalique. Considérons les formes françaises (il) scie [si] et (il) joue [zu]. Si on ajoute, par exemple, le suffixe -er [e] de l'infinitif, il résulte deux voyelles en hiatus: scier [si.e] et jouer [zu.e]. Il est aussi possible de prononcer ces mots en une seule syllabe: [sye] et [zwe]. Pour les prononciations en deux syllabes, chaque voyelle bien sûr appartient a son propre noyau et occupe sa propre syllabe. Dans l'autre cas, il a une fusion de syllabes avec le résultat que les deux anciennes voyelles appartiennent aussi au même noyau. Ce qui était avant une voyelle indépendante est transformé en semi-voyelle. Je dirais qu'une voyelle ne peut jamais directement devenir une semi-consonne. 6) Vocalisation du glide = diphtongue vocalique C'est la situation inverse de celle que nous venons d'examiner. Ici un glide peut être remplacé par la voyelle fermée correspondante, soit comme variation libre, soit seulement en contextes restreints. En espagnol, il a une variation entre gobierno /go.bïer.no/ (trois syllabes) et /go.bi.er.no/ (quatre syllabes). La différen ce dépend du style du locuteur et de son débit. Un phénomène semblable se passe en français mais dans des conditions différentes: il dépend du nombre et du type des consonnes qui précedent le glide. Remarquons la différence entre troi.sième /trwa.zεm/ (deux syllabes) et qua.tri.ème ka.tri.εm/ (trois syllabes). Un glide qui peut se transformer en une voyelle destinée a occuper le noyau d'une syllabe indépendante doit avoir son origine dans le même noyau que la voyelle voisine et a donc dü fonctionner comme semivoyelle. C'est-a-dire que chaque composante de l'ancien noyau se transforme en un noyau indépendant.
DIPHTONGUES VOCALIQUES ET CONSONANTIQUES
577
2.1.2. Critères phonotactiques 7) Occurrence avec consonnes particulieres = diphtongue consonantique Des contraintes distributionnelles sur la cooccurrence d'un glide postconsonantique et d'un segment adjacent peuvent servir a déterminer si le glide fonc-tionne comme semi-consonne ou semi-voyelle. Un glide qui ne suit que certaines con sonnes se comporte comme une semi-consonne et fait partie d'un groupe de consonnes. En anglais, [w] postconsonantique ne peut suivre que des segments dentaux et vélaires: (e.g. twin, dwarf, swim; queen), mais non pas labiaux. Le glide fonctionne ici comme la semiconsonne /w/. 8) Occurrence avec voyelles particulieres = diphtongue vocalique Cette situation est le contraire de la précédente. Un glide dont l'occurrence est restreinte a certaines voyelles fonctionne plutót comme semi-voyelle. En anglais, [y] postconsonantique a un comportement complètement différent de celui de [w]. Le [y] postconsonantique se trouve uniquement avant la voyelle longue [u:] - e.g. cute, view. La séquence /u:/ donc fonctionne dans contexte en tant que diph tongue vocalique. En espagnol, les glides [] et [w] se trouvent très souvent (mais pas exclusivement) avant la voyelle [e] (e.g. bien, bueno). Ici aussi le glide fonctionne comme semi-voyelle. 2.1.3. Critères morphologiques 9) Alternance entre diphtongue et voyelle = diphtongue vocalique Si dans la morphologie d'une langue il a des alternances entre une diphtongue et une voyelle simple, nous avons affaire a une diphtongue vocalique. Nous trouvons plusieurs exemples de ce phénomène - en anglais: line /aï/, linear /if; punitive :/, punish //; en espagnol: tiene / /, tener /e/; muere /ŭ/, morir /o/; en français: (ils) tiennent /, tenir //; (Us) doivent //, devoir //. Dans tous les cas, et la voyelle simple et la diphtongue se trouvent a l'intérieur du noyau de leur syllabe. 10) Comportement phonologique d'une voyelle ou d'une consonne = diphtongue vocalique ou diphtongue consonantique Nous avons déja vu les exemples français de iode / od/, /yod /yod/, et de ouate /ŭat/, watt /wat/, ou les glides, quoiqu'identiques phonétiquement, ont le compor tement de voyelles et de consonnes, respectivement, en ce qui concerne l'élision et la liaison. Par conséquent, le premier membre de chaque paire fonctionne comme semi-voyelle et le deuxième comme semi-consonne.
578
SANDFORD SCHANE
2.2. Critères en conflit Il a des situations où ces critères donnent des résultats contradictoires. Que se passe-t-il, par exemple, si une diphtongue est classée comme vocalique d'après un de ces critères, mais se comporte comme consonantique d'après un autre ? Voici quelques exemples. En espagnol, la diphtongue ascendante / et la descendante /eï/ devraient, toutes les deux, être vocaliques: elles entrent en alternance avec la voyelle simple /e/ - e.g. hierba, herbal et rey, real. Mais dans les styles ù il a endurcissement des glides, ces diphtongues sont devenues consonantiques - e.g. hierba [dzerba] et reyes [rezes]. En anglais, la diphtongue ascendante :/ semble être vocalique, d'après deux de nos critères: en position postconsonantique, le glide se trouve uniquement devant la voyelle longue /u:/, et dans la morphologie dérivationnelle, il quelques alternances entre cette diphtongue et la voyelle brève /^/ - e.g. / punitive :/, punish //. Considérons maintenant la règie en anglais pour la distribution de l'article indéfïni a, an: la variante a se trouve devant un mot commençant avec une consonne (e.g. a banana), et an devant un mot avec une voyelle (e.g. an apple). Néanmoins, la variante a est employée exclusivement devant des mots commençant avec la diphtongue :/ - e.g. a use, a union, *an use, *an union; donc, le glide ici doit avoir la fonction d'une semiconsonne. Y a-t-il une solution a ce paradoxe? La solution se trouve dans une contrainte sur les syllabes qui n'ont pas d'attaque (McCarthy & Prince 1993). Dans presque toutes les langues, il y une préférence pour les syllabes qui commencent avec une consonne. Une syllabe qui commence avec une voyelle violera tout simplement cette contrainte. Mais que se passe-t-il avec les syllabes qui commencent avec une diphtongue ascendante? Si le glide a la fonction de semi-voyelle (c'est-a-dire, s'il se trouve a l'intérieur du noyau de sa syllabe) il aura également un conflit avec la contrainte sur les syllabes sans attaque; par contre, une syllabe qui commence avec un glide qui fonctionne comme semi-consonne (ù le glide est hors du noyau) ne sera pas en conflit. Or, une syllabe qui commence avec une voyelle n'aura pas toujours de moyen de se conformer a la contrainte, tandis qu'avec une diphtongue il aura une stratégie de rechange: un glide en position initiale de syllabe qui se trouve a l'intérieur du noyau peut être retiré de cette position et placé en position d'attaque. Le résultat sera un changement de diphtongue vocalique en diphtongue consonantique. J'appelle ce processus promotion. La figure 2 montre l'application de ce phénomène pour le nom anglais use. Au début les deux parties de la diphtongue se trouvent sous le nœud N, indiquant qu'il s'agit d'une diphtongue vocalique (pour les raisons de distribution que nous avons citées auparavant). Ensuite le glide est détaché du noyau et rattaché au noeud supérieur G, en position d'attaque.
DIPHTONGUES VOCALIQUES ET CONSONANTIQUES
579
Figure 2 Remarquez que cette promotion s'accorde avec les autres occurrences en anglais de [y] en position initiale de syllabe, qui fonctionnent toujours comme semiconsonnes - e.g. yeast, yes, young. La promotion de semi-voyelle en semi-consonne tient compte également des exemples espagnols du type hierba et reyes. Considérons reyes. Nous avons ici la diphtongue vocalique descendante /e/ suivie de la voyelle /e/, ce qui est l'équivalent de deux voyelles en hiatus. L'hiatus peut être éliminé par la transformation de la semi-voyelle en semi-consonne. Rappelez-vous qu'en anglais, le glide de use est devenu l'attaque de la syllabe de son origine, alors pour l'espagnol reyes, le glide après être transformé en semi-consonne est promu a la position d'attaque de la syllabe suivante. Ensuite il aura endurcissement phonétique facultatif du glide - i.e. /re.es/ → /re.yes/ → [re.zes].
Conclusion La structure phonologique exige que nous reconnaissions deux types de diphtongues - les vocaliques et les consonantiques. Cette distinction, qui est d'ailleurs phonologique plutot que phonétique, tient compte des fonctions différentes des diphtongues a l'intérieur de la syllabe. Les critères que j'ai suggérés pour distinguer les deux types de diphtongues peuvent mener a un résultat contradictoire, qui trouve sa solution a travers une contrainte sur les syllabes sans attaque.
Références Clements, George N. and Samuel Jay Keyser .1983. CV Phonology: A Generative Theory of Constraint Interaction. Cambridge, Mass.: MIT Press. Milner, Jean-Claude. 1973. Arguments linguistiques. Paris: Mame. Prince, Alan and Paul Smolensky. 1993. Optimality Theory: Constraint Inter-
580
SANDFORD SCHANE
action in Generative Grammar (manuscript). Rutgers University, University of Colorado at Boulder.
Summary Within the syllable I look at the properties of diphthongs, defined as a glide and adjacent vowel. Both halves of a diphthong may occur within the nucleus of a syllable, or else only the vowel part is in the nucleus whereas the glide component functions as part of the onset or coda. This distinction is phonological and not necessarily phonetic and leads to a distinction between vocalic diphthongs and consonantal diphthongs. From this perspective, the diphthongs of English, French, and Spanish are examined. I provide criteria for distinguishing the two types of diphthongs. However, at times these criteria may be in conflict: the solution to this paradox is to be found through a constraint against syllables with no onset. A preliminary version of this study was presented at a conference dealing with syllables at the Université de Nantes, March 25-27, 1999.1 thank the participants at that conference for their comments.
TIME IN LANGUAGE - LANGUAGE IN TIME A LEIBNIZIAN PERSPECTIVE HELMUT SCHNELLE Ruhr-Universität Bochum « Tempora in verbis accurate explicanda » G.W.Leibniz (1903, p. 282: PHIL,VII, B,III, 8)
1. The scientific notion of time is derived Our specific notion of time is a result of our cultural development, involving the sciences and techniques of time measurement. Together with space, time is now seen as a basic notion for empirical science and rational thought: it is taken as a matter of course that everything occurs and is distibuted in space and time. This idea is made precise in theoretical and mathematical physics where time is represented in terms of a one-dimensional measurable continuum either indepen dently, as in classical physics, or in combination with the three dimen-sions of space, as in the relativistic space-time continuum. Philosophically, it is doubtful however, whether this notion of time is an abso lutely primitive concept, as Kant believed, or whether its status depends on the analytic framework of theoretical understanding. Leibniz, for instance, assumed two essentially different analytical frameworks, one philosophically, the other empirically basic. Time is a basic concept only in the latter, whereas in the former it is a derived from the notions of causation and dynamics. H. Weyl expressed this position very succinctly: "As the root of the words past, present, future, referring to time, we find something much more tangible than time, namely the causal structure of the universe" (Weyl 1960:1836). In this article, we shall be concerned with neither the philosophical nor the scientific perspective but with the linguistic one. our question is: can anything be learned from the analysis of words, phrases and sentences implying temporal meaning? We thus follow Leibniz' suggestion: "Tempora in verbis accurate explicanda [sunt]" The following grammatical features imply temporal meaning (cp. Schnelle 1992):
582
HELMUT SCHNELLE
- diathesis, aspect and mood, as expressed by inflectional and functional mor phemes, and equally - tense, as expressed by inflectional and functional morphemes, - temporal-adverbials, such as now, then, yet, etc., - causal prepositions, such as because or when, - temporal prepositions derived from spatial ones, such as before or after, - temporal expressions for dates and durations. We add to them lexical features implying temporal meaning: - the meanings of activity verbs in general, and - the meanings of the word time, such as specified by the approximately fifty entries to be found in an ordinary lexicon. These linguistic forms, functions and uses of grammatical and lexical expressions have been studied extensively, but the status of their semantics still remains rather unclear (cp. Schnelle 1980, 1981a, 1981b, 1992). Over many deca des most linguists simply took the scientific notion of time for granted and held that "the time-line is an adequate representation of time for the purpose of analysing expressions of time in natural language" (Comrie 1985). I strongly disagree. Following Leibniz, I believe that the scientific notion of time is derived, and that the immediate semantical correlates of our expressions involve a multiplicity of notions and perspectives of time. Therefore, we prefer to speak of temporality instead of time, which, in our days, is always restricted to its scientific definition. But historically and ontogenetically the notions and perspec tives of temporality have priority over the strict notion. This insight is a special case of Leibniz' statement, that the structures of languages do not reflect the logical order of thought or truth but the order of our species' mental evolution and discoveries - in fact, evolutions and discoveries which are essentially determined by the representational organization of the minds and brains of individuals selectively communicating and interacting with the world (Leibniz 1882: §5, 255/6). Consequently, if we want to analyse the proper discovery of time in language we must study the historical and ontogenetic development of language in time in connection with systematic considerations: - there are strong indications that the semantic concepts of experiential dyna mics of activity as expressed by typical activity verbs are conceptually basic as such, and are distinctively marked by the gradually emerging features of control of activities expressed by the grammatical functions of diathesis, aspect, or mood. The emergence of grammatical features correlate with perspectives of tempora lity which correspond to the ancient names for temporality such as Kairos (refer ring to the proper moment for doing something), momentum (referring to the dynamics of an activity), Aion-Chronos (referring to life-time, resp. to periods in
TIME IN LANGUAGE
583
life) and Tempus (referring to sections in time), and finally Consecutio (temporum). They are historically very much earlier than the concept that all events have their location on the time-line. When the bible says "Everything has its own time" (Eccl. ,1) what is meant is Kairos, i.e that there is a proper moment for each act or event. I claim that even today, knowing the location on the time-line is without much relevance in most of our spontanous uses of language as well as in chil dren's uses of language.
2. Some systematic consideration on the semantic foundation As indicated already in the introduction, our current notion of time is a result of cultural development, in which the tense system of the latin language, increasing sophistication and use of time measurements and, finally, the scientific modelling of mechanics have a large share. Due to the efficiency of this cultural impact un derstanding time as the linear ordered set of time points extending from the past to those in the future passing by the time point of the present has become a natural idea. It is transmitted to children in connection with learning to use watches, clocks and calendars at about seven years of age (cp. Schnelle 1981a:634, 1981b: 218; 1991: K. 12). Once the framework is stabilized, every event or activity in the world is thought to have its extended location on the time line or even to occur in time. This concrete understanding of space and time assumed by Newton was attacked by Leibniz (1715/16: §47/8, 400-402). In his view the things of this world exist independently and not as arranged on or in something else such as some existing infinite entity called space-time. The real things do, however, have sequential relations to each other; but space is merely the schema of these rela tions. Things are continually changing due to their internal dynamics or entelechy; correspondingly time is the schema of the orders of their sequentiality and simultaneity. Leibniz' view of time is motivated by logical and computational considera tions. In fact, his ideas are still relevant in modern explications of constructive mathematics which led to the precise notions of computation. A brief discussion of these ideas in their modern guise may help the reader to understand how the semantics of time may be understood as derivable from the framework of computational analysis (cp. Schnelle 1980, 1991). Indeed, in studying the foundational works of modern computation (Gödel, Turing, Post, etc., see Davis 1965) we remark that the notion of time was not relevant and thus not used in these articles. Basic is the notion of rules for mental or symbolic operations whose activations generate sequences of rule applications. Special cases which are well-known in formal linguistics are (string) rewrite rules (due to Post and introduced into formal linguistics by Chomsky) or transition
584
HELMUT SCHNELLE
functions defining finite state automata (cp. Roche and Schabes 1997). The actual time and duration of their activation is irrelevant for the understanding of these systems. In the case of an actual computing machine, the causal properties of its hardware determine the execution of their operations. The activities generated are essentially the same, independently of when and in which durations they are ins tantiated. At best one can say, that "the time it takes to recognize a string is proportional to its length" (Roche and Schabes, p. 7; my underlining). But on the other hand, we may abstract a sequential schema of moments of rule applications. In this way, time may be generated implicitly by complex activity, i.e. time is derivative whereas activity (of rule, transition or change of state) is primitive. In a corresponding way, Leibniz conceived the activities of the world's entities as primitive, whereas temporal topology is generated by the relations of sequentiality and simultaneity between activities. Since, now, activities are typically expressed by verbs and the temporal relations by prepositions connecting verbbased statements, Leibniz view leads to the idea that the dynamical meaning of activity verbs and the relational meaning of prepositions must be constructively prior to the notion of an infinite set of ordered time points. This does not contradict the fact, that for modern empirical science, space-time may well be taken as basic. In epistemology, the question is not, how humans can conceive or discover a rigorous mathematical framework for science, but how they makes use of it in a precise, rigorous and universal way. But the empirical analysis of linguistics must well be concerned with precisely this question of the ontogenetic or historical discovery.
3. Language in historical time The earlier and basic notions of temporality are best studied in connection with the development of the grammatical systems of the verbs. Given the limitation of my article, I shall confine the discussion to the analysis of functions and semantic correlates in the historical development of the Indo-European family of languages. Even there I must concentrate on a particular view of systematicity. I chose the view of my late colleague E. Neu, who was an expert in hittite. His results closely correspond to the modern views about Proto-Indo-European and show some similarity with early Semitic , i.e. stages of langage development reflecting four to five thousand years ago. In these stages there does not seem to be any direct indication of time in the form of verbs. Based on very detailled studies, it turns out that in the earliest phases, typical verbs just were expressions of "basic types of human behaviour, activity, event, and state." (Neu 1985:279), perhaps even without formal distinction between nouns and verbs. As a first step of development a distinction of activity and state marks the verbal "dynamicity" (grammatically expressed as ACTIVE and PERFECT and by the proto-tense mark
TIME IN LANGUAGE
585
PRESENT). In further steps "the [immediate] involvement of participants" (as expressed by PERFECT and MEDIUM), "their voluntative and prospective involvement" as rendered in discourse (grammatically differentiated by INDICA TIVE and SUBJUNCTIVE forms of MOOD) emerged. These distinctions involve, more or less directly, temporality but do not make the slightest reference to linear, uniquely holistic and infinite time. The developmental schema of the verbal features in early Indo-European is given in figure 1, such that the developmental direction is from top to bottom. Rather than discussing the details I shall try an explanation with reference to brain organization.
Figure 1 : Indogermanic system of diathesis
4. Mind/brain as the area of semantical correlates Let us recall the Leibnizian perspective: The development of languages do not reflect the logical order of thought or truth but the order of our species' mental evolution and discoveries. The plausibility of these discoveries may come from an insight into the ways in which the brain's organization of language form becomes integrated into the brain's organization of the general human experience.. We must understand that the latter is highly structured by our evolutionary heritage prior to the development of lexical and morphological distinctions of the languages. The following list enumerates functional brain components which interact in the organization of the experiential processes in the brain. This interacting system of components provides the semantical basis for the primitive features of language forms (the latter are enumerated and marked by an (L) in the following list). The location of the interacting components enumerated as follows are marked with the help of their numbers in the accompanying schematic figure 2.
586
HELMUT SCHNELLE
Figure 2: location in brain 1) Activity - Primary Motoric Activation in the Cortex - Differenciation of Motoric Organization - (L) Articulation - (L) Communicative Role I: Distinctive Speech-Marking of Experience (Arti culation of Speech) 2) -
Intention Goals of Activities (Telicity) Degree of Awareness and Attention Degree of Concentration Activity Composition Will and Emotion (Memic-Perimemic-Deontic)
- (L) Communicative Role II: Phrasal Syntax 3) -
Perception Primary Sensory Activation in the Cortex Differentiation of Sensory Patterns Focus of Activities Setting of Activities Identification of Objects, Faces and Situations (Specific Setting)
- (L) Differentiation of Linguistic Perception of Sounds and Letters - (L) Identification of Syllables and Wordforms 4) Memory - Selection of experiential data to be memorized - Organizational formation of experientiel data for memorization (Propositional structure) - Topic (Focus)/Comment - Recall from memory (via topic) - (L) Theme/Rheme - (L) Communicative Role III: Propositional Syntax - (L) Communicative Role III: Narrative, Factual claim
TIME IN LANGUAGE
587
5) Thought (Imagination and Controlled Imagination) - Terms and Representational Images - Propositions and Representational Configurations - Discourse Structure and Imagination of Courses of Events - (L) Communicative Role IV: Symbolic Control of Thought The integration of the experiential framework is a gradual process and the integra tion of language form organization (those marked by (L)) follows their develop ment. The first level of development concerns movement and its perceptual control. Correspondingly, the basic words are - verbs of movement, - deictic adverbs marking the visual control of locations and - nouns, identifying salient things, in particular partners of interaction and com munication. The second level of development concerns the five types of intentional control. It is the level first of Kairos and then of Momentum. Correspondingly, the grammatical features marking movement verbs, namely - diathesis - aspect - mood emerge. The third level of development concerns memory. It is the level of AionChronos. Correspondingly the grammatical features marking and distinguishing the narrative from the report and the past and the non-past become marked in a - discourse tense The fourth level of development concerns systematic thought organization. It is the level of Tempus Here narrative and report become organized with respect to the sections of the events in the past and those in the future and finally under the notion of consecutio, more specifically the consecutio temporum.
References Comrie, B. 1985. Tense. Cambridge: Cambridge University Press. Davis, M. 1965. The Undecidable. New York: Raven Press. Leibniz, G.W. 1882. Nouveaux Essais sur l'entendement humain. In G.W. Leib niz, Die philosophischen Schriften, Bd 5 (Hrsg. C.I.Gerhardt), Berlin (Nachdruck: Hildesheim, 1965).
588
HELMUT SCHNELLE
Leibniz, G.W. 1890. Correspondance avec S. Clarke. In G.W. Leibniz, Die philosophischen Schriften, Bd 7 (Hrsg. C.I.Gerhardt), Berlin (Nachdrack: Hildesheim, 1965) Leibniz, G.W. 1903. Opuscules et fragments inédits, éd. par L. Couturat, Paris, 1903 (Nachdruck: Hildesheim 1988). Neu, E. 1985. Das frühindogermanische Diathesensystem. Funktion und Geschichte. In B. Schlerath (Hrsg.), Grammatische Kategorien. Funktion und Geschichte, Wiesbaden: Dr. Ludwig Reichert Verlag, S. 275-295. Quine, W.V. 1960. Word and Object. Cambridge, Mass.: MIT Press. Roche, E. and Y. Schabes. 1997. Introduction. In E. Roche and Y. Schabes (eds.), Finite State Language Processing, Cambridge, Mass.: MIT Press. Schnelle, H. 1980. Pre-tense. In Chr. Rohrer (ed.), Time, Tense and Quantifiers, Tübingen: Max Niemeyer, pp. 329-354. Schnelle, H. 1981. Phenomenological analysis of language and its application to time and tense. In H. Parret (ed.), Possibilities and Limitations of Pragmatics, Amsterdam: J. Benjamins, pp. 631-655. Schnelle, H. 1981b. Semantics and pragmatics in psycho-physiological context. In W. Klein, W.J.M. Levelt (eds.), Crossing the Boundaries in Linguistics, Dordrecht: Reidel, pp. 211-220. Schnelle, H. 1991. Die Natur der Sprache - Dynamik der Prozesse des Sprechens und Verstehens, K. 12. Berlin: W. de Gruyter. Schnelle, H. 1992. S. in E. Rudolph, H.Wismann (Hrsg.), Sagen, was die Zeit ist Analysen zur Zeitlichkeit der Sprache, Stuttgart: Metzler Weyl, H. 1960. The mathematical ways of thinking. In J.R. Newman (ed.), The World of Mathematics, London: George Allen and Unwin, pp. 1832-1849 (Repr. of the article in Science, Nov. 15, 1940). Summary Ordinary language is not determined by a single and unique system. Just as a biological organism, its interrelated systems of form and meaning are developing as a multi-system, even in conceptual areas which, to the scientific mind, seem to be highly systematic, such as time. A closer study reveals there to be a multiplicity of temporalities, which are appropriate and put to use in a variety of circumstances. If the logician and epistemologist complains that "our ordinary language shows a tiresome bias in its treatment of time" and thinks that "this bias is of itself an inelegance or breach of theoretical simplicity" (cf. Quine 1960:170), he shows that he does not understand the organiza tionalframeworkof the languages' efficiency.
RECONNAISSANCE DES DÉTERMINANTS FRANÇAIS MAX SILBERZTEIN IBM T.J. Watson Research Center
1. Introduction Cette étude a pour cadre la description des phrases en vue de leur analyse automatique dans les textes. Notre projet est de construire un analyseur syntaxique automatique de textes français en reprenant le principe de la grammaire en chaîne décrite dans Salkoff (1973), cette fois en utilisant la technologie des transducteurs finis1. Suivant Gross (1975), nous nous intéressons aux phrases qui ont la structure suivante:2 GN0 V(Prép + <E>) GNi1 Prép GN2 ... Prép GNi ou GN représente les groupes nominaux, l'indice 0 marque le sujet, 1 le premier complément, 2 le second complément, etc., V représente le groupe verbal (grosso modo le verbe et ses auxiliaires éventuels), et Prép représente les prépositions et locutions prépositionnelles qui introduisent les groupes nominaux. La description des groupes nominaux a donc une place importante dans ce projet. Les groupes nominaux présentent certaines différences selon leur fonction syntaxique. Par exemple, certaines constructions négatives portent plus facilement sur le GN\ que sur le GN0: GN0 V(Dét N)1 Luc ne mange pas de gâteau * (Dét N)0 V W * Pas de gateau n 'est mangé par Luc Certains déterminants sont plus utilisés dans un complément d'objet direct qu'indirect: GNo V(Dét N)\ Luc a mangé dans les environs de vingt petits fours * GNo V Prép (Dét N)\ * Luc a goüté a dans les environs de vingt petits fours Nous ne décrivons ici que les séquences qui peuvent apparaïtre aussi bien dans les groupes nominaux sujet, complément d'objet direct et complément d'objet indi rect:
1 2
Cf. Silberztein (1993) pour une description de la méthodologie employée; Silberztein (2000) pour le manuel d'utilisation du logiciel INTEX. Nous avons adapté la notation de Gross (1975): GN représente les groupes nominaux; N les noms (entrées lexicales simples ou composes), <E> représente le mot vide. Les classes de mots sont représentées par des graphes dont le nom est écrit en gras, et ne prend pas de lettre accentuée.
590
MAX SILBERZTEIN
GN0 V W
(Beaucoup d' + la plupart de mes + certains) amis viendront GNo V GN1 Luc a vu (beaucoup d' + la plupart de mes + cer tains) amis GNo V Prép GN1 Luc pensera a (beaucoup d' + la plupart de mes + certains) amis Nous notons alors GN les groupes nominaux concernés, indépendamment de leur fonction syntaxique. Si l'on exclut les groupes nominaux phrastiques, par exemple: Luc aime quand il pleut; Luc veut dormir tard; Qu'il pleuve ennuie Luc les titres et les noms propres (ex. Mlle Dupont aime Paris), les groupes construits a partir d'un adjectif (ex. Luc est rouge de honte), ainsi que certains groupes nominaux dans des constructions figées (ex. Noblesse oblige), la structure géné rale des GN est la suivante:3 Dét Adjg N Modif ou Dét représente les combinaisons possibles de prédéterminants et déterminants, Adjg la séquence optionnelle d'adjectifs épithètes antéposés (avec leurs modifieurs éventuels), N le nom tête du groupe nominal, et Modif la séquence facultative de modifieurs qui peuvent prendre la forme d'adjectifs épithètes, de groupes prépositionnels, propositions relatives, etc. Le projet décrit ici est de construire le graphe Det. Une première ébauche de construction de ce graphe avait été décrite dans Marchand (1999). Contraintes entre le déterminant et son contexte droit Recenser les séquences de déterminants dans un graphe Det, c'est mettre en fac teur ces séquences indépendamment de leur contexte droit Adjg N Modif. Or: - Le genre et le nombre des déterminants sont contraints par leur contexte droit: la table, * le table; les chevaux, * les cheval Pour tenir compte des contraintes d'accord, nous subdivisons les graphes de déterminants lorsque nécessaire; par exemple Detmp est le graphe qui représente les déterminants qui précèdent un nom masculin pluriel4. Nous avons choisi de marquer les déterminants par le genre et le nombre du nom qu'ils introduisent, plutöt que par ceux du groupe nominal. Par exemple, dans la phrase: Un groupe d'amies est venu
2
4
La notation utilisée dans [Salkoff 1973] est: g T T Q gA A N dN, où gT (ou gQ si T est absent) représente les prédéterminants, T les articles, Q les quantificateurs, A les adjectifs, gA les adverbes d'adjectifs, N le nom tête du groupe nominal, et dN la suite des modifieurs. Par exemple, dans toutes les trois très belles robes de Marie, gT =: toutes, T =: les, Q =: trois, gA =: très, A =: belles, N =: robes et dN =: de Marie. Le graphe Det construit ici reconnait (entre autres) les séquences gT T Q. Nous utilisons la notation utilisée dans le système des dictionnaires DELA, cf. Courtois (1990).
RECONNAISSANCE DES DÉTERMINANTS FRANÇAIS
591
le déterminant un groupe d' est reconnu par le graphe Detfp puisqu'il introduit un nom féminin pluriel, même si le groupe nominal complet est masculin singulier. En conséquence, le genre et nombre du groupe nominal GN ne sont pas toujours les mêmes que ceux du déterminant (mais le déterminant s'accorde toujours avec le nom tête du groupe nominal). - Certains noms imposent des contraintes distributionnelles au déterminant: Luc a ramené du sable; * Luc a ramené (un sable + plusieurs sables) Luc manifeste un peu de sincérité; * Luc manifeste un nombre de sincérité Nous subdivisons les graphes de déterminants lorsque nécessaire; par exemple, Dnom21 représente les déterminants qui peuvent introduire des noms abstraits. - Certaines contraintes locales n'ont pas été prises en compte dans cette étude. Par exemple, l'article de impose la présence d'un adjectif pluriel a gauche du nom: Luc a vu de très belles fleurs; * Luc a vu defleurs L'utilisation des déterminants , ton, son, ma, ta, sa est contrainte par l'initiale vocalique du mot qui les suit lorsqu'ils sont suivis d'un nom féminin: Luc a vu (amie + * belle amie); Luc a vu ma (* amie + belle amie) La situation est similaire avec le déterminant ce et sa variante cet. - Certaines contraintes syntaxiques n'ont pas été prises en compte. Par exemple, certains déterminants imposent la présence d'un modifieur, par exemple: Luc boit une quantité d'eau impressionnante * Luc boit une quantité d'eau d'autres imposent que la phrase soit négative (ex.: ne ... pas de), etc. Nous avons indiqué les contraintes d'utilisation en commentaire dans les graphes (ex.: « initiale vocalique », «... Rel »). Elles devront être prises en compte lors de l'analyse du GN, voire de la phrase. 2. Les données Le lexique des déterminants a été bien décrit dans les dictionnaires et grammaires traditionnelles. Par exemple, Grevisse et Goosse (1986) fournit la liste des articles et des déterminants définis suivante:5 - l'article défini (LE) et ses formes fléchies et élidée: le, la les, l' - l'article indéfini (UN): un, une, des - l'article partitif du au singulier (DU): du, de la, de l' - les déterminants numéraux cardinaux (Dnum):6 deux, trois,... 5
6
Les graphes construits dans cette étude ne contiennent que des formes explicites, et aucun symbole lexical (comme ou ).Ilspeuvent donc être appliqués sans dictionnaire. Nous n'avons pas intégré le déterminant un, une au graphe Dnum; ce graphe recommit les déterminants composés, ex.: deux mille trois cent vingt-trois, et existe en deux versions Dnummp et Dnumfp pour tenir compte des accords, ex. cent une tables.
592
MAX SILBERZTEIN
- les déterminants possessifs (Poss): , ma, mes, ton, ta, tes,... - l'adjectif démonstratif (CE) et ses formes: ,cet,cette, ces - le déterminant relatif (LEQUEL): lequel, laquelle, lesquels, lesquelles Le graphe Ddef rassemble les graphes LE, Poss et CE; le graphe Ddef-le est le graphe Ddef auquel on a enlevé le et les (ce graphe est utilisé pour tenir compte des contractions après de ou d). Le graphe DPart 7 généralise le graphe DU en ajoutant des (Luc mange des viandes rouges) et les séquences de Ddef (Eve a mange de ton pain; je boirai de cette eau). Les déterminants indéfinis et des prédéterminants ont été recensés, classés et leurs propriétés combinatoires décrites dans Gross (1986): Classes de déterminants Dadv Dnom Dadj Pred
Exemples beaucoup bon nombre certains, chaque à peu près, environ
Dét N
Dét de(GN+N)
GNo VDét
-
+ +
+
+ -
-
-
Parmi tous les déterminants et prédéterminants recensés par Gross (1986), nous n'avons tenu compte dans cette étude que des suivants: - dans les graphes de la familie Dadv: autant, d'autant moins, d'autant plus, de moins en moins, de plus en plus, davantage, moins, plus, plus ou moins, pas mal, tant, tant et tant, assez, beaucoup, peu, trop, un (tout petit + petit + <E>) , un epsilon, un poil, un soupçon, un tantinet, abondamment, énormément, étonnamment, infiniment, suffisamment, tellement, vachement Nous avons exclu de notre description les déterminants suivants:8 drôlement, excessivement, passablement, putainement, ne...aucunement, ne... guère, ne...jamais, ne...ni, ne...pas, ne...plus, ne...point - dans les graphes Dnom: DDnomms9 groupe, DDnommp groupes, DDnomfs moitié, DDnomfp moitiés, DDnomms Dnumiemems, DDnommp Dnumiememp, DDnomms 7
8
9
L'article partitif négatif n'est pas inclus dans DPart car il ne peut pas apparaître en position sujet: Luc ne boit jamais de bière mais * Jamais de bière n 'est bue par Luc. Rappelons que nous ne considérans ici que les déterminants et prédéterminants qui peuvent être utilisés indifféremment dans un groupe nominal sujet, complément d'objet direct ou complé ment d'objet indirect. Par exemple, nous avons écarté drölement: *Drölement de pommes sont sur la table et a moitié: *A moitié mes pommes sont tombées. Les graphes Ddnom et Dnumieme sont décrits plus loin.
RECONNAISSANCE DES DÉTERMINANTS FRANÇAIS
593
morceau, DDnommp morceaux, un nombre ... Rel, des nombres ... Rel, DDnomfs portie, DDnomfp parties, DDnomfs quantité ... Rel, DDnomfp quantités ... Rel, la plupart, le plus clair, le (<E> + plus) gros, le (<E> + petit + tout petit) ... Rel, l'un, l'une, chacun, chacune, quelques-uns, quelques-unes, ne ... rien, (<E> + bon) nombre, plein, quantité, (<E> + n 'irnporte + Dieu sait + je ne sais + qui sait) (combien + lequel + laquelle + lesquels + lesquelles), moins, plus, près, un ordre de grandeur, autour, au-dela, (au+en) dessous, (au+en) dessus, (au+dans le) voisinage, (aux+ dans les) alentours, (aux+dans les) environs, dans la fourchette, dans la zone, dans les limites, dans les parages, dans les, du côté, de l 'ordre, en dega, pour une valeur, pour Nous n'avons pas intégré le déterminant Dnum Nmes (ex. trente centimètres de tissu), ni les noms déterminatifs décrits par Buvet (1994) (ex. une boïte de thon, un troupeau de vaches) à cause des contraintes distributionnelles fortes entre déterminants et noms: * trente centimètres d'appartement, * une boîte de vache, * un troupeau de thons Recenser ces déterminants indépendamment des noms qu'ils peuvent introduire ne serait pas très utile: il faudra plutöt décrire les combinaisons Nd de N acceptables dans le cadre du GN. - dans les graphes Dadj: Dnum, certains, certaines, chaque, différents, différentes, divers, diverses, force, maint, mainte, maints, maintes, plusieurs, quelque, quelques, tel, telle, tels, telles, tout, toute, ne ... (aucun + aucune), ne ... (nul + nulle) (<E> + autre que Ddef), (<E> + n 'irnporte + Dieu sait + je ne sais + qui sait) (quel + quelle + quels + quelles), (Ddefms + Ddeffs) autre, (Ddefmp + Ddeffp) autres, (Ddefms seul + Ddeffs seule + Ddefmp seuls + Ddeffp seules) ... Rel, un autre, une autre, (des + d') autres, un certain, une certaine, un seul, une seule Nous n'avons pas décrit les déterminants productifs le plus Adj, le moins Adj ni le déterminant d'aucuns. - dans les graphes Pred: à peine, au mieux, au grand mieux, au moins, au pire, au pis, au pis aller, au plus, en gros, en tout, en tout et pour tout, approximativement, exactement, littéralement, notamment, pratiquement, précisément, seulement, simplement, strictement, uniquement, virtuellement, pas tout a fait, tous, toutes, tout, toute, bien, comme, d'abord, encore, ensuite, environ, presque, quel ques, seul, seule, seuls, seules Nous n'avons pas intégré les prédéterminants suivants pour diverses raisons: a demi, a moitié, a Tind près, au tiers, en entier, en moins, en plus, en totalité, entièrement, exclusivement, particulièrement, premièrement, spécialement, totalement, avant tout, par-dessus tout, surtout, jusqu'a, ê, ne... que, plutôt
594
MAX SILBERZTEIN
Par exemple, à demi ne s'emploie pas dans un groupe nominal sujet; le prédéterminant libre à Tind près (ex. Luc a bu à deux verres près toute la bouteille) impose des contraintes sémantiques et pragmatiques qui dépassent le cadre de notre projet. 3. Séquences complexes A partir du vocabulaire sélectionné en 2, nous construisons les séquences de formes qui constituent les déterminants; l'existence de ces séquences est indiquée en colonne dans chaque table du lexique-grammaire en annexe de Gross (1986).10 Dadv Les séquences construites a partir des Dadv sont décrites par les propriétés suivantes (nous indiquons entre parenthèses les numéros de colonne): Propriétés décrites en colonne
Exemples
Séquences reconnues
(21) Dét de Nplur
autant de tables, * un epsilon de tables de plus en plus de mes tables
Dadv21 de
(22) Dét de GNDéfplur (23) Dét de Dind Nplur {2A) Dét de Nnomb, sing (25) Dét de Nmas (26) Dét de Nabs
---
davantage de sable, * abondamment de sable un soupçon de sincérité
Dadv (de Ddef-lemp + de Ddef-lefp + des) ---
Dadv25 de Dadv26 de
- Le graphe Dadv21 représente le sous-ensemble des Dadv que nous avons retenus dans cette étude qui entrent dans la construction « Dét de Nplur ». Les séquences reconnues par la concaténation du graphe Dadv21 et du graphe de sont des déterminants qui apparaissent dans les graphes Detmp et Detfp. - Tous les adverbes que nous avons retenus dans le graphe Dadv entrent dans la construction «Dét de GNDéf ». Il n'est donc pas nécessaire de construire un graphe Dadv22. - Aucun déterminant de notre graphe Dadv n'entre dans la structure Dét de Dind Nplur, ni dans la structure Dét de Nnomb (i.e. il n'y a pas de graphe Dadv23 ou Dadv24). - Les graphes Dadv25 et Dadv26 représentent les adverbes du graphe Dadv qui entrent dans les constructions décrites dans les colonnes respectives 25 et 26.
10
Nous avons ajouté quelques séquences qui nous semblent acceptables; elles sont indiquées en commentaire dans les graphes; par ex., j'aceepte: Son discours a une partie de sincérité.
RECONNAISSANCE DES DÉTERMINANTS FRANÇAIS
595
- Nous avons pris en compte les ajouts adverbiaux suivants décrits dans Gross (1986:165) dans tous les graphes de la familie Dadv: vrairnent, aussi, fort, si, très, bien, tout, presque, Dnumfois, plus ou moins - Nous avons ajouté aux graphes Dadv21 les séquences décrites dans Gross (1986:159): (assez + assez trop + drólement + infiniment + suffisamment + tellement + vachement) peu + (beaucoup + énormément + un epsilon + un poil + un soupgon + un tantinet + un (tout + <E>) (petit + <E>) peu + drólement + infiniment + suffisamment + tellement + vachement) (moins + plus + trop) Dnom Les séquences construites a partir de Dnom sont décrites par les propriétés suivantes: Propriétés décrites en table Dét de Nplur Dét de GNDéf plur
Dét de Dind Nplur Dét de Nnomb, sing Dét de Nmas Dét de Nabs
Exemples
Séquences reconnues
un groupe de gens, * la moitié de gens la moitié de mes amies, * un ordre de grandeur de mes gâteaux
Dnom 16 de
autour de trois tables, * la plupart de trois tables cette portie de table, une portie de cette table, * moins de table deux morceaux de glace, * la moitié de glace un petit peu de sincérité, * la plupart de sincérité
Dnom17mp (de Ddetmp + des) + Dnom17fp (de Ddetfp + des) Dnoml8 de (Dnummp + Dnumfp) Dnoml9 (de + du + de Ddetms + de Ddetfs) Dnom20 de Dnom21 de
- Certains déterminants de Dnom17 s'accordent en genre avec le nom (ex. chacuri), ce qui nous a obligé a dédoubler graphe; n'est pas le cas pour les graphes Dnoml6, Dnoml8 et Dnoml9. - Parmi les déterminants Dnom, les noms groupe, moitié, morceau, Dnumième, partie et quantité peuvent être précédés eux-mêmes d'un déterminant que nous avons noté DDnom: (ce + un + chaque + un tel + cette partie de) (morceau + tiers) de fromage (cette + une + chaque + une telle + ma partie de) (moitié + partie + quan tité) de fromage Le déterminant DDnom est lui-même construit a partir de certains déterminants avec leurs prédéterminants éventuels. Nous avons les séquences possibles:
596
MAX SILBERZTEIN
DDnomms = (PDdefms + <E>) Ddefms +. (PUN + <E>) un + Dadjms + un tel + Dnoml9 (de + de Ddef-lems + du) DDnomfs = (PDdeffs + <E>) Ddeffs + (PUN + <E>) une + Dadjfs + une telle + Dnoml9 (de + de Ddef-lefs) Au pluriel, on a les exemples similaires: (ces + des + certains + trois + de tels + ces divers + autour de trois) groupes d'amis ainsi que des combinaisons plus complexes: (un de mes + certains de mes + la plupart de ces) groupes d'arnis ce que nous avons généralisé de la façon suivante: DDnommp = (PDdefmp + <E>) Ddefmp + des + Dadjmp + (PDnum + <E>) Dnummp + de tels + Ddefmp Dadjl7mp + Dnoml8 de Dnummp + (un + Dnummp + Dadjl3mp + Dnoml7) (des + de Ddef-lemp) DDnomfp = (PDdeffp + <E>) Ddeffp + des + Dadjfp + (PDnum + <E>) Dnumfp + de telles + Ddeffp Dadjl7fp + Dnoml8 de Dnumfp + (une + Dnumfp + Dadj13fp + Dnom17) (des + de Ddef-lefp) - Nous avons aussi pris en compte les combinaisons Adv Dnom décrites dans Gross (1986:167) dans tous les graphes de la familie Dnom. Puisque le graphe DDnom reconnaît lui-même des séquences qui contiennent certains déterminants Dnom, le graphe Det reconnaït des séquences de longueur non bornée, par exemple: la moitié de la plupart de la majorité des groupes de morceaux de frontage. L'arbre de dérivation suivant nous montre comment le groupe nominal: « une partie de ce groupe d'amies » est reconnu dans notre grammaire:
RECONNAISSANCE DES DÉTERMINANTS FRANÇAIS
597
Dadj Les formes Dadj constituent a elles seules des déterminants qui doivent s'accorder avec le nom qu'ils introduisent (* certaine amis). Nous ajoutons a ces formes les séquences qui entrent dans les structures suivantes: Propriétés décrites Exemples en table Dét de GNdéf, plur certains de mes amis, * quelques de mes amis Ddéf Dét N ces divers amis, * chaque ami Dind Dét N de tels amis, * deux quelques amis
Séquences reconnues Dadj13m (des + de Ddef-lemp) + Dadj13f (des + de Ddef-lefp) Ddefmp Dadj17mp + Ddeffp Dadjl7fp un tel + une telle + (de+des+Dnummp) tels + (de+des+Dnumfp) telles
- Nous avons ajouté dans les quatre graphes Dadj et les deux graphes Dadj13 les combinaisons Adv Dadj décrites dans Gross (1986:172). Par exemple, « trois fois sept (crayons) » ou « vraiment n 'irnporte quelles (tables) ». - Nous avons généralisé11 les combinaisons décrites dans Gross (986:174); nous avons ainsi ajouté au graphe Dadjms les séquences suivantes: Dadv (du seul + du même + de l'autre + de quel + de je ne sais quel + de n'irnporte quel) + (un epsilon + un poil + un tantinet + un (<E> + petit + tout petit) ) (d'un seul + d'un certain + d'un autre + du seul + du même + de l'autre + de quel + de je ne sais quel + de n'irnporte quel + de tout + de tel + de quelque + de chaque) et les séquences fléchies correspondantes (lorsqu'elles sont acceptables) dans Dadjfs, Dadjmp et Dadjfp. Rappelons que nous avons choisi d'accorder les déterminants avec le nom qu'ils introduisent, plutot qu'au groupe nominal lui-même. Par exemple, la sé quence un tout petit de la même (tarte) est reconnue par le déterminant Dadjfs. - Nous avons enfin construit les quatre graphes Dadj divers qui reconnaissent les séquences Dind Dét N, ainsi que d'autres combinaisons décrites dans Gross (1986:168471): ((Ddeffs + une) moitié + (Ddefms + un) Dnumiemems) (des + de Ddeflemp) ((Ddeffp + Dnumfp) moitiés + (Ddefmp + Dnummp) Dnumiememp) (des + de Ddef-le mp) + (quels + les autres + les mêmes + les seuls) Dnummp + Dnummp différents + Dnummp (des + de Ddef-lemp) (différents + divers + quelques + Dnummp + autres + seuls) oil Dnumiemems = tiers + quart + cinquième + ... 11
En généralisant les combinaisons a tout le graphe Dadv, nous avons aussi tenu compte des séquences ou le Dadv contient lui-même un modifieur, comme dans: plus ou moins autant du même, ou trois fois davantage de je ne sais quel.
598
MAX SILBERZTEIN
Préd Les séquences construites a partir d'un Préd sont décrites par les propriétés suivantes: Propriétés décrites en table Préd Dnum Nplur
Exemples
environ trois tables, * toutes trois tables settlement un litre, Préd un Nsing * torn un litre toutes les tables, Préd GNDef, plur * pas tout a fait les tables uniquement ce verre, Préd GNDef, sing * bien le verre bien de la chance, Préd de Artg N * environ de la chance
Graphes insérés PDnummp, PDnumfp PUNms, PUNfs PDdefmp, PDdeffp PDdefms, PDdeffs PArtg
- Nous avons inséré un appel aux graphes des families PDnum, PUN, PDdef et PArtg dans tous les graphes, partout où ils sont possibles (i.e. dans notre descrip tion, il n'y a pas de graphe indépendant Pred). - Nous avons ajouté les deux formes tout et bien qui peuvent figurer a gauche d'autres prédéterminants (ex. tout aupire trois tables). Conclusion L'utilisation de la classification et de la description de Gross (1986) nous a permis de ranger toutes les séquences de déterminants dans une centaine de graphes.12 La méthode qui consiste a construire des graphes généraux (ex. Dadv), puis a les spécialiser en tenant compte des propriétés en colonnes (ex. Dadv25, Dadv26, etc.) s'avère très efficace. L'ajout des graphes DDnom nous a permis de mettre a jour certaines régularités que Ton ne pouvait pas percevoir dans les tables du lexique-grammaire, puisque celles-ci sont limitées a la description de combinaisons de deux éléments lexicaux. De même, nous avons inséré les modifieurs de déterminants et les prédéterminants directement a leur place dans les différents graphes, puisqu'il n'y a aucune généralisation possible au niveau des classes de déterminants et prédéterminants. Mais ce nouveau niveau de précision est loin d'être ultime; la description des prédéterminants devra en particulier être raffmée, comme on le voit dans des exemples comme: seulement un soupgon de courage vs ?* tout un soupqon de courage. Nous n'avons pas traité la coordination de déterminants: certaines coordina tions semblent fïgées (ex. tel ou tel ami); d'autres régulières (ex. entre trois et cinq tables). Il faudra ensuite ajouter a cette description les déterminants qui ne peuvent pas 12
Les graphes sont disponibles sur le site Internet d'INTEX.
RECONNAISSANCE DES DÉTERMINANTS FRANÇAIS
599
être utilisés dans les positions syntaxiques sujet et compléments. On ajoutera alors des graphes spécialisés, par ex. DnomO pour les déterminants nominaux qui apparaissent en position sujet. Cette formalisation ne reprend qu'une petite partie de la description des groupes nominaux que Ton trouve dans Gross (1986) ou Salkoff (1973). Il apparaît cependant que les transducteurs finis constituent un outil bien adapté a la forma lisation a large couverture de phénomènes syntaxiques. Les outils INTEX d'application de graphes a des textes pour construire des concordances, d'exploration automatique de graphes, de recherche de graphes et de débogage nous ont facilité la tache de développement. D'autres outils devront être développés, comme par exemple un outil de visualisation d'une hiërarchie de graphes, qui donnerait des résultats similaires a celui en annexe. Références Buvet, Pierre-Andre. 1994. Les déterminants: les noms. Lingvisticœ Investigationes XVIII:1, John Benjamins: Amsterdam. Courtois, Blandine. 1990. Un système de dictionnaires électroniques pour les mots simples du français. Langue franqaise 87, Paris: Larousse. Goosse, André, Maurice Grevisse. 1986. Le Bon Usage. Gembloux: Duculot. Gross Maurice. 1975. Méthodes en syntaxe. Paris: Hermann. Gross Maurice. 1986. Grammaire transformationnelle du français: syntaxe du nom. Cantilène: Malakoff. Marchand, Aurélia. 1999. La description graphique des déterminants du français. Mémoire de maïtrise, Besançon: GRELIS, Université de Franche-Comté. Salkoff, Morris. 1973. Une grammaire en chaîne dufranqais. Paris: Dunod. Silberztein, Max. 1993. Analyse automatique de textes: le système INTEX. Paris: Masson. Silberztein, Max. 2000. Manuel d'utilisation du logiciel INTEX. Disponible sur le site www.nyu.edu/pages/linguistics/intex. Summary This article describes the implementation of a large-coverage description of French deter miners and predeterminers, that includes simple words such as le, compounds such as la plupart des, and more complex sequences such as toute une partie de ce groupe de. The grammar is available in the form of a library of over one hundred INTEX graphs. Its organization follows as closely as possible the classification of the determiners described by Maurice Gross in Syntaxe du nom, 1986. Using INTEX graphs to represent syntactic constraints on the grammatical words that constitute determiners presents several advantages over using two-dimension lexicongrammar tables, especially in terms of legibility. I show also that the difficult problem of describing recursive determiners and their constraints (e.g. in un groupe de groupes d'amis) is naturally described by recursive graphs. This library can be compiled into a (non-recursive) minimal deterministic finitestate automaton that contains over 1,000 states and 25,000 transitions.
600
MAX SILBERZTEIN
ANNEXE Organisation des graphes de déterminants masculins singuliers
ESSAI D'INTERPRÉTATION FONCTIONNELLE DES TABLES DU LEXIQUE-GRAMMAIRE YOICHIRO TSURUGA Université des Longues Étrangères de Tokyo
Introduction Les verbes charger et remplir se ressemblent sémantiquement et syntaxiquement. Le verbe planter, quant a lui, présente la même construction que les verbes précé dents. (1) (2) (3)
Luc charge le camion de blé Luc remplit le camion de blé Luc plante le jardin de blé
Les trois phrases ci-dessus ont chacune un sujet, un objet direct et un objet indi rect introduit par de. Du point de vue de l'organisation fonctionnelle de la phrase, les trois verbes en question sont donc très proches les uns des autres. Cependant, chaque forme verbale présente plusieurs autres constructions, ce qui manifeste plusieurs capacités d'organisation différentes: (4) (5) (6)
Luc charge du blé dans le camion Luc charge le camion avec du blé Le blé charge le camion
(7) (8) (9)
* Luc remplit du blé dans le camion Luc remplit le camion avec du blé Le blé remplit le camion
(10) Luc plante du blé dans le jar din (11) Luc plante le jardin avec du blé (12) * Le blé plante le jardin Les trois phrases (1), (2) et (3) impliquent-elles toujours les différences d'usage manifestées par les phrases (4) a (12)? Les quatre occurrences de la forme charger des phrases (1), (4), (5) et (6), par exemple, supposent-elles un seul et même verbe? Nous nous proposons dans cet article d'analyser ces questions, en partant de la construction N0 V N1 de N2 à laquelle nous nous intéresserons plus particulièrement.
602
YOICHIRO TSURUGA
1. La construction "croisée" N0 V N1 de N2 Dans un dictionnaire des verbes français assez détaillé (par exemple, W. Busse et J.-P. Dubost (1977), on trouve environ 400 verbes qui présentent la construction N0 V N1 de N2. Mais dans l'ouvrage de A. Guillet et Ch. Leclère (1992), les auteurs mentionnent 1134 verbes de la même construction (7 classes: 37E et de 37M1 a 37M6); et il en a encore beaucoup d'autres qui font appel a la cons truction en question: cf. J.-P Boons, A. Guillet et Ch. Leclère (1976). Du point de vue sémantique, on peut dire de manière générale que la construc tion en question est constituée d'un agent (No), d'un lieu (N1) et d'une chose (N2) située ou a situer dans le lieu. Il faut souligner que le lieu est exprimé par l'objet direct (N1). Cette construction est appelée "croisée" (la construction ou le lieu est indiqué par une préposition est dite "standard". Voir ci-dessous). Dans On dégage le couloir des meubles (classe 37E), par exemple, les meubles sont situés dans le couloir et ils sont en train d'être déménagés. Dans On équipe l'hôpital d'un scanner (classe 37M1), le scanner est dans l'höpital ou il est sur le point d'y être installé. La différence entre 37E et 37M, c'est que, dans le premier, N\ représente le lieu initial de N2, tandis que dans le second, N1 est le lieu final de N2. Parmi les 250 verbes de 37E, il en a 131 qui acceptent la construction dite "standard": N0 V N2 de N1 (ou N1 est le lieu initial, introduit par la préposition de). Les verbes qui acceptent les constructions "standard" et "croisée" sont, par exemple, dégager, mentionné ci-dessus: On dégage les meubles du couloir et On dégage le couloir des meubles. Le verbe dégager peut ainsi avoir un objet direct indiquant une chose qui est située dans un lieu mais aussi le lieu même d'ou l'on dégage la chose. Les verbes qui permettent ces deux constructions représentent un peu plus de la moitié des verbes de 37E. Les verbes de 37E n'acceptent ni la préposition avec à la place de de dans de N2 (*On dégage le couloir avec les meubles) ni la construction N2 V N1 (*Les meubles dégagent le couloir). Que se passe-t-il pour les verbes de 37M1 à 37 6? Le N\ de la construction "croisée" des verbes de 37M exprime le lieu final où est déposée une chose (Luc charge le camion de blé). Mais les verbes de 37M n'acceptent pas tous la cons truction "standard" N0 V N2 Loc N1 (Loc est une préposition variée indiquant un lieu). Parmi les 884 verbes de 37M, il en a 189 qui acceptent la construction "standard", 586 qui acceptent la préposition avec (au lieu de de), et 743 qui accep tent la construction N2 V N1. Le tableau 1 ci-dessous donne ces proportions. On voit que beaucoup de verbes de 37M (84,0 %) acceptent la construction N2 V N1. Il a donc une correspondance étroite entre N0 V N1 de N2 et N2 V N1. Du point de vue sémantique, on peut dire que le N2 indiquant les "matériaux" dans No V N1 de N2 (Luc charge le camion de blé) peut facilement assumer la fonction sujet N2 dans N2 V N1 (Le blé charge le camion). Dans le tableau 1, on peut remarquer que les cas d'acceptabilité de la construc tion N0 V N1 avec N2 sont assez variés en fonction des sous-classes de 37M1 à 37M6. Les 6 sous-classes sont qualifiées de: "non locatif', "trace", "déformation",
INTERPRÉTATON FONCTIONNELLE DES TABLES
Croisée N0 VN1de N2 37M1 37M2 37M3 37M4 37M5 37M6
164 117 107 117 151 228
Total
884(100%)
Standard N0V N2 Loc N1 10 20 37 25 34 63
(6%) (17%) (34,6%) (21,4%) (22,5%) (27,6%)
189 (21,4%)
N0 VN1avec N2 76 60 0 103 136 211
(46,3%) (51,3%) (0%) (88%) (90%) (92,5%)
586 (66,3 %)
603
N2 V N1 123 101 86 96 132 205
(75,0%) (86,3%) (80,4%) (82,1%) (87,4%) (89,9%)
743 (84,0 %)
Tableau 1 "résiduel", "apport 1" et "apport 2" (A. Guillet et Ch. Leclère 1992:262). Remarquons que 37M3 n'autorise jamais la construction N0 V N1 avec N2 et que 37M6 est la sous-classe qui l'accepte le plus (92,5%), mais qu'inversement, c'est 37M3 (34,6%) qui permet le plus la construction "standard" alors que 37M6 l'accepte moins (27,6%). Prenons un exemple de chacune de ces sous-classes. (13) Luc creuse le sol de trous (37M3) (14) Luc creuse des trous dans le sol (15) * Luc creuse le sol avec des trous (16) Les trous creusent le sol (17) Luc couvre le livre de plastique (37M6) (18) * Luc couvre du plastique sur le livre (19) Luc couvre le livre avec du plastique (20) Le plastique couvre le livre La différence entre les deux groupes ci-dessus est délicate a expliquer. Ne pourrait-on pas dire que la préposition avec suppose une relation moins étroite avec le verbe que la préposition del Mais n'oublions pas qu'aucun verbe de 37M3 n'accepte la préposition avec, tandis que 27,6% des verbes de 37M6 acceptent la construction "standard" (cf. (4) Luc charge du blé dans le camion (37M6), cidessus). 2. Combinaisons de constructions Dans cet article, nous nous intéressons plus particulièrement aux différentes combinaisons possibles des quatre constructions pour l'ensemble des 884 verbes de la classe 37M, quelles que soient les différences que présentent les sous-classes 37M1 à 37M6. Voici un tableau récapitulatif:
604
YOICHIRO TSURUGA Croisée N0V N1de N2
108 (12,2%) 13 (1,5%) 50 (5,7%) 18 (2,0%) 408 (46,2%) 60 (6,8%) 178 (20,1%) 49 (5,5%) Total
+ + + + + + + + 884+ (100%)
Standard N0V N2 Loc N1
N0 VN1aveN2
N2 V N1
+ + + +
+ +
+
-
+
-
+ +
+
-
+
189+ (21,4%)
586 +(66,3 %)
-
743 + (84,0 %)
Tableau 2 84,0% des verbes utilisant la construction "croisée" acceptent la construction N2 V N1, tandis que ceux qui acceptent la construction "standard" sont beaucoup moins nombreux (21,4%). La proportion assez élevée (66,3%) de N0 V N1 avec N2 n'est peut-être pas sans rapport avec ce fait. Constatons aussi qu'il a un peu plus de correspondance (88,1%: 516 sur 586 verbes) entre le N2 de avec N2 et celui de N2 V N1 qu'entre le N2 de de N2 et celui de N2 V N1 (84,0%: 743 sur 884 verbes). La correspondance entre les trois constructions N0 V N1 de N2, N0 V N1 avec N2 et N2 V N1 est moins fréquente (58,4%: 516 sur 884 verbes). 2.1. Croisée (+), Standard (+), N0 V N1 avec N2 (+), N2 V N1 (+): 12,2% Parmi les 189 verbes acceptant les constructions "croisée" et "standard", 121 (64,0%) acceptent aussi la construction N0 V N1 avec N2. Parmi ces 121 verbes, il en a 108 (89,3%) qui acceptent aussi la construction N2 V N1 et ceux qui refusent seulement cette dernière construction sont seulement 13 (10,7%). Ces verbes représentent seulement 1,4% des 884 verbes qui sont en question. Que peut indiquer tout cela? Le verbe charger (37M6), par exemple, est un des 108 verbes qui acceptent les quatre constructions en question. On a Luc charge le camion de blé, Luc charge du blé dans le camion, Luc charge le camion avec du blé et Le blé charge le camion. Dans la première phrase ("croisée"), Luc fait Taction de charger, l'objet direct de cette action est le lieu le camion et les matériaux avec lesquels on fait Taction sont {du) blé. Dans la deuxième phrase ("standard"), Luc fait la même action mais Tobjet direct de Taction est du blé (les matériaux) et le lieu le camion est muni de la préposition dans. La troisième phrase sert a indiquer plus explicitement le sens de la préposition de de la première phrase. De peut avoir des sens très variés selon les contextes, et la possibilité de commutation avec une autre préposition {avec) suggère bien que {du) blé représente bien les matériaux avec
INTERPRÉTATON FONCTIONNELLE DES TABLES
605
lesquels on fait Taction de charger. Dans la quatrième phrase, les matériaux en question occupent la place de sujet (No). Il arrive fréquemment que les matériaux ou l'instrument avec le(s)quel(s) on fait une action puisse(nt) aussi occuper la place de sujet avec certains verbes. Mais dans Le blé charge le camion, il est plutôt ques-tion d'un état que d'une action. Dans tout cela, il est important de remarquer que les matériaux (du/le) blé peuvent occuper trois places distinctes autour du verbe charger. Dans un premier cas, (du) blé est muni de la préposition de ou de la préposition avec et il s'agit de la place de complément d'objet indirect. Quand les matériaux occupent ainsi la place d'objet indirect, c'est le lieu qui occupe celle d'objet direct. Ici, l'élément qui est le plus étroitement lié (après le sujet) au verbe est le lieu même le camion. Dans un deuxième cas: la construction "standard", le lieu est muni de la prépo sition dans. La fonction locative est ainsi le plus typiquement exprimée en tant que telle. Et les matériaux assument la fonction d'objet direct. C'est ainsi les matériaux qui occupent ici (après le sujet) la place le plus étroitement liée au verbe charger. Dans un troisième cas enfin (la quatrième phrase), les matériaux (le) blé occu pent la place de sujet du verbe charger qui garde toujours comme objet direct le lieu le camion. Dans cette construction, les fonctions sujet "agent", objet direct "matériaux" et locatif "lieu" de la construction "standard" se réduisent a celles de sujet "matériaux" et d'objet direct "lieu". 2.2. Croisée (+), Standard (+), N0 V N1 avec N2 (+), N2 V N1 (-): 1,5% Comme déja indiqué ci-dessus, seulement 13 des 884 verbes en question (soit 1,5%) acceptent les trois premières constructions et refusent N2 V N1. Et parmi les 121 verbes acceptant les trois premières constructions, la plupart (108: 89,3%) acceptent aussi la quatrième. Cela signifie qu'il a une correspondance étroite entre les trois premières constructions et la quatrième. On peut observer aussi un lien étroit entre la troisième et la quatrième constructions (88,1%: 516 verbes sur 586). Cela indique que les matériaux indiqués par avec assument facilement la fonction sujet du même verbe qui garde alors comme objet direct le lieu. Par rapport l'objet direct "lieu", l'agent et les matériaux assument facilement la fonction sujet autour des verbes en question. Les 13 verbes évoqués ci-dessus sont donc très exceptionnels. Enumérons-les: asperger, inséminer, planter (37M4), cimenter, crayonner, peinturer, peinturlurer, plâtrer, ripoliner (37M5), élinguer, ensemencer, frotter, vaporiser (37M6). On peut remarquer que, sauf exceptions, ces verbes ont un sens très délimité et très spécialisé, et sont de fréquence d'utilisation peu élevée. De plus, beaucoup d'entre eux sont liés a un nom dont la morphologie ressemble a la leur et qui correspond N2: asperger-?, inséminer-semence, planter-plante, cimenter-ciment, crayonner-crayon, peinturer-peinture, peinturlurer-peinture, plâtrer-pldtre, ripoliner-Ripolin, élinguer-élingue, ensemencer-semence, frotter-?, vaporiservapeur.
606
YOICHIRO TSURUGA
Prenons, par exemple, le verbe planter, dont la fréquence d'utilisation est la plus élevée (cf. J. Baudot 1972). On a Luc plante le jardin de blé, Luc plante du blé dans le jardin, Luc plante le jardin avec du blé, mais *Le blé plante le jardin semble difficile a accepter. Le blé est un nom qui correspond a une plante. *Une plante plante le jardin est inacceptable, tandis que On plante le jardin d'une plante et On plante une plante dans le jardin sont acceptables. Le verbe planter vient du nom plante et on peut dire qu'il est conçu de sorte qu'il organise comme objet direct des choses comparables a des plantes. Et en même temps le sujet de ce verbe est conçu comme quelque chose qui n'est pas une plante et qui peut effectuer Taction qu'exprime le verbe. C'est ainsi qu'il est difficile d'accepter *Une plante plante le jardin. Il en va de même pour les 12 autres verbes. En simplifiant les choses, on peut dire que les verbes en question exigent comme sujet un agent humain ou quelque chose qui est assimilable a un agent. L'argumentation sémantique donnée ci-dessus n'est pourtant pas toujours valable. Des verbes comme saupoudrer (poudre) (37M4), poivrer (poivre) (37M5), saler (sel) (37M5), sucrer (sucre) (37M5) et vinaigrer (vinaigre) (37M5), par exemple, sont sémantiquement et morphologiquement comparables aux verbes donnés ci-dessus. Mais dans leur cas, la construction N2 V N1 n'est pas refusée: (21) (22) (23) (24)
Luc saupoudre le gateau de chocolat Luc saupoudre du chocolat sur le gateau Luc saupoudre le gateau avec du chocolat Le chocolat saupoudre le gateau
(25) Luc poivre le steak de poivre rouge (26) * Luc poivre du poivre rouge sur le steak (27) Luc poivre le steak avec du poivre rouge (28) ?Le poivre rouge poivre le steak (29) Luc sale le roti de sel fin (30) *Luc sale du sel fin sur le roti (31) Luc sale le roti avec du sel fin (32) ?Le sel fin sale le roti (33) Luc sucre son café de cassonade (34) * Luc sucre de la cassonade dans son café (35) Luc sucre son café avec de la cassonade (36) ? La cassonade sucre son café (37) Luc vinaigre la sauce de vinaigre de vin (38) * Luc vinaigre du vinaigre de vin dans la sauce (39) Luc vinaigre la sauce avec du vinaigre de vin (40) ? Le vinaigre de vin vinaigre la sauce Dans (36), par exemple, *Le sucre sucre son café semble difficile a accepter, comme Test *Une plante plante le jardin. Mais si (28), (32), (36) et (40), par
INTERPRÉTATON FONCTIONNELLE DES TABLES
607
exemple, sont acceptables, ne peut-on pas accepter des phrases comme *Une couleur vive peinturlure le mur? La frontière entre les 13 verbes en question et ceux de (21) a (40) n'est-elle pas surmontable? 2.3. Croisée (+), Standard (+), N0 V N1 avec N2 (-) N2 V N1 (+): 5,7% 5,7% des verbes mentionnés dans le tableau 2 acceptent cette combinaison. Les verbes de la construction "croisée" acceptent souvent N2 V N1. Mais ceux qui acceptent ces deux constructions acceptent aussi assez facilement N0 V N1 avec N2. En effet, les verbes qui acceptent ces trois constructions en même temps sont 58,4%. Mais la combinaison ci-dessus exclut N0 V N1 avec N2. Les verbes qui accep tent les quatre constructions (12,2%) sont beaucoup moins nombreux que ceux qui refusent seulement la construction "standard" (46,2%: cf. voir 2.4., ci-dessous). Et la combinaison ci-dessus accepte la construction "standard". La conséquence en est que le pourcentage auquel on aboutit est peu élevé. Un exemple de cette combinaison 2.3. est le verbe creuser (37M3). Cf. (13) a (16), ci-dessus. 2.4. Croisée (+), Standard (-), N0 V N1 avec N2 (+), N2 V N1 (+): 46,2% 'est cette combinaison qui est acceptée par le plus de verbes (46,2%). Parmi les quatre constructions, c'est la construction "standard" qui est acceptée par le moins de verbes (21,4%). Il est ainsi normal que cette combinaison soit la plus répandue. Ce fait montre une étroite correspondance entre objets indirects de N2, avec N2 et N2 sujet. Couvrir (38M6) en est un exemple. Cf. (17) a (20), ci-dessus. 2.5. Croisée (+), Standard(+), N0 V N1 avec N2 (-), N2 V N1 (-): 2,0% Cette combinaison est acceptée par très peu de verbes (18: 2,0%). Elle est a com parer avec la combinaison de 2.2. D'abord, rappelons que les verbes qui acceptent N2 V N1 sont très nombreux (84,0%). Ceux qui acceptent N0 V N1 avec N2 sont nombreux également (66,3%), de même que ceux qui refusent la construction "standard" (78,6%). La combinaison en question ici est précisément opposée a ces trois tendances. La conséquence en est qu'il très peu de verbes acceptant cette combinaison. Labourer (37M3) en est un exemple: (41) Luc laboure le champ de sillons (42) Luc laboure des sillons dans le champ (43) * Luc laboure le champ avec des sillons (44) * Les sillons labourent le champ
608
YOICHIRO TSURUGA
2.6. Croisée (+), Standard (-), N0 V N1 ovec N2 (+), N2 V N1 (-): 6,8% Cette combinaison n'est pas acceptée par beaucoup de verbes. Elle refuse la cons truction "standard", mais elle refuse aussi N2 V N1. Or le simple fait de refuser cette construction limite le pourcentage a moins de 16%. Ravitailler (37M1) en est un exemple: (45) Luc ravitaille Max de vin (46) * Luc ravitaille du vin a Max (47) Luc ravitaille Max avec du vin (48) * Le vin ravitaille Max 2.7. Croisée (+), Standard (-), N0 V N1 avec N2 (-), N2 V N1 (+): 20,7% Cette combinaison est acceptée par 20,1% de verbes. La correspondance entre la construction "croisée" et N2 V N1 est tres étroite (84,0%), et celle existant entre la construction "croisée", N0 V N1 avec N2 et N2 V N1 est aussi assez étroite (58,4%). C'est le refus de N0 V N1 avec N2 qui explique le pourcentage peu élevé. Précéder (37M2) en est un exemple: (49) Luc précéde son discours de remerciements (50) * Luc precede des remerciements a son discours (51) * Luc précède son discours avec des remer dements (52) Les remerdements précedent son discours 2.8. Croisée (+), Standard (-), N0 V N1 avec N2 (-), N2 V N1 (-): 5,5% Cette combinaison, ou plutot cette absence de combinaison, n'est pas acceptée par beaucoup de verbes. C'est le refus des deux dernières constructions qui fait baisser le pourcentage. Mais la construction "standard" est aussi refusée, ce qui élève le pourcentage un peu plus que celui (2,0%) de la combinaison de 2.5. qui acceptait la construction "standard". Brûler (37M3) en est un exemple: (53) (54) (55) (56)
? Le soleil brûle Luc de brülures graves * Le soleil brüle des brülures graves sur Luc * Le soleil brüle Luc avec des brülures graves *?Les brülures graves brülent Luc
Après avoir examiné, ci-dessus, les huit combinaisons possibles avec les quatre constructions, nous constatons qu'il des correspondances étroites entre certaines d'entre elles. En fait, notre choix de ces quatre constructions s'est fondé d'abord sur l'observation d'un lien intéressant entre la construction "croisée" a laquelle nous nous intéressons et la construction "standard". Notre choix est aussi basé sur la correspondance, manifestement étroite, entre la construction "croisée", la construction N0 V N1 avec N2 et la construction N2 V N1. Ces diverses cor-
INTERPRÉTATION FONCTIONNELLE DES TABLES
609
respondances sont clairement sous le contrôle des capacités organisatrices des verbes.
3. Un ou deux verbes Les capacités organisatrices de verbes règlent les différentes combinaisons de constructions vues ci-dessus. Mais quand on parle de capacités organisatrices ver bales, nous devons nous poser la question: s'agit-il de la capacité d'un ou de deux verbes? Une forme verbale comme charger, par exemple, accepte les quatre construc tions discutées ci-dessus. D'abord, en comparant Luc charge le camion de blé et Luc charge le camion avec du blé, on peut dire qu'il s'agit de variantes fonctionnelles de prépositions malgré leur différence. Fonctionnellement, on peut considérer que dans ce contexte et a un certain niveau d'analyse, de et avec représentent une même fonction. Par conséquent, les deux charger représentent ici un seul et même verbe charger. Mais que se passe-t-il avec Luc charge le camion de blé et Luc charge du blé dans le camion. Il s'agit nettement de deux constructions distinctes et donc de deux ensembles distincts de fonctions syntaxiques. Les deux phrases ont en commun les fonctions sujet et objet direct. Mais la fonction en de de la première et la fonction en dans de la seconde ne peuvent pas être considérées comme identiques, ni comme variantes. La fonction en de peut être qualifiée de "matériaux" et celle en dans, de "locatif directionnel". Du point de vue de l'organisation fonctionnelle, il semble donc difficile de considérer qu'un même verbe est a la base de ces deux constructions. Sémantiquement, cependant, on ne peut pas nier qu'il a quelque chose de commun entre les deux charger. Seulement la partie commune sémantique ne se reflète pas bien dans les constructions. Mais ne pourrait-on pas concevoir un niveau d'analyse ou "objet direct - matériaux" et "objet direct - locatif directionnel" soient des variantes d'un même ensemble fonctionnel syntaxique, puisqu'on peut reconnaïtre que les deux ensembles en question sont organisés par le même ensemble Luc charge? Rappelons aussi qu'il n'y a pas beaucoup de verbes qui acceptent les deux constructions en question. Enfin, que peut-on dire de Luc charge le camion de blé et de Le blé charge le camion? Dans la première de ces deux phrases, N0 n'est pas nécessairement "humain" (cf. Cette victoire charge Luc de gloire). Alors, la construction N2 V N1 n'accepte-t-elle jamais une autre fonction en de "matériaux" {Le blé charge le camion de son poids)? Si c'est le cas, on pourrait considérer Le blé charge le camion comme un simple cas d'ellipse. Si nous tenons a Pidentité verbale malgré les différences formelles de construc tions, c'est que les combinaisons de constructions et leurs pourcentages de fré quence, donnés par le tableau 2, semblent indiquer divers facteurs de construc tions qui sont finalement sous le controle des capacités organisatrices des verbes.
610
YOICHIRO TSURUGA
Conclusion Il a une correspondence étroite entre N0 V N1 de N2 et N2 V N1 (84,0%). La correspondance entre N0 V N1 avec N2 et N2 V N1 (88,1%) et celle existant entre N0 V N1 de N2 et N0 V N1 avec N2 (66,3%) sont aussi étroites. Parmi les verbes qui acceptent N0 V N1 de N2, N0 V N2 Loc N1 et N0 V N1 avec N2, la plupart (89,3%) acceptent N2 V N1. La correspondance entre N0 V N1 de N2 et N0 V N2 Loc N1 est plutot faible (21,4%). Les différentes combinaisons des quatre constructions peuvent servir a classer les verbes en question. Le verbe charger est un des verbes qui acceptent les quatre constructions "croisée", "standard", N0 V N1 avec N2 et N2 V N1. Remplir ressemble sémantiquement et syntaxiquement a charger, mais il refuse la construction "standard", ce qui est le cas le plus fréquent (408 sur 884: 46,2%). Notons que remplir n'est pas classé dans 37M mais parmi les 284 verbes de la table 32RA (RA pour "rendre adjectif") dont certains ont la construction "croisée" (cf. J.-P. Boons, A. Guillet et Ch. Leclère 1976). Les verbes qui refusent seulement la quatrième construction sont les plus rares (13 sur 884: 1,5%). Planter en est un exemple. Concernant charger, l'"agent" et les "matériaux" peuvent assumer la fonction sujet, et le "lieu" et les "matériaux" peuvent occuper les places d'objet direct et d'objet indirect. Dans le cas de remplir, l'"agent" et les "matériaux" peuvent assumer la fonction sujet mais il n'y a que le "lieu" qui puisse occuper la place d'objet direct, et l'objet indirect ne peut être assumé que par les "matériaux". Pour le verbe planter, le "lieu" et les "matériaux" peuvent assumer les fonctions d'objets direct et indirect, mais seul l'"agent" peut assumer la fonction sujet. Voici un tableau résumant ces données: Sujet
Verbe
Objet direct
Objet indirect
"agent" + "matériaux" "agent" + "matériaux" "agent"
- charger - remplir -planter
- "lieu" + "matériaux" - "lieu" - "lieu" + "matériaux"
- "lieu" + "matériaux" - "matériaux" - "lieu" + "matériaux"
Tableau 3 On remarque dans ce tableau que les "matériaux" apparaissent dans toutes les positions, que F "agent" n'apparaït que dans la position de sujet et que le "lieu" n'apparaït jamais dans la position de sujet. Le "lieu" apparaït comme objet direct des trois verbes (dans le cas du verbe remplir, le "lieu" ne figure que dans cette position). Notons que dans les 1000 premières occurrences de remplir du corpus que nous avons recensé {Le Monde 1990-1992), le "lieu" est presque toujours présent en tant qu'objet direct a la voix active (sauf dans 2 occurrences ù l'objet direct est absent) et en tant que sujet a la voix passive, bien que les deux autres éléments puissent disparaïtre. L'élément "lieu" objet direct est ainsi essentiel pour c verbe, c qui est un des facteurs empêchant la construction "standard". La
INTERPRÉTATON FONCTIONNELLE DES TABLES
611
différence entre charger et remplir tient donc dans le fait que charger n'exclut pas l'objet direct "matériaux", que refuse remplir. Ou plutot dans le fait que remplir n'accepte comme objet direct que le "lieu".
Références Baudot, Jean. 1972. Fréquences d'utilisation des mots en franqais écrit contem porain. Montréal: Presses Universitaires de Montréal. Boons, Jean-Paul, Alain Guillet, Christian Leclère. 1976. La Structure des phrases simples en français - Constructions intransitives. Genève: Droz. Boons, Jean-Paul, Alain Guillet, Christian Leclère. 1976. La Structure des phrases simples en franqais. Classes de constructions transitives. Rapport de Recher ches 6, Paris: LADL , Université Paris 7. Busse, Winfried et Jean-Paul Dubost. 1977. Französisches Verblexikon, Die Konstruction der Verben im Französischen, Stuttgart: Klett-Cotta. Gross, Maurice. 1975. Méthodes en syntaxe. Paris: Hermann. Guillet, Alain, Christian Leclère. 1992 . La Structure des phrases simples en fran qais 2. Constructions transitives locatives. Genève: Droz. Index du DELAS. v 08 et du Lexique-Grammaire des verbes. 1997. Paris: LADL, Université Paris 7. Martinet, André (dir.). 1979. Grammaire fonctionnelle du français. Paris: Didier. Summary In French, there are verbs that permit an interesting correspondence between N0 VN1de N2 and N0 V N2 Loc N1 (Loc: a locative preposition). The correspondence between N0 V N1 de N2 and N2 VN1is very close (84.0 %): 743 of 884 verbs), and so is the one between No VN1avec N2 and N2 VN1(88.1 % : 516 of 586 verbs) and the one between N0 VN1de N2 and N0 VN1avec N2 (66.3 %: 586 of 884 verbs). Different combinations of the four constructions N0 V N1 de N2, N0 V N2 Loc N1 N0 V N1 avec N2 and N2 V N1 variously account for the verbs taking N0 V N1 de N2. The verbs that accept the three former constructions but refuse only the fourth are very exceptional (1.5 % : 13 of 884 verbs), while those that refuse only the second are more numerous (46.2 %). The correspondence between N0 VN1de N2 and N0 V N2 Loc N1 is in fact the least frequent (21.4 %). There are clear semantic and functional factors that control these tendencies. The tight correspondence between N0 V N1 de N2 and N2 V N1, for example, indicates clearly that the element functioning as the "materials" relation, with de, can also function very easily as subject of the same verb. It is important to try to bring out such fundamental functional information in the "Lexique-Grammaire" tables.
SOME ELEMENTS FOR AN EMPIRICAL APPROACH TO THE STUDY OF MEANING JEAN-ROGER VERGNAUD MARÍA LUISA ZUBIZARRETA C.N.R.S. & University of Southern California*
1. On the notion "focus" Given some sentence S, the semantic analysis of S will in general involve cons tructs and notions that are not all defined within the grammatical description of S as standardly construed. For example, encyclopedic knowledge associated with the lexical items in S will be relevant. And so will be the knowledge of the parti cular world situations and entities connected with S. We refer to the latter kind of knowledge as "pragmatic knowledge", following standard practice. In some sense, pragmatic knowledge is knowledge of "accidental" facts. Thus, typically, a proper name will evoke pragmatic knowledge, while a common noun will call up ency clopedic knowledge. But the difference between the two kinds of knowledge is not always clear-cut, and there is no fix rule for apportioning them to any given type of linguistic expression. For example, a proper name may well call up ency clopedic knowledge if it is the name of a famous character (where "fame" is relative to a given culture).1 Given these notions, one could design a method which identifies for each utte rance what is antecedent knowledge and what is "new" knowledge. One might then devise such categories as, e.g., that of utterances for which the antecedent knowledge is purely encyclopedic and does not include any pragmatic component. The utterances in (l)-(3) below would be in that category: (1) (2) (3)
There is a flaw somewhere It was raining Caesar was assassinated
In the examples in (1) and (2) the antecedent knowledge is the encyclopedic knowledge associated with common lexical items, in this case the noun flaw and the verb rain, respectively. To the extent that Caesar in (3) refers to the historical Roman character and that his assassination is part of the encyclopedic knowledge * We thank R. Freidin and A. Rouveret for their help. 1 Kripke (1972) contains a fundamental discussion of some relevant aspects.
614
JEAN-ROGER VERGNAUD & MARIA LUISA ZUBIZARRETA
that comes with the description of that character, the utterance in (3) is on a par with (1) and (2) in the relevant respect: it involves no antecedent pragmatic knowledge.2 Of course, the question is whether this kind of taxonomy has any empirical relevance, or even substance. Note that, on intuitive grounds, the utte rance in (3) is structurally closer to that in (4) below than to either of those in (1) or in (2): (4)
Luc was dreaming
This is just a small example, but one that suggests that such notions as "new information" vs "old information" are bound not to be very illuminating at best. Indeed, there is a relatively long history in linguistics of descriptive approaches that have relied on some notion of "information", and one can only note that such approaches have failed to yield any result.3 The crucial feature is not what information is "new" or "old", but what is high lighted or not. Thus, the utterance in (4) can be understood in different ways, depending in part on the intonation of the sentence. With the unmarked "neutral intonation", i.e., with nonemphatic nuclear stress on dreaming as indicated in (5) below, the utterance of (4) can be a thetic judgment or a "categorical" one, in the sense of Kuroda (1972). (5)
Luc was dreaming
The distinction between "thetic judgment" and "categorical judgment" has really to do with which part of the utterance is "highlighted". As a first approximation, the categorical construal of the utterance in (5) can be equated with the form in (6) (see Zubizarreta 1998): (6)
One thing Luc was doing was dreaming
In (6), pragmatic or encyclopedic knowledge of who Luc is is presupposed and the assertion is concerned with identifying, "highlighting", what Luc is doing. That construal of (5) may be described by defining (5) as a possible answer to the question in (7): (7)
What was Luc doing?
The part that is complementary to the presupposition, the predicate was dreaming in (5), (6) or (7) is traditionally called the focus of the assertion. Assuming this analysis, then, the utterance in (5) may be described as asserting the following: (8)
The proposition [cp Luc... ] is true if... has the value was dreaming
We take this relation to be a central component of the meaning of the sentence in (5). Formally, we take the semantic description of (5) to include the conditional 2
The utterance in (3) in the text is what we might call a "singular generic" statement concerning the individual "Caesar". 3 See for example the discussion in Hawkins (1994).
AN EMPIRICAL APPROACH TO THE STUDY OF MEANING
615
statement in (9) below, in essence following an original proposal in Zubizarreta (1998): (9)
If TP in [CP Luc TP] has the structural description [TP was dreaming], then CP is true
We can rewrite (9) more compactly as in (10): (10)
IF (TP=[was dreaming]), THEN ([CP Luc TP]=True)
In general, given an affirmative sentence A with the structure in (11), we shall take the semantic description of A to include the conditional statement in (12): (11)
[cp (p [x α] Ψ] with [x α] the focus and φ— Ψ, the presupposition
(12)
IF (X=α) THEN ([CP... X... ]=True)
According to the formal description in (12) then, uttering an affirmative sentence A is tantamount to asserting the truth of A as conditional upon some description of the focus of A. We state this in (13): (13)
An affirmative assertion is an assertion of the conditional truth of the proposition represented by the matrix clause CP: CP is asserted to be true in case the focus of CP has the description given.
Given the semantic structure in (12), the focus of an affirmative sentence can be identified as follows: (14)
Given some affirmative sentence A=[cp ... ], the focus of A is defined as the constituent of [cp ... ] which is the antecedent in the conditional describing A.
It may be instructive to compare the IF-THEN connective to the implication connective of mathematical logic. The implication connective, standardly denoted by the symbol "z>", is defined by means of the truth table in (15), where "T" stands for "true" and "F", for "false" (see Mendelson 1964: chap.l, or Lyndon 1966, for example):4
4
Given some formula F(p, q„ ..., r, ...), the truth table for F is the table that represents F's truth value for each assignment of truth values to the various statement letters in F. For example, the truth table for the connective "¬' ("not") is represented in (i) and that for the connective "v" ("or/and") is given in (ii), with "T" standing for "true" and "F", for "false": (i) p ¬p (ii) p q pvq T F F T
T T T F T T TFT FFF
616
JEAN-ROGER VERGNAUD & MARÍA LUISA ZUBIZARRETA
(15) p T T F F
q T F T F
p⊃q T F T T
Alternatively, one could define " ⊃ " as the correspondence in (16) where "¬" is "not" (see note 4): p ⊃q
(16) p p ¬P ¬p
q ¬q q ¬q
T F T T
The table in (16) indicates whether p ⊃ q is valid or not for each of the four combinations (p, q), (p, ¬g), (¬, q) and (¬p, ¬q). As the table in (15) (or (16)) shows, the definition of the mathematical connective " ⊃ " subsumes the conven tion in (17): (17)
The implication p ⊃ q is true whenever p is false
Define the negation of the antecedent (TP=[was dreaming]) of the conditional in (10) as follows: (18)
"(TP=[was dreaming]) is false" =def (TP≠[wasdreaming])
In the case of the categorical construal of the example in (5), then, the mathema tical convention in (17) is reflected in the fact that the utterance is noncommital concerning whether Luc was doing anything else than dreaming or not.5 This is typical of the kind of focus structure examplified by (5). We shall refer to that kind of focus structure as informational focus.6 The property just noted can be taken as evidence that the system of mathematical conventions defining propositional calculus has a modicum of empirical relevance. However, this system will have to be revised: as we shall see, the traditional hypothesis that the set of propositions is structured as a Boolean algebra7 is not adequate for natural language. Furthermore, a formula like that in (10), repeated below in (19), has a quantificational force, really, due to the multiplicity of occurrences of the variable TP in it: 5
One has to assume that "doing nothing else than dreaming" is a well defined attribute from the point of view of human cognition. 6 As M. Halle points out (p.c), the tale of the Armenian nightingale provides a good illustration of the notion of informational focus. The tale runs as follows: "The Armenian nightingale sings at night. And during the day? It sings anyway." 7 A Boolean algebra is a Boolean lattice viewed as an algebraic structure. A Boolean lattice is a complemented distributive lattice (see Birkhoff 1995, for example).
AN EMPIRICAL APPROACH TO THE STUDY OF MEANING
(19)
617
IF (TP=[was dreaming]), THEN ([CP Luc TP]=True)
In fact, the formula in (19) can be viewed as equivalent to the formula in (20) where (TP=[was dreaming]) is taken a "generalized quantifier" with variable TP and with scope ([cp Luc TP]=True): (20)
(TP=[was dreaming]) ([cp Luc TP]=True)
We come back to that question below. A special instance of the formula in (12) is when the antecedent is the maximal projection TP of T within CP, as represented in (21): (21)
IF (TP=[Luc was dreaming]), THEN ([CP TP]=True)
The statement in (21) describes the case when the truth of CP is asserted uncon ditionally. We take this case to be that found in thetic judgments. In our sense, then, a thetic judgment is an assertion with an empty presupposition and with the whole matrix TP as the focus. Here, we follow Kuroda (1972) in assuming that such an utterance as (5) may be construed as a thetic judgment, i.e., with the des cription in (21). Other interpretations of the form in (4) can be identified, corresponding to intonations that differ from the unmarked "neutral intonation" (i.e., the one with nonemphatic nuclear stress on dreaming displayed in (5)). Suppose, for example, that Luc in (4) has main stress, as represented in (22): (22)
Luc was dreaming
With the intonation in (22), the focus is the subject Luc: the utterance is construed as the assertion in (23), formalized in (24): (23)
One that was dreaming was Luc
(24)
IF (DP=[Luc]% THEN ([CP DP was dreaming]=True)
Thus, the utterance in (22) is a felicitous answer to the question in (25): (25) Who was dreaming? Another case in which the intonation of a sentence differs from the neutral pattern is when the main stress is associated with an extra-high pitch. Call this emphatic stress. Emphatic stress, wherever it may be located, yields an inter pretation distinct in nature from the kind of interpretation discussed above. To illustrate, suppose that the main stress in (22) is emphatic stress. We represent this intonation by capitalizing the relevant word as indicated in (26): (26)
L UC was dreaming
The utterance in (26) is not interpreted as in (23), but rather as in (27): (27)
Only Luc was dreaming. Noone else was
We refer to the interpretation in (27) as an "exhaustive" interpretation. One says that the focused subject Luc in (26) is interpreted as a contrastive focus. Thus, the
618
JEAN-ROGER VERGNAUD & MARIA LUÍSA ZUBIZARRETA
utterance in (26) is natural in a context like that in (28): (28)
LUC was dreaming, not Mary
The interpretation of (26) can be paraphrased as in (29i) or (29ii): (29) i. The (only) one that was dreaming was Luc ii. It was Luc that was dreaming, noone else Note the definiteness associated with the focused item in(29). The interpretation in (29i) should be contrasted with an interpretation such as that in (23). To be sure, the utterance in (22), with nonemphatic main stress, may also be construed as a case of contrastive focusing. However, such an interpretation is marked in the absence of any overt contrasting context such as that in (28). The same remark applies to the interpretation of (5) above. We then distinguish between two kinds of focus, informational focus and contrastive focus. As illustrated in the discussion above, the distinction between contrastive and informational focus can be represented as a distinction between definiteness and lack thereof in a clefted or pseudo-clefted paraphrase (in the case of a clefted paraphrase, definiteness is manifested as the subject pronoun it in it be X CP). Consider again the description of the interpretation of (22) in (29). As implied by our description, the definite article in (29i) is to be construed as implying uniqueness, or exhaustivity. Recall that an informational focus is repre sented as the antecedent in the formula in (12), repeated below in (30): (30)
IF (X=α), THEN ([CP... X... ]=True)
A characteristic property of the contrastive focus, as opposed to the informational focus, is the "exhaustive" interpretation just noted. Clearly, this interpretation can be described by adding the converse of the implication in (30) to the semantic description defined in (12). Then, we shall assume that the semantic description of contrastive focussing is as in (31): (31) i. IF(X=α),THEN([ CP ...X... ]=True) ii. IF ([CP ... X... ]=True), THEN (X=α) Thus, contrastive focusing is semantically represented as an equivalence between the assignment of some value to the focused constituent and the assignment of the value True to the matrix clause. Correspondingly, the contrastively focussed cons tituent is analyzed both as the antecedent in some implication and as the conse quent in the converse of that an implication. The description in (31) can be simpli fied to (32): (32)
(X=a) IFF. ([CP ... X... ]=True)
It will prove useful to have some terminology to distinguish the two reciprocal implications involved in the representation of focus. The one in which the focus is the antecedent, i.e., the one common to informational and contrastive focusing, we
AN EMPIRICAL APPROACH TO THE STUDY OF MEANING
619
shall call the weak conditional. The implication in which the focus is the consequent, restricted to the case of contrastive focusing, we shall call the strong conditional: (33) i. Weak conditional ii. Strong conditional8
IF (X=α), THEN ([CP...X... ]=True) IF ([CP... X... ]=True), THEN (X=α)
Because of the case of the contrastive focus, we need to sharpen the definition of focus in (14) to (34): (34)
Given some affirmative sentence A=[cp ... ], the focus of A is defined as the constituent of [cp ... ] which is the antecedent in the weak conditional in the semantic description of A
To summarize, an affirmative sentence is analyzed as asserting the conditional truth of the matrix CP given some assignment of value to the focused constituent within CP. This is formalized as the general implication in (33i) (=(30)=(12)), which we call the "weak implication". The antecedent in that implication is the focus of the sentence. Contrastive focus additionally involves the "strong" impli cation in (33ii), the converse of the weak implication in (33i). We assume that the IF-THEN connective found in (33) is a primitive mental relation among descrip tions and points of views on descriptions. There are various formal aspects of the IF-THEN connective that need to be clarified. Note that, depending on how we interpret the formula in (33i) (= (30) = (12)), generalized to (35) below, the variable X in it may or may not be taken as a free variable in the sense of predicate calculus (see Mendelson 1964: chap. 2, or Lyndon 1966, for example). (35)
IF (X=α), THEN ([Y... X... ]=ß) (where X, Y are syntactic features and α, ß are descriptions or points of views)
Under the most immediate interpretation of (35), X stands as a free variable. On the other hand, it is possible to view the antecedent of the conditional in (35) as a "generalized quantifier" with variable X and with scope the consequent fly... X... ]=ß); see (19)-(20) in section 1. Indeed, we may assume that every if-then connective in natural language is so interpreted. For example, the if... section of the structure in (36) below will be analyzed as a quantifier binding a modalized because-type adjunct in the then... section of the structure: (36)
If Mary leaves, then John will cry
Note that, if one analyzes (35) as an instance of generalized quantification, the antecedent (X=a) in (35) would really correspond to the restriction of the quanti8
The formula in (33ii) in the text is equivalent to the formula IF ([CP... X... ] = True), THEN (X = a), which is the converse of that in (33i).
620
JEAN-ROGER VERGNAUD & MARÍA LUISA ZUBIZARRETA
fier. The quantifier itself would be vacuous: when the restriction is a singular term, all distinctions among positive quantifiers are neutralized. The particular form of (35) we have encountered in sections 1 and 2 is the formula in (33i) (= (30) = (12)), with Y the matrix CP and ß the value True. Two related questions arise: (37) i. What does the variable X in the formula in (35) stand for, i.e., what is its range? ii. What is the notion of description mentioned in (35) and, in particular, in what sense is the truth-value True a description? The following sections are devoted to these two questions.
2. On the notion "description" Consider the forms below: (38) i. ii. iii. iv. v. vi. vii. viii.
It is raining Someone just arrived John is sitting on the beach John knows English a butterfly some robin in the distance a big flaw a soft landing
Such linguistic expressions as those in (38) can be viewed as descriptions of events or entities in the most general sense of these terms. For example, the forms John is sitting on the beach and John knows English in (38iii-iv) are analyzed here as descriptions of "events" of a certain type, to wit, "stative events". The linguistic expressions that are descriptions of events (resp. entities) in the sense above are verbal expressions (resp. nominal expressions): the forms in (38i-iv) are verbal expressions, those in (38v-vi)), nominal expressions. We assume that, more generally, descriptions may fall under any of the types in the (nonexhaustive) list in (39): (39) i. ii. iii. iv. v. vi. vii. viii.
descriptions of propositions descriptions of events descriptions of entities descriptions of properties descriptions of states descriptions of locations descriptions of manners descriptions of reasons
AN EMPIRICAL APPROACH TO THE STUDY OF MEANING
621
We take the notion of "description" just introduced to be a general cognitive notion, not restricted to the language faculty. Thus, we assume the following: (40)
Each particular sensory or cognitive modality M may give rise to descriptions. Such descriptions are formal expressions in some "code" specific to M
As we hint elsewhere (see Vergnaud & Zubizarreta 2000), the hypothesis that the notion of description is not restricted to the language faculty is quite crucial to a proper understanding of meaning. In the case of the language faculty, we assume the "code" referred to in (40) to consist of the structural descriptions generated by grammatical theory in the usual sense. For the sake of this discussion, we take linguistic theory to be some implementation T M P of the Minimalist Program. It will be useful to adopt the following notation: (41) Given some linguistic expression LE, the structural description of LE generated by the linguistic theory T M P is denoted by .9 An important empirical question is whether any given sensory or cognitive moda lity M can refer to descriptions encoded within another modality M and, if so, how. We postulate that a modality Mmay refer to such descriptions by means of names, which we assume are drawn from the infinite set of atomic symbols in (42): (42)
{ δi}, i in N, with δ1 = T ("true")10
We can identify these names with the indices of Chomsky (1965). A name δi will be called a boundary description. If a modality M may use names to denote des criptions encoded within another modality M', it should also be able to use names to denote descriptions within Mitself. Indeed, we submit that this what happens in an example like (43): (43)
A bird was singing in the distance. That bird was a robin
There is another phenomenon at play within the above example, namely that of
9
We should be careful to distinguish the two notions of "description" used here. On the one hand, we have the notion of "structural description" in the sense, e.g., of Chomsky (1955): given a linguistic expression LE, the structural description of LE is the set of structures associated to LE by grammatical theory. At the same time, the structural description is also a description in the other, primitive, sense assumed here for the purpose of constructing a semantic theory. In what follows, we shall use the simple term "description" when we mean "description" in the latter sense, and the compound term "structural description" when we mean "description" in the former sense. 10 In this discussion, we assume a simplified model with a two-valued logic. A complete theory would have to include a modal logic, possibly along the lines of the Aristotelian distinction among "necessary, contingent, possible, impossible."
622
JEAN-ROGER VERGNAUD & MARÍA LUISA ZUBIZARRETA
definitization.11 The approach adopted here ultimately derives from Chomsky's critical apprai sal of theories of meaning that rely on some notion of "reference to a world" (see Chomsky 1992, 2000). Accordingly, the notion of "description" above does not involves any mapping relating the "description" to some set of objects external to the mind. Obviously, we are not denying the existence of correspondences between mental representations or operations and the "outside" world.12 We are just claiming, following Chomsky (1992, 2000), that such correspondences are irrelevant to a theory of linguistic meaning and that they pertain to a different domain of study. Although, in our view, the theory of meaning does not include any notion of "reference", it must provide a formal way of linking descriptions that "corefer" in the standard sense, since, indeed, coreference is a central relation in the realm of meaning. To illustrate, consider the form in (44): (44)
Hesperus is Phosphorus
With neutral intonation, the sentence in (44) asserts that D' = describes the same entity as D = . We shall note D→D' the relation between the two descriptions asserted in (44). We are then assuming that descrip tions may be compounded as indicated in (45): (45)
Given two descriptions D and D', a relation may exist according to which D' is defined as a description of D. We denote by D•D' a description D' that is in the relation "description-of" to another description D. By definition, the type of D•D' is that of D'.
If the description is analyzed as d•, i.e., as a description of d for some other description d, the utterance in (44) may be taken as asserting (46): (46)
IF d•, THEN d•
When D and D' in (45) are of the same type, then D•D' and D describe the same object (i.e., the same proposition, or event, or entity, or property, etc.). Note that the primitive relation between descriptions just assumed is asymmetrical. We refer the reader to Vergnaud & Zubizarreta (2000) for further discussion of that fact. A description D that does not stand in the relation "description-of' to any other description, we call a primitive description. Given some primitive 11
See Vergnaud & Zubizarreta (2000), which assumes, following Hawkins (1991), that definiteness is a semantic feature whose value is pragmatically determined. 12 There are really two notions of "outside." Given a pair (m, b), where m is some mind and b, the body that supports m, one can define a "strict" notion of "outside" of m encompassing b. There is also a "broad" notion of "outside" which does not include b. Both notions should be considered in the study of the correspondences between mental representations or operations and the "outside" world.
AN EMPIRICAL APPROACH TO THE STUDY OF MEANING
623
description d, the set of all descriptions of d is called a family, denoted by d. Given the definitions in (42) and in (45), the consequent in the implication in (33i) (= (30) = (12)) can be identified as the description True*[cp ... X ... ]. Accordingly, we may revise (33i) (= (30) = (12)) to (47): (47)
IF (X=α), THEN True•[CP... X... ]
In the following section, we examine some central properties of the calculus of descriptions.
3. The semilattiee of pure descriptions Consider the question in (48), itself a short form for the question in (49): (48) (49)
Is the cat alive? Is the cat alive or not?
Following in essence Hamblin (1958), we take the description of a question to be the set of propositions that are possible answers to that question. Then, the des cription of (48) is the set in (50): (50)
{[the cat is alive], [the cat is not alive]}
Formally, then, the disjunction in (51) below must be taken as a description of the question in (48): (51)
P v (¬P), P = [the cat is alive]
This implies that, given the proposition P, we cannot take Pv(¬P) to be a propo sition. In particular, we must assume that P v(¬P) has no truth-value. This goes against standard assumptions, according to which, for every proposition P, Pv(¬) is a proposition with the truth-value "true". Note however that there is really little empirical support for the standard view. In fact, there is quite a bit of evidence that the natural language connectives AND and OR should not be treated symmetrically. Forms involving OR always behave quite differently from those involving AND. Compare the English structures (52i) and (52ii), for example: (52) i. John and Mary left ii. John or Mary left If AND and OR really were dual connectives, as they are assumed to be in the standard Boolean treatment of propositional calculus, then we would expect the two sentences in (53) to be equivalent: (53) i. John is tall or (John is tall and he is fat) ii. John is tall
624
JEAN-ROGER VERGNAUD & MARÍA LUISA ZUBIZARRETA
The reasoning goes as follows. The connective or in (53i) cannot be construed as the "exclusive" or, since the second conjunct would then include a contradiction, which certainly is not the meaning of (53i). Then, the connective or in (53i) must be the "inclusive" or, i.e., the connective v of propositional calculus (see note 4). It is an elementary theorem of propositional calculus that the statement A V(AΛB) is equivalent to the statement A. On intuitive or empirical grounds, characterizing (53i) and (53ii) as logically equivalent does not make much sense, though. At least, this does not seem to be an adequate description of our intuitions. Such objections to the Boolean approach are well-known. To give other examples, it is unclear what meaning one should attribute to the assertion that "a false propo sition implies every proposition", or to the assertion that "of any two propositions P and Q, either P implies Q or Q implies P".13 The fact is that there is more to the natural language connective OR than its mere logical content as defined by propositional calculus. Specifically, the natural language OR in (53i) seems to have a "performative force" that is not necessarily present in the natural language connective AND. More generally, natural language OR appears to be interpreted "one level higher" than the minimal CP in which it is pronounced. Indeed, accepting the argument above and assuming that the seman tic stucture of a clause includes a "weak conditional" of the form in (33i) one could hypothesize that the scope of OR has to include the minimal IF-THEN statement containing the CP in which it is pronounced. By contrast, the connec tive AND is not so governed. In that respect, natural language OR belongs in the same class as the connective IF-THEN or as the metalinguisitc NOT discussed in Vergnaud & Zubizarreta (2000). Then, the descriptions defined in the preceding section cannot be modelled as a Boolean algebra, but have a "weaker" logical struture. Specifically, a class of such descriptions is identified as a strict subpart of a Boolean algebra. Let us call the descriptions defined in the preceding section pure descriptions. Given a family d of pure descriptions of d, define the connective A as follows: (54)
Given two pure descriptions d•D and d•D' of d, the description (d•D)^(d•D') is the unification of d•D and d•D', where unification is standardly defined as the operation that, given two structures Σ and Σ", constructs the smallest structure Σ" that contains both Σ and Σ".
The description (d•D)^(d•D') is equal to d•D•D', also equal to d•D'•D. The connective ^ is more restricted than natural language AND. It is intended to merely correspond to the subcase of AND that applies to attributes. Plurality is associated with a distinct primitive connective, which we call listing and which we shall not discuss here. The set d with the binary operation ^ is a semilattice.14 13 14
See Birkhoff (1995, Chap. XII). See Birkhoff (1995). We must keep in mind that the structure postulated in the text is defined independently of any notion of reference. Obviously, there will be different referential impli-
AN EMPIRICAL APPROACH TO THE STUDY OF MEANING
625
The ordering relation in d is defined as in (55): (55)
D
= D
We denote by the least element of d .15 We shall assume furthermore that the semilattice d is complemented: (56)
Each description D in d admits at least one complement D1 defined by: (i) D^D1 =
The set of all complements of D is denoted by not D. We shall now introduce the notion of mixed description: (57)
Given two pure descriptions D and D', the combination D v D' is called a mixed description. A mixed description is not a description of anything, but represents a set of alternative pure descriptions.
In these terms, then, the description of a yes-no question such as that in (48) or (49) always is a mixed description, not a pure description. Answering a question Q essentially consists in selecting one of the pure descriptions that compose the mixed description for Q. Note that we are not saying that the question in (48) or (49) has the same meaning as the conjunction in (58): (58)
The cat is alive or the cat is not alive
What we are saying is that the question in (48) or (49) and the conjunction in (58) admit the same propositional description. Obviously, those structures differ by their force. By definition, the form in (48) or (49) has the force of a question, a property which is lacking in the case of (58). The force aspect may be analyzed in terms of the notion of point of view (see Vergnaud & Zubizarreta 2000). The notion of "mixed description" is relevant to the analysis of any (or either) and of the wh words in English. Specifically, we shall assume that those words constitute mixed descriptions as indicated in (59): (59)
any, wh =def v i€s , S some set
Thus, we take any and the wh words to share a central component of meaning (ob viously, they will differ along some other dimension). We also assume that any has the same meaning in all constructions: there is no intrinsic semantic distinc tion between a "free choice any" and a polarity any.16 We finally assume that mixed descriptions may themselves be arranged into families, with each family having the (really dual) semilattice structure of a family of pure descriptions. cations depending on whether or not the descriptions concerned are definite descriptions (see the end of section 2 in the text). 15 For the sake of simplicity, we shall assume that the set of pure descriptions under consideration is finite. This hypothesis is not necessary, though. 16 As Vergnaud & Zubizarreta (2000) argues, the lattice ideal generated by a mixed description gives rise to the "downward entailing" property characteristic of polarity items.
626
JEAN-ROGER VERGNAUD & MARÍA LUISA ZUBIZARRETA
References Birkhoff, G. 1995. Lattice Theory. Providence: American Mathematical Society. Boole, G. 1854. An investigation of the laws of thought, on which are founded the Mathematical Theory of Logic and Probabilities. London: Macmillan and Co. (reprinted by Open Court Publishing Co., Chicago, 1940). Chomsky, N. 1955. The Logical Structure of Linguistic Theory. Ms., Harvard. Chomsky, N. 1965. Aspects of the Theory of Syntax. Cambridge, Mass.: MIT Press. Chomsky, N. 1976. Conditions on rules of grammar. Linguistic Analysis 2, 303-351. Chomsky, N. 1981. Lectures on Government and Binding. Dordrecht: Foris. Chomsky, N. 1992. Explaining language use. Philosophical Topics 20, 205-231. Chomsky, N. 2000. New Horizons in the Study of Language and Mind. Cambridge: Cambridge University Press. Fiengo, R. 1974. Semantic Conditions on Surface Structure. Doctoral dissertation, Cambridge, Mass.: MIT. Hamblin, C.L. 1958. Questions. The Australasian Journal of Philosophy 36: 159168. Hawkins, J. 1991. On (in)definite articles in English, implicatures and (un)grammaticality predictions. Journal of Linguistics. Hawkins, J. 1994. A Performance Theory of Order and Constituency. Cambridge: Cambridge University Press. Johnson-Laird P.N., Fabien Savary. 1999. Illusory inferences: a novel class of erroneous deductions. Cognition 71: 191-229. Johnson-Laird P.N., Paolo Legrenzi, Vittorio Girotto, Maria S. Legrenzi. 2000. Illusions in Reasoning about Consistency. Science 288: 531-532. Kayne, R. S. 1994. The Antisymmetry of Syntax. Cambridge, Mass.: MIT Press. Kripke, S.R. 1972. Naming and necessity. In Semantics of Natural Language, D. Davidson and G. Harman (eds.), Dordrecht: Reidel.. Kuroda, S.Y. 1972. Anton Marty and the transformational theory of grammar. Foundations of Language 9: 1-37. Lyndon, R.C. 1966. Notes on Logic. Princeton: D. Van Nostrand Company, Inc. Mendelson, E.1964. Introduction to Mathematical Logic. Princeton: D. Van Nostrand Company, Inc. Vergnaud, J.-R. 1988. The source of metrical stucture. Ms., CNRS. Vergnaud, J.-R. and M.L. Zubizarreta. 2000. Intervention effects in French wh-insitu: syntax or semantics? Ms., USC. Zubizarreta, M.L. 1998. Prosody, Focus and Word Order. Cambridge, Mass.: MIT Press.
AN EMPIRICAL APPROACH TO THE STUDY OF MEANING
627
Summary This article argues that meaning must be analyzed in terms of a notion of description. That notion is taken to apply quite generally beyond the language faculty to other cognitive and perceptual modalities. Descriptions are gathered into families, each family having the structure of a semilattice. The semilattice connective corresponds to the and connective of natural language. One distinguishes between pure descriptions and mixed descriptions: a mixed description obtains when pure descriptions are conjoined by means of Boole's connective +, corresponding to the exclusive or of natural language. To illustrate, the description associated with a yes-no question is a mixed description, and so is the description associated with such determiners as English any or English wh-. The connective + is naturally extended to families of descriptions. In turn, mixed descriptions may themselves be arranged into families, with each family having the (really dual) semilattice structure of a family of pure descriptions. Finally, descriptions may be related by the connective IF-THEN. That connective is construed as a mapping between mixed descriptions. In particular, the focus structure of an utterance is defined in terms of that connective. Given a description UXW with subdescription X, X is the focus of UXW iff. the relation IF X is a description of t, THEN UtW is a description hold. The approach adopted ultimately derives from Chomsky's critical appraisal of theories of meaning that rely on some notion of "reference to a world"; see Chomsky (1992, 2000).
MORPHOLOGIE DÉRIVATIONNELLE ET MOTS SIMPLES LE CAS DU SERBO-CROATE DUŠKO VITAS Université de Belgrade
Introduction Les différentes expériences de construction d'un dictionnaire morphologique électronique du serbo-croate, d'après le modèle du système DELA des mots simples du français, décrit dans M. Gross (1989a), B. Courtois, M. Silberztein (1990), M. Silberztein (1993), montrent que la manière dont les dictionnaires usuels déterminent l'entrée doit être soumise l'examen de la forme du mot vedette ainsi que des informations grammaticales associées (D. Vitas; . Krstev 1996). Le processus de formation des entrées est fondé sur l'intuition lexicographique des relations formelles possibles qui existent entre les unités lexicales. L'identification de ces relations formelles et, avant tout, des relations d'équi valence se rapportant aux propriétés lexicales, permet d'organiser le dictionnaire électronique sur des principes explicites et formels. L'un des moyens de base en vue de la présentation de ces relations au niveau morphologique est offert par les automates a états finis ou, qui est équivalent, par des expressions rationnelles. Le role des expressions rationnelles est double. D'un cóté, les automates finis, sous forme des grammaires locales, sont une ma nière naturelle de représenter des faits linguistiques, ainsi qu'un moyen efficace pour la reconnaissance de l'ensemble des chaines qu'ils décrivent (M. Gross 1997b). De l'autre côté, les expressions rationnelles permettent de définir formellement les relations entre les mots, lesquelles sont alors un outil pour une classi fication précise et exhaustive des propriétés lexicales, et de ce fait un cadre méthodologique pour les recherches en morphologie.
1. La morphologie flexionnelle Les expressions rationnelles permettent de définir avec précision la relation entre les mots appartenant a une même classe flexionnelle. Cette relation peut être définie, pour la plupart des langues européennes, a partir du facteur droit obtenu
630
DUSKO VITAS
par la factorisation de l'expression rationnelle par laquelle sont présentés les éléments du paradigme flexionnel (la déclinaison ou la conjugaison) et ceci de la manière indiquée par M. Gross (1989b). Pour illustrer ce procédé, examinons l'exemple de la classe N36 dans le dictionnaire électronique des mots simples du français DELAS (B. Courtois 1992). Cette classe de noms, comme toute autre classe de noms en fran9ais, peut être présentée par un quadruplet contenant la description des terminaisons flexionnelles dont l'ordre détermine les valeurs associées des catégories grammaticales. La même information est présentable sous forme de l'expression rationnelle (la): (1)
a. eur/rns+rice/fs+eurs/mp+rices/fp b. act(eur/ms+rice/fs+eurs/mp+rices/fp)
Un exemple prototypique de cette classe peut être le nom acteur comme dans . Courtois (1992): la factorisation des formes fléchies (lb) de ce nom donne un facteur droit égal a (la). Dans cette interprétation de la classe N36, le nom acteur peut être considéré comme le représentant canonique de la classe d'équivalence, et ceci dans deux relations d'équivalence différentes. a) La première est celle qui rassemble les formes fléchies sous un même lemme. C'est ainsi que dans l'exemple ci-dessus, acteur apparaït comme le représentant canonique de son paradigme flexionnel. En d'autres termes, l'entrée acteur repré sente au niveau du dictionnaire DELAS d'autres formes fléchies, par exemple actrice ou acteurs du dictionnaire DELAF. Un tel choix du représentant cano nique est conditionné par la tradition lexicographique mais, du point de vue purement formel, il n'y a pas de raisons a priori pour que le représentant canonique ne soit n'importe quelle autre forme du paradigme flexionnel. b) La seconde relation d'équivalence pourrait être nommée la relation de «l'égalité flexionnelle». Elle est définie de la façon suivante pour les noms: deux noms sont dans la même classe d'equivalence si et seulement si les facteurs droits, issus de la factorisation de leurs paradigmes flexionnels, sont égaux. Ainsi, le nom acteur peut être considéré comme le représentant canonique de la classe N36: le facteur droit dans la factorisation de son paradigme flexionnel est le même que pour les autres noms appartenant a la classe N36, par exemple fondateur, lecteur, etc. Dans ce cas, si Ton note par le symbole f= la relation d'«égalité flexionnelle», on pourrait parier d'égalité parmi les noms de la classe N36 , comme dans (2a), car la factorisation de leurs paradigmes flexionnels donne la même expression rationnelle (2b) que dans le facteur droit (la): (2) a. «acteur» f= «fondateur» f= «lecteur» f= ... b. (act + fondat + lect+ ...)
(eur/ms+rice/fs+eurs/mp+rices/fp)
De même, si Ton note l'inégalité par f!=, on obtient: (3)
«acteur» f!= «vendeur» ou «acteur» f!= «auteur»
MORPHOLOGIE DÉRIVATIONNELLE
631
puisque le résultat de la factorisation est différent: par exemple, auteur est dans la classe N31 décrite par l'expression ε/ms+ε/fs+s/mp+s/fp. Dans les langues dont la morphologie des noms est riche, telles les langues slaves, et le serbo-croate en particulier, le facteur droit a la même fonction classificatoire dans la description de la flexion. Par exemple, examinons les déclinaisons des noms glumac (acteur) et glumica (actrice) qui sont des équivalents sémantique de l'entrée française acteur. Les classes flexionnelles de ces noms en serbo-croate sont respectivement N17.11 i N71.01 (D. Vitas 1993), décrites par les expressions rationnelles suivantes:1 (4)
a. N17.11 ac/ns+ca/gs,as+cu/ds,ls+ce/vs+corn/is+ ci/np, vp+aca/gp+cima/dp, lp, ip+ce/ap b. N71.01 a/ns,gp,ap+e/gs,vs,np,vp+i/ds+u/as+om/is+arna/dp,lp,ip
Ces classes sont nettement distinguées des classes non-marquées des noms du même type de déclinaison: (5) a. N01.01: ε/ns+a/gs,as,gp+u/ds,ls+e/vs,ap+om/is+i/np,vp+irna/dp,lp,ip b. N70.01: a/ns,gp,ap+e/gs, np,vp+i/ds, ls+u/as+o/vs+om/is+ama/dp, lp, ip Pour abréger la citation des classes, nous n'allons indiquer que la chaine précédant la marque ns et le code de la classe. 'est ainsi que la classe du nom glumac sera marquée par ac;N17.11 et le cas non-marqué par ε, N01.01. A tout mot flexionnel du serbo-croate est associé au moins Tune de ces expressions rationnelles. La factorisation du paradigme flexionnel est étroitement liée avec la liste des valeurs fïxées des paramètres morphographématiques qui déterminent les spécificités de chaque classe. Ces paramètres peuvent être présentés comme des propriétés binaires qui décrivent les conditions morphographématiques nécessaires pour former les formes fléchies. De cette manière, la définition morphographématique représente «l'explication grammaticale» des facteurs droits comme une expression formelle des propriétés utilisées au niveau morphophonologique pour expliquer les relations entre la forme d'entree et des formes fléchies. A partir de la forme canonique de Pentrée et de la définition morphographématique, il est possible de générer automatiquement des formes fléchies (D. Vitas 1997). Par exemple, la définition morphographématique peut comprendre Pindicateur de Pexistence d'un a mobile (au nominatif singulier et génitif pluriel) ou bien de la palatalisation (au vocatif singulier), comme c'est le cas de la classe N17.11 dans (4a). Le rapport de la définition morphographématique et de l'expression rationnelle permet de décrire avec précision les conditions de la classification extensive des unités lexicales au niveau de la morphologie flexionnelle dans le sens proposé par M. Gross (1975). 1
pour nominatif, g pour génitif, d pour datif, etc.; s pour singulier, p pour pluriel; le symbole / est un méta-symbole séparant la terminaison et les valeurs des catégories grammaticales, ε: séquence vide.
632
DUŠKO VITAS
2. La morphologie dérivationnelle Les expressions rationnelles peuvent aussi être appliquées de deux façons au niveau de la morphologie dérivationnelle. Le premier aspect, mis sous la forme d'automates a états finis, a été élaboré par M. Gross (1989b, 1997a). Par rapport à l'autre aspect de l'usage des expressions rationnelles, en tant que moyen de classification, la factorisation des paradigmes dérivationnels n'est plus justifiée comme dans le cas de la morphologie flexionnelle (M. Gross 1989b). Les raisons en sont multiples et, tout d'abord, elles résultent du fait que le facteur droit rassemble des segments qui ne doivent avoir aucune signification morphologique. Même si l'on néglige cet aspect de factorisation, l'expression rationnelle d'une familie de mots rassemble les mots qui, en dehors des rapports dérivationnels, n'ont pas d'autres propriétés communes. Un tel exemple est offert par le dictionaire dérivationnel du russe (A. N. Tihonov 1990) qui décrit les dérivations en partant d'un radical déterminé. La structure de Particle dans dictionnaire est telle qu'il est possible de construire directement l'automate fini associé au paradigme dérivationnel. Mais lors de l'implantation des automates finis constants a partir de dictionnaire, le résultat de la reconnaissance pour un mot donné serait sa base lexicale et son analyse dérivationnelle, mais pas les relations qui existent entre certaines formes dérivées. Même si Ton pouvait trouver une justification a la factorisation des paradigmes dérivationnels, la variabilité et la productivité des moyens dérivationnels ne permettrait pas d'établir un système analogue a une description exhaustive permettent l'établissement de «l'égalité dérivationnelle». Pourtant, dans certains cas, la factorisation des mots dérivés peut contribuer a apporter une réponse aux hésitations ou combler les manques de la pratique lexicographique. Dans les dictionnaires électroniques, le problème de la structure de l'entrée peut être abordé de différentes façons, comme par exemple, a la manière proposée par D. Clemenceau (1993) ou, récemment, par Mota. La question que nous allons examiner ici est posée de la façon suivante: quel rapport peut-on établir entre certains éléments du paradigme dérivationnel et sa base au sein du dictionnaire électronique et est-il possible d'élargir la notion de classe flexionelle de manière a les intégrer, tout en gardant certaines propriétés de l'égalité flexion elle? La motivation pour un tel examen est issue de l'analyse des dictionnaires usuels, et tout particulièrement du serbo-croate. L'analyse des deux dictionnaires du serbo-croate (RMSMH, V. Anić 1998), montre que 25 a 30% des entrées sont le résultat d'une dérivation et sont caractérisées par des définitions-clichés. Ces entrées sont, en général, le résultat d'une dérivation structurale, réalisée le plus souvent par suffixation. La dérivation structurale change éventuellement la partie du discours, sans changer la signification lexicale de base. La stéréotypie de la définition s'exprime de Tune des deux façons suivantes. La première façon consiste en une description de la signification du mot dérivé s'appuyant sur la signification du mot de base. Pour illustrer ce type de descrip-
MORPHOLOGIE DÉRIVATIONNELLE
633
tion, examinons la série suivante d'entrées dans RMSMH: (6) a. forme du féminin: b. adjectif possessif:
adverbe
glumica, Nf. = žena (koja je) glurnac (actrice, = femme (qui est) l'acteur) glumcev Adj. = koji pripada glumcu (= qui appartient à l'acteur) glumicin Adj. = koji pripada glumici (= qui appartient a l'actrice) glumacki Adv. = kao glurnac (= comme un acteur)
Tous ces mots dérivés sont habituellement des entrées séparées dans les dictionnaires du serbo-croate, a cause des changements, soit de la classe flexionnelle, soit des parties du discours. L'autre type se réduit a Pindication du code du procédé dérivationnel qui relie le mot dérivé et celui de sa base. Telle est la façon de marquer les valeurs amplifiant des noms. Par exemple: (7)
a. glumcic Nm = dem. i hip. od glurnac (RMSMH) (dim. et hyp. de Pacteur) b. glumcic Nm = 1. dem. i hip. od glurnac 2. pejor. (Anic) (1. dim. et hyp. de Pacteur 2. péj.)
La marque pour le diminutif dem, signale que la forme glumcic est dérivée par le suffixe -ić à partir de la base glurnac. Si ces entrées serbo-croates sont reproduites fidèlement dans le dictionnaire électronique, plusieurs effets indésirables apparaissent. Citons-en quelques-uns. 1) Les dictionnaires enregistrent uniquement les occurrences des phénomènes de dérivation structurale attestés dans le corpus, quoiqu'il s'agisse d'une possibilité du système morphologique. Ainsi, par exemple, dans RMSMH, sloncic n'est pas enregistré comme une entrée, bien qu'il se construise sur le même modèle que glumcic et qull puisse avoir la même définition: diminutif de slon (éléphant). Le besoin d'une description exhaustive exige que toutes ces entrées soient générées avec leur base. 2) En séparant, par exemple, le diminutif dans une entrée a part, selon la structure de la définition, on trouve un pointeur de la forme dérivée vers le mot de base, mais pas l'inverse. A côté de l'entrée glurnac, il n'existe pas de pointeurs vers les mots qui en sont dérivés par dérivation stracturale (par exemple, glumica ou glumcic). 3) Certaines significations des entrées témoignent souvent de procédés dérivationnels différents (D. Vitas 1999).
634
DUŠKO VITAS
3. Les modificateurs nominaux Nous allons examiner des dérivations d'une entrée avec des modificateurs nominaux qui sont un exemple restreint de la dérivation structurale. Les modi ficateurs nominaux seront considérés comme des procédés de la dérivation structurelle qui ne changent pas de parties du discours. Le modificateur nominal per met, a partir d'un nom, d'en former un autre par suffixation, sans changer la signification lexicale. Deux classes importantes de modificateurs nominaux en serbo-croate sont la mutation du genre et l'amplification (qui est un moyen de formation des diminutifs et des augmentatifs). 3.1. Mutation du genre En français, la mutation du genre d'un nom est considéré comme une question de flexion, que montre l'exemple (1) de la classe N36. Dans cette classe, le rapport entre les formes acteur et actrice est marqué par la mutation du genre. Dans les langues slaves, la formation des mots qui désignent des êtres du sexe féminin est étroitement liée a la formation des mots indiquant des êtres du sexe masculin. Les suffixes qui réalisent un tel procédé dérivationnel sont appelés les suffixes de mutation. Le rôle du suffixe de mutation se réduit a marquer l'opposition masculin/féminin (B. Coric 1982). La mutation produit d'habitude le changement de la classe flexionnelle. B. Coric distingue deux types de mutations: Tune a partir du radical défectif et l'autre a partir du radical intégral du nom désignant le sexe male. Le premier type de mutation a déja été illustré dans l'exemple (4). Dans ce cas, la mutation est effectuée par le choix d'un suffixe pour la base commune glum-. Au suffixe -ac est attribuée la classe N17.11 et au suffixe-ila classe N71.01. Considérons la paire 'mutative' comme une expression rationnelle: La factorisa tion donne l'expression suivante: (8)
glum(ac; N17.11 + ica; N71.01)
L'autre type de mutation implique que le nom désignant le sexe féminin sera dérivé a partir du nom intégral désignant le sexe masculin. Les exemples pour la mutation de ce type présentent les paires: (9)
a. profesor+ka > profesorka (professeur) b. doktor+ka > doktorka (docteur > doctoresse) pekar+ > pekarka (boulanger > boulangère)
ou
profesor+ica > profesorica
ou
doktor+ica > doktorica ucitelj + ica > uciteljica (instituteur > institutrice)
Si l'on forme des expressions rationnelles a partir des paires (9) et si l'on effectue la factorisation d'après le type de suffixe mutatif (-ka ou -ica), on obtient:
MORPHOLOGIE DÉRIVATIONNELLE
(10)
635
(profesor+doktor+pekar+...) (e;N01.01 + ka;N73.01) (profesor+doktor+ucitelj+...) (e;N01.01 + ica;N71.01)
La factorisation montre que ces deux types de mutation, en fait, ne diffèrent pas au niveau de leur structure. En comparant les modèles (8) et (10), on voit que la forme masculine, comme la forme féminine, est réalisée par le choix de la classe flexionnelle déterminée. Le modèle de la mutation a partir du radical inté gral présente, de fait, le choix de la classe non-marquée comme dans (5a). La construction de l'expression rationnelle qui présente la mutation du genre exige d'ajouter la valeur du sexe aux éléments de la classe. Par le marquage explicite du sexe avec les valeurs M (pour le masculin) ou F (pour le féminin) devant le code de la classe, on obtient le schéma unique de mutation du genre: (11) a. (glum+vest+star+...) (ac; M: N17.11+ica; F: N71.01) b. (profesor+doktor+pekar+...) (e; M:N01.01+ka; F: N73.01) (profesor+doktor+ucitelj+.„) (e; M: N01.01+ica; F: N73.01) Le groupement des classes flexionnelles ainsi formalisées peut faire l'objet d'un recensement exhaustif. De plus, la relation d'égalité flexionnelle est prolongée de façon naturelle en incluant la mutation de genre. La possibilité de choix de suffixes différents pour la mutation du genre (par ex. -ka u (11b) i -ica u (11c)), présente un cas analogue a celui issu de la variation des propriétés binaires dans la définition morphographématiques (D. Vitas 1997). 3.2. L 'amplification Par amplification des noms, nous allons considérer le changement de la grandeur (ou du volume) de la signification des noms, l'aide des modificateurs mis en jeu pour la formation des diminutifs et des augmentatifs. La lexicographie serbocroate traditionnelle relie souvent la signification hypocoristique pour le diminutif et la signification péjorative pour l'augmentatif. Mais, au niveau dérivationnel, en général, rapport ne peut pas être établi. Le diminutif et l'augmentatif peuvent prendre, en fonction du contexte, soit une signification péjorative, soit une signifi cation hypocoristique. A titre d'exemple, examinons l'amplification du nom glumac. Les dictionnaires analysés montrent que glumcic (7) est la forme diminutive pour le nom glumac. De même, dans (12), glumcina est sa forme augmentative: (12) a. glumcina m i f. b. glumcina f
= augm. i pej. od glumac (RMSMH) = (m i f sex) augm. od glumac (Anić)
La mutation du genre dans Pexemple (12) montre que le nom glumcina a le fémi nin comme genre grammatical, mais il représente aussi l'augmentatif des noms glumac et glumica, déja examiné dans (8). Le suffixe du diminutif -cic dans (7) appartient a la classe N01.01, tandis que le suffixe de Paugmentatif -cina dans
636
DUSKO VITAS
(12) appartient a la classe N70.01. La factorisation de l'expression rationnelle donne comme dans l'exemple (8): (13) glum(ac; N17.11 + cic; N01.01 + cina; N70.01) Le même modèle est appliqué aux segments du facteur gauche dans (11b): (14) (profesor+doktor+pekar)(e; N01.01+čić; NOl.Ol+čina; N70.01) Dans le cas général, donc, l'amplification des noms de la première déclinaison a la même structure formelle que nous avons rencontrée pour la mutation du genre. Ici, aussi, sont possibles certaines variations pour le choix du suffixe de l'amplification, mais elles ne sortent pas du cadre de la structure décrite dans (13) et (14). L'élargissement de la classe flexionnelle de base peut être effectué par l'introduction des marques de genre et d'amplification (D pour le diminutif et A pour Paugmentatif) avec les suffixes -čic et -čina, sans toucher a la relation d'égalité flexionnelle. Par exemple: (15) glum(ac; m: N17.11 + cic; m:dem:N01.01 + cina; f.aug: N70.01) Les noms du deuxième groupe de déclinaison présentent la même régularité dans l'amplification. Le modèle général pour la forme du nominatif singulier de cette déclinaison peut être décrit par les expressions rationnelles: - pour le diminutif (et, éventuellement, pour l'hypocoristique): (e+ (ič)* (ic)) a - pour l'augmentatif (et, éventuellement, pour le péjoratif): (e + (e + ič) (etin)) a Ce modèle est suivi par la plupart des noms de la deuxième déclinaison: drzava (Etat), glava (tête), sreća (bonheur), bomba (bombe), etc. ce qui donne l'expression rationnelle suivante: (16) (drzav+glav+srec+ bomb+...)((£ + (e + ic)(etin))/aug (ε + (ic)*(ic)))/dema Le même processus de formation des diminitifs et des augmentatifs peut être constaté dans la plupart des autres classes flexionnelles, mais avec une expression rationnelle de structure différente. On peut noter que les amplificateurs introduisent dans la flexion des noms un phénomène analogue a celui observé pour les adjectifs et les adverbes.
4. La structuration de l'entrée Les conséquences de Panalyse des modificateurs nominaux sur la structure de Pentrée dans le dictionnaire serbo-croate de type DELAS, et également DELAF, changent la forme habituelle de Pentrée. Les factorisations présentées par les expressions (11), (15) et (16) permettent d'envisager la possibilité d'entrées multi ples. En cas de mutation du genre, le paradigme flexionnel du nom peut être décrit
MORPHOLOGIE DÉRIVATIONNELLE
637
par une paire ordonnée dont les éléments sont respectivement les classes flexionnelles marquées par les valeurs du paramètre du sexe: M ou F. Dans le cas de amplification, le paradigme flexionnel peut être présenté comme un triplet ordonné qui indique les classes du nom de base, de son diminutif (D) et de son augmentatif (A). L'unification de ces deux modifications établit une échelle pour les six éléments qui représentent les classes flexionnelles que le système dérivationnel choisit pour marquer la mutation du genre et l'amplification. Dans l'exemple (17a) sont présentées les entrées des dérivés du nom glumac dans le DELAS, sans tenir compte des modificateurs nominaux. Dans (17b) est présentée l'entrée du même nom mais avec la structure de la classe flexionnelle complexe (abrév. CFC) construite l'aide des modificateurs nominaux. Les exemples (18a-b) correspondent a l'extrait du DELAF, limité aux formes du génitif singulier, pour les entrées (17a-b). (17) a. glumac. N17.11 glumica. N71.01 glurncic. N01.01 glumcina. N70.01 b. glumac. CFC: glumac M - -:N17.11 glumica F - -:N71.01; glurncic MD -: N01.01; glumicica F D -: N71.01; glumcina M - A: N70.01 glumcina F - A: N70.01 (18) a. glumca, glumac.N:mgs glumice, glumica.N:fgs glumicice, glumicica.N:fgs glumcica, glumčić.N:mgs glumcine, glumcina. N: mgs+N:fgs b. glumca, glumac .CCN: N17.11 :M--mgs glumice, glumac .CCN:N71.01:F--fgs glumcica, glumac .CCN:N01.01:MD-mgs glumicice, glumac. CNN:N71.01:FD-fgs glumcine, glumac .CCN:N70.01:M-Afgs+F-Afgs
Conclusion La description des classes flexionnelles du serbo-croate peut être élargie de telle manière que le DELAF comprenne une partie importante des processus considérés par la grammaire traditionnelle comme le résultat d'une dérivation. Ceci est démontré par Pexemple des modificateurs nominaux, mais cette approche peut
638
DUSKO VITAS
être prolongée pour englober d'autres processus de dérivation structurale (par exemple les adjectifs possessifs illustrés dans (6) (L. Zlatic 2000)), réalisant ainsi une importante compression de la taille du dictionnaire de type DELAS pour le serbo-croate.
Références Anic, Vladimir. 1998. Rjecnik hrvatskoga jezika (trece izdanje). Zagreb: Novi Liber. Courtois, Blandine; Max Silberztein (eds.).1990. Dictionnaires électroniques du français. Langue française 87. Paris: Larousse. Courtois, Blandine. 1992. Dictionnaire électronique des mots simples du franqais DELAS V07-E1. Paris: LADL. Clemenceau, David. 1993. Structuration du lexique et reconnaissance de mots dérivés. Thèse de Doctorat d'informatique fondamentale, Université Paris 7, LADL,CERIL. Coric, Bozo. 1982. Mocioni sufiksi srpskohrvatskom jeziku. Monografije LIII. Beograd: Filoloski fakultet, Univeriztet u Beogradu. Gross, Maurice. 1975. Méthodes en syntaxe. Paris: Hermann. Gross, Maurice. 1989a. La construction de dictionnaires électroniques. Annates des télécommunications 44: 1-2. Gross, Maurice; Dominique Perrin (eds.). 1989b. Electronic Dictionaries and Automata in Computational Linguistics. Lecture Notes in Computer Science, Berlin: Springer Verlag. Gross, Maurice. 1997a. Synonymie, morphologie dérivationnelle et transfor mations, Langages 128, Paris: Larousse. Gross, Maurice. 1997b. The Construction of Local Grammars. In E. Roche ; Y. Schabes (eds.) Finite State Language Processing, Cambridge, Mass.: The MIT Press. RMSMH, 1967. Recnik srpskohrvatskoga knjizevnog jezika, vol. 1-6. BeogradZagreb: Matica Srpska, Matica Hrvatska. Silberztein, Max D. 1993: Le dictionnaire électronique et l'analyse automatique de textes: Le systeme INTEX. Paris: Masson. Tihonov, A.V. 1990. SlovoobrazovateVnyj slovar' russkogo jazyka. Moskva: Russkij jazyk. Vitas, Dusko. 1993. Matematicki model morfologije srpskohrvatskog jezika (imenska fleksija). Beograd: Matematicki fakultet, Univerzitet u Beogradu. Vitas, Dusko; Cvetana Krstev. 1996. Tuning the Text with an Electronic Dictionary. In: Ferenc Kiefer, Gabor Kiss, Julia Pajzs (eds): Papers in Computational Lexicography, COMPLEX'96, Budapest: Hungarian Academy of Sciences.
MORPHOLOGIE DERIVATIONNELLE
639
Vitas, Dusko. 1997. O elementamoj morfografemskoj klasi. In Naucni sastanak slavista Vukove dane "Meduodnos gramatike i recnika srpskom jeziku", 26/2, Beograd: MSC. Vitas, Dusko; Cvetana Krstev. 1999. The Flexible Entry. In Proceedings of the 3rd Conference of Formal Descriptions of Slavic Languages, Leipzig: Uni versity of Leipzig. Zlatic, Larisa, Stephen Wechsler. 2000. A Theory of Agreement and Its Appli cation to Serbo-Croatian. Language.
Summary The traditional representation of nominal inflection in Serbo-Croatian lexicography cannot link the entries between which a close derivational relationship exists. In the dictionary, this relationship is usually expressed by a stereotyped definition that is based on the meaning of the basic entry. Two types of nominal modifiers of this kind are discussed in this paper: modifiers for gender mutation and modifiers for amplification (formation of diminutives and augmentatives). It is shown that both modifiers form the new noun from the initial one according to the same model and in the way that the nominal inflective class is described. The extension of the traditional nominal class can thus be seen as a tuple of the elementary morphographemic classes that describe the derivations of the basic entry. The consequences of such an extension of the nominal inflective class to the development of the electronic dictionaries of simple words DELAS and DELAF are examined.
UNE GRILLE D'ANALYSE POUR LES PRÉDICATS NOMINAUX ROBERT VIVÈS Université de Paris VIII et LLI, UMR 7546
Introduction Les quelques pages qui suivent voudraient témoigner de l'admiration et de l'affection que j'ai porté a Maurice Gross pendant de longues années. Elles ont pour thème les substantifs prédicatifs, qui faisaient l'objet de mon travail de troisième cycle sous sa direction au LADL, thème sur lequel nous avons continué a travailler au LLI sous la houlette de Gaston Gross, dans le cadre de l'équipe Lexique et Grammaire, dont ce bref texte se propose de façon synthétique de présenter les résultats.
1. Rappel de quelques généralités Un substantif prédicatif est actualisé par un /des verbe(s) support(s) qui porte(nt) les marques de temps, personne, nombre et des indications d'aspect. Les phrases sont de forme: Nsujet Vsup Npréd (en position de complément direct) (E + Prép N1): Luc donne une gijle à Max ou Npréd Vsup (E + Prép N\) (E + Prép N2), N1 et N2 pouvant être des arguments ou des circonstanciels plus ou moins obligatoires: Un orage s 'est produit hier sur la région de Tours Les propriétés des phrases nominates prédicatives sont distinctes, d'une part, de celles des phrases ou le prédicat est un verbe et, d'autre part, de celles des phrases où le prédicat est une locution verbale (« verbe composé »)1. Dans tous les cas, c'est le prédicat qui sélectionne le nombre et la nature lexico-sémantique de ses arguments (M. Gross 1981). C'est pour cette raison que les études réalisées au 1
Voir, entre autres, Vivès (1998), pour des exemples portant sur une sous-classe de prédicats de .
642
ROBERT VIVÈS
LADL sur les prédicats verbaux distributionnels, simples ou composés (Lamiroy 1998), ont comme entrées les prédicats verbaux eux-mêmes: ce sont des constantes et les propriétés distributionnelles et syntaxiques des arguments, qui permettent de caractériser les différents « emplois », sont a juste titre considérées comme des variables. Si, dans un premier temps, les études consacrées aux substantifs prédicatifs ont eu comme entrées les verbes-supports basiques {avoir, donner, faire, etc.), c'est parce que le domaine a défricher était pratiquement inexploré et que le modèle de description des prédicats verbaux avait fait ses preuves. Ces travaux ont d'ailleurs apporté nombre d'informations entièrement nouvelles (Lamiroy 1998), a partir desquelles on peut aujourd'hui proposer un autre type de description que nous esquisserons ci-après.
2. Une grille d'analyse de prédicat nominal Dans une phrase nominale prédicative, les propriétés dépendent du Npréd. Pour différentes raisons, aspectuelles et sémantiques pour la plupart, on observe des compatibilités diverses entre un Npréd et l'ensemble des verbes-supports possi bles. Mais les verbes-supports ne sont que des variables, au même titre que les autres propriétés qui caractérisent les phrases auxquelles peut donner lieu tel ou tel Npréd: contraintes sur les déterminants, contraintes sur la combinatoire possible avec d'autres éléments du lexique (autres prédicats, adjectifs, adverbes, etc), contraintes sur les effacements possibles de certains arguments dans les groupes nominaux. Toutes ces raisons font que l'étude des noms prédicatifs ne peut être faite qu'a partir de chaque substantif dont il convient de recenser les diverses propriétés caractéristiques. Les propriétés essentielies des phrases nominales prédicatives sont: - l'impossibilité de nominaliser le verbe support pour former un groupe nominal: * le don d'une gifle * la production d'un orage - l'effacement possible du verbe support dans un groupe nominal reprenant tout ou partie des arguments de la phrase de départ: Cette gifle de Luc a Max a surpris tout le monde L'or age d'hier sur la région de Tours a fait de gros dégats - une combinatoire lexicale spécifique en ce qui concerne, entre autres, l'aspect, la cause, diverses restructurations2 (cf. les rubriques 5 a 14 ci-après, §3).
2
Ce dernier terme est utilisé ici dans un sens plus général que celui que lui donne Guillet et Leclère(1981).
GRILLE D'ANALYSE POUR LES PRÉDICATS NOMINAUX
643
Une collaboration entre le LLI de Paris XIII et le CIS de l'Université de Munich a abouti a la mise au point d'une grille de description qui comporte quatorze rubriques nécessaires pour recenser la majeure partie des propriétés caractéristiques des substantifs prédicatifs, regroupés en classes et en sous-classes sémantiques établies, par domaines, sur des bases lexicales et syntaxiques (cf., entre autres, G. Gross 1998, F. Guenthner 1998, D. Le Pesant et M . MathieuColas 1998, R.Vivès 1998). Voici la liste des rubriques retenues, que nous ne commentons pas plus avant, mais dont la signification précise apparaïtra clairement, pensons-nous, dans les exemples de grilles données aux § 3 et 4 ci-après: - Nom de la classe sémantique - Nombre et nature sémantique des arguments: N0: /(E + Prép)N1: /(E + Prép)N2 - Verbe(s) support(s) basique(s) - Déterminants - Verbes supports aspectuels: duratif, inchoatif, intensif, itératif, ponctuel, progressif, terminatif - Verbes supports appropriés - Verbes supports métaphoriques - Restructurations - Constructions causatives sur le verbe support - Prédicats verbaux appropriés - Prédicats nominaux appropriés - Prédicats adjectivaux appropriés - Adverbes appropriés - Constructions événementielles
3. Grille monolingue d'analyse de prédicats nominaux 1)
Nom de la classe sémantique: <EVEN:météo> Orage, bourrasque, giboulée, ouragan, tempête, tornade, tourmente, typhon
2)
Nombre et nature sémantique des arguments: NPréd: orage /N1: Prép Ntemps/N2'. Prép Nloc
3)
Verbes supports basiques: avoir lieu, se produire Un orage ulieu /s'estproduit hier dans le sud du département
4)
Déterminants: un, des, plusieurs, une vague de, une série de
5)
Verbes supports aspectuels: Duratif: s'éterniser Éventuel: menacer
644
ROBERT VIVÉS
Inchoatif: arriver, gronder, s'annoncer, se former, se développer, se pré parer Intensif: faire rage, se déchainer Itératif: recommencer, revenir, se succéder Ponctuel: éclater, se déclencher, se lever, survenir Progressif: redoubler (de violence), s 'intensifier Terminatif: cesser, être passé, s'apaiser, s'arrêter, se dissiper, s'eloigner 6)
Verbes supports appropriés: frapper Nloc, s 'abattre sur Nloc
7)
Verbes supports métaphoriques: cingler Nloc, s'étaler sur Nloc, s'étendre sur Nloc
8)
Restructurations: Nloc/Nohum connaître, essuyer, subir, être victime de Dét orage Prép Ntemps
9)
Constructions causatives sur le verbe support: causer, déclencher, être a l'origine de, être la cause de, provoquer, chasser, dissiper, éloigner
10)
Prédicats verbaux appropriés: N0nr annoncer, être un signe de, N0hum échapper a , être pris/surpris par, prévoir, voir/sentir monter Le temps être/se mettre a
11)
Prédicats nominaux appropriés: l'absence de?, l'imminence de?, la fré quence de?, la présence de?3, la violence de
12)
Prédicats adjectivaux appropriés: dévastateur, épouvantable, gros, meurtrier, violent, terrible, ponctuel, localisé, fréquent, passager, répété, immi nent, lointain, de grêle, d'été, d'hiver, tropical
13)
Adverbes appropriés: au cœur de, au milieu de, en plein, au plus fort de, sous, au sein de, a l'abri de, à l'approche de
14)
Constructions événementielles: il avoir un/de le/des
4. Grille bilingue d'analyse de prédicats nominaux 1)
Nom de la classe sémantique. Exemple: : gifle, claque, coup de pied, beigne ... Ohrfeige, Schlag, Fusstritt, Tritt...
2)
Nombre et nature des arguments: N0: hum /N1: hum /N2: (sur, a)
(auf in) Npc
Verbe(s) support(s) basiques: donner/recevoir
geben/bekommen, kriegen
3)
3
Les points d'interrogation indiquent que nous ne sommes pas sûr que ces substantifs, qui corres pondent a des phrases simples négatives ou affirmatives ou a des indications temporelles, soient a noter sous cette rubrique.
GRILLE D'ANALYSE POUR LES PRÉDICATS NOMINAUX
645
4)
Déterminants: un, des, une dégelée, une grêle, une volée
ein, 0(pluriel), ein Sack, eine Tracht
5)
Verbes supports aspectuels: Duratif: Ø Inchoatif: esquisser Intensif: asséner Itératif: bourrer de Ponctuel: Ø Progressif: Ø Terminatif: Ø
6)
Verbes supports appropriés: coller, flanquer, porter I versetzen, verpassen
7)
Verbes supports métaphoriques: administrer / verabreichen
8)
Restructurations: a reçu une gijle de A / B hat von A eine Ohrfeige bekommen
9)
Constructions causatives sur le verbe support: Ø
10)
Prédicats verbaux appropriés: esquiver / ausweichen (dat), sich einfangen
11)
Prédicats nominaux appropriés: Ø
12)
Prédicats adjectivaux appropriés: violent /gewaltig, saftig, ordentlich
13)
Adverbiaux appropriés: en pleine poire, sur Npc / in die Fratze
14)
Constructions événementielles: Les coups pleuvent / Es hagelt Schlage
5. Conclusion Ce format de description permet de cerner et donc de prendre en compte dans des lexiques bi- ou multilingues les différences de fonctionnement entre les langues. On rencontre différents cas, par exemple en ce qui concerne le fran9ais et l'allemand: - propriétés formelles correspondantes: Tom macht Bernd einen Vorwurf = Tom fait un reproche a Bernd - variation des déterminants: Tom erhebt Einspruch bei Bernd = Tom fait une objection a Bernd (Dét vide vs Indéf sing: Tom singt ein Loblied auf Bernd = Tom chante les louanges de Bernd (Dét sing vs Dét plur)
ROBERT VIVÈS
646
- changement de catégorie du prédicat: chanter les louanges de N\ a N2 a les propriétés d'une locution verbale en français, tandis qu'en allemand l'équivalent a les propriétés d'une construction nominale prédicative: Tom 's Loblied auf Bernd et das Loblied, das Tom auf Bernd gesungen hat Il sera sans doute nécessaire de faire figurer dans cette grille d'autres informations qui pourraient s'avérer indispensables et elle est donc conçue comme un outil provisoire. Dans cette perspective, nous sommes en train d'affiner le cadre de la rubrique portant sur les aspects, dont la formulation n'est actuellement pas complètement satisfaisante, surtout en ce qui concerne des langues qui marquent ces traits sémantiques autrement que le français.
Références Barra-Jover, Mario. 1999. L'opposition abstrait/concret et la dimension spatiotemporelle. Travaux de Linguistique 38, 29-61, Louvain-la-Neuve: Duculot. Gross Gaston. 1998. Pour une typologie des prédicats nominaux. In Prédication, assertion, information. Actes du colloque d'Uppsala en linguistique française, 6-9 juin 1996. Gross, Gaston ; Ferenc Kiefer. 1995. La structure événementielle des substantifs. Folia Linguistica, Acta Societatis Linguisticae Europaeae, I,1-2, 43-65. Gross, Gaston. 1993. Trois applications de la notion de verbe support. L'Infor mation grammaticale 59, 16-22, Paris. Gross, Gaston. 1996. Prédicats nominaux et compatibilité aspectuelle. Langages 121, Paris: Larousse, 54-72. Gross, Maurice. 1981. Les bases empiriques de la notion de prédicat sémantique. Langages 63, 7-52, Paris: Larousse. Gross, Maurice. 1998. La fonction sémantique des verbes supports. Travaux de Linguistique 37, 25-46, Louvain-la-Neuve: Duculot. Guenthner, Franz. 1998. Constructions, classes et domaines: concepts de base pour un dictionnaire électronique de l'allemand. Langages 131, 45-55, Paris: Larousse. Guillet, Alain; Christian Leclère, 1981, La restructuration du groupe nominal, Langages 63, 99-126, Paris: Larousse. Karolak, Stanislaw. 1998. Remarques sur l'aspect des noms abstraits. In La ligne claire. De la linguistique a la grammaire. Mélanges offerts a Marc Wilmet a l'occasion de son soixantième anniversaire, A. Englebert, M. Pierrard, L. Rosier, D. van Raemidonck (eds), 212-228, Bruxelles: Duculot. Kiefer, Ferenc. 1998. Les substantifs déverbaux événementiels. Langages 131, Paris: Larousse. Kiefer, Ferenc. 2000. Structure argumentale / structure événementielle. In Lexique, Syntaxe et Sémantique . Mélanges offerts a Gaston Gross a l'occasion de
GRILLE D'ANALYSE POUR LES PRÉDICATS NOMINAUX
647
son soixantième anniversaire, P.A. Buvet, D. Le Pesant, M. Mathieu-Colas (eds.), 379-389, Besan9on: BULAG. Lamiroy, Béatrice. 1998. Le lexique-grammaire. Essai de synthèse, Travaux de Linguistique 37, 7-23, Louvain-la-Neuve: Duculot. Le Pesant, Denis ; Michel Mathieu-Colas. 1998. Introduction aux classes d'objets. Langages 131, 6-33, Paris: Larousse. Lerat, Pierre. 1981. L'aspect dans le lexique français contemporain. Cahiers de Lexicologie 39, 48-54. Mel'cuk Igor et al 1988. Dictionnaire explicatif et combinatoire du français contemporain. Recherches lexico-sémantiques II, Montréal: Presses de l'Université de Montréal. Vetters, Carl. 1996. Temps, aspect et narration. Amsterdam/Atlanta: Rodopi. Vivès, Robert. 1998. Les mots pour le DIRE: vers la constitution d'une classe de prédicats. Langages 131, 64-76, Paris: Larousse. Vivès, Robert. 2001. Passer un savon vs sonner les cloches, a-t-il une différence? In Par monts et par vaux. Itinéraires linguistiques et grammaticaux, . Buridant, G. Kleiber et J.-C. Pellat (eds.), Louvain/Paris: Editions Peeters.
Summary This contribution deals with lexical, syntactic and semantic features used by researchers of the « Laboratoire de Linguistique Informatique » for decribing the most relevant proper-ties of predicative nouns in the frame of the « classes d'objets » approach. Grids of two different semantic classes of predicative nouns are presented as examples.
PUBLICATIONS DE MAURICE GROSS (1963-2002) Bibliographie établie par Takuya NAKAMURA Université de Marne-la-Vallée
Cette bibliographie a été établie a partir de diverses sources, dont notamment: Ch. Leclère & . Subirats-Rüggeberg (1991), A bibliography of studies on lexicon-grammar, Lingvisticae Investigationes XV:2, Amsterdam/Philadelphia: John Benjamins.
~~~ 1963
Linguistique mathématique et langages de programmation. Revue frangaise de traitement de l'information 4, pp. 231-253.
1964
a. Sur certains procédés de définition de langages formels. Automata Theory, New York: Academic Press, pp. 181-200. b. Inherent ambiguity of minimal linear grammars. Information and control 7, New York: Academic Press, pp. 366-368.
1966
a. On the equivalence of models of language used in the fields of mechanical translation and information retrieval. Automatic Translation of Languages, Oxford: Pergamon Press, pp. 123-137 (également dans Introduction to Infor mation Science, New York: R.R. Bowker Company, 1970, pp. 210-218; et Information Storage and Retrieval II, 1964, pp. 43-57). b. Compte rendu de l'ouvrage de Y. Bar-Hillel: Language and Information; Selected Essays on Their Theory and Application, Jerusalem Academic Press - Addison-Wesley, 1964. Foundations of Language 2, Dordrecht-Holland: D.Reidel Publishing Company, pp. 192-199. Applications géométriques des langages formels. ICC Bulletin 5, pp. 141167. d. La surveillance des effets facheux des médicaments par un système intégré. Actes du colloque international sur Vinformatique médicale, Toulouse, pp. 317-325. a. Linguistique et documentation automatique. Revue de VEnseignement Supé rieur 1-2, pp. 47-55. b. Analyse formelle comparée des complétives en frangais et en anglais. Thèse de troisième cycle, Paris: Université de la Sorbonne, 179 p. Sur une règie de cacophonie. Langages 7, Paris: Larousse, pp. 105-119. (éga lement dans La grammaire, Paris: Klincksieck).
1967
650
MAURICE GROSS
d. (avec André Lentin) Notions sur les grammaires formelles. Paris: GauthierVillars, 204 p. (préface de Noam Chomsky). e. (avecMaurice Nivat) A command language for visualization of articulated movements. Computer and Information Sciences II, New York: Academic Press, pp. 281-290. 1968
a. Grammaire transformationnelle du frangais, Vol. 1: Syntaxe du verbe. Paris: Larousse, 181 p. (réédité sous le même titre, Paris: Cantilène, 1986). b. L'adéquation des grammaires transformationnelles aux phénomènes de langue. L'Age de la Science 4, Paris: Dunod. (comme éditeur) Les modèles en linguistique. Langages 9, Paris: Larousse. d. L'emploi des modèles en linguistique. Langages 9, Paris: Larousse, pp. 3-8. e. Transformational Analysis of French Verbal Constructions. Transformations and Discourse Analysis Papers 74, University of Pennsylvania: Philadelphia.
1969
a. Lexique des constructions complétives. Thèse de doctorat d'Etat, Université Paris 7 (publié sous le titre Méthodes en syntaxe, 1975, Paris: Hermann). b. Remarques sur la notion d'objet direct en français. Langue Frangaise 1, Paris: Larousse, pp. 63-73. Compte rendu de l'ouvrage de N. Ruwet: Introduction a la grammaire générative. Lingua 24-1, Amsterdam: North-Holland Publishing Company, pp. 46-53. d. De la formalisation en linguistique. Sciences, Paris: Hermann. e. Mathématique et linguistique. Revue de l'Enseignement Supérieur 46-47, pp. 75-89.
1970
a. Compte rendu de l'ouvrage de Z. Harris: Mathematical Structures of Lan guage. Semiotica II-4, The Hague: Mouton, pp. 380-390 (également dans Transformationnelle Analyse. Die Transformationstheorie von Zellig Harris und Ihre Entwicklung, S. Plötz (ed.), 1972, Frankfurt a. M.: Athenaum, pp. 313-324). b. (avec André Lentin) Introduction to Formal Grammars. Berlin/New York: Springer Verlag (traduction de 1967d par M. Salkoff). (avec A.-M. Lyotard) Notes sur les buts et méthodes de la description linguis tique. Linguistica Matematica e Calcolatori, Firenze: Leo S. Olschki Editore.
1971
a. (comme coéditeur avec Jean Stéfanini) Syntaxe transformationnelle du fran gais. Langue Frangaise 11, Paris: Larousse. b. Grammaire transformationnelle et enseignement du français. Langue Fran gaise 11, Paris: Larousse, pp. 4-14. (avec Marcel-Paul Schützenberger) Compte rendu de l'ouvrage de Z. Harris: Mathematical Structures of Language. The American Scientist, vol. 58, 1970. (également dans Transformationnelle Analyse. Die Transforma-tionstheorie von Zellig Harris und Ihre Entwicklung, S. Plötz (ed.), 1972, Frankfurt a. M.: Athenaum, pp. 307-312.)
BIBLIOGRAPHIE 1971-72
651
Représentation de régies syntaxiques dans les grammaires transformationnelles. Dossiers pédagogiques de la radio-télévision Scolaire 2, pp. 33-36.
1972
a. Mathematical Models of Language. Englewood Cliffs, N.J.: Prentice-Hall, 159 . b. About the French Verb to know. Studia Linguistica 25-2, pp. 122-124. Notes sur l'histoire de la traduction automatique. Langages 28, Paris: Larousse, pp. 40-48. d. L'ordre de quelques transformations en malgache. Linguistique et Enseignement 2, pp. 13-16.
1973
a. Rapport sur l'étude d'un langage documentaire destiné a représenter des infor mations sur les problèmes de pollution d'environnement. Actes du colloque international de traitement automatique des longues, Pise. b. (comme coéditeur avec M. Halle et M.-P. Schützenberger) The Formal Ana lysis of Natural Languages. Proceedings of the First International Confe rence, The Hague: Mouton. Remarques sur la méthodologie de la grammaire générative transformationnelle. The Formal Analysis of Natural Languages, The Hague: Mouton, pp. 251-264. d. On Grammatical Reference. Generative Grammar in Europe, Dordrecht: D. Reidel, pp. 203-217. e. Une approche syntaxique a la structuration du lexique des verbes du fran9ais. Cours de l'école d'été de linguistique et informatique, Pise. f. Conjonctions doubles: l'exemple de ni...ni. Rapport de Recherches du LADL n°l, Paris: Université Paris 7.
1974
a. A Remark about Plural Agreement between Determiner and Noun. Linguistic Inquiry 5-4. Cambridge, Mass.: The MIT Press. b. Groupes nominaux. Objet direct sans déterminant. Cahiers d'Orientalisme et de Slavistique, Université de Provence. c. Remarques sur les processus d'apprentissage de la syntaxe d'une première langue. Problèmes actuels en psycholinguistique, Paris: Editions du CNRS, pp. 23-27 (traduction anglaise de cet article dans le même volume: Some Remarks on Syntax Acquisition in a First Language). d. La notion de groupe nominal en français. Note LADL, Paris. Actes de la 3ème école d'été en linguistique et informatique, Pise. e. Compte rendu de l'ouvrage de N. Chomsky et M. Halle: The sound pattern of English (traduction française par P. Encrevé, Paris: Le Seuil). Le Monde, 27 février 1974. f. New Formal Devices for Linguistics. Current Trends in Linguistics, vol. 12/2, pp. 985-998, The Hague: Mouton.
1975
a. Méthodes en syntaxe. Paris: Hermann. b. On the Relations between Syntax and Semantics. Formal Semantics of Natu ral Languages, Cambridge: Cambridge University Press, pp. 389-405.
652
MAURICE GROSS
c. Remarques sur le rôle de la prosodie en reconnaissance. Actes des 6èmes journées d'études de la parole, Toulouse. 1976
a. Méthodes empiriques en syntaxe. Structure et dynamique des systèmes. Séminaires interdisciplinaires du Collège de France réalisés avec la colla boration de l'Institut collégial européen et de VI.S.M.E.A., Paris: MaloineDoin,pp. 149-163. b. Une classification des déterminants et prédéterminants indéfinis du français. Grammaire transformationnelle: syntaxe et lexique, Villeneuve-d'Ascq: Publications de l'Université de Lille III, pp. 9-46. Notes du cours de syntaxe. Paris: Le Seuil (traduction française des notes de cours de Z. Harris a l'Université de Paris-Vincennes). d. (comme coéditeur avec J.-C. Chevalier) Méthodes en grammaire frangaise, Paris: Klincksieck. e. Sur quelques groupes nominaux complexes. Méthodes en grammaire fran gaise, J.-C. Chevalier et M. Gross (eds.), Paris: Klincksieck, pp. 97-119.
1977
a. Grammaire transformationelle du frangais. Vol. 2: Syntaxe du . Paris: Larousse, 256 p. (réédité sous le même titre, Paris: Cantilène, 1986). b. Remarks on the Separation between Syntax and Semantics. Studies in Descriptive and Historical Linguistics, Festschrift for Winfred P. Lehmann, Amsterdam/Philadelphia: John Benjamins, pp. 71-81. Une analyse non présuppositionnelle de l'effet contrastif. L'extraction dans 'est... Qu et la négation. Lingvisticae Investigationes 1:1, Amsterdam/ Phila delphia: John Benjamins, pp. 39-62. d. Sur quelques problèmes posés par les représentations formalisées de textes. Analyse et validation dans Vétude des données textuelles, M. Borillo et J. Virbel (eds.), Paris: Editions du CNRS, pp. 65-82.
1978
a. Observations on Semantic Theories. Theoretical Linguistics 5:1, pp. 3-17 (réédition de Logically-Based Syntax versus Autonomous Generative Syntax. Round Table Rep., 12th International Congress of Linguists, Innsbruck). b. Taxonomy in Syntax. SMIL, Journal of Linguistic Calculus 3-4, Stockholm: Skriptor, pp. 78-96. (comme coéditeur avec Ch. Leclère) Études de syntaxe frangaise. Longue Frangais e 39, Paris: Larousse. d. Correspondance entre forme et sens a propos du subjonctif. Longue Fran gaise 39, Paris: Larousse, pp. 49-65.
1979
a. On the Failure of Generative Grammar. Language 55:4, pp. 859-885. b. Linguistique taxonomique et linguistique théorique. Informatique et Sciences Humaines 11:40-41, pp. 43-58.
1980
a. Les bases empiriques de la notion de prédicat sémantique. Actes du colloque "Codages et transductions", Florence, pp. 30-94 (réédité sous le même titre, voir 1981b).
BIBLIOGRAPHIE
653
b. Informatique et enseignement du français (interview). Le Frangais Aujourd'hui, 2ème supplément au n°52, Association française des enseignants de français, déc. 1980. Deux remarques sur l'aspect. Recherches linguistiques V, Actes du colloque "La notion d'aspect", Paris: Klincksieck, pp. 69-81. d. Sur le traitement des langues naturelles et ses applications aux banques de données. Les enjeux culturels de l'informatique, Paris: La Documentation Française, pp. 120-142. 1981
a. Un adjectif épithète peut être sujet d'un verbe (lère partie). Lingvisticae Investigationes 5:1, Amsterdam/Philadelphia: John Benjamins, pp. 215-218. b. Les bases empiriques de la notion de prédicat sémantique. Langages 63, Paris: Larousse, pp. 7-52. La formalisation des langues naturelles. Pour la science 47, Paris: Belin. d. Syntaxe et poétique. Analogie et connaissance, Tome II, De la poésie a la science, Paris: Maloine.
1982
a. Une classification des phrases "figées" du français. Revue Québécoise de Linguistique 11:2, Montréal: UQAM, pp. 151-185. b. Un adjectif épithète peut être sujet d'un verbe (2ème partie). Lingvisticae Investigationes 6:1, Amsterdam/Philadelphia: John Benjamins, pp. 217-219. Simple Sentences. Text Processing, Proceedings of Nobel Symposium 51, Stockholm: Almqvist Wiksell, pp. 297-317. d. (avec J.-P. Boons, L. Danlos, A. Elia, A. Guillet et Ch. Leclère) Rapport final pour ... Intelligence Artificielle 1980 du CNRS, Paris.
1983
a. On Structuring the Lexicon. Quaderni di Semantica 4:1, Bologne: CLUEB, pp. 107-120. b. Sur quelques fonctions logicielles d'une banque de données terminologiques. Enjeux. . Round Table on Models of Lexical Structuring. Discussion. Quaderni di Semantica 4:2, Bologne: CLUEB, pp. 290-294. d. Sur quelques types de coréférence contrainte. Analyses grammaticales du frangais. Etudes publiées a l'occasion du 50eme anniversaire de Carl Vikner. Revue Romane 24, pp. 116-129. e. Quelques sources transformationnelles de formes pronominales. Langue Frangaise 57, Paris: Larousse, pp. 43-59. f. A Few Analogies with Computing. The Behavioral and Brain Sciences 6:3, pp. 407-408. g. Syntaxe et localisation de l'information. Information et Communication, Séminaires interdisciplinaires du Collège de France réalisés avec la collaboration de lTnstitut collégial européen et de l'I.S.M.E.A., Paris: Maloine, pp. 85-109. h. The Formalization of Syntactic Properties. The Arab School on Science and Technology: Damascus, pp. 79-94.
MAURICE GROSS
654 1984
a. A Linguistic Environment for Comparative Romance Syntax. Papers from the XIIth Linguistic Symposium on Romance Languages, Amsterdam/Phila delphia: John Benjamins, pp. 373-416. b. Une familie d'adverbes figés. Les constructions comparatives en comme. Revue Québécoise de Linguistique 13:2, Montréal: UQAM, pp. 237-269. Les noms traceurs. Cahiers de Lexicologie 44:1, pp. 105-136. d. Une classification des phrases « figées » du fran9ais. De la syntaxe a la pragmatique, P. Attal et C. Muller (eds.), Lingvisticae Investigationes Supplementa Vol.8, Amsterdam/Philadelphia: John Benjamins, pp. 141-180. e. Avant-propos de Lexique-grammaire des longues romanes, A. Guillet et N. La Fauci (eds.), Lingvisticae Investigationes Supplementa Vol.9, Amster dam/ Philadelphia: John Benjamins, pp. XI-XIII.
1985
a.
Sur les déterminants dans les expressions figées. Langages 79, Paris: Larousse. b. (avec Diane Tremblay) Étude du contenu d'une banque terminologique. Rapport Technique du LADL n° 9, Paris: Université Paris 7. Le traitement syntaxique des écarts. Adverbes de manière en -ment en français normé et en français québécois. Biblioteca della Ricerca: Schena editore.
1986
a. Lexique-grammaire et adverbes. Deux exemples. Revue Québéquoise de Linguistique 15:2, Montréal: UQAM, pp. 299-311. b. Grammaire transformationelle du frangais, Vol. 3: Syntaxe de l'adverbe. Paris: ASSTRIL, 670 p. Les nominalisations d'expressions figées. Langue frangaise 69, Paris: Larousse. d. Lexicon-Grammar. The Representation of Compound Words. Proceedings of COLING '86, Bonn: University of Bonn. e. Une mise a plat du français écrit. Encrage 16, Paris: Université Paris 8, pp. 51-55.
1987
a. La traduction automatique, bilan des descriptions en cours. Le Frangais dans le Monde, n° spécial: Retour a la traduction, Paris: Hachette, pp. 40-48. b. Index alphabétique des adverbes composés. Rapport n° 5 du Programme de Recherches Coordonnées "Informatique Linguistique", LADL, Paris: Univer sité Paris 7. The Formalization of Syntactic Properties. Applied Arabic Linguistics and Signal and Information Processing, New York: Hemisphere Publishing Cor poration (voir 1983h).
1988
a. La phrase élémentaire et ses composants. Une discussion de quelques exemples. Travaux de Linguistique 17, Paris/Gembloux: Duculot, pp. 13-32 b. Sur les phrases figées complexes du fran9ais. Langue Frangaise 11, Paris: Larousse, pp. 47-70. Les limites de la phrase figée. Langages 90, Paris: Larousse, pp. 7-22.
BIBLIOGRAPHIE
655
d. Methods and Tactics in the Construction of a Lexicon-Grammar. Linguistics in the Morning Calm 2. Selected Papers from SICOL 1986, Séoul: Hanshin Pub. Co, pp. 177-197. e. (comme coéditeur avec Cl. Blanche-Benveniste et A. Chervel) Grammaire et histoire de la grammaire. Hommage a la mémoire de J. Stéfanini, Aix-enProvence: Université de Provence, 494 p. f. Adjectifs composés. Grammaire et histoire de la grammaire. Hommage a la mémoire de J. Stéfanini, Aix-en-Provence: Université de Provence, pp. 211233. g. La phrase élémentaire et ses composants. Une discussion de quelques exemples. Travaux de linguistique 17. La prédication seconde, Paris/Gembloux: Duculot, pp. 13-32. h. La construction de dictionnaires électroniques du fran9ais. Traitement des langues naturelles. École d'été du CNET, pp. 5-36. i. (avec L. Danlos) Building Electronic Dictionaries for Natural Language Processing. Programming of Future Generation Computers II, K. Fuchi et L. Kott (eds.), North Holland: Elsevier Science Publishers B.V. 1989
a. The Use of Finite Automata in the Lexical Representation of Natural Language. Electronic Dictionaries and Automata in Computational Linguis tics. Lecture Notes in Computer Science, Berlin/New York: Springer Verlag, pp. 34-50. b. Les industries de la langue et l'étude du fran9ais. Longue frangaise 83, Paris: Larousse, pp. 88-100. Préface a La lingua francese nel seicento, Bari: Adriatica, Paris: Nizet. d. La construction de dictionnaires électroniques. Annates des Télécom munications. Tome 44, n° 1-2, Issy-les-Moulineaux/Lannion: CNET, pp. 419. e. Sur la structure des articles d'un lexique-grammaire. Linguistica Computazionale. Vol. VI. Computational Lexicology and Lexicography. Special Issue Dedicated to Bernard Quemada, Pise: Giardini editori e stampatori. f. (avec E. Laporte et M.-P. Schützenberger) La réforme de l'orthographe. L'informatique teste les qualités des réformes. Pour la Science 139, Paris: Belin, pp. 6-8. g. (comme éditeur avec D. Perrin) Electronic Dictionaries and Automata in Computational Linguistics. Lecture Notes in Computer Science, Berlin-New York: Springer Verlag, 110 p. h. (avec Ch. Leclère) Modèles linguistiques. Support de cours. 2ème école d'été CNET-CERIL, Lannion. i. Les logiciels de traitement linguistique. Développements et perspectives d'industrialisation. Rapport présenté a la C.E.E. j . Un long travail de fourmi qui a bouleversé le visage de la langue. Entretien avec Maurice Gross réalisé par Amr Helmy Ibrahim. Le Français dans le monde n° spécial Lexiques, Paris: Hachette, pp. 51-57. k. Qu'est-ce qu'un mot ? Le Frangais dans le monde, n° spécial Lexiques, Paris: Hachette, pp. 207-208.
656
MAURICE GROSS
1990
a. La caractérisation des adverbes dans un lexique-grammaire. Langue Fran gaise 86, Paris: Larousse, pp. 90-102. b. Argumentations nouvelles dans les discussions sur la réforme de l'orthographe. Éducation et Pédagogies n° 5, Sèvres: CIEP. Sur l'établissement d'une norme de représentation pour les langues européennes. Journal of Applied Linguistics 6, pp. 141-167. d. Sur la détermination de quantité dans les langues naturelles. Mots. Mélanges offerts à .-. Schützenberger, Lothaire (ed.), Paris: Hermès. e. Le programme d'extension des lexiques éleetroniques. Langue Frangaise 87, Paris: Larousse, pp. 123-127. f. Sur la notion harrissienne de transformation et son application au français. Langages 99, Paris: Larousse, pp. 39-56. g. La réforme de l'orthographe. Pour la science n° 156, Paris: Belin.
1991
a. Les banques de données du LADL: analyse automatique et couverture. Actes du colloque "Informatique et langue naturelle", Nantes: LIANA, pp. 361386. b. Un ordinateur peut-il comprendre une langue naturelle ? Analyse automa tique et couverture lexicale du fran9ais. Annates des Mines, Paris. Les principes de la représentation des formes figées dans le lexiquegrammaire du fran9ais. Journal de l'Association coréenne de linguistique. d. Linguistic Representations and Text Analysis. Proceedings of the 1990 meeting of the Academia Europaea, Londres. e. Dictionnaires électroniques et dictionnaires pour le grand public. Actes du colloque "Les Industries de la langue", Montréal (20-23 novembre 1990). f. Quelques problèmes de normes dans la présentation de phénomènes linguistiques. Actes du 8° Convegno Internazionale di studi canadesi, Université de Bari (25-28 avril 1990), Bari/Paris: Schena/Nizet. g. (comme coéditeur) Langage humain et machine. CNRS-PLUS, Paris: Presses du CNRS.
1992
a. Quelques réflexions sur le domaine de la traduction automatique. T.A.L. 33/12, Paris: ATALA, pp. 85-90. b. Lexique et syntaxe. Actes du colloque de lexicologie frangaise. Travaux de linguistique 23, Paris/Gembloux: Duculot, pp. 107-132. The Argument Structure of Elementary Sentences. Language Research Vol. 28-4, Seoul: Seoul National University.
1993
a. Les phrases figées en français. L'information grammaticale 59, Paris, pp. 3641. b. Lexicon-Based Algorithms for the Automatic Analysis of Natural Language. Theorie und Praxis des Lexikons. Actes du colloque "Theories and Applications of Lexicology and Lexicography", Berlin/New-York: Walter de Gruyter, pp. 218-236. Local Grammars and Their Representation by Finite Automata. Data, Description, Discourse. Papers on the English Language in honour of John McH Sinclair, M. Hoey (ed.), London: Harper-Collins, pp. 26-38.
BIBLIOGRAPHIE
657
d. Un nouvel agent en par. Langages 109, Paris: Larousse, pp. 32-34. e. Towards a Realistic Coverage of French by Electronic Dictionaries and Grammars. Actes des Premières journées franco-japonaises sur la traduction assistéepar ordinateur, Tokyo: Ambassade de France au Japon. f. Dictionnaires électroniques. Les différents niveaux de complexité (mots simples, mots composés), MED-CAMPUS, Bari, Monopoli. g. Grammaires électroniques. La phrase élémentaire et la phrase complexe. Problèmes d'analyse logique et de terminologie grammaticale, MEDCAMPUS, Bari, Monopoli. 1994
a. Dictionnaires électroniques et traduction automatique. Langages 116, Paris: Larousse, pp. 48-58. b. La structure d'argument des phrases élémentaires. Lingua Franca, C.U.M., Fasamo: Schena Editore. Perfections et imperfections du langage. Pour la Science, n°200. Paris: Belin. d. Constructing Lexicon-Grammars. Computational Approaches to the Lexicon, Oxford: Oxford University Press, pp. 213-263. e. Analyse syntaxique automatique et lexiques. Accademia pugliese delle scienze, Fasano: Grafischena, pp. 45-68. f. The Lexicon-Grammar of a Language. Application to French. Encyclopedia of Language and Linguistics, London: Pergamon Press.
1995
a. L'article indéfini de l'attribut nominal. Lexique grammaires comparés en frangais. Lingvisticae Investigationes Supplementa 17, Amsterdam/Phila delphia: John Benjamins, pp. 53-58. b. La notion de lieu argument du verbe. Tendances récentes en linguistique frangaise et générale. Volume dédié a David Gaatone. Lingvisticae Investi gationes Supplementa 20, Amsterdam/Philadelphia: John Benjamins, pp.173200. On Counting Meaningful Units in Texts. Actes des JADT 95, Rome: CISU, pp. 5-18. d. Quelques considérations sur les marques sémantiques d'un dictionnaire électronique. Lexiques-grammaires comparés et traitements automatiques, Actes du deuxième colloque international LGC, Montréal: UQAM, pp. 9-30. e. Representation of Finite Utterances and the Automatic Parsing of Texts. Languages Research 31:2, Seoul: Seoul National University, pp. 291-307. f. Une grammaire locale de l'expression des sentiments. Langue Frangaise 105, Paris: Larousse, pp. 70-87.
1996
a. Les formes Être Prép X du fran9ais. Lingvisticae Investigationes XX:2, Amsterdam/Philadelphie: John Benjamins. b. Le sens des mots. Pour la Science 221, Paris: Belin, p. 21. Les verbes supports d'adjectifs et le passif. Langages 121, Paris: Larousse, pp. 8-18. d. Lexicon-Grammar. Concise Encyclopedia of Syntactic Theory, Keith Brown and Jim Miller (eds.), Oxford: Pergamon Press, pp. 224-259.
MAURICE GROSS
658
e. Construction de grammaires locales et automates finis. Working Papers 5 del Centro linguistico, Universita commerciale "L. Bocconi", Milano: Universita L. Bocconi, pp. 1-65. 1997
a. b. d. e.
Synonymie, morphologie dérivationnelle et transformations. Langages 128, Paris: Larousse, pp. 72-90. La traduction automatique a cinquante ans. Pour la Science, Paris: Belin. The Construction of Local Grammars. Finite State Language Processing, Cambridge, Mass.: The MIT Press, pp. 329-352. La traduction automatique. Pour la science. Dossier Les longues du monde, Paris: Belin, pp. 126-130. The Construction of Local Grammars and the Automatic Analysis of Texts. Applications to Information Retrieval and Translation. Korea-France joint workshop on language industries, Seoul.
1998
a. L'analyse et la déformation des phrases figées dans La tour des miracles. Georges Brassens. Lingua, poesia, interpretazioni. Actes du colloque international de Milan, M. Conenna (ed.), Bari: Schena, pp. 41-55. b. Lexique, grammaires et cumulativité. Cahiers de Vinstitut de linguistique de Louvain 24/3-4, Louvain-la-Neuve: Université Catholique de Louvain. La fonction sémantique des verbes supports. Travaux de linguistique 37, Louvain-la-neuve: Duculot. d. (avec J. Senellart) Nouvelles bases statistiques pour les mots du français. Actes des JADT, Université de Nice. e. Sur quelques extensions possibles de l'appellation passif. Actes des Journées sur le Passif, Université de Copenhague (cf. 2000a). f. Lemmatization of Compound Tenses in English. Lingvisticae Investigationes 22. Amsterdam/Philadelphia: John Benjamins Publishing Company. g. Nouvelles applications des graphes d'automates finis a la description lin guistique. Lingvisticae Investigationes 22, Amsterdam/Philadelphia: John Benjamins Publishing Company.
1999
a. Sur la définition d'auxiliaire du verbe. Langages 135, Paris: Larousse, pp. 821. b. Remarques sur la notion de pluriel. L'emprise du sens - structures linguistiques et interprétations. Mélanges de syntaxe et de sémantique offerts a Andrée Borillo, Amsterdam/Atlanta: Rodopi, pp. 137-154. A Bootstrap Method for Constructing Local Grammars. Contemporary Mathematics. Proceedings of the Symposium, Belgrad: University of Belgrad.
2000
a. Sur quelques extensions possibles de l'appellation passif. Études Romanes 45 (cf. 1998e). b. Verbes a trois compléments essentiels. Bulag, n° Hors Série Lexique, syntaxe et sémantique, mélanges offerts a Gaston Gross, pp. 199-210, Centre Tesnière, Besan9on: PUFC. Early MT in France. Early years in machine translation. Hutchins, W. J. (ed.), Amsterdam/Philadelphia: John Benjamins, pp. 325-330.
BIBLIOGRAPHIE
659
2001
a. Compte rendu de l'ouvrage de Francis Kaplan: Des singes et des hommes. Pour la science, n° 284, Paris: Belin. b. Grammaires locales de déterminants nominaux. Détermination et formalisation, Lingvisticae Investigationes Supplementa 23, Amsterdam/ Phila delphia: John Benjamins, pp. 177-193. Les ambiguïtés. Lingvisticae Investigationes 24:1, Amsterdam/Philadelphia: John Benjamins. pp. 3-41.
2002
a. Les déterminants numéraux, un exemple: les dates horaires. Langages n°145, Paris: Larousse, pp. 21-37. b. Consequences of the Metalanguage Being Included in the Language. The Legacy of Zellig Harris. Language and Information into the 21st Century. Vol. 1; Philosophy of Science, Syntax and Semantics, Amsterdam/Phila delphia: John Benjamins, pp. 57-67.
Christian Leclère nous a indiqué que certains exégètes, s'appuyant sur la similitude des initiales (M.G.) et d'incontestables analogies de style, ont cru pouvoir affirmer que les articles suivants, signés Michel Gouet, avaient été écrits en réalité par Maurice Gross. Nous les citons avec prudence: nos recherches concernant cette hypothèse n'ont pas abouti a des conclusions totalement convaincantes. 1971 1976
Gouet, Michel. Lexical problems raised by some of the foutre constructions. Studies Out in Left Fields, Edmonton: Linguistic Research Inc., pp. 79-85. Gouet, Michel. On a class of circumstantial deletions. Linguistic Inquiry 7:4.
In the series Lingvisticœ Investigationes Supplementa the following titles have been pub lished thus far or are scheduled for publication:
1
FOLEY, James: Theoretical Morphology of the French Verb. 1979. iv, 292 pp.
2
SALKOFF, Morris: Analyse syntaxique du Français-Grammaire en chaine. 1980. xvi, 334 pp.
3
PARRET, Herman: 'Le Langage en Contexte. Etudes Philosophiques et Linguistiques de Pragmatique', par H. Parret, L. Apostel, P. Gochet, M. Van Overbeke, O. Ducrot, L. Tasmowski-De Ryck, N. Dittmar, W. Wildgen. 1980. iv, 790 pp.
4
LOVE, Nigel: Generative Phonology: A Case Study from French. 1981. viii, 241 pp.
5
PAILLET, Jean-Pierre and André DUGAS: Approaches to Syntax. (English translation from the French original edition 'Principes d'analyse syntaxique', Québec, 1973). 1982. viii, 282 pp.
6
LIGHTNER, Ted: Introduction to English Derivational Morphology. 1983. xxxviii, 533 pp.
7
Taken from program.
8
ATTAL, Pierre et Claude MULLER (red.): De la Syntaxe a la Pragmatique. Actes du Colloque de Rennes, Université de Haute-Bretagne. 1984.389 pp.
9
GUILLET, Alain et Nunzio La FAUCI (réd.): Lexique-Grammaire des langues romanes. Actes du ler colloque européen sur la grammaire et le lexique comparés des langues romanes, Palerme, 1981.1984. xiii, 319 + 58 pp. Tables.
10 ZWANENBURG, Wiecher: Productivité morphologique et emprunt. 1983. x, 199 pp. 11
LAMIROY, Béatrice: Les verbes de mouvement en français et en espagnol. Etude comparée de leurs infinitives. 1983.xiv, 323 pp.
12
HONG, Chai-Song: Syntaxe des verbes de mouvement en coréen contemporain. 1985. xv, 309 pp.
13 VERGNAUD, Jean-Roger: Dépendance et niveaux de représentation en syntaxe. 1985. xvi, 372 pp. 14
SUBIRATS-RÜGGEBERG, Carlos: Sentential Complementation in Spanish. A lexico-grammatical study of three classes of verbs. 1987. xii, 290 pp.
15
LEHRBERGER, John and Laurent BOURBEAU: Machine Translation. Linguistic characteristics of MT systems and general methodology of evaluation. 1988. viii, 240 pp.
16 VERLUYTEN, S. Paul (red.): La phonologie du schwa français. 1988. vi, 202 pp. 17
LABELLE, Jacques et Christian LECLÈRE (réd.): Lexiques-Grammaires comparés en français. Actes du colloque international de Montréal (3-5 juin 1992). 1995. 217 pp.
18
PICONE, Michael D.: Anglicisms, Neologisms and Dynamic French. 1996. xii, 462 pp.
19
FUCHS, Catherine and Bernard VICTORRI (eds.): Continuity in Linguistic Semantics. 1994iv,255 pp.
20
SHYLDKROT, Hava Bat-Zeev et Lucien KUPFERMAN (réd.): Tendances Récentes en Linguistique Française et Générale. Volume dédié a David Gaatone. 1995. xvi, 409 pp.
21
NAM, Jee-Sun: Classification Syntaxique des Constructions Adjectivales en Coréen. 1996. xxvi, 560 pp.
22
SALKOFF, Morris: A French-English Grammar. A contrastive grammar on translational principles. 1999. xvi, 342 pp.
23
BLANCO, Xavier, Pierre-André BUVET et Zoé GAVRIILIDOU (réd.): Détermination et Formalisation. 2001. xii, 345 pp.
24
LECLÈRE, CHRISTIAN, ERIC LAPORTE, MIREILLE PIOT ET MAX SILBERZTEIN (RÉD.): Lexique, Syntaxe et Lexique-Grammaire / Syntax, Lexis & Lexicon-Grammar. Papers in honour of Maurice Gross. 2004. iv, 647 pp.