En hommage à André Chervel (1931-2025),
comme une évidence...
Quand on supprime l’écriture par la pensée, celui qu’on prive de cette image sensible risque de ne plus apercevoir qu’une masse informe dont il ne sait que faire. C’est comme si l’on retirait à l’apprenti nageur sa ceinture de liège. Ferdinand de Saussure Cours de linguistique générale 1994 55
1 | Introduction
1Si, indiscutablement, l’orthographe normée du français pose problème à nombre de francophones natifs, cet article l’envisagera uniquement sous l’angle épistémologique des biais qu’elle est susceptible de générer dans la description linguistique du français contemporain1. Observons pour commencer quelques extraits d’écrits produits par des scripteurs aguerris et ayant de surcroit nécessairement fait l’objet de relectures avant leur diffusion. Dans son étude sur l’accord du participe passé (PP) à l’écrit, Marsac (2016 : 17) mentionne, entre autres, le texte de la Constitution française de 19582. Ici, l’erreur, indiquée en gras, concerne ce qu’on nomme communément l’accord en genre du PP :
Article 16
Lorsque les institutions de la République, l’indépendance de la
Nation, l’intégrité de son territoire ou l’exécution de ses engagements
internationaux sont menacés [1] d’une manière grave
et immédiate et que le fonctionnement régulier des pouvoirs publics
constitutionnels est interrompu, le Président de la République prend les
mesures exigées par ces circonstances, après consultation officielle du
Premier ministre, des Présidents des Assemblées ainsi que du Conseil
constitutionnel.
2La note [1] explique : « Cet article fut originellement publié avec une faute d’orthographe. Le terme “menacés” devrait en effet s’écrire “menacées”. » Si le PP est réputé problématique, il n’est pas le seul à être affecté. En témoigne l’extrait ci-dessous issu d’un article de revue scientifique – portant sur l’orthographe –, où l’erreur provient ici d’une confusion entre singulier et pluriel dans la graphie de l’indicatif présent (IndPr) :
[…] les homographes hétérophones sont des mots pour lesquels il existe une même orthographe associée, selon le contexte, à des prononciations différentes. Ainsi « dans les poules couvent des œufs » et « Marie entre au couvent », la même orthographe « couvent » se prononcent de deux façons distinctes. (Bonin, Collay & Fayol 2008 : 522)
3Retrouvée en juin 1991 sur la scène du meurtre de Ghislaine Marchal, l’inscription accusatrice « Omar m’a tuer » – tracée avec le sang de la victime – est probablement l’une des graphies non-normées les plus célèbres en France. Si le contenu sémantique de cet ultime message a rapidement mené à accuser d’homicide volontaire Omar Raddad, le jardinier de la victime, c’est la confusion entre les graphies de l’infinitif (Inf) et du PP qui en vient à constituer un argument à charge envisageable pour établir que la victime en était bien l’autrice :
La faute d’orthographe relevée dans la phrase « Omar m’a tuer » n’est pas de nature à remettre en cause les résultats des expertises car l’examen de plusieurs écrits émanant de la victime démontre que cette dernière faisait de nombreuses fautes de la même nature (scellés n° 5, 6, 8, 39). Mme Gisèle KONRAD, amie de la veuve MARCHAL, a confirmé ce fait. (Arrêt de la chambre d’accusation du 14 avril 1994, repris dans Vergès 1994 : 156)
4Une telle erreur surprenait pourtant de la part d’une femme dont « tous [l]es proches dis[ai]ent qu’elle était intelligente » (Vergès 1994 : 27) et « très cultivée » même si « elle faisait de temps en temps des fautes d’orthographe et de grammaire, parfois élémentaires » (Cenci 2012 : 187). Durant l’enquête, à la demande de la juge d’instruction, un premier « rapport d’expertise en écriture » a été rédigé le 10 juillet 19913. En dépit du caractère officiel d’un tel document et de l’importance accordée à l’orthographe erronée du PP de l’inscription <Omar m’a tuer>4, ce court rapport comporte lui aussi une dizaine de graphies non-normées (relevant de l’orthographe lexicale ou grammaticale). Citons-en quelques-unes :
- La porte n’est guère salie par des traces de sang. Les plus notables qui existent : des tirets horizontaux de petite taille qui encadre la mention. (p. 6)
- L’écrit incomplet est placé vers le milieu du plan inférieur de la porte. Il est difficile à lire car l’attaque est noyée dans un tracé correspondant à une main qui de plus a probablement glissée. (p. 6)
- Les deux A, le second M et le T tracées avec deux doigts. (p. 7)
- L’étude des mentions est fondamentale car elle nous fournie un ensemble d’informations essentielles à la comparaison. (p. 8)
- Les mentions sont tracées en écriture typographiques. (p. 10)
- […] c’est à dire destinés à être lus par d’autre. (p. 10)
- Nous avons constater que […] (p. 13)
- Nous avons appris que la victime avait eu une agonie qui avait durée de 20 à 30 minutes. (p. 13)
5Que révèleraient donc les « erreurs » en (1), (2) et (3) produites – et relues – par des scripteurs pourtant fortement lettrés ? Signalons que, en dépit de leur caractère non-normé, toutes ces graphies autorisent une lecture conforme à la lecture cible. En effet, en (1), <menacés> et <menacées> (la norme ciblée) se lisent /mənase/, en (2), <prononcent> et <prononce> /pʁɔnõs/, en (3)-d, <fournie> et <fournit> /fuʁni/, etc. (voir les réflexions à ce propos dans Surcouf 2018, 2021b, 2024b). Détaillons l’ensemble de ces exemples :
Lecture | Item | Graphie produite | Norme ciblée | Confusion | Type d’écart |
/mənase/ | PP | <menacés> | <menacées> | genre | – <e> |
/glise/ | PP | <glissée> | <glissé> | genre | + <e> |
/tʁase/ | PP | <tracées> | <tracés> | genre | + <e> |
/kõstate/ | PP | <constater> | <constaté> | temps/mode | <é> ≡ <er> |
/dyʁe/ | PP | <durée> | <duré> | temps/mode | + <e> |
/pʁɔnõs/ | IndPr | <prononcent> | <prononce> | nombre | + <nt> |
/ãkadʁ/ | IndPr | <encadre> | <encadrent> | nombre | – <nt> |
/fuʁni/ | IndPr | <fournie> | <fournit> | temps/mode | <t> ≡ <e> |
/tipɔgʁafik/ | Adj | <typo-graphiques> | <typo-graphique> | nombre | + <s> |
/otʁ/ | Pronom | <d’autre> | <d’autres> | nombre | – <s> |
6En dehors des deux erreurs de nombre dans l’adjectif et l’usage pronominal de <autre>, toutes les autres erreurs concernent le marquage grammatical orthographique du verbe, caractérisé par une divergence considérable entre formes orales et normes écrites (Blanche-Benveniste 2000 : 137). La rime en /e/ peut, selon les variétés parlées (Carton 2000 : 28-29), correspondre à dix désinences graphiques normées <é>, <ée>, <és>, <ées>, <er>, <ez>, <ai>, <ais>, <ait>, <aient>. Les verbes du 1er groupe comme encadrer ont une forme /ãkadʁ/ à l’IndPr susceptible de s’écrire de trois manières différentes <encadre>, <encadres> et <encadrent>. Pour les verbes du 2e groupe, les formes de l’IndPr1-35 et du PP sont homophones et peuvent donner lieu à cinq graphies différentes, à l’instar de /fuʁni/, <fournis> – (Pr1-2 et PP m.pl) –, <fournit>, <fourni>, <fournie>, <fournies>. Toutefois, comme « la phonologie joue un rôle crucial dans la lecture silencieuse » (Ferrand & Ayora 2015 : 56)6, on peut alors supposer que les relations graphème-phonème permettent l’accès immédiat au mot phonologiquement ciblé (première colonne du tableau 1) et à son sémantisme. C’est notamment en vertu de l’identification de cette cible que la compréhension du message est assurée et que le lecteur aguerri peut – éventuellement – repérer l’écart orthographique, et parfois s’en irriter : « L’orthographe est d’abord affaire d’esthétique. Une faute c’est aussi laid qu’une tache d’encre, ou qu’une fausse note dans La lettre à Élise » (Bouchard 2022 : 28).
7Comme le révèle l’échantillon du tableau 1, les types d’écarts par rapport à la norme en vigueur peuvent prendre la forme d’un ajout (<prononcent> au lieu de <prononce>), d’une omission (<encadre> au lieu de <encadrent>), ou d’une substitution (<constater> au lieu de <constaté>). Bien que la forme orale soit chaque fois invariable, les écarts graphiques peuvent, comme ici, relever du marquage du genre, du nombre ou du mode. Ce premier aperçu révèle qu’en cas d’invariabilité dans la langue parlée, même des scripteurs adultes aguerris sont susceptibles de commettre des erreurs.
2 | Pour ou contre la complexité de l’orthographe ?
8On sait depuis longtemps déjà que « l’orthographe du français pose d’énormes problèmes à ceux qui l’apprennent comme à ceux qui s’en servent », et que « comparée à d’autres […], elle s’avère […] particulièrement complexe » (Fayol & Jaffré 2014 : 6). Déplorée par nombre de linguistes et de didacticiens, il n’est pas rare cependant que cette complexité soit perçue positivement :
Sur le fond, sur le constat, il y a un relatif accord. Notre langue la plus claire qui soit au monde dans son expression est aussi la plus compliquée, dans sa syntaxe autant que dans son orthographe. […] Mais ces complications, ces fioritures, ces surcharges et ces exceptions diaboliques, qui font de l’orthographe un labyrinthe, sont aussi constitutives de son histoire. Tout comme le vieux Paris, malodorant, tarabiscoté, qu’aimait tant Victor Hugo, a perdu beaucoup de son charme après les simplifications d’Haussmann. L’orthographe, c’est aussi l’histoire d’une langue. Ceux qui y sont attachés ne le sont pas forcément par intégrisme ou un conservatisme de scrogneugneu, mais parce qu’ils considèrent que cette complexité même lui confère une beauté de cathédrale gothique. (Rouart Jean-Marie, Paris-Match 01/03/2016)
9Certains linguistes peuvent également argumenter en faveur de cette complexité. Interrogé par l’hebdomadaire Le Point (15/06/2023) à propos d’une éventuelle simplification de l’orthographe, Bentolila affiche clairement sa position : « Ne touchons pas aux règles d’accord, car elles portent notre pensée. Ne touchons pas aux marqueurs étymologiques, car ils nous racontent l’histoire de la langue. » Bien que Bentolila ait manifestement été invité à s’exprimer non pas en tant que citoyen mais en tant que « linguiste […] professeur à l’université Paris-Descartes, auteur d’une vingtaine d’essais », ses propos constituent-ils des arguments scientifiques ? En quoi les « règles d’accord » permettraient-elles de « port[er] notre pensée », alors que beaucoup sont inexistantes dans la langue parlée ? Par ailleurs, apprend-on véritablement l’histoire de la langue au travers de son orthographe ? Bien qu’il s’agisse ici d’une intervention ponctuelle dans la presse, il parait difficile de statuer catégoriquement sur le statut scientifique de tels arguments7. En définitive, s’il est légitime pour tout citoyen de prendre parti pour ou contre la complexité de l’orthographe française, le linguiste, doit quant à lui – quelle que soit son opinion personnelle sur la question – s’efforcer de porter un regard objectif pour non pas justifier cette complexité, mais la décrire de la manière la plus scientifique possible.
3 | Les arguments linguistiques ?
3.1. L’utilité des morphogrammes et la différenciation des homophones
10Dans leur Que sais-je ? intitulé L’orthographe, Fayol & Jaffré (2014) proposent d’autres arguments, en évoquant notamment la différenciation des homophones à l’aide de l’hétérographie :
Si à l’oral le contexte ou la situation peuvent suffire à lever les ambigüités nées de l’homophonie, l’écrit y parvient plus difficilement, ce qui motive le fréquent recours à des procédés spécifiques – lettres, accents, etc. Ce phénomène conditionne la transparence sémiographique, dans le domaine verbal tout spécialement. (2014 : 17)
11Les auteurs en viennent ainsi à établir une sorte de corrélation négative entre complexité morphologique – issue du fonctionnement naturel de la langue – et simplicité orthographique, qui semblerait alors impliquer à l’inverse qu’une morphologie simple – comme celle du français – soit représentée par une orthographe complexe :
La sémiographie8 est inf[l]uencée par d’autres facteurs structurels et notamment par l’homophonie qui constitue à cet égard un domaine clé : plus les langues disposent d’un nombre varié de désinences orales, plus leur écriture s’en trouve simplifiée. En espagnol par exemple, le présent de l’indicatif du verbe dormir distingue duermo (« je dors ») et duerme (« il dort ») tandis qu’en français les formes sont homophones mais différenciées à l’écrit. Ainsi, plus la structure morphologique de l’oral est explicite et moins l’orthographe a besoin de procédés compensatoires. (2014 : 17)
12Si dans un système d’écriture alphabétique, il parait logique que la complexité morphologique de la langue se répercute dans sa graphie (/dwermo/ <duermo>, /dwermes/ <duermes>, etc.), quelles que soient les conventions en vigueur issues de l’histoire, il n’existe à priori aucune nécessité de « différenci[er] les homophones » dans une langue dont la morphologie verbale est simple à fortiori si le pronom personnel est obligatoire9. L’anglais illustre cette possibilité : /aɪkæn/ <I can>, /jukæn/ <you can>, etc. De même, en français10, le pronom étant obligatoire, /ʒdɔʁ/, /tydɔʁ/, etc., il spécifie d’emblée la personne, et rend superflue toute indication graphique à cet égard. À priori, aucun « procéd[é] compensatoir[e] » n’est ici nécessaire. Que s’agirait-il de compenser s’il suffit de transposer des pronoms /ʒ/, /ty/, etc. par <je>, <tu>, etc. et /dɔʁ/ par le segment <dor> pour reproduire à l’identique un fonctionnement de la langue parlée, parfaitement connu de tous les locuteurs et compris de tous leurs interlocuteurs ? À l’inverse, le <s> de <je dors> ou le <t> de <il dort> s’avèrent redondants11. Par ailleurs, si le <t> renvoie univoquement à la P3, tel n’est pas le cas du <s>, au statut ambivalent, puisqu’il ne permet pas de discriminer la P1 de la P2, semblant par là même prouver son inutilité informationnelle, quelles que soient les conventions.
13Plus loin, Fayol & Jaffré (2014) développent davantage leur raisonnement en faveur de l’hétérographie des homophones résultant de l’usage de morphogrammes12, qui permettraient d’« assure[r] la cohésion » et « la conservation de l’information […] dans la modalité écrite, plus lente et difficile à traiter que celle orale » :
Imaginez que vous ayez à transcrire le message suivant : /legRãdtuRsõbRãtuRlavilnwaR/13 (les grandes tours sombres entourent la ville noire). À l’oral, au début de cet énoncé, seul le déterminant initial (/le/ ; les) indique la pluralité (il y a plusieurs grandes tours et elles sont sombres). En fin d’énoncé, seul le déterminant (/la/) marque le féminin de manière audible. Or, la transcription recourt systématiquement à des marques morphologiques : -s et -nt pour le nombre pluriel et -e pour le genre féminin, sont utilisées sur les noms (tours), les adjectifs (grandes ; sombres ; noire) et le verbe (entourent). Ces marques assurent la cohésion d’une part, à l’intérieur des syntagmes par l’accord de l’adjectif avec le nom et, d’autre part, à l’intérieur de la proposition du fait de l’accord du verbe avec le sujet. Elles permettent la conservation de l’information (= la redondance) dans la modalité écrite, plus lente et difficile à traiter que celle orale. Les exemples précédents relèvent tous de la morphologie flexionnelle, celle qui correspond à l’orthographe grammaticale. (2014 : 90-91)
14Bien que, lorsqu’ils évoquent « la modalité écrite plus lente et difficile à traiter que celle orale », les auteurs ne précisent pas s’il s’agit ici de l’écriture ou de la lecture (ou des deux), on peut néanmoins supposer qu’ils renvoient à cette dernière, comme spécifié ailleurs dans un article de l’un des coauteurs : « l’orthographe peut […] faciliter la compréhension, ou la ralentir » (Jaffré 2006 : 33).
3.2. A-t-on affaire à des arguments scientifiques ?
15Si dans l’absolu, il est effectivement possible que le recours « systématiqu[e] à des marques morphologiques » « assur[e] la cohésion » permettant alors « la conservation de l’information […] dans la modalité écrite », « plus lente et difficile à traiter que celle orale », comment le démontrer scientifiquement ? Comment objectiver ces faits invoqués par les auteurs ?
16Remarquons en premier lieu qu’à l’oral le locuteur impose toujours son débit à l’auditeur, contraint au décodage de ce flux de parole en temps réel. Dans la modalité écrite, le lecteur n’est soumis à aucune contrainte temporelle de la sorte. Il peut lire à sa guise, avec de surcroit le privilège – inexistant à l’oral – de revenir sur un mot14, voire un passage qu’il n’aurait pas compris15.
17Outre cette première objection, l’argumentaire de Fayol & Jaffré sous-entend logiquement que si l’orthographe du français ne comportait pas de telles « marques morphologiques », le lecteur aurait davantage de mal à percevoir « la cohésion […] à l’intérieur des syntagmes par l’accord de l’adjectif avec le nom » (2014 : 90-91) – soit ici <grandes tours sombres>, <ville noire> – « et […] à l’intérieur de la proposition du fait de l’accord du verbe avec le sujet » – ici <les grandes tours sombres entourent>. En quoi ces conventions graphiques seraient-elles effectivement nécessaires pour « assure[r] la cohésion » et « conserv[er] l’information », alors qu’aucun équivalent n’existe à l’oral ? En d’autres termes, comment expliquer l’émergence d’une telle nécessité à l’écrit, pourtant absente à l’oral ? En effet, les scripteurs étant d’abord des locuteurs, ils n’ont jamais éprouvé de difficulté à discriminer oralement (4) et (5) sur la base unique du changement de déterminant (d’ailleurs évoqué par Fayol & Jaffré 2014 : 90).
[lagʁãdʁivjεʁsõbʁãtuʁlavil]16
[legʁãdʁivjεʁsõbʁãtuʁlavil]
18Il s’agit là d’un des fonctionnements les plus élémentaires de la langue française, que tout francophone a nécessairement intégré dès sa prime enfance (voir Bernicot & Bert-Erboul 2014 : 74). Dès lors, se pose la question de savoir pourquoi un fonctionnement aussi élémentaire de la langue deviendrait soudain problématique une fois transposé à l’écrit, lisible de surcroit à la vitesse décidée par le lecteur. Si les normes de l’orthographe en vigueur différencient effectivement (6) et (7), on pourrait tout autant imaginer des normes alternatives calquant les fonctionnements de l’oral17 et permettant de discriminer (6) et (8) sur la seule base de l’opposition entre <la> et <les>, opposition non seulement maitrisée par tous les locuteurs, mais la seule qui, comme ici, leur serve d’indice de nombre dans leur pratique quotidienne de l’oral :
Orthographe en vigueur : <la grande rivière sombre entoure la ville>
Orthographe en vigueur : <les grandes rivières sombres entourent la ville>
Orthographe alternative : <les grande rivière sombre entoure la ville>
19Bien entendu, tout lecteur aguerri de l’orthographe en vigueur perçoit immédiatement dans (8) des écarts par rapport à la norme, qui, rappelons-le, requiert un apprentissage scolaire d’« au moins une dizaine d’années » (Wolfarth, Ponton & Brissaud 2018 : 209). Bien qu’il soit possible qu’en raison de l’absence de « marques assur[a]nt la cohésion » (Fayol & Jaffré 2014 : 90), le lecteur chevronné lise la version (8) plus lentement que la (7), il pourrait tout simplement s’agir là d’un manque d’habituation. Pour être en mesure de démontrer les vertus supposées des marques <s> et <nt> dans la discrimination en nombre de (6) et (7) de notre orthographe actuelle, il faudrait pouvoir comparer ce fonctionnement avec celui d’une orthographe alternative, dans laquelle il n’y aurait aucune marque au pluriel (comme en (8)). Or, pour mener une telle comparaison scientifique, l’expérimentateur devrait disposer d’une communauté alternative de locuteurs/scripteurs francophones natifs, qui, depuis leur plus jeune âge, auraient uniquement appris la norme selon laquelle le pluriel s’écrit <les grande rivière sombre entoure la ville>. C’est à cette seule condition qu’il serait possible de décréter que l’une ou l’autre des deux orthographes s’avère plus ou moins facile ou difficile à lire. Comme c’est le cas de tout apprentissage, celui de la lecture d’une orthographe donnée relève avant tout d’une habituation. Chervel rappelle ainsi que « savoir lire, c’est obligatoirement connaitre, sur le mode passif, l’orthographe française. L’orthographe française de son époque, bien entendu » (2006 : 79). En effet :
Il suffit de mettre nos contemporains face à des formes graphiques du XVIIe siècle, comme ils eſtoient, ils bruſloiēt, iay, cognoiſtre, ſuyure, ſcauans, eſcripuons, Iuifue ou beueuë, pourtant prononcées à peu près comme aujourd’hui (ils étaient, ils brûlaient, j’ai, connaître, suivre, savants, écrivons, juive, bévue), pour prendre conscience de l’existence de cette compétence passive qui a été acquise à l’école, et qui ne permet pas de lire d’autres orthographes ou d’autres graphies du français. (Chervel 2006 : 79-80)
20En définitive, on peut légitimement supposer qu’il pourrait être tout aussi rapide et facile de lire la norme alternative <les grande rivière sombre entoure la ville noir> que celle à laquelle nous avons été exercés durant toute notre scolarité. S’il est impossible de démontrer scientifiquement l’intérêt ou la nécessité de l’usage des « marques morphologiques » <s>, <e>, <nt>, etc., se pose alors la question de savoir si elles contribuent effectivement à « assure[r] la cohésion » et « permett[re] la conservation de l’information (= la redondance) dans la modalité écrite », sachant que le locuteur/scripteur a depuis sa prime enfance appris à fonder sa compréhension orale sur des indices beaucoup plus ténus, qu’il doit de surcroit percevoir en temps réel.
21Épistémologiquement, une autre question fondamentale s’impose dès qu’on aborde en synchronie la fonction de morphogrammes comme <s>, <nt>, etc. : constituent-ils des « marques morphologiques » à part entière ? Transposeraient-ils par écrit – au travers de l’« orthographe grammaticale » – « l’accord de l’adjectif avec le nom » ou « l’accord du verbe avec le sujet » (Fayol & Jaffré 2014 : 90 & 91) ? En effet, parler de « l’accord de l’adjectif avec le nom », c’est partir du principe qu’un tel accord existe en français contemporain. Or, s’il est indéniable que le <s> constitue une marque orthographique de pluriel dans <sombres>, <grandes>, etc., est-ce épistémologiquement suffisant pour considérer que de tels « exemples […] relèvent tous de la morphologie flexionnelle » (Fayol & Jaffré 2014 : 91) ? S’agit-il ici de « morphologie flexionnelle » relevant des fonctionnements naturels de la langue ou de « morphographie flexionnelle » résultant des normes prescriptives de l’orthographe18 ?
3.3. L’invariabilité et la question de l’accord en synchronie
22Appréhendés du point de vue linguistique, ni /gʁã(d)/ ni /sõbʁ/ ne varient en nombre, et /nwaʁ/ est invariable en genre et en nombre, en dépit de la présence du morphogramme <e> dans <la ville noire>. Dans leur réalité morphologique, les adjectifs du français contemporain sont presque tous invariables en nombre (voir tableau 4) et un sur trois seulement varient en genre (Surcouf 2022). Dès lors, y a-t-il véritablement « accord en genre » entre le syntagme /lavil/ et l’adjectif invariable /nwaʁ/, ou « accord en nombre » entre /letuʁ/, /gʁãd/ et /sõbʁ/ si ces adjectifs sont invariables en nombre (voir également Blanche-Benveniste 2007 : 131) ? Qu’en serait-il de /tuʁ/, lui aussi invariable en nombre à l’instar de 99,5 % des substantifs du français (voir tableau 2) ? Si on prend au sérieux l’un des principes fondamentaux de la linguistique générale selon lequel « la langue évolue sans cesse » contrairement à « l’écriture [qui] tend à rester immobile » (Saussure (de) 1994 : 48), alors ne devrait-on pas, objectivement, parvenir au constat qu’en français contemporain l’accord n’est plus systématique, quelles que soient les règles régissant l’orthographe normée ? Dès lors, imaginer que l’orthographe grammaticale sert à transposer la « morphologie flexionnelle » (Fayol & Jaffré 2014 : 91) revient à projeter indument les règles prescriptives de l’écrit normé sur la langue. En d’autres termes, en synchronie, aurait-on véritablement affaire à des « accords » dans l’exemple de Fayol & Jaffré (2014 : 90) ?
23Dans l’ouvrage qu’il consacre entièrement à l’accord, Corbett (2006) prend la définition suivante de Steele comme point de départ de son développement :
The term agreement commonly refers to some systematic covariance between a semantic or formal property of one element and a formal property of another. (1978 : 610)
24Il rappelle alors :
The essential notion is covariance. It is not sufficient that two items happen to share properties; the sharing must be systematic, and we see this by the fact that as one element varies so will the other. (Corbett 2006 : 4)
25En d’autres termes, la forme affectée par l’accord doit afficher cette covariation à la fois de manière conjointe et systématique. Dans le développement de son argumentaire, Corbett (Ibid.) prend notamment les deux exemples suivants de l’usage du passé en anglais, qu’il commente :
Mary made pancakes.
The cooks made pancakes.
Here we see no evidence of agreement. Past tense verbs in English do not show agreement. Clearly, then, agreement is a matter of morphology (word structure) since we require the morphology to provide the opportunity for agreement to be indicated. (2006 : 3)
26Appliquons ce raisonnement au français dans les exemples (11), (12), (13), où les déterminants sont signalés en gras dans les syntagmes nominaux – (SN) délimités par des crochets – en fonction sujet et objet :
m.sg. /[ləʒɔlilɛ̃gɥistfaʁfəly]SN [analiz]V [lafʁazpaʁadɔksal]SN/
f.sg. /[laʒɔlilɛ̃gɥistfaʁfəly]SN [analiz]V [lafʁazpaʁadɔksal]SN/
pl. /[leʒɔlilɛ̃gɥistfaʁfəly]SN [analiz]V [lefʁazpaʁadɔksal]SN/
27Comme dans le cas de (9) et (10) en anglais, le verbe /analiz/ ne varie pas en nombre entre (11) / (12) et (13). Aucune marque morphologique n’apparait. Il en est de même pour les adjectifs /ʒɔli/, /faʁfəly/, quel que soit leur genre. Quant à l’adjectif au féminin /paʁadɔksal/, il demeure insensible au nombre. Les substantifs /lɛ̃gɥist/ et /fʁaz/ restent également inchangés. En d’autres termes, tout comme Corbett (2006 : 3) déclarait qu’il n’y avait pas d’accord au passé en anglais dans le verbe made en (9) et (10), malgré une variation en nombre dans le SN sujet, un constat analogue semble s’imposer pour (11), (12) et (13), même si les règles de l’orthographe prescrivent l’ajout de morphogrammes de genre et de nombre :
(11)‘ <le joli linguiste farfelu analyse la phrase paradoxale>
(12)‘ <la jolie linguiste farfelue analyse la phrase paradoxale>
(13)‘ <les jolis linguistes farfelus analysent les phrases paradoxales>
(13)‘‘ <les jolies linguistes farfelues analysent les phrases paradoxales>
28Le même raisonnement vaudrait pour « /legRãdtuRsõbRãtuRlavilnwaR/ » (Fayol & Jaffré 2014 : 90) où n’apparait aucune marque d’accord, tel qu’il est défini linguistiquement par Corbett (Ibid.). Une question, fondamentale, demeure cependant : quel est le degré de représentativité des comportements observés dans (11), (12) et (13) ? En d’autres termes, l’absence de marques d’accord est-elle un épiphénomène ou une tendance majoritaire du français contemporain ? Idéalement, pour répondre, il faudrait analyser de grandes quantités de données parlées et estimer le pourcentage effectif d’apparitions objectivables de l’accord19 comme dans l’exemple suivant :
/ilvãɛ̃ʒuʁnalʒenjal/ vs /ilvãddeʒuʁnoʒenjo/
Verbe : /vã/-/vãd/
Nom : /ʒuʁnal/-/ʒuʁno/
Adjectif : /ʒenjal/-/ʒenjo/
29À défaut d’une telle analyse de productions langagières effectives, on peut cependant examiner les potentialités offertes par les mots de ces trois catégories grammaticales du lexique français20. Si on prend le nombre comme dimension transversale susceptible d’affecter les substantifs, les adjectifs et les verbes, seulement 0,5 % des substantifs (tableau 2) présentent une variation /ʃəv.al|o/, /vitʁ.aj|o/, /œj/-/jø/, etc., et 4 % des adjectifs (tableau 4) /paʁadɔks.al|o/, /sãtʁ.al|o/, etc.21 (Surcouf 2022).
table | bois | noix | N | % | bocal | œil | jazz-man | N | % | |
sg. | /tabl/ | /bwa/ | /nwa/ | 30 778 | 99,52 | /bɔkal/ | /œj/ | /dʒaz-man/ | 147 | 0,48 |
pl. | /bɔko/ | /jø/ | /dʒaz-mεn/ |
30Les cent noms les plus fréquents du français parlé affichent déjà une invariabilité très élevée (96 %) :
variable23 | 4 % |
invariable | 96 % |
jeune | joli | noir | gris | doux | N | % | légal | N | % | |
sg. | /ʒœn/ | /ʒɔli/ | /nwaʁ/ | /gʁi/ | /du/ | 10 794 | 95,94 | /legal/ | 457 | 4,06 |
pl. | /lego/ |
31Comme pour les substantifs, les adjectifs sont très majoritairement invariables en nombre au sein des cent premiers du français parlé :
variable24 | 4 % |
invariable | 96 % |
32En ce qui concerne la morphologie verbale, l’examen des 6464 verbes du Petit Robert révèle que l’invariabilité en nombre entre les personnes 3 (il) et 6 (ils) concerne plus de neuf verbes sur dix au présent de l’indicatif (regroupés par type dans le tableau suivant. À ce propos, voir Surcouf 2011) :
laver | courir | N | % | finir | N | % | boire | pouvoir | N | % | ||
sg. | 3 | /lav/ | /kuʁ/ | 5847 | 90,4 | /fini/ | 546 | 8,5 | /bwa/ | /pø/ | 68 | 1,1 |
pl. | 6 | /finis/ | /bwav/ | /pœv/ |
33Parmi les autres temps simples, aucune variation n’existe entre les personnes 3 et 6 pour l’imparfait (tableau 7), le subjonctif et le conditionnel présent, à l’inverse du futur simple (/lavʁa/-/lavʁõ/).
laver | courir | finir | boire | prendre | être | % | ||
sg. | 3 | /lavε/ | /kuʁε/ | /finisε/ | /byvε/ | /pʁənε/ | /etε/ | 100 |
pl. | 6 |
34Pour les temps composés – plus-que-parfait, conditionnel et subjonctif passés –, aucune différenciation n’est faite entre les personnes 3 et 6 en raison d’une forme unique des auxiliaires avoir et être, respectivement à l’imparfait (/avε/ ; /etε/), au conditionnel présent (/ɔʁε/ ; /sʁε/) et au subjonctif présent (/ε/ ; /swa/)25. Tel n’est pas le cas pour le passé composé et le futur antérieur, toujours discriminés par la forme des auxiliaires, au présent (/a/-/õ/ ; /ε/-/sõ/), et au futur simple (/ɔʁa/-/ɔʁõ/ ; /sʁa/-/sʁõ/). En somme, potentiellement, les verbes du lexique français offrent assez peu de possibilités de variation en nombre même si les verbes les plus fréquents être, avoir, faire, aller, vouloir, devoir, venir, prendre, mettre, etc. (et leurs dérivés), varient clairement à cet égard au présent de l’indicatif. Ainsi, quinze des vingt-cinq verbes les plus fréquents du Français fondamental (60 %) varient en nombre (colonne de gauche). Un tel fonctionnement est cependant déjà minoritaire au sein des cinquante premiers verbes (48 %), la tendance ne faisant que s’accentuer au fur et à mesure qu’on s’achemine vers la droite du tableau 8. L’invariabilité concerne ainsi 827 des 1000 premiers verbes du français parlé (82,7 %) :
N=25 | N=50 | N=100 | N=300 | N=500 | N=750 | N=1000 | |
variable | 60 % | 48 % | 41 % | 23,7 % | 21,2 % | 18,7 % | 17,3 % |
invariable | 40 % | 52 % | 59 % | 76,3 % | 78,8 % | 81,3 % | 82,7 % |
35Même si les verbes sont moins affectés à cet égard, le français contemporain est à un stade d’évolution très avancé de disparition de l’accord en nombre pour les substantifs (99,5 %) et les adjectifs (96 %), le déterminant étant la plupart du temps le seul indice transversal véritablement stable26. Se pose alors la question de savoir s’il est scientifiquement légitime de convoquer la notion d’accord pour justifier – rétrospectivement – la complexité des normes prescriptives de l’orthographe actuelle. Un tel argumentaire semble poser l’accord comme systématique en français contemporain, dans la droite ligne de l’image qu’en donne l’orthographe normée. On peut néanmoins soupçonner l’influence, considérable, de l’imaginaire grammatical véhiculé par l’apprentissage scolaire de l’orthographe. Chervel rappelle ainsi le caractère uniformisant de l’orthographe grammaticale :
Étant donné une partie du discours (par exemple le nom) qui, dans la langue parlée, présente parfois certaines variations morphologiques (par exemple la variation en nombre), l’orthographe vise à donner le maximum de généralité à ce phénomène. Peu importe qu’un nombre très limité de noms pratiquent cette opposition (noms en -al, en -ail, […]) ; sur le plan graphique elle sera étendue à tous les autres noms […] dont le « pluriel » est marqué par la désinence graphique -s ou -x. […] L’orthographe met un -s à chat parce qu’elle généralise l’opposition de nombre, et deuxièmement on dit que chats est un pluriel (grammatical) parce qu’on lui a mis un -s. (Chervel 1973 : 88)
36Ainsi, les 0,5 % de substantifs variables en nombre (/bɔk.al|o/, voir tableau 2) en viennent à imposer aux scripteurs l’ajout d’un morphogramme de pluriel à tous les autres substantifs invariables (une|des /tabl/). En somme, potentiellement, on passe de 0,5 % d’accord véritable – envisagé selon l’approche linguistique de Corbett (2006) – à près de 100 % dans l’orthographe normée. Dans l’histoire d’un système d’écriture alphabétique, une telle convention orthographique s’explique aisément par le décalage entre évolution naturelle de la langue et inertie institutionnelle, sociale et politique des pratiques normées de l’écrit. À défaut de démarches proactives, régulières et raisonnées pour adapter l’ensemble des normes, des mutations fonctionnelles peuvent émerger au cours du temps. Certains graphèmes qui, à une époque, renvoyaient à des désinences audibles au travers du seul principe phonographique, se sont progressivement mutés en morphogrammes sans correspondance orale, en raison de la disparition de ces désinences dans le fonctionnement de la langue :
La morphographie est apparue en moyen français, comme une conséquence de l’amuïssement des consonnes finales. On ne prononce plus ces consonnes (qui correspondaient bien souvent à des marques désinentielles) mais on continue de les écrire pour l’information grammaticale ou lexicale dont elles sont la marque. (Cazal & Parussa 2015 : 24-25)
37Il s’agit donc là d’une conjoncture sociohistorique, qui dévoile davantage le fonctionnement de la langue en diachronie qu’en synchronie :
Depuis le M[oyen] F[rançais] (14ème-15ème siècles), on n’a plus que deux
genres […] et deux nombres ; il n’existe plus de déclinaison pour les
noms, déterminants et adjectifs […]. Les anciennes marques de cas régime
singulier et pluriel (le mur/les murs) servent désormais uniquement à marquer l’opposition
de nombre à l’écrit, car la plupart du temps elles ne s’entendent plus à
l’oral, et c’est de fait le déterminant qui marque cette distinction
(le mur [lømyR] / les
murs [lemyR]). (Marchello-Nizia 1999 : 83)
La morphologie du pluriel est encore, en ancien français, une morphologie
intégrée par des cas d’emploi et une marque flexionnelle s, cependant bivalente […]. Réduite à la marque
du nombre avec l’effacement des cas, elle s’efface oralement dans le
mouvement général d’amuïssement des consonnes finales, amorcé à la fin
du 13e siècle, le pluriel n’étant plus marqué oralement que par
l’article les/des selon un
drift évolutif tendant à transférer les flexions nominales et verbales
sur des morphèmes externés antéposés. (Buridant 2019 : 1121, § 704)
38Pourtant, en dépit de ce décalage entre orthographe normée et fonctionnements langagiers en synchronie, la linguistique contemporaine continue de fonder nombre de ses analyses sur la base d’un étalon écrit. Blanche-Benveniste (2010 : 2) déplore ainsi que « les analyses grammaticales ont été pendant si longtemps si fortement ancrées dans l’orthographe qu’il est difficile de s’en émanciper », « la morphologie du français parlé » se voyant alors considérée « en termes de manques, manque de flexions, manque d’accords, faiblesse des désinences ». À titre d’illustration, observons la manière dont est présenté le nombre en relation avec le substantif dans deux grammaires linguistiques d’époques différentes. Les fonctionnements de la morphographie y sont décrits en premier, comme le révèle la pagination :
La catégorie morphologique du nombre comporte en français deux termes : le singulier et le pluriel. Elle affecte le nom et les éléments qui s’accordent avec lui. (Arrivé, Gadet & Galmiche 1986 : 418)
39Les auteurs illustrent cette première explication d’exemples :
Le nombre n’intervient pas de la même façon dans la morphologie de tous
les noms :
1. Seuls les noms comptables sont, dans les conditions normales,
susceptibles de prendre en alternance, selon les besoins momentanés de
l’énonciation, la forme du singulier et celle du pluriel : une maison, des maisons,
mais de l’eau, de la
bière, de la bonté. (Arrivé, Gadet &
Galmiche 1986 : 418-419)
40À ce stade aucune mention n’a encore été faite de l’invariabilité en nombre de la quasi-totalité des substantifs. Et c’est au travers de l’orthographe normée, constituée comme étalon – qui impose une variabilité visuelle entre <sac> et <sacs> – qu’est analysé « en termes de manques » (Blanche-Benveniste 2010 : 2) le fonctionnement de la langue orale, puisque le <s>, morphogramme d’emblée envisagé comme manifestation indiscutable du nombre, « ne se prononce pas »27 :
La forme du pluriel des noms est généralement opposée à celle du singulier par la présence, à l’écrit, d’un -s à la fin du mot : un sac, des sacs ; un jonc, des joncs ; une poire, des poires, etc. Sauf dans les phénomènes de liaison, cet -s ne se prononce pas. (Arrivé, Gadet & Galmiche 1986 : 421)
41Trente-cinq ans plus tard, La Grande grammaire du français suit le même cheminement :
Les noms varient en nombre et ont pour la plupart deux formes (singulier et pluriel : maison, maisons), alors qu’ils ont généralement un seul genre (féminin ou masculin). (Melis & Godard 2021 : 377)
42C’est encore en termes de manque qu’est évoquée la non-conformité de l’oral à la norme visuelle :
À l’oral : le pluriel des noms, qu’il soit en -s ou en -x, ne s’entend pas, sauf en cas de liaison avec un adjectif épithète (amis attentifs prononcé /amizatãtif/) (Melis & Godard 2021 : 391)
43De telles présentations linguistiques s’inscrivent dans la lignée de celles de la grammaire traditionnelle. On les retrouve en des termes plus simples dans les manuels scolaires, dont l’objectif n’est en l’occurrence pas scientifique mais pédagogique : enseigner les normes de l’orthographe. La grammaire pour tous de Bescherelle explique effectivement, elle aussi, que « Le nom possède un genre et il est variable en nombre […] Le nom varie en nombre : un rôti, des rôtis. » (Laurent & Delaunay 2024 : 52, § 59). Si d’un point de vue pédagogique, il est fondamental d’attirer l’attention des élèves sur cette variation morphographique qu’ils devront apprendre à maitriser, linguistiquement, depuis plusieurs siècles déjà, /ʁoti/ n’est pas plus variable que /mezõ/ pris comme exemple par Arrivé, Gadet & Galmiche (1986 : 419) et Melis & Godard (2021 : 377). Toutefois, comme le remarque Chervel (1973 : 88-89) : « c’est la grammaire de l’écrit qui attire tous les regards, c’est la seule qui soit, par l’école et les manuels, intégrée à notre culture ». En dépit de la reconnaissance en linguistique de la primauté de l’oral (voir Lyons 1972 : 62-65), les linguistes peinent eux aussi à s’affranchir de l’influence de l’écrit (voir note 32), dénoncée par Harris28 :
The scriptist bias of modern linguistics reveals itself most crudely in
the way in which, for all their insistence in principle on the primacy
of the spoken word, linguistic theorists in practice follow the
traditional assumption that standard orthographic representation
correctly identifies the main units of the spoken language. […] Such
assumptions, when made on page after page, amount virtually to
presupposing that the linguist’s analytic task has already been done for
him in advance, and its results conveniently embodied in traditional
orthographic practice. (1980 : 8-9)
44En ce qui concerne le nombre, si on s’émancipe de l’emprise de l’orthographe, Chervel rappelle que :
L’usage oral, c’est d’une part /ʃəval/-/ʃəvo/29, d’autre part /ʃa/-/ʃa/ : et il est évident que chaque Français dispose d’une grammaire implicite stipulant une opposition de nombre pour /ʃəval/ […] mais pas pour /ʃa/, enregistré comme invariable ainsi que l’immense majorité des noms. (1973 : 88)
45Toutefois, l’apprentissage scolaire des normes prescriptives de l’orthographe remodèle en partie cette « grammaire implicite » du locuteur natif en générant notamment de nouvelles manières de se représenter les fonctionnements langagiers. En effet :
L’usage graphique ajoute un -s à cha (et aussi un -t […]) quand il y a plusieurs chats […]. Il sous-tend une grammaire qui est fondée à parler de « formes » différentes chat et chats, à opposer un singulier et un pluriel pour ce mot, et à considérer comme (quasi) générale l’opposition de nombre dans le nom : c’est la grammaire traditionnelle. En tant que grammaire de l’usage écrit elle n’est jamais que l’une des deux grammaires du français. Tout aussi légitime est la grammaire de l’oral qui énonce que le mot /ʃa/ n’a pas plus un pluriel /ʃa/ qu’il n’a un accusatif /ʃa/ ou un ergatif /ʃa/, et qui conclut que /ʃa/ est invariable. (Chervel 1973 : 88-89)
46Si, comme Blanche-Benveniste citée plus haut, Chervel revendique ici l’intérêt de la « grammaire de l’oral », il n’en demeure pas moins que la « grammaire de l’écrit » en est indissociable à beaucoup d’égards. En effet, cette dernière émane nécessairement en grande partie de l’acquis des fonctionnements de la première. L’apprentissage du français écrit se déroule toujours dans un second temps sur la base de connaissances langagières déjà bien en place : « writing has to be taught after the basic grammar, phonology and lexicon of spoken language have already been largely mastered. In the experience of the child, writing is built up on already acquired knowledge of speech. » (Milroy & Milroy 2002 : 55). Que l’apprentissage scolaire des normes de l’écrit influence notre manière de conceptualiser les fonctionnements langagiers et les modifie en partie parait indiscutable. Il semble toutefois plus hasardeux d’imaginer que ces normes prescriptives puissent supplanter les mécanismes langagiers de notre grammaire implicite de l’oral, fruit de l’acquisition naturelle de notre langue maternelle et de nos usages parlés quotidiens. Dès lors, fournir des descriptions linguistiques de l’accord en prétendant, conformément aux normes prescriptives de l’orthographe, que son fonctionnement reste systématique en français contemporain – contre l’évidence de son évolution en diachronie – constitue une hypothèse (très) forte, dont il faudrait démontrer la pertinence et la validité scientifiques30.
4 | La dimension sociale de l’orthographe et la responsabilité des linguistes
47Si ce type de critique d’ordre épistémologique reste en général confiné au champ de la recherche scientifique, un problème annexe surgit cependant quand il s’agit de l’orthographe. En effet, contrairement à d’autres tentatives de description entreprises par la linguistique (par ex. le statut phonologique du schwa, l’usage des marqueurs discursifs, le sémantisme de mais, etc.), celle de l’orthographe est toujours susceptible d’avoir des répercussions sociopolitiques.
48En effet, « l’orthographe est […] devenue le domaine d’entrée dans la langue écrite le plus emblématique de l’école » (Manesse & Cogis 2007 : 17). Dès lors, dans une société comme la nôtre, où la scolarisation est obligatoire, l’orthographe et l’écrit normé en viennent à jouer un rôle déterminant tout au long du parcours scolaire, et au-delà, dans le monde professionnel31. Or, l’orthographe du français étant « très certainement l’une des plus difficiles à apprendre et à utiliser » (Fayol & Jaffré 2014 : 23), des débats autour de sa simplification surgissent régulièrement avec « des réformes souvent proposées mais rarement acceptées » (Ibid. : 6). C’est ici précisément que le rôle de la description linguistique des fonctionnements du français contemporain et de l’orthographe prescriptive peut devenir important, voire déterminant.
49Cependant, comme nous l’avons entrevu dans cet article, une description linguistique entachée d’un biais scriptural tendra inévitablement à offrir des explications justifiant la complexité orthographique actuelle en posant par exemple comme systématique, contre les faits de langue, l’existence de l’accord en français contemporain. Si l’apprentissage de la morphographie pouvait reposer sur la simple mise en œuvre de « processus réflexifs, de nature métalinguistique » (Manesse 2007 : 17) s’inspirant notamment de ces descriptions linguistiques, les scripteurs francophones n’éprouveraient guère de difficulté à la maitriser (Blanche-Benveniste 2000 : 2). Il leur paraitrait rapidement naturel d’insérer ces morphogrammes supposés transposer l’« accord », décrit par les linguistes. Or, les difficultés demeurent et « les ambitions d’une maitrise de l’orthographe achevée à la fin de la scolarité obligatoire ne sont pas satisfaites », « l’orthographe grammaticale étant la zone à haut risque » (Cogis 2007 : 136 et 97). En témoignent les deux courts extraits (15) et (16), le premier issu du Corpus14 (Steuckardt 2015) provient de la correspondance d’un soldat « peu lettré » de la première guerre mondiale, le second d’un élève de Cours Élémentaire 2ème année, (CE2 ; 3ème année de primaire) du corpus Scolinter (Wolfarth, Ponton & Totereau 2017) :
la nuit toute les routes qui aboutissent au village son barrés avec des charriot et les sentinelles empèche de passer (Alfred Foray, 30 ans, 15/10/1914)
Il étais une fois une sorcière et son chat ils vivait dans une maison sombre. (élève de CE2, France)
50Malgré les graphies non-normées (en gras), le principe phonographique assure une lecture parfaitement conforme à celle ciblée (voir Surcouf 2018, 2021b, 2024b). La syntaxe est également irréprochable. Seule l’orthographe grammaticale pose véritablement problème. Récurrentes dans l’appropriation et la manipulation des normes orthographiques, l’existence de telles difficultés révèlerait non seulement la discordance conceptuelle entre normes prescriptives et intuition langagière des locuteurs/scripteurs (Surcouf 2024c) mais aussi le caractère en partie inadéquat des descriptions linguistiques, comme celles entrevues dans cet article (voir également Surcouf 2024a)32. En tant que locuteurs francophones, ces scripteurs perçoivent naturellement /tut/, /ʃaʁjo/, /ãpεʃ/, /etε/, /vivε/ comme invariables en nombre, et /baʁe/ en genre et en nombre. La (re)lecture de leur propre production les convainc en temps réel que la présence des déterminants et des pronoms personnels – correctement orthographiés – suffit à véhiculer l’information de genre et de nombre, sans aucun risque d’ambigüité, conformément aux fonctionnements du français parlé contemporain. En d’autres termes, pour eux, en tant que premier lecteur de leur propre écrit, nul besoin impérieux d’« assur[er] la cohérence » ou de veiller à la « conservation de l’information » (Fayol & Jaffré 2014 : 90) en faisant l’« accord » entre <les> et <toute>, <des> et <charriot>, <les sentinelles> et <empêche>, <ils> et <vivait>. Les exemples (15) et (16) n’ont rien d’exceptionnel, comme le révèlent les résultats rapportés par Fayol & Jaffré :
L’instruction dispensée et les apprentissages réalisés implicitement conduisent à une amélioration des performances en fonction du niveau scolaire : dans une épreuve de complètement de mots inclus dans des syntagmes ou des propositions (les poul... rouss... picor...), les taux d’accords corrects passent de 47 % en 1ère primaire à 91 % en 3ème primaire pour les noms, de 20 % en 1ère primaire à 60 % en 3ème primaire pour les adjectifs et de 1 % en 1ère primaire à 65 % en 3ème primaire pour les verbes. (2014 : 96)
51Ces résultats peuvent être envisagés de plusieurs points de vue : didactique, linguistique et épistémologique. Didactiquement, de telles données offrent un aperçu précieux du parcours effectué, et peuvent servir de base au développement de nouvelles approches pédagogiques pour optimiser l’enseignement-apprentissage de l’orthographe, l’un des objectifs fondamentaux de l’école. Maintenant, d’un point de vue épistémologique les linguistes devraient prendre garde aux risques de glissements interprétatifs entre les niveaux d’analyse didactique et linguistique. Le premier s’articule autour de problématiques orthographiques, abondamment traitées dans les manuels scolaires, où le terme « accord » concerne essentiellement l’orthographe grammaticale (voir Chervel 1973), même s’il recoupe occasionnellement l’acception linguistique (Corbett 2006) (cf. la paire d’exemples : <ce cheval spécial mord tout le monde>/<ces chevaux spéciaux mordent tout le monde>).
52En ce qui concerne le niveau linguistique, notre discipline devrait s’émanciper davantage de la grammaire traditionnelle, caractérisée par sa propension à fonder ses analyses sur la base de l’étalon écrit. C’est à cette seule condition qu’il deviendra possible de s’affranchir de la dimension archaïsante des normes prescriptives de l’orthographe et des états de langue révolus qu’elles véhiculent (voir également Surcouf 2021a). La prise en compte du stade actuel d’évolution du français – en synchronie donc – permettra notamment de jeter un éclairage nouveau sur les fonctionnements, désormais sporadiques en français contemporain, de l’accord.
53En somme, en tant qu’approche scientifique de la langue, la linguistique doit s’efforcer de fournir des descriptions synchroniques le plus proche possible de la réalité des faits de langue contemporains. Or, en laissant sans cesse s’immiscer l’écrit dans leurs analyses, les linguistes en viennent à présenter les fonctionnements langagiers filtrés par le biais des normes prescriptives de l’orthographe. Et dans une sorte d’approche de rétroingénierie descriptiviste, étrangement, ils finissent par reformuler en des termes propres à la linguistique les règles prescriptives de l’orthographe à l’origine des textes analysés. En découle l’impression – en grande partie erronée – que l’orthographe grammaticale ne fait que répondre aux exigences d’accords du français contemporain. Aussi difficile soit-elle à apprendre, cette complexité de fonctionnement serait en somme inévitable puisqu’elle reflèterait celle de la langue :
D’une façon générale, la « nécessité » hétérographique – si nécessité il y a – est d’abord tributaire de la structure linguistique (morphologie, phonologie, etc.) et de la fréquence des mots. Elle ne fait en quelque sorte que prolonger des aspects « inscrits dans la langue », en les adaptant aux exigences de la communication écrite. (Jaffré 2006 : 38)
54Enfin, on en vient à trouver à cette complexité des vertus (pourtant difficiles à prouver scientifiquement ; voir plus haut) :
À priori l’hétérographie n’est qu’un facteur parmi d’autres, qu’il convient d’apprécier en tant que tel, un instrument à la disposition du lecteur et de son confort. (Jaffré 2006 : 38)
55Et, en raison du caractère social de l’orthographe, de telles justifications risquent de déborder le champ de la linguistique. En témoignent par exemple les explications quelque peu caricaturales fournies par Dehaene – neuroscientifique titulaire de la chaire de psychologie cognitive expérimentale au Collège de France – dans son ouvrage Les neurones de la lecture :
Les conventions orthographiques ont évolué pour tenir compte de cette contrainte qui complique certainement le travail de dictée, mais facilite immensément celui du lecteur. L’élève qui se lamente sur les dizaines d’orthographes du son « é » dans « tu es », « il est », « j’ai », « j’avais », « il avait », « vous avez », doit comprendre que ces fioritures sont indispensables à la lecture. Sans ces distinctions, le texte écrit ne serait qu’un rébus, que le lecteur passerait un temps considérable à décoder. (2007 : 63)
56Les linguistes ont une part de responsabilité dans ce type de réappropriation, toujours susceptible de servir d’argument – partiellement infondé – contre toute proposition de réforme de l’orthographe. Il ne s’agit pas ici de prendre parti pour ou contre une telle proposition (voir à cet égard le positionnement engagé d’Auroux 1998 : 289), mais de porter un regard épistémologique critique sur l’incidence du biais scriptural dans les descriptions du français contemporain, dont beaucoup reposent sur un parti pris théorique fort ne faisant l’objet d’aucune argumentation33. Et l’analyse linguistique de l’orthographe n’est pas épargnée.
57Pour finir, examinons cette dernière citation, à la fois anodine et représentative :
Les orthographes se distinguent surtout par la façon dont elles rendent compte de l’organisation grammaticale d’une langue. La langue française est une langue flexionnelle. Les mots s’achèvent en général par des « flexions », c’est-à-dire des éléments grammaticaux qui marquent le nombre, le genre, le temps, etc. (Jaffré 2005 : 28)
58Si cette affirmation ne semble pas relever d’un postulat théorique fort, c’est qu’elle est congruente avec la plupart des approches linguistiques. Mais arrêtons-nous précisément sur la forme même des mots de cette citation. Aucun des onze substantifs qu’elle comporte – /ɔʁtɔgʁaf/, /fasõ/, /kõt/, /ɔʁganizasjõ/, etc. – ne varie en nombre. Sur les trois adjectifs, à l’instar de la majorité d’entre eux, /flεksjɔnεl/ et /fʁãsε/ sont invariables en nombre, seul le second varie en genre ; quant à /gʁamatikal/, il varie en nombre, et en genre uniquement au pluriel. Enfin, sur les cinq verbes utilisés ici à l’IndPr, la variation en nombre entre P3 et P6 est inexistante pour distinguer, achever et marquer, soit /distɛ̃g/, /aʃεv/, /maʁk/ mais effective pour rendre /ʁã/-/ʁãd/ et être /ε/-/sõ/. Bien qu’anecdotique, cette comparaison n’en révèle pas moins la grande disparité entre les normes prescriptives de l’orthographe et les fonctionnements objectivables de la langue. En l’absence d’homologie entre ces deux fonctionnements, l’orthographe normée ne peut pas servir d’indice fiable pour analyser le français contemporain. Pour le nombre, la prise en compte de l’évolution de la langue imposerait, contre les normes orthographiques, d’envisager l’accord comme en voie de disparition, le substantif en étant l’incarnation la plus évidente.
59Si l’écrit s’offre comme l’outil indispensable à l’émergence et au développement de toute science, en linguistique, son statut revêt un caractère particulier. En effet, quelles que soient les normes prescriptives de l’orthographe, elles véhiculent toujours une forme de théorisation sur la langue. Le linguiste doit alors s’efforcer de se départir de son conditionnement de lecteur/scripteur expert pour repérer et pondérer tous les biais qu’est susceptible d’introduire l’orthographe.
60Outil prodigieux, l’écrit nous permet également d’accéder aux recommandations des grandes figures disparues de notre discipline :
Bien que l’écriture soit en elle-même étrangère au système interne, il est impossible de faire abstraction d’un procédé par lequel la langue est sans cesse figurée ; il est nécessaire d’en connaitre l’utilité, les défauts et les dangers. (Saussure 1994 : 44)
61L’utilité, le linguiste l’a saisie depuis longtemps. Désormais il lui faut réfléchir aux défauts et aux dangers. Saussure servira-t-il à ce sursaut ?
- 1 En d’autres termes, nos réflexions, épistémologiques, ne visent nullement à prendre parti pour ou contre une réforme de l’orthographe actuelle.
- 2 Le texte officiel est disponible sur le site de Légifrance, « service public de la diffusion du droit par l’internet » qui « est placé sous la responsabilité éditoriale du Secrétariat général du Gouvernement ». Ce passage a été « Modifié par loi constitutionnelle n°2008-724 du 23 juillet 2008 de modernisation des institutions de la Ve République » pour apparaitre désormais dans l’article 6 », sans que l’erreur n’ait pour autant été rectifiée. La version officielle du site de l’Assemblée nationale rétablit la forme normée <menacées>.
- 3 Le document officiel est consultable à [https://omarlatuee.fr/index.php?post/2011/08/La-premiere-expertise-en-ecriture] (25/08/2024).
- 4 Les graphies seront dorénavant notées entre chevrons.
- 5 Les personnes sont indiquées dans l’ordre conventionnel : 1=je, 2=tu, etc. et ailleurs « P1 » renverra à la 1re personne, « P2 » à la deuxième, etc.
- 6 « Several decades of research on visual word recognition have revealed that the recovery of phonological information is the primary mechanism by which we retrieve meaning » (Frost & Ziegler 2007: 115). Les études de suivi oculaire en lecture confirment également ces résultats : « The eye movement data […] indicate a very central role for phonological coding when people read text. » (Rayner et al. 2012 : 137). Pour une synthèse récente sur le rôle déterminant de la phonologie, voir Brysbaert (2022).
- 7 Des développements plus conséquents sont proposés dans le chapitre Laissez l’orthographe en paix ! de Bentolila (2010, 145-156).
- 8 « ou écriture du sens », « dont le but est de donner une forme visible aux signes linguistiques » (Fayol & Jaffré 2014 : 15).
- 9 En japonais, le pronom personnel est optionnel et la conjugaison ne comporte aucune marque de personne (voir Corbett 2006, 107). Ainsi, dans le système d’écriture mixte du japonais (sinogrammes et syllabaires), la forme unique /ikɯ/ (aller, je vais, tu vas, il va, nous allons, etc.) s’écrit toujours 行くquelle que soit la personne (1 à 6) du présent (le sinogramme – kanji – 行 signifie aller et se lit ici /i/ ; le hiraganaくtranspose la syllabe /kɯ/ et indique l’infinitif/le présent).
- 10 Fayol & Jaffré (2014 : 29) signalent ailleurs ce fait historique dans l’évolution du français parlé : « Le fonctionnement de ces désinences est d’autant plus complexe qu’il distingue des homophones (je veux vs il veut). C’est d’ailleurs pour compenser l’inconvénient de désinences devenues obsolètes, que les pronoms (je, tu, etc.), typiques de la langue française, se sont imposés au XVIIe siècle. »
- 11 Redondance perçue comme un atout, voire une nécessité dans le cadre de la théorie de l’information : « La communication ne peut en effet s’établir que si rien ne vient interrompre le contact entre le locuteur et l’auditeur ; mais la communication ne se réalise jamais dans des conditions optimales ; il y a des "bruits" qui viennent masquer la communication (bruits divers, autres voix, inattention de l’auditeur, etc.). L’auditeur n’entend finalement qu’une partie du message ; tous les éléments de l’énoncé, et cela quel que soit le plan linguistique, ont besoin d’être redondants » (Dubois 1965 : 9).
- 12 Définis par Catach comme « "graphèmes de morphèmes", c’est-à-dire de désinences, flexions verbales, préfixes, suffixes, de dérivation, etc. Ces morphogrammes sont prononcés ou non, mais maintenus dans la graphie dans l’un et l’autre cas, en tant que marques de série ou de sens » (2004 : 53).
- 13 Nous avons rectifié la coquille de l’original. Le symbole phonétique /R/ est celui des auteurs. Étant donné qu’en français contemporain d’Europe il s’agit d’une fricative uvulaire, nous le remplacerons par /ʁ/ dans nos développements.
- 14 Le suivi oculaire durant la lecture silencieuse permet effectivement d’établir la présence constante de saccades à rebours, même chez les lecteurs aguerris soumis à ce type d’expérimentations : « While most saccades in reading move forwards, about 10–15% move backwards and are termed regressive saccades (or regressions for short). […] since we make about four to five saccades per second, we make a regression about once every 2 seconds » (Rayner et al. 2012 : 91). Par ailleurs, ces saccades vers l’arrière augmentent avec la difficulté du texte : « for more difficult text we know that the reading rate slows down, the average fixation duration increases, the average saccade size decreases, and the number of regressions increase » (Ibid. : 124).
- 15 Ailleurs, Fayol évoque ces différences fondamentales : « Contrairement à ce qui vaut pour l’oral, il est possible de ralentir sa lecture et son écriture pour mieux contrôler ce que l’on comprend ou rédige. Cette situation est difficilement réalisable à l’oral où le traitement dépend du rythme imposé par le débit d’autrui et par la nécessité de reprendre ou de laisser la parole. D’autre part, le retour sur ce qui a déjà été lu ou produit est envisageable, ouvrant la voie à une meilleure intégration des informations ou à une reprise de ce qui a déjà été formulé. Là encore, les conditions de l’oral réduisent ces possibilités » (2013 : 6).
- 16 Nous avons changé tour en rivière pour rendre la phrase au singulier plus vraisemblable pragmatiquement et nous avons également éliminé l’adjectif noir pour simplifier la démonstration.
- 17 Rappelons que notre propos est épistémologique et, pour cette raison, n’entend aucunement suggérer les orientations que devrait prendre une éventuelle réforme de l’orthographe.
- 18 Défini ailleurs par les auteurs, le terme « morphographie » « désigne […] l’ensemble des marques écrites jouant un rôle grammatical » (Fayol & Jaffré 2014 : 29). On remarque cependant un certain flottement terminologique dans la mesure où <s>, <nt>, etc. sont parfois qualifiés, comme ici, de « marques morphologiques » et ailleurs de marques « morphographiques » comme c’est le cas par exemple du « -s du pluriel des noms » mentionné ailleurs par Fayol & Jaffré (Ibid. : 29).
- 19 Un tel travail, considérable, ne peut pas entrer dans le cadre de la rédaction d’un article.
- 20 La prise en compte des 100 items les plus fréquents (noms, adjectifs, verbes) du Français fondamental (Gougenheim et al. 1964) donne un aperçu de la fréquence d’usage en français parlé. Ces calculs ont été effectués à partir des données nettoyées et réorganisées provenant d’un fichier compilé par Boris New, et anciennement disponible sur Lexique.org.
- 21 Remarquons que pour les substantifs comme pour les adjectifs, il n’y a pas de véritable morphème de pluriel qui viendrait s’ajouter à un radical comme par exemple dans le mot chat en espagnol /gato/ /gatos/ ou en anglais /kæt//kæts/, etc.
- 22 Ont été exclus les noms n’apparaissant qu’au pluriel, comme calendes, confins, fiançailles, etc.
- 23 Ces quatre noms sont cheval, mal, monsieur, et madame, ce dernier fonctionnant généralement comme vocatif et admettant assez difficilement « les mesdames », ou encore « *plusieurs/*quelques/*certaines mesdames ».
- 24 Les quatre adjectifs sont général, normal, social, national. À titre indicatif, signalons que parmi les cent premiers adjectifs, un sur deux est invariable en genre, /vʁe/, /sœl/, /povʁ/, /ʁuʒ/
- 25 Cette remarque vaut uniquement quand le sujet est un syntagme nominal (par ex. : Le poisson avait nagé/Les poissons avaient nagé). Lorsque la forme conjuguée de l’auxiliaire commence par une voyelle (/avε/, /etε/, /ɔʁε/, /ε/), l’usage des pronoms personnels (il/ils, elle/elles) entraine une liaison obligatoire permettant la discrimination du nombre (voir note suivante).
- 26 Un marquage du pluriel subsiste dans l’usage de la liaison, pouvant être obligatoire ou non. Elle est obligatoire avec les pronoms personnels /il/ et /εl/ devant un verbe à initiale vocalique au présent de l’indicatif ou du subjonctif (/(k)ilaʁiv/-/(k)ilzaʁiv/), à l’imparfait (/ilaʁivε/-/ilzaʁivε/) et au conditionnel (/ilaʁivʁε/-/ilzaʁivʁε/). Ce fonctionnement s’avère déterminant dans les temps composés comme le plus-que-parfait (/ilavεlave/-/ilzavεlave/ ; /iletεpaʁti/-/ilzetεpaʁti/), ainsi que pour le conditionnel passé et le subjonctif passé avec avoir (/ilɔʁεlave/-/ilzɔʁεlave/ ; /kilelave/-/kilzelave/). Pour les noms et les adjectifs, les études sur corpus montrent que la liaison n’est plus catégorique : « liaison with plural prenominal adjectives [“beaux outils”] is almost categorical across styles, liaison after plural nouns [“soldats italiens”] is exceptional in colloquial speech and frequent only in formal production » (Côté 2011 : 8). « De nombreux travaux ont considéré <Adj+N> comme un contexte de liaison obligatoire. Les conversations de PFC [=Phonologie du Français Contemporain] fournissent un nombre limité de ces séquences, l’adjectif et le substantif pouvant être au singulier ou au pluriel. Ce type de liaison ne constitue […] que 0,64 % de l’ensemble des liaisons réalisées. […] Pour les non-liaisons, on a des attestations du type […] petits // entrepreneurs, longues // années » (Durand et al. 2011 : 116). Quoi qu’il en soit, aucun consensus n’existe sur le statut de cette liaison. Côté (2011) recense cinq analyses possibles, allant du statut de suffixe du mot1 /ptiz+ami/ (conformément aux normes orthographiques <petits amis>) à celui de préfixe du mot2 /pti+zami/ en passant par celui de consonne épenthétique /pti+z+ami/, chacune de ces solutions pouvant de surcroit reconnaitre un statut plus ou moins morphologique de marque de pluriel à ce /z/.
- 27 Bien que canonique, cette formulation constitue un abus de langage et surtout, plus dommageable, un impensé épistémologique (voir déjà Saussure 1994 : 52). Une lettre étant par essence un graphisme, elle ne se prononce pas davantage que le dessin d’un hippopotame ou d’une chaussette en laine. La prononciation – propre au fonctionnement de toute langue parlée –, préexiste à la lettre. La logique de fonctionnement d’un système d’écriture alphabétique consiste en revanche à associer par convention un (ou plusieurs) phonème(s) à un graphème. Ainsi, en français, <s> est notamment associé à /s/. Conformément à l’ensemble de ces conventions, il est alors possible de lire – pas de prononcer – <sac> en se fondant sur les associations <s> /s/, <a> /a/, <c> /k/, menant ici par concaténation à la lecture /sak/. En présence d’un <s> final faisant office de morphogramme dans <sacs>, l’association <s> /s/ du <s> final est suspendue ou désactivée. En définitive, dire que le « -s ne se prononce pas » revient à prendre l’écrit comme étalon, et à poser comme linguistiquement indiscutable la marque visuelle de pluriel <s>, dont on chercherait alors, en vain, un équivalent à l’oral, menant à cette formulation négative qui en signalerait l’absence. Dans [lesak], il n’y a rien qui « ne se prononce pas » : tout se prononce. En inversant la perspective, et en prenant la langue parlée comme point de départ du raisonnement, on aboutirait à une formulation de type : « Bien qu’il n’existe aucune marque de pluriel pour /sak/ dans /lesak/ en dehors du déterminant par rapport à /ləsak/, les normes prescriptives de l’orthographe imposent l’ajout d’un <s> à la transposition <sac> de /sak/, soit <sacs> ». Le terme « consonne muette » est pour les mêmes raisons également inapproprié.
- 28 Voir également la définition de « scriptism » donnée par Coulmas (1996 : 455), l’ouvrage sur le biais scriptural – « written language bias » – de Linell (2005), les critiques de Bachtin & Vološinov (1977 : 96-119), et dans leur continuité Lahire (2008 : 63).
- 29 Pour rendre le propos plus clair, nous avons transformé la graphie phonétisante de Chervel en alphabet phonétique.
- 30 Il est bien entendu toujours possible dans le modèle théorique de postuler, comme dans l’approche générativiste, des représentations sous-jacentes (« underlying representations » chez Schane 1965) différant des formes de surface. La question épistémologique est alors de savoir si un tel modèle explicatif, sans correspondance direct avec les observables, correspondrait à une réalité cognitive, elle aussi inobservable.
- 31 « Poor and disadvantaged families are overrepresented among functional illiterates, and people with literacy problems are more likely than others to have low-paying or no jobs and to be at risk of falling into poverty » (Coulmas 2013 : 64).
- 32 Dans son cours de Linguistique générale du 16/01/1906, Saussure rappelle avec insistance qu’« il est impossible de prendre pour base de la linguistique le mot écrit ; ce serait en restreindre fort l’objet. […] le mot écrit n’est pas coordonné au mot parlé mais il lui est subordonné. La prééminence revient donc de droit au mot parlé sur le mot écrit. […] Pourtant nous ne pouvons pas nous passer du mot écrit comme document » (Komatsu & Wolf 1996 : 5-6). En effet, si les graphies en italique <je douis soubalement>, <un dris garçon groude ici> n’existent pas, c’est pour une raison simple : aucune de ces formes n’existe ou n’a existé en français parlé. À l’inverse, l’existence de <tu lis tout> et <il court vite>/<ils courent vite> est rendue possible par celle, ontologiquement première, de /tylitu/ et /ilkuʁvit/. La prise en compte de cette précédence ontologique du parlé sur l’écrit s’avère épistémologiquement fondamentale dans toute entreprise de description des fonctionnements d’une langue. Prendre l’écrit comme étalon, c’est contredire cette précédence ontologique. En ce sens, entreprendre la description du français parlé n’est pas une approche complémentaire ou souhaitable (Blanche-Benveniste 2007) de la linguistique, elle en est le fondement. Pour autant, l’avertissement épistémologique de Saussure n’exclut pas de notre discipline l’étude de l’écrit.
- 33 D’un point de vue purement théorique, quelle que soit l’approche, il est toujours possible de proposer des arguments. Par exemple pour défendre la généralité de l’accord en nombre des substantifs, on peut argüer que les 99,5% substantifs invariables sont commutables avec /ʃəv.al|o/. Les structures sous-jacentes, les règles d’effacement, les morphèmes zéro, etc. ont déjà été exploités par la linguistique. L’absence de tout argumentaire constitue en revanche un angle mort épistémologique.