Deutsche Gesellschaft
für phänomenologische Forschung

Zeitschrift | Band | Artikel

L'orthographe, entre phonographie et sémiographie

Jean-Pierre Jaffré(CNRS)Jean-Christophe Pellat(UR LiLPa, Université de Strasbourg)

pp. 19-39

Abstrakt

Depuis plusieurs années déjà, les travaux linguistiques s’accordent sur un point, fondamental : les orthographes du monde résultent d’un double processus, phonographique et sémiographique. Après un exposé succinct de la genèse de ces deux principes, de leur histoire, deux études de cas sont présentées. La première porte sur l’orthographe du français et la seconde, sur celle du japonais. Ces deux exemples, parce qu’ils relèvent de milieux socio-culturels et linguistiques différents, illustrent ce qui, au-delà des similitudes, fait la spécificité de chaque orthographe.

L’histoire même n’est pas que hasard, mais nécessité, système… Nina Catach, dédicace personnelle, Dictionnaire historique de l’orthographe française, 1995

1Depuis plusieurs années, les travaux scientifiques s’accordent sur un même constat : toutes les orthographes du monde résultent de la mise en œuvre de deux principes complémentaires, la phonographie et la sémiographie. Le premier de ces principes, qui constitue la base de l’écriture1, permet d’ancrer la trace écrite dans la langue en s’appuyant sur les unités de base telles que les syllabes ou les phonèmes. Le second, incarne la raison d’être de cette même écriture en donnant à voir le sens linguistique. Mais si toutes les orthographes ont ces deux principes en commun, elles ne les mettent pas forcément en œuvre de la même façon. Les options phonographiques peuvent différer selon qu’elles sélectionnent des phonèmes, à l’instar des orthographes occidentales, ou des syllabes, celle du chinois par exemple. Certaines comme le hangul coréen ou les écritures indiennes mixent même les deux. D’autres facteurs contribuent également à la spécificité orthographique. Les options sémiographiques peuvent notamment différer en fonction de la structure des langues – isolantes, agglutinantes ou flexionnelles. Le statut des marques grammaticales – désinences, accords, etc. – joue également un rôle important. Se dégagent dans ce domaine deux tendances majeures. Les marques grammaticales qui empruntent la voie de la phonographie, comme en espagnol ou en italien, tendent à faire de la sémiographie une simple réanalyse. Dans ce cas, les orthographes sont proches de la transparence et l’on parle de sémiographie mineure. En revanche, lorsque la morphologie écrite diffère de celle de l’oral, la sémiographie revêt une part de spécificité, comme en français ou en chinois. Les orthographes sont alors qualifiées d'opaques et la sémiographie devient majeure (Brissaud, Jaffré & Pellat, éds, 2008). C’est ce que nous verrons plus loin à partir de l’étude de deux cas représentatifs, ceux du japonais et du français (Fayol & Jaffré 2024).

1 | Genèse graphique

2Mais il n’est d’abord pas inutile de s’interroger, serait-ce brièvement, sur la genèse des deux principes constitutifs de toute orthographe. Car, avant de parvenir aux formes qui nous sont aujourd’hui familières, l’écriture a emprunté bien des chemins tortueux. Et si certains ont pu affirmer que l’écriture linguistique est née brutalement, à l’instar de la déesse Athéna sortant toute armée du crâne de Zeus son père, l’histoire de l’écriture donne à entendre un air sensiblement différent. Et s’il est vrai que la phonographie fut très tôt présente – la palette de Narmer de l’Égypte antique en comporte déjà des éléments −, la place qu’elle occupa et les formes qu’elle prit autorisent à retracer des phases de mutation, au gré des sociétés, des langues, et des contextes culturels.

1.1. Genèse de la phonographie

3Bien qu’ils ne fassent pas l’unanimité, les travaux de Schmandt-Besserat (1992) permettent au moins de faire l’hypothèse d’une première séquence morphogénétique qui fait des jetons et de la comptabilité d’abord concrète, puis abstraite, les précurseurs de l’écriture. S’ensuivit une sémiographie première manière rendue nécessaire par les besoins économiques et comptables de la Mésopotamie du IIe millénaire avant notre ère. Une option qui va très vite devoir imaginer des procédés capables de saisir des concepts difficiles sinon impossibles à représenter par un dessin, fût-il stylisé. C’est là qu’intervient un premier phénomène à la portée décisive : la présence de termes monosyllabiques homophones permettant la création de rébus. Ainsi, en sumérien, le signe [gi] qui désigne le roseau représente également le verbe « rembourser », qui se prononce de la même manière (Robinson 1995).

4Ce procédé, amplifié par l’emprunt qui dissocie langue et graphie, entraine une première émancipation phonographique, celle de l’écriture akkadienne du 1er millénaire empruntée à celle des Sumériens. Mais pour importante qu’elle soit, cette première incursion phonographique demeure éparse et ne dépasse pas le stade syllabique. Reste à franchir un pas supplémentaire permettant d’accéder au cœur de la syllabe en séparant les éléments qui la composent.

5C’est la rencontre des langues ouest-sémitiques telles que l’araméen, le phénicien ou l’hébreu, qui est à l’origine d’une seconde mutation d’importance. Il se trouve en effet que ces langues se caractérisent par un faible nombre de voyelles qui confère à la structure consonantique une position dominante. Lorsque ces sociétés sémitiques empruntèrent l’écriture, elles l’adaptèrent à la structure spécifique de leur langue. Ainsi naquirent ce qu’il est convenu de nommer des écritures consonantiques – ou abjad selon la terminologie de Daniels (1996). Nulle intention délibérée dans cette création, au point d’ailleurs que certains spécialistes comme Gelb (1973), pariant sur la présence par défaut des voyelles, les tenaient pour des écritures syllabiques. Pour être tout à fait exact, il faut préciser que, si certaines écritures comme celle de l’araméen ou du phénicien furent effectivement consonantiques, celle de l’hébreu notait parfois, en cas d’ambigüités, ce qu’on appelle des « mères de lecture », qui sont en fait des voyelles longues.

6Ce sont les Grecs, aux alentours du VIIIe siècle avant notre ère, qui furent à l’origine de la troisième et ultime étape de la construction alphabétique. En empruntant l’écriture phénicienne, ils attribuèrent aux voyelles un statut similaire à celui des consonnes en les inscrivant sur une même et seule ligne.

7Ainsi se présente, résumée à grands traits, la genèse phonographique de l’écriture. Une phonographie certes précoce que les hasards de structures linguistiques variées permirent d’affiner, pour aboutir aux formes que nous connaissons aujourd’hui. Il faut toutefois préciser que l’option alphabétique, si elle se retrouve dans les principaux systèmes graphiques du monde, n’est pas pour autant universelle. Ce qui l’est en revanche, c’est la présence d’une base phonographique ancrée dans des unités phoniques, le choix dépendant de leur nombre. Certaines langues, comme celle du japonais dont nous parlerons plus bas, comportent un nombre de syllabes suffisamment faible pour privilégier leur usage.

1.2. Genèse de la sémiographie

8Si, comme on vient de le voir, les premières traces écrites ont dû très tôt recourir à la phonographie, il n’en reste pas moins qu’elles ne faisaient qu’accompagner une représentation globale d’unités significatives comme le montrent les nombreuses tablettes exhumées lors des fouilles mésopotamiennes. Cela dit, même lorsque la phonographie constitue la base majeure de l’écriture, la sémiographie reste omniprésente. Et cela d’autant plus que l’usage graphique prendra de l’ampleur. Car la raison d’être de l’écriture, et donc de l’orthographe, est de permettre à un lecteur expert d’accéder le plus commodément possible au sens linguistique.

9La description d’une genèse sémiographique s’avère toutefois plus complexe que pour la phonographie. En effet, outre qu’elle peut prendre des formes diverses, elle n’a pas suivi une seule ligne directrice. Par ailleurs, le procédé que désigne l’appellation sémiographie a généralement fait appel à des ressources culturelles. Comme nous le verrons plus loin, les clercs du Moyen âge ont largement puisé dans l’étymologie latine (Cerquiglini 2004) et, en Extrême-Orient, l’influence de la culture chinoise a pesé très lourd dans les options graphiques des pays environnants, Japon, Corée et Vietnam notamment (Taylor & Taylor 1995).

10Nous nous en tiendrons donc ici à quelques repères marquants et, principalement à deux domaines qui permettent d’illustrer la place qu’occupe la sémiographie dans l’histoire de l’écriture : la distinction des homophones et les procédés de démarcation permettant la segmentation des mots.

11Parce qu’elle n’est pas une simple notation de l’oral, l’écriture doit se doter de moyens spécifiques afin de représenter les unités significatives d’une langue de la façon la plus claire possible. Et les homophones constituent de ce point de vue un excellent indice de cette nécessité. L’orthographe française, dont il sera question plus bas, en fournit un excellent témoignage, elle qui doit compter avec son lot d’homophones. Mais si, comme le signalait naguère Catach, la langue française est de toutes les langues romanes celle qui en compte le plus2, elle n’est pas la seule. Loin de là. La langue japonaise sur laquelle nous reviendrons, en compte bien plus encore, tout comme la langue chinoise dont les nombreux monosyllabes sont une source prolifique d’homophones. Ainsi la syllabe « shi »3 peut noter une vingtaine de mots4.

12L’homophonie n’est cependant pas le seul marqueur de la sémiographie ; elle n’en est peut-être même pas le principal. En effet, dès les débuts de l’écriture se pose la question de la démarcation des « mots », une façon pour l’usager d’en permettre une meilleure saisie. Les procédés utilisés sont divers et nous ne citerons ici que quelques cas typiques. Ainsi, à la fin du XVIIIe siècle, en déchiffrant l’écriture cunéiforme du vieux perse, langue parlée à Persépolis sous Darius 1er dont l’alphabet fut utilisé jusque vers 330 avant notre ère, l’allemand Tychsen découvrit ce qu’on appelle aujourd’hui le point de séparation, un clou isolé et oblique revenant sans cesse dans les textes. Un clou que l’on retrouve également dans l’alphabet ougaritique en usage au milieu du 2ème millénaire avant notre ère.

13Dès le début de la seconde moitié du 1er millénaire avant notre ère, la plupart des scribes ouest-sémitiques pratiquaient la segmentation. Le premier diviseur de mot fut une barre verticale très courte qui diminua par la suite, jusqu’à devenir un point au cours du VIIIe siècle avant notre ère. À partir du VIIe siècle, on observa de nombreux cas de segmentation avec des blancs graphiques. L’usage de la démarcation ne se généralisa cependant pas tout de suite. Et d’ailleurs, les écritures ouest-sémitiques elles-mêmes, si elles utilisaient indistinctement le point ou l’espace, recouraient aussi à la scriptio continua (Naveh 1973), tout comme la Grèce antique ou Rome. Cette pratique, si elle semble aller à l’encontre du principe sémiographique, s’explique surtout par un usage élitiste de l’écrit (Saenger 1989). Bien plus tard, au début du Moyen-âge, la réintroduction des blancs graphiques par les scribes irlandais et anglo-saxons provoqua un changement radical, libérant les facultés intellectuelles du lecteur en ouvrant le champ de la lecture silencieuse (Saenger 1997).

14Mais la segmentation n’est pas la panacée et la perception des unités sémiographiques peut emprunter d’autres voies. À cet égard, ce qui vaut pour l’Occident se manifeste quelque peu différemment dans d’autres régions du monde, en raison notamment de structures linguistiques spécifiques. Ainsi en Asie du Sud-est comme en Extrême-Orient, de nombreuses écritures ne recourent pas à la segmentation des mots, une absence de démarcation étant rendue possible par l’absence de flexions. Dans une langue isolante comme celle du thaï chaque mot est autonome et s’insère dans une syntaxe très rigide. Des conditions structurelles qui facilitent la reconnaissance des mots (Daniels & Bright, eds, 1996). Nous y reviendrons à propos de l’orthographe du japonais.

2 | Le cas du français

15En français, contrairement aux autres langues romanes, le décalage entre l’oral et l’écrit est devenu très important au fil des siècles. Ce décalage se constate dans tous les domaines de la langue, et en particulier en orthographe dans la correspondance entre les unités phoniques et les unités graphiques. La complexité de celle-ci donne une grande opacité à la phonographie, alors que la sémiographie occupe une place majeure.

2.1. Pallier les insuffisances de l’alphabet latin

16Le premier état écrit du français est attesté par les Serments de Strasbourg (842) et d’autres manuscrits de 842 à 1130. Comme les autres langues romanes, le français s’est écrit avec l’alphabet latin, qui était mal adapté à sa phonologie. Alors que des langues comme l’italien et l’espagnol ont une phonographie transparente, le français, en raison de sa phonologie, a dès le début une phonographie imparfaite (trop de voyelles non notées par l’alphabet latin, une consonne latine correspondant à différents phonèmes français, absence de différenciation graphique entre i et j, u et v, etc.). Pour pallier les insuffisances de l’alphabet latin, on a eu recours à divers expédients :

  • notation des voyelles nasales ou de certaines consonnes au moyen de digrammes (an, in, on ; gu, ge, ...) : gant, long, vague, mangeons ;
  • emploi de consonnes diacritiques pour différencier les timbres de E (s dans destruire (= e fermé) et dans mesler (= e ouvert long)) et pour distinguer des voyelles i et u (lier, muer) les consonnes j et v (adiouster, debuoir), seuls i et u étant employés ;
  • ajout d’un h non étymologique pour marquer la lettre u dans huit et huile (car sans ce h-, on ne savait pas si, dans vit, vile, le v- initial était consonne ou voyelle) ;
  • doublement de consonne comme ll dans appelle ou tt dans cette (pour noter e ouvert bref), opposé à l’emploi du s muet pour noter la voyelle longue dans teste, paste, coste.

17On met en place très tôt des conventions graphiques qui n’ont rien de phonographique et qui posent des problèmes de lecture. Quand on lit an, comment savoir si ce digramme correspond à la nasale [ã] (quand) ou s’il note la séquence a+n (cane) ? Il en va de même avec les consonnes diacritiques, qui ne sont pas prononcées : comment différencier teste et peste ? Vraisemblablement, on passe au niveau supérieur du mot, et l’on mémorise son image globale, d’un point de vue sémiographique. Paradoxalement, cette phonographie imparfaite présente une utilité sémiographique. On sait qu’un même phonème est représenté par des graphies différentes. Par exemple, à la nasale [ɛ̃] correspondent les graphies in, en, ain, aim, ein. Cette variété a un intérêt sémiographique. Dans les graphies ain et aim, le a marque un rapport avec des dérivés comportant cette voyelle : main / manuel ; faim / affamé. Il en va de même pour la graphie ein, qui marque un rapport avec une forme en ei [ɛ] : plein / pleine.

18Indépendamment des problèmes de notation de phonèmes, on fait des choix purement graphiques pour faciliter la lecture, en employant notamment la lettre Y, qui n’a rien d’étymologique dans beaucoup de mots. Dans les manuscrits, on écrit y pour i car ce dernier est généralement difficile à identifier. On écrit souvent un Y dit calligraphique qui note [i] à la finale des mots courts (luy, voicy) ou des participes passés (aduerty, bouffy, ...), dans les digrammes -ay, -oy, -uy (essay, Roy, ennuy) et même à l’initiale de certains mots (yvoire, yvre). Ronsard, en bon phonographiste, a voulu supprimer « cet épouvantable crochet d’Y », mais cet usage calligraphique a persisté dans les imprimés jusqu’au XVIIIe siècle (Académie 1740).

2.2. L’oral évolue, l’écrit se fige

19L’ancienne langue évolue, tant dans sa prononciation que dans son écriture, jusqu’aux XIIe-XIIIe siècles. A partir du moyen français, alors que l’oral continuait d’évoluer, l’écrit s’est figé, conservant des traits périmés. Ainsi, quand les diphtongues ont disparu (la dernière [ao] (autre) au XVIe siècle), on les a conservées dans la graphie : roi (oi devenu [wa]), tout (ou devenu [u]), etc. Et des consonnes qui, à l’origine, étaient prononcées, ont pris une valeur proprement sémiographique quand elles sont devenues muettes, notamment, en morphologie grammaticale, les marques du pluriel (-s des noms et -(e)nt des verbes). Certains archaïsmes graphiques ont été conservés longtemps. Dès le XVIIe siècle, on prononçait [Ɛ] dans les imparfaits, qu’on écrivait toujours oi (chantoit). Il a fallu attendre 1835 pour que l’Académie choisisse la graphie ai (chantait). Quand les voyelles étaient nasalisées, les doubles consonnes nasales étaient motivées : la première consonne contribuait à noter la voyelle nasale, la seconde notait [n] ou [m] : donner, grammaire. Dans les étymons latins, la consonne était souvent simple (donare). Ce doublement historique de la consonne a été conservé après la dénasalisation (achevée à la fin du XVIIe siècle), ajoutant à la complexité de la graphie des consonnes doubles qui constituent souvent des anomalies dans les familles de mots (consonne/consonant).

2.3. Le poids de la culture antique

20Les prémices de la graphie actuelle du français apparaissent en moyen français (XIVe-XVe siècles). Mais quel français écrire, si l’on peut parler à cette époque de français, face à la variété dialectale ? La langue orale manifestait une grande « instabilité phonétique » : par exemple, les diphtongues seront encore vivantes dans certaines régions au XVIIIe siècle (Catach 2001 : 77). Et l’on peut penser que les érudits donnaient la priorité à l’écrit sur l’oral, étant bien conscients des non correspondances entre les deux5. Autant dire que l’écrit, appuyé sur le latin, possédait déjà son autonomie sémiographique. Sur le plan du vocabulaire, de nombreux mots savants ont été empruntés, avec leur graphie, au latin et au grec, donnant souvent des doublets avec un mot de formation populaire (fragilem > frêle / fragile).

21Inversement, alors que des consonnes cessaient de se prononcer, les lettrés du moyen français en ont souvent rajouté, en puisant dans l’étymologie latine, parfois grecque (« les lettres grecques » : ph, th, rh, ch...). Car le français leur semblait un latin sans consonnes. Il faut dire qu’ils étaient pétris de culture latine (environ 95 % des incunables parus avant 1500 étaient écrits en latin6), parlant aussi bien le latin que le français. Ces lettres étymologiques, qui transcrivent certains phonèmes (dans philosophe, ph = [f] ; dans qui, qu = [k]), ont été consciemment introduites pour distinguer à l’écrit les homophones. Ainsi, on a différencié conte, comte et compte en utilisant, pour les deux derniers, des consonnes de leur étymon latin (comitem, computare). L’homophonie s’est considérablement développée en français, avec l’« érosion phonétique rapide » des mots (« affaiblissement des consonnes sourdes, disparition des sonores, réduction des diphtongues et des hiatus », Catach 2001 : 77-78).

2.4. La distinction des homophones et les familles de mots

22La distinction des homophones s’appuie souvent sur les familles de mots. La grammaire de Port-Royal (1660) explique la distinction entre chant et champ par l’étymologie (cantus et campus), ces deux homophones appartenant à deux familles différentes (cf. chanter vs champêtre). Et le souci constant des lexicographes et des grammairiens, y compris de l’Académie, a été de marquer le lien graphique entre les mots d’une même famille, ce qui se traduit souvent par la présence dans le mot simple d’une consonne muette qui est prononcée dans ses dérivés (bois / boiserie ; grand / grandeur ; trot / trotter). Dans certains cas, une lettre uniquement étymologique s’ajoute à une distinction morphologique, comme le -s dans corps (cf. corporel) et dans temps (cf. temporel). Cette unité graphique des familles de mots constitue une dimension sémiographique importante, car on mémorise des micro-séries lexicales. Au XVIIe siècle, Bossuet est bien conscient de la perception visuelle des mots, appuyée sur les lettres muettes (ses trois premiers exemples sont des monosyllabes) :

Si on ecrivoit tans, chan, cham, emais ou émês, connaissais, anterreman, faisaiet, qui reconnoistroit ces mots ? On ne lit point lettre à lettre ; mais la figure entière du mot fait son impression tout sur l’œil et sur l’esprit, de sorte que quand cette figure est considérablement changée tout à coup, les mots ont perdu les traits qui les rendent reconnoissables à la veüe et les yeux ne sont point contents. (cité par Catach 2001 : 140)

23Ce recours conscient à l’étymologie n’excluait pas les erreurs, comme écrire poids en le rattachant à tort à pondus, et non à pensum, ou scauoir, qui vient de sapere, relié à tort à scire, le sens primant sur la forme. Et l’on est allé très loin dans l’introduction en français de lettres étymologiques sans réelle utilité distinctive, comme c’est le cas des lettres grecques rh (rhétorique) ou th (théorie), dont se passent facilement les autres langues romanes (italien : retorica, teoria). On a abandonné certaines lettres étymologiques (cholère, rhythme), mais la plupart sont restées. Pire, en 1935, l’Académie a modifié la graphie de nénufar en nénuphar, sur la base d’une fausse étymologie grecque (alors que le mot est d’origine arabe), corrigée par les Rectifications de 1990 qui ont rétabli nénufar.

24Mieux, avec le temps et le poids croissant de l’écrit, à l’inverse, certaines consonnes muettes se sont prononcées (« effet Buben » 1935), notamment à la finale (finir : le -r final était muet jusqu’au XVIIe siècle). La Fontaine pouvait encore faire rimer ours et toujours, le -s final étant muet dans les deux mots. Et la prononciation des consonnes muettes continue de progresser, dans des mots comme aspect, dompteur, sculpture.

2.5. Aspects de l’évolution historique

25L’évolution de l’orthographe française n’a pas été continue, d’une phonographie originelle imparfaite à la sémiographie majeure d’aujourd’hui. Dès le moyen français, deux tendances s’opposent dans la graphie du français : une tendance phonographique et une tendance sémiographique de plus en plus forte, appuyée sur des graphies étymologiques et morphologiques, notamment dans la distinction des homophones7. Du XVIe siècle au XVIIIe siècle, les débats et controverses ont été vifs pour un enjeu de taille : quelle orthographe officielle choisir pour le français ? Les réflexions ont été suscitées, à partir du XVIe siècle, par deux évolutions majeures, poussant à l’unification graphique après les variations du Moyen âge : le développement irréversible de l’imprimerie face aux manuscrits et la centralisation politique de la France (voir l’ordonnance de Villers-Cotterêts 1539).

26Au XVIe siècle, le combat a fait rage – avant les guerres de religion – entre les partisans d’une orthographe ancienne, étymologisante, installée en moyen français, et ceux d’une orthographe moderne, plus proche de la prononciation, comme Ronsard (Pellat 2023 : 25 sv). Mais ces derniers ne remettaient pas en cause la sémiographie inhérente à l’orthographe française car, à part les plus radicaux, ils ne souhaitaient pas une orthographe phonétique. L’orthographe moderne s’est rapidement répandue dans les imprimés de la Renaissance : après 1550, « plus de la moitié des éditions originales » consultées par Catach ont une orthographe qui « va d’une orthographe ordinaire modernisée à l’orthographe réformée de Ronsard » (1968 : 248). Mais le recul de l’imprimerie à la fin du XVIe siècle, lié à la crise économique provoquée par les guerres de religion, a amené la disparition presque totale de l’orthographe nouvelle en France pendant une cinquantaine d’années. La modernisation a ensuite repris dans les imprimés partir de 1640 (date de la création de l’Imprimerie royale), notamment avec la généralisation des distinctions i/j et u/v, effective dès les années 1670, et avec la lente progression de l’accentuation, en particulier sur e, qui s’accompagne de la suppression des s ou des consonnes diacritiques (destruire > détruire ; comette > comète ; teste > tête).

27Cependant, l’Académie française a choisi, pour son premier dictionnaire (1694), « l’ancienne Orthographe receuë parmi tous les gens de lettres, parce qu’elle ayde à faire connoistre l’Origine des mots », comme indiqué dans la Préface (voir Pellat 2023 : 41-42). Mais au XVIIIe siècle, elle a procédé à des modernisations irréversibles (accentuation des voyelles, suppressions de consonnes inutiles, ...) dans les trois éditions successives de son dictionnaire en 1740, 1762, 1798 (voir Pellat 2023 : 46-48).

28Après l’édition de 1835 du dictionnaire de l’Académie, l’orthographe française se fige et n’évolue plus guère. Elle se pose comme l’orthographe d’État, transmise par l’école, et elle devient un instrument de distinction sociale, étant survalorisée par rapport aux autres domaines de la langue. La peur des fautes et de leur sanction sociale s’installe. Aucune tentative de réforme n’a abouti depuis, jusqu’aux Rectifications de l’orthographe (1990) qui visent à régulariser certains usages. Et pourtant, contrairement à l’image trompeuse d’une orthographe française immuable, la variation a été considérable au fil des siècles :

Plus d’un mot sur deux a, en France, changé au moins une fois d’orthographe depuis le XVIe siècle, à plusieurs reprises. [...] [Et] un bon cinquième du vocabulaire d’un dictionnaire courant de 50 000 mots est touché d’une façon ou d’une autre par ces variations8.

29Les premières éditions du dictionnaire de l’Académie enregistraient une part de variation graphique, progressivement réduite jusqu’à l’édition de 1935. Les Rectifications de 1990 réintroduisent un peu de variation, mettant un peu d’huile dans les rouages graphiques grippés, bien que la tension entre phonographie et sémiographie ne change guère dans l’orthographe française.

3 | Le cas du japonais

30Au Japon, l’histoire de l’écriture est d’abord celle d’une influence sans partage de la Chine et des caractères de son écriture – hanzis – qui vont servir à la notation d’une langue elle-même très influencée par le style kanbun, calqué sur la langue chinoise et dont la complexité le réserve à une élite. Comme le souligne Sampson (1985), dès que l’écriture est aux mains d’une classe privilégiée plus préoccupée de valeur culturelle que de valeur fonctionnelle, la voie du happy few ne peut que l’emporter. Très précoce, cette influence du chinois est difficile à dater avec précision ; selon les auteurs, elle varie entre les IVe et VIIe siècles.

31Les premiers siècles de l’écriture japonaise furent ceux d’une quadrature du cercle, à l’instar d’un manche carré destiné à un trou rond. De fait, en Extrême-Orient, l’influence de la langue et de l’écriture chinoises9 fut à certains égards comparable à celle du latin en Occident. Avec toutefois une différence de taille : la structure isolante de la langue chinoise convenait plutôt mal à celle, agglutinante, du japonais dont la structure grammaticale est très différente. À partir de là, l’histoire de l’écriture japonaise peut se décrire comme la très lente libération d’une influence inadaptée, jusqu’aux changements drastiques, tant linguistiques qu’orthographiques, qui devaient se produire au cours de la seconde moitié du XIXe siècle, sous l’ère Meiji. Cette histoire révèle aussi, en creux, le passage progressif d’une culture réservée à une élite à la nécessité de répondre à des besoins sociaux bien plus larges.

32C’est dans ce contexte que l’écriture du japonais va connaitre de multiples changements, évoluant au gré de réformes, tiraillée entre une sémiographie souvent marquée par un conservatisme extrême nourri d’une référence constante à la culture chinoise, et une phonographie de plus en plus standardisée mais dont l’existence se heurtera aux critiques acerbes d’une élite très attachée au passé. Cette bataille de l’orthographe est aussi ancienne que l’orthographe elle-même et, de ce point de vue, le Japon ne déroge pas à la règle. Mais c’est surtout au XIXe siècle que la bataille devint féroce entre des Anciens attachés aux traditions historiques, des conservateurs plaidant même pour l’insertion d’éléments médiévaux, et des Modernes bien plus progressistes qui optaient pour une langue standard basée sur le dialecte de Tokyo écrit avec les seuls kanas et l’alphabet. Au début de l’ère Meiji, le Japon ne disposait encore d’aucune langue standard, l’écriture étant d’ailleurs considérée comme un moyen de faire état d’une culture plutôt que comme un outil de communication. Ce conflit aboutira, en 1902, à la création d’un Conseil national officiellement chargé de ces questions (Twine 1991) et, quelques décennies plus tard, à la reconnaissance d’une forme simplifiée des kanas. Pour autant, ce mouvement ne mettra pas un point final à la querelle (Gottlieb 1995).

33Parler d’écritures au Japon revient à employer le pluriel. En effet, plusieurs formes graphiques coexistent, chacune ayant une fonction propre. Résumée à grands traits, on peut dire qu’il existe, aujourd’hui encore, des caractères qui, bien qu’adaptés à la langue japonaise, demeurent inspirés par les caractères chinois. Ce sont les kanjis10, très nombreux en théorie mais dont certains sont rarement employés. Sur les 10 000 kanjis d’usage courant, 2 000 couvrent 98,2 % de la communication (Griolet 1998). Très tôt cependant, dès que les mots du japonais devinrent difficilement traduisibles, apparut un usage phonétique des caractères chinois destinés à mieux rendre la structure grammaticale de la langue japonaise. Ces formes graphiques ont donné naissance à deux syllabaires appelés respectivement hiragana et katakana, regroupés sous le terme générique de kanas.

34Ces caractères fonctionnent par juxtaposition pour constituer une orthographe mixte tout à fait originale : les kanjis remplissent pour l’essentiel une fonction lexicale tandis que les hiraganas notent plutôt la grammaire comme dans 本を読む, hono yomu ; « lire un livre » – littéralement « livre » + particule objet + « lire » (radical) + marque de l’infinitif. Il existe également une écriture alphabétique appelée rōmaji, apparue au XIXe siècle. D’abord décrié, ce système finit néanmoins par se faire une place, à des fins décoratives d’abord, dans la publicité ou le commerce, les Japonais finissant par considérer que ce qui était moderne devrait s’écrire avec l’alphabet (Coulmas 2001).

3.1. Une phonographie syllabique

35Les emprunts graphiques au chinois diffèrent de ceux que l’on peut observer dans la sphère occidentale. Même quand il nécessite certaines adaptations, le principe alphabétique, parce qu’il représente des consonnes et des voyelles, possède une faculté d’adaptation quasi universelle. Il n’en va pas de même pour les hanzis du chinois, au service d’une langue isolante, à tendance monosyllabique, au moins dans ses débuts. Utiliser ces caractères morphosyllabiques pour écrire une langue agglutinante nécessita donc d’importants aménagements qui, d’ailleurs, n’intervinrent pas tout de suite. Au début, la langue japonaise s’écrivit « à la chinoise », ce qui impliquait de la part des usagers une gymnastique réservée à une élite. Petit à petit toutefois, les hanzis du chinois se transformèrent pour noter la morphologie de la langue japonaise. Une évolution qui aboutit à la création des man’yoganas, des graphies essentiellement phonographiques, issues pour l’essentiel des textes poétiques. Le Kojiki ou « Enregistrement des questions anciennes », plus vieil ouvrage connu écrit en japonais, paru en 712, illustre le double usage des caractères chinois : notation sémantique et notation phonétique, cette dernière portant déjà sur la notation phonétique des usages grammaticaux, des noms propres et des chansons (Habein 1984).

36Malheureusement, cette utilisation phonique des caractères chinois se fit d’abord sans méthode et créa une situation chaotique qu’il fallut progressivement régulariser et standardiser. À l’origine, plusieurs kanas pouvaient en effet noter une seule et même syllabe. Sansom (1928) parle de 300 symboles hiraganas pour 47 syllabes. En évoluant, les syllabaires ont vu leur taille se réduire mais il fallut attendre le XIXe siècle pour qu’une réelle standardisation fut entreprise. Depuis 1946, les kanas sont basés sur la prononciation standard même s’il demeure parfois des vestiges de prononciations anciennes (Seeley 1991). Aujourd’hui, les syllabaires comprennent 46 symboles chacun alors que le japonais parlé aujourd’hui est censé employer de 105 à 113 syllabes selon les dialectes. On a donc deux fois plus de syllabes que de symboles. Au lieu de créer des syllabaires biunivoques, ce qui aurait été tout à fait possible, les Japonais ont préféré réduire le nombre de symboles en notant notamment le voisement à l’aide de diacritiques. Pour autant, les kanas ne sont transparents qu’en apparence comme le rappelle le ministère japonais de l’éducation dans un petit ouvrage édité en 1960.

37Il a donc fallu du temps pour que ces premières formes phonographiques aboutissent aux inventaires actuels. Comment se fait-il alors, qu’à la différence de la Corée dont un empereur éclairé favorisa l’invention d’une écriture originale à base de syllabogrammes, le Japon demeura sous l’emprise de caractères chinois ? Deux raisons majeures à cela : une société influencée par la culture chinoise dont se réclament, aujourd’hui encore, certains conservateurs, mais également une structure linguistique marquée par la présence d’homophones, obstacle rédhibitoire au tout phonographique.

3.2. La phonographie des kanjis

38Si les kanas se caractérisent par un fonctionnement phonographique qui tend vers la biunivocité, il en va tout autrement pour les kanjis. Et cela, comme on l’a vu, en raison d’emprunts au chinois qui ont eu lieu sur des périodes diverses et se sont soldés par l’importation de nombreuses variantes, prononcées « à la chinoise ». Avec le temps, la langue japonaise exerçant une influence de plus en plus importante, ces mêmes kanjis se prononcèrent « à la japonaise ». En résulta une situation encore plus complexe, un même kanji pouvant se prononcer de deux façons différentes : à la chinoise – lecture « on » – il est monosyllabique mais ne s’emploie jamais isolément ; à la japonaise – lecture « kun » –, il peut avoir d’une à quatre syllabes et se trouve isolé. C’est ainsi que le caractère /voiture/ se prononce [ʃa] dans un composé tel que [dɛnʃa] / 列車 (le train) mais [kuruma] / 車 pour dire « voiture » (Malherbe 1983).

39Cette phonographie spécifique des kanjis est si complexe qu’elle ne contribue en rien à la transparence de l’orthographe japonaise. Bien au contraire. D’où, parfois, le nécessaire recours à des symboles nommés furiganas qui précisent la prononciation des kanjis. Dès le XVIe siècle, avec l’émergence d’une litéracie plus étendue, des textes réputés difficiles étaient accompagnés de telles gloses imprimées le long des kanjis afin de les rendre accessibles. Au début du XXe siècle, dans les journaux ces gloses peuvent représenter 50 % de tout un texte (Takashi-Wilkinson & Wilkinson 2000). Très employé jusqu’à la fin de la Seconde Guerre mondiale, ce système accompagne aujourd’hui les textes d’enfants.

3.3. Une sémiographie à la japonaise

40En japonais, tout comme en chinois, on ne trouve pas de segmentation explicite des mots puisque tous les caractères sont équidistants. Mais le japonais a l’avantage de s’appuyer sur la coexistence de kanjis et de kanas. Comme on l’a vu, la forte présence d’homophones explique largement le recours aux kanjis. Tamba (1986) évalue leur part à 36,4 %.11 Il n’existe par exemple pas moins de 17 signes prononcés [kanʃō] (Robinson 1995). Cette complexité sémiographique a-t-elle, comme le soulignent certains, ses vertus ? Dans son analyse linguistique de l’écriture du japonais, Suzuki (1977) explique que les Japonais sont bien plus dépendants de l’image graphique que ne le sont les Anglais ou les Français. À moins de connaitre la forme écrite des mots, ils éprouveraient des difficultés à comprendre ce qui est dit.

41En japonais, l’écrit serait donc plus « consubstantiel » de la langue que ne le sont les écritures alphabétiques, les kanjis permettant de voir directement le sens de l’idée-mot qu’ils transcrivent. Compte tenu de la structure de la langue japonaise, ils seraient les seuls capables de transcrire « des idées verbalisées », indépendamment de leur forme phonique. Un état de fait qui a largement contribué à autonomiser la langue écrite par rapport à la langue orale (Tamba 1986). Sans opter pour des positions aussi radicales, la plupart des spécialistes insistent sur la grande complexité de l’orthographe du japonais et s’accordent sur un point : l’homophonie est la source majeure de ladite complexité. Au point que même s’il est entendu que l’orthographe japonaise favorise le lecteur expert au détriment du scripteur (Hatano 1986), les professionnels de l’écrit eux-mêmes éprouvent bien des problèmes pour la maitriser.

42Raison pour laquelle différentes initiatives ont tenté d’apporter des solutions susceptibles d’alléger le fardeau des usagers. C’est notamment le cas de la simplification du nombre de traits. La réforme la plus importante demeure celle de 1946, avec la publication de la liste limitative de 1 850 kanjis, qu’il faut opposer aux 5 000 caractères au moins que le lecteur devrait connaitre pour lire les journaux.12 Et quand un scripteur a besoin d’un morphème qui ne se trouve pas dans cette liste, il peut toujours employer les symboles kanas. En fait, une telle liste a surtout pour but de limiter les objectifs scolaires car on trouve dans les supports sociaux bien plus de 1 850 caractères.

43Les défenseurs des kanjis avancent un autre argument, culturel cette fois. Ainsi, lorsque Seeley (1991) s’interroge sur la raison pour laquelle l’écriture syllabique n’a pas supplanté de façon plus nette les caractères inspirés du chinois, il donne à cela une raison majeure : la forte influence de la culture chinoise qui perdurera au cours de toute l’histoire du Japon. En fait, il s’avère que la défense des kanas est considérée par beaucoup comme une atteinte au niveau culturel du pays (Griolet 1998). Dans l’esprit des Japonais, l’éducation, la connaissance et les kanjis sont en fait étroitement mêlés. Et même en présence de zones où le choix entre kanas et kanjis serait possible, la préférence culturelle penche en faveur des seconds (Crump 1986).

44Barrière envers une communication internationale mais si importants pour la culture japonaise, l’usage des kanjis ne se trouve-t-il pas facilité par l’apport des nouvelles technologies ? En mars 2006, une dépêche AFP constatait qu’au moins un Japonais sur quatre possède un dictionnaire électronique pour confirmer l’écriture d’un kanji, ou sa lecture, dans un contexte donné, presque tous ces caractères comptant plusieurs prononciations. Ces dictionnaires sont très prisés en raison de leur simplicité d’emploi, de la lisibilité de l’écran, de leur petite taille et du fait qu’ils intègrent plusieurs ouvrages, selon la même étude. Mais des voix s’élèvent pour constater la présence d’un effet pervers : la machine aurait tendance à faire oublier la façon dont s’écrivent les kanjis (Gottlieb 2000). Du fait de ces difficultés, certains n’hésitent pas à prédire l’avènement de l’écriture alphabétique. Introduit au Japon dès le XVIIe siècle, d’abord décrié, l’alphabet a fini par se faire une place dans la société japonaise et, désormais, il serait capable de mieux répondre aux besoins de la technologie moderne que les kanas ou les kanjis (Coulmas 2001). Qui vivra verra.

4 | Conclusion

45L’orthographe du français comme celle du japonais résultent de choix empiriques au long cours, parfois hasardeux et marqués par des contraintes sociales, changeantes selon les époques. Toute orthographe, à l’exception peut-être de celle du coréen, fruit d’un travail concerté, résulte d’une forme de bricolage qui introduit des zones d’incertitude et aussi des failles susceptibles d’autoriser des changements, des réformes. Dès la fin du XIXe siècle, la description de ces orthographes prit la forme d’une typologie tripartite – logographie – syllabaire – alphabet – qui allait dominer la grammatologie pendant un siècle, une tendance aujourd’hui supplantée par la coexistence d’un double processus – phonographique et sémiographique. Ainsi, au-delà de toute divergence théorique, on peut finalement dire que les orthographes du monde répondent toutes, à leur manière, aux mêmes nécessités. Celle, phonographique, d’une structure élémentaire qui facilite le traitement cognitif, et celle, sémiographique, d’une iconicité au service des exigences d’une langue écrite qui, contrairement à ce que prétendait Voltaire, n’est pas la peinture de la voix. Ce qui varie, ce sont les rapports entre ces deux nécessités dont nous avons rappelé au début de cet article les aspects aléatoires. Certaines de ces orthographes, comme celles du finnois, de l’espagnol, voire du coréen, disposent en effet d’une phonographie qui épouse la plupart des contours d’une langue et permettent donc une sémiographie mineure. Les psycholinguistes parlent à leur sujet d’orthographes « transparentes ». Mais, au regard de l’écrit, lorsque cette phonographie est lacunaire, la sémiographie doit assumer les compléments graphiques. Elle devient dans ce cas majeure, les orthographes devenant plus « opaques », comme celles du français, de l’anglais, du chinois et, pour partie, celle du japonais. Ainsi, toute orthographe conjugue les hasards de l’histoire et du temps et les nécessités de la communication écrite.

    Notes

  • 1 Conformément à l’analyse qu’en donna naguère Coulmas (1989), écriture et orthographe ne se confondent pas. La première fournit en effet à la seconde les bases de sa structure. Ainsi, le principe alphabétique aboutit à des formes orthographiques aussi différentes que celles inspirée de l’alphabet latin ou de l’alphabet cyrillique. La frontière entre ces deux acceptions n’est cependant pas toujours facile à déterminer puisque les spécialistes de la question préfèrent parler d’écriture pour le chinois ou le japonais alors que la notion de norme est bien présente.
  • 2 Article « Homophones », in Les délires de l’orthographe, 1989, p. 310.
  • 3 Ton descendant.
  • 4 Departement of Linguistics and Oriental Languages, San Diego State University, San Diego, CA92182-7727 [www-rohan.sdsu.edu/dept/chinese].
  • 5 « Les lettrés sont accoutumés depuis des siècles à « traduire » automatiquement l’écrit, surtout celui du latin, en un oral tout autre » (Catach 2001 : 80).
  • 6 Catach (2001 : 74-75) cite une étude d’H.-J. Martin sur cette première époque des imprimés.
  • 7 Nous reformulons ici une distinction de Catach (2001 : 78-79), qui ne correspond pas exactement à celle développée par Pellat (2023 : 25-35) entre « orthographe ancienne » et « orthographe moderne » (ou « nouvelle »). Car ces dernières intègrent toutes les deux une part de sémiographie, bien que l’« orthographe moderne » accorde une place plus importante à la phonographie.
  • 8 Catach (1989 : 81-82) et voir aussi Catach & Pellat (1990), sur le point de vue de Charles Perrault.
  • 9 L’expression « langue chinoise » est utilisée ici par souci de simplification. En fait, parmi les diverses langues parlées en Chine, celle à laquelle il est d’usage de se référer, parce que dominante, celle qui sert de base à l’écriture, est souvent nommée mandarin mais il serait plus juste de la désigner par le terme putonghua, une « langue commune » basée pour l’essentiel sur le dialecte pékinois.
  • 10 Bien que la littérature spécialisée utilise plutôt ces termes sans les accorder – kanji, kana… –, nous avons choisis ici de nous conformer aux règles de l’orthographe française – kanjis, kanas
  • 11 La langue chinoise n’en compte que 11,6 %… grâce aux tons. Sinon, ce taux serait de 35 %.
  • 12 Les journaux sont passés d’un stock de 7 500 unités avant la guerre à 1 850 puis 1 945 kanjis, les caractères abandonnés étant remplacés par les kanas.

References

Brissaud Catherine, Jaffré Jean-Pierre, Pellat Jean-Christophe (2008) Nouvelles recherches en orthographe. Limoges, Lambert-Lucas.

Buben Vladimir (1935) Influence de l'orthographe sur la prononciation du français moderne. Bratislava, Universum.

Catach Nina (1968) L'orthographe française à l'époque de la Renaissance: auteurs, imprimeurs, ateliers d'imprimerie. Genève, Droz.

Catach Nina (1989) Les délires de l'orthographe. Paris, Plon.

Catach Nina (1995) Dictionnaire historique de l'orthographe française. Paris, Larousse.

Catach Nina, Pellat Jean-Christophe (1990) „Mercure ou le messager des dieux, Perrault et l'orthographe“. Europe 739-740, 82–94.

Cerquiglini Bernard (2004) La genèse de l'orthographe française (XIIe-XVIIe siècles). Paris, Champion.

Conseil supérieur de la langue française (1990) „Les Rectifications de l'orthographe“. Journal officiel de la République française 12 (6).

Coulmas Florian (1989) The writing systems of the world. Oxford, Blackwell.

Coulmas Florian (2001) „L'écriture alphabétique du japonais“. Pour la science 33, 108–113.

Crump Thomas (1986) „Literacy and hierarchy in modern Japan“. Sociolinguistics 16 (1), 56–71.

Daniels Peter T (1996) „The study of writing systems“, In: P.T. Daniels & W. Bright (eds.), The world's writing systems, Oxford, Oxford University Press, 3–17.

Daniels Peter T, Bright William (1996) The world's writing systems. Oxford, Oxford University Press.

Fayol Michel, Jaffré Jean-Pierre (2014) L'orthographe. Paris, Presses Universitaires de France.

Gelb Ignace Jay (1973) Pour une théorie de l'écriture. Paris, Flammarion.

Gottlieb Nanette (1995) Kanjis politics: language policy and Japanese script. London, Kegan Paul.

Gottlieb Nanette (2000) Word-processing technology in Japan: Kanjis and the keyboard. London, Curzon Press.

Griolet Pascal (1998) „Les enjeux des réformes linguistiques d’après-guerre au Japon (1945-1951)“, In: S. Chaker (éd), Langues et pouvoirs, Aix-en-Provence, Edisud, 327–336.

Habein Yaeko Sato (1984) The history of the Japanese language. Tokyo, University of Tokyo Press.

Hatano G (1986) „How do Japanese children learn to read?: orthographic and eco-cultural variables“, In: B.R. Foorman & A.W. Siegel (eds.), Acquisition of reading skills, Hove, Erlbaum, 71–114.

Jaffré Jean-Pierre (2003) „Orthography: overview“, In: W.J. Frawley (ed.), Writing and written language, Oxford, Oxford University Press, 386–390.

Malherbe Michel (1983) Les langages de l'humanité. Paris, Seghers.

Naveh J (1973) „Word division in west Semitic writing“. Israël Exploration Journal 23, 206–208.

Pellat Jean-Christophe (2023) L'orthographe française. Paris, Ophrys.

Robinson Andrew (1995) The story of writing. London, Thames & Hudson.

Saenger Paul (1989) „Physiologie de la lecture et séparation des mots“. Annales ESC 4, 939–952.

Sampson Geoffrey (1985) Writing systems. London, Hutchinson.

Sansom George Bailey (1928) Historical grammar of Japanese. Oxford, Oxford University Press.

Schmandt-Besserat Denise (1992) Before writing 1: from counting to cuneiform. Austin, University of Texas Press.

Seeley Christopher (1991) A history of writing in Japan. Leiden, Brill.

Suzuki Takao (1977) „Writing is not Language, or is it?“. Journal of Pragmatics 1, 407–420.

Takahasi Wilkerson Kyoko, Wilkerson Douglas (2000) „The gloss as poetics: transcending the didactic“. Visible Language 34 (3), 228–263.

Tamba Irène (1986) „Approche du "signe" et du "sens" linguistiques à travers les systèmes d'écriture japonais“. Langages 82, 83–100.

Taylor Insup, Taylor Martin M (1995) Writing and literacy in Chinese, Korean and Japanese. Amsterdam, Benjamins.

Twine Nanette (1991) Language and the modern state: the reform of writen Japanese. London, Routledge.

Publication details

Published in:

David Jacques, Doquet Claire (2025) Approches linguistiques de l’orthographe du français. Linguistique de l’écrit Special Issue 5.

Seiten: 19-39

DOI: 10.19079/lde.2025.s5.19

Referenz:

Jaffré Jean-Pierre, Pellat Jean-Christophe (2025) „L'orthographe, entre phonographie et sémiographie“. Linguistique de l’écrit 5, 19–39.