1 | Introduction
1Pour le lecteur lettré d’aujourd’hui, l’orthographe est le premier indice permettant de saisir la spécificité du rapport des scripteurs moins lettrés à l’écrit. Les formes graphiques qui s’éloignent de la norme établie, communément considérées comme des erreurs, nous renseignent en réalité sur la connaissance des procédures orthographiques que les scripteurs possèdent (David 2006), ainsi que sur les difficultés inhérentes à l’orthographe française.
2Dans cette contribution, nous explorons le domaine de la segmentation de la chaîne graphique afin de mettre en lumière les liens qui peuvent être établis entre certains découpages et des pratiques individuelles de l’écrit. L’hypothèse de départ de cette étude est en effet que certaines soudures et sur-segmentations, favorisées par des facteurs tels que la fréquence d’emploi, le phénomène de l’homophonie-hétérographie et certains contextes lexico-syntaxiques, s’installent dans la pratique de chaque scripteur peu lettré1 et fonctionnent ainsi comme des routines graphiques. Le corpus sur lequel se fonde cette étude est constitué de quatre correspondances de scripteurs peu lettrés de la Grande Guerre, issues des fonds du projet Corpus 14 (Steuckardt, éd.) : Marie et Pierre Fabre, ainsi que Joséphine et Laurent Pouchet (infra 2.1).
3Cette étude s’articule en trois parties. Après une brève contextualisation du phénomène analysé et du corpus utilisé (section 2), nous présentons un classement des soudures et des sur-segmentations particulièrement fréquentes relevées dans chaque correspondance, selon la catégorie grammaticale des éléments linguistiques concernés (section 3). Enfin, dans la troisième partie de l’étude, nous poursuivons l’analyse de ces occurrences en comparant les usages que les scripteurs en font, afin de vérifier si ces réalisations écrites sont corrélées à des pratiques individuelles (section 4).
2 | Contextualisation
2.1. Présentation du corpus
4Cette étude se fonde sur les données attestées dans des correspondances privées de scripteurs peu lettrés de la Première Guerre mondiale, recueillies dans le cadre du projet Corpus 14. Agriculteurs, viticulteurs, meuniers, les hommes sont appelés au front en 1914, au début de la guerre, tandis que leurs familles – parents, femmes et enfants – restent à l’arrière, chargées de mener à bien les tâches du travail quotidien. L’échange de lettres constitue alors le seul moyen de garder le contact : bien que peu habituée à la pratique de l’écrit, la plupart de la population peu instruite du début du XXe siècle s’empare de ce mode de communication. La quantité de lettres écrites est considérable : on a estimé à dix milliards les lettres échangées tout au long de la guerre, dont quatre millions par jour pour l’année 1915 (Baconnier, Minet & Soler 1985). La Grande Guerre constitue ainsi non seulement un évènement historique, mais aussi linguistique (Guilhaumou 1996 ; Roynette, Siouffi & Steuckardt 2017), marquant l’entrée dans l’écrit d’une large partie des Français. Les fonds d’archives du projet Corpus 14 constituent ainsi des sources précieuses, qui témoignent des usages graphiques de cette partie de la population.
5Pour réaliser la présente étude, nous avons sélectionné les correspondances de quatre scripteurs : Marie et Pierre Fabre ainsi que Joséphine et Laurent Pouchet. Le premier couple, marié, vit dans la commune du Soulié, dans l’Hérault, et possède une ferme. Marie travaille sans relâche avec ses parents pour que la gestion de la ferme soit assurée pendant l’absence de son époux, tout en s’occupant de leur enfant en bas âge, Aimé. Pierre est blessé par balle à l’épaule le 19 août 1914, lors du combat de la Forêt de Bride et Koeking, et est reformé par la suite. Laurent et Joséphine, mariés également, font partie d’une famille de vignerons à Baillargues, près de Montpellier (Hérault) et ont un jeune enfant, Albert. Malheureusement, Laurent est blessé au front et décède le 5 avril 1916, à Boezinghe.
6Les quatre correspondances varient en longueur. Le corpus analysé est constitué d’un total de 109 333 tokens, ainsi répartis :
Pierre Fabre | Marie Fabre | Joséphine Pouchet | Laurent Pouchet | |
Taille du sous-corpus | 14 895 | 26 315 | 4 197 | 63 926 |
7
2.2. La segmentation de la chaîne graphique
8Dans l’histoire de l’écriture du français, bien que nous puissions considérer que la scriptio continua n’est pas attestée (Andrieux-Reix & Monsonégo 1997; Catach 1998), les réalisations des mots graphiques se sont stabilisées tardivement. Comme Catach (1998) le rappelle, la notion même de « mot » a longtemps été débattue et, encore au XVIIe siècle, « le traitement du mot graphique reste une pratique à peine théorisée », la définition qu’on en donne étant encore intuitive ou fondée sur l’oral (Pellat 1998 : 88). En matière de segmentation de la chaîne écrite, Pellat (Ibid.) livre des observations sur les pratiques du XVIIe siècle grâce à une comparaison de manuscrits autographes d’auteurs classiques d’une part, et de textes imprimés d’autre part. Si la norme concernant la segmentation des mots graphiques apparaît installée dans les textes imprimés, de nombreuses hésitations persistent dans les textes manuscrits des auteurs lettrés. Ainsi, le XVIIIe siècle est encore considéré par Seguin (1998) comme un siècle de malaise orthographique en ce qui concerne la pratique du découpage de la chaîne écrite en mots2.
9Que veut dire segmenter la chaîne graphique ? Cela équivaut à séparer par un espace ou des signes orthographiques3 (apostrophe, trait d’union) les unités lexicales et grammaticales de la langue. Le découpage « non standard » de la chaîne graphique donne lieu à trois phénomènes (Cappeau & Roubaud 2018, inter alia), que nous illustrons par des occurrences issues de l’ensemble des fonds de Corpus 14 (45 scripteurs au total).
10Premièrement, la sous-segmentation correspond à la soudure d’unités linguistiques différentes :
« Tu menverrais ladresse de mon frère je lui écrit deux fois je na pas encore recus de réponsse » (Jules Ramier, 02.01.1915)
11Trois soudures sont attestées dans l’extrait (1) : le pronom objet de 1ère personne me élidé est agglutiné au verbe envoyer, ce qui produit la forme menverrais ; l’article défini élidé l’ et le substantif adresse sont soudés (ladresse), tout comme l’adverbe de négation élidé ne et le verbe avoir, a (na)4.
12Deuxièmement, la sur-segmentation constitue le phénomène inverse ; elle équivaut à la séparation d’une unité en plusieurs éléments :
« Tes cheres l’etre je les li et reli je ne sai combien de foi » (Marie Fabre, 31.12.1915)
13En (2), le substantif lettre est sursegmenté en deux éléments, l et etre, au moyen de l’apostrophe (l’etre).
14Enfin, une consonne de liaison peut être marquée également à l’écrit, en étant redupliquée au début du mot suivant :
« Ma foi que veu tu nous sana von la bitude de puis 15 mois » (Laurent Pouchet, 28.10.1915)
15Dans l’extrait (3), la consonne de liaison s est graphiquement marquée au début du mot suivant (en), donnant lieu à la graphie nous sana.
16Ces trois phénomènes peuvent se cumuler, comme l’exemple (3) l’atteste. Dans ce dernier extrait, la suite nous en avons présente en effet la marque surnuméraire à l’écrit de la consonne de liaison s (nous sana von), la sur-segmentation du verbe avoir en deux éléments (a von) ainsi que la sous-segmentation entre ce premier élément a et le pronom en qui précède le verbe (ana von).
17Ces découpages, qui sont également présents dans des productions scolaires (Ponton et al. 2021 ; Cappeau & Roubaud 2018 ; David & Doquet 2016 ; Ros-Dupont 1995 ; Ferreiro & Pontecorvo 1993), sont tout aussi bien attestés dans des écrits de scripteurs adultes peu lettrés en diachronie longue. Par exemple, G. Ernest en a relevé dans des textes privés des XVIIe et XVIIIe siècles (Ernst 2019), tandis que Seguin (1998), Branca-Rosoff & Schneider (1994) ainsi que Martineau & Bénéteau (2018 [2010]) en ont rencontré dans des textes du XVIIIe siècle5.
18Dans la suite de cette étude, nous analysons les phénomènes de sous- et sur-segmentation particulièrement fréquents dans les quatre correspondances sélectionnées, afin d’en fournir une typologie (section 3) et de mieux appréhender leur fonctionnement dans la pratique de l’écrit de chaque scripteur (section 4.).
3 | Typologie des segmentations
19Dans les sections suivantes, nous présentons une typologie de ces découpages tels qu’ils sont réalisés dans chaque correspondance, en nous restreignant aux occurrences particulièrement fréquentes6, en fonction des catégories grammaticales dont les éléments soudés relèvent7.
3.1. Pierre Fabre
20En matière de découpage de la chaîne graphique, l’écriture de Pierre est globalement conforme à la norme orthographique. Les soudures qu’il réalise le plus fréquemment apparaissent dans le tableau suivant, en ordre de fréquence :
CATÉGORIES GRAMMATICALES | OCCURRENCES |
Déterminants | |
article contracté + nom | aussoir (8), aurevoir (4) |
Pronoms | |
pronom + verbe (auxiliaire ou lexical) | tembrasse (26), ma (16), lai (7), la / las (6), tai (et variantes, 6), tassure (5), jetais (5), técrire (3), cetait / setait (3) |
pronom + pronom | ten / tan / tant (10), men / ment (6) |
Conjonctions | |
conjonction + pronom | quelle (5) |
Prépositions | |
préposition + infinitif | davoir (3) |
Adverbes | |
adverbe de négation ne + verbe | nas (3) |
locution adverbiale | dessuite (3) |
21Les données issues de ce sous-corpus indiquent que le type de soudure le plus fréquent concerne les pronoms personnels objet. Ces derniers sont agglutinés tantôt à un verbe, tantôt à un autre pronom. Parmi ces formes, ressortent par leur fréquence particulièrement élevée tembrasse, issue de te + embrasser, ma, forme homophone-hétérographe de m’a et les graphies ten / tan / tant pour la suite des pronoms te + en8. Pour ce qui est des autres catégories grammaticales, dans ces soudures fréquentes, le seul déterminant qui apparaît agglutiné au nom est l’article contracté au dans les locutions aussoir et aurevoir, tout comme la seule conjonction concernée est que lorsqu’elle est suivie du pronom personnel elle. Parmi les prépositions, c’est de élidé (d’) qui apparaît soudé à un infinitif (davoir) et, parmi les adverbes, nous relevons la forme nas, constituée de la soudure entre l’adverbe de négation ne et le verbe avoir (as), ainsi que la locution adverbiale dessuite (de suite). De même, les sur-segmentations demeurent rares dans sa correspondance, comme le tableau ci-dessous l’illustre :
CATÉGORIES GRAMMATICALES | OCCURRENCES |
Conjonctions | par ce que (4) |
Prépositions | au pres (de) (8) |
Adverbes | plus tôt / plus-tot (6), toute fois / tout fois (6), d’avantage (3) |
22Les résultats du dépouillement de ce sous-corpus montrent que la seule conjonction souvent sur-segmentée est par ce que (parce que) et que la seule préposition est au pres (de) (auprès). En ce qui concerne les adverbes, on remarque notamment la sur-segmentation de plutôt (plus tôt) et toutefois (toute fois). Globalement, ces sur-segmentations semblent être motivées par les facteurs proposés dans un travail précédent (Dal Bo 2024). D’une part, la quasi-totalité des réalisations correspond à l’isolement des éléments de composition du mot (par ce que, au pres, plus tôt, tout(es) fois), qui correspondent individuellement à des unités analysables dans la langue. À cela pourrait s’associer un mécanisme d’analogie avec d’autres locutions appartenant aux mêmes classes grammaticales et s’écrivant en plusieurs mots, comme à peu près. D’autre part, la dernière forme, d’avantage, indique l’utilisation d’un mot grammatical fréquent dans la langue, d’, dans la réalisation écrite d’une autre unité (davantage)9.
3.2. Marie Fabre
23La graphie de Marie présente davantage de soudures et sur-segmentations que celle de son époux. Ainsi, en raison des contraintes d’espace, nous listons ici seulement certaines des formes fréquentes dans sa correspondance. Le tableau ci-dessous présente quelques sous-segmentations :
CATÉGORIES GRAMMATICALES | OCCURRENCES |
Déterminants | |
article défini + nom | lair (5) |
Pronoms | |
pronom + verbe (auxiliaire ou lexical) | jai / jais (51), ma / mas (44), tembrasse (26), lai / les / lés (26), la (22), tembrasser (et var., 17), tai / tais (15), cest (et var., 15), tassure (15), setait (et var., 12), técrire / tecrire (10), seveille (et var., 10), sagit (8) |
pronom + pronom | ten / tan (21), jen / jan (18), jy (15), sen / san (11), men (9) |
Conjonctions | |
conjonction + pronom | quelle / quelles (20), sil / sils (12), quil (7) |
locutions conjonctives | dessuitte que (5), parceque (5) |
Prépositions | |
préposition + infinitif | di / dy (4) |
locutions prépositionnelles | jusqua (16) |
Noms | apremidie / aprémidie (6) |
Adverbes | |
adverbe de négation ne + verbe | na (35), nai / nais (18), navez / navait (13), netait (10) |
adverbe de négation ne + pronom | ni / ny (20), nen (9) |
adverbes | aujourdhui (19) |
locutions adverbiales | apresent (et var., 22), rienque (9), dessuite (7) |
24Parmi les soudures les plus communes, nous remarquons celles qui touchent les pronoms personnels et les verbes. Certaines de ces soudures correspondent à des mots qui existent dans la langue et sont donc influencées par le phénomène d’homophonie-hétérographie, comme ma (soudure de m’a) et la (soudure de l’a)10. D’autres soudures résultent de l’agglutination d’un pronom personnel clitique à un verbe, telles que jai, lai, tai, tembrasse, tassure, técrire, ou à un autre pronom, comme ten / tan, jen / jan et jy. De façon similaire, la conjonction que suivie du pronom personnel elle (qu’elle) est réalisée par la forme homophone-hétérographe quelle, alors que l’adverbe de négation clitique ne se trouve souvent soudé au verbe avoir, comme dans les formes non homophones-hétérographes na et nai. Lorsque ne est soudé au pronom y, la réalisation graphique correspond soit au mot homophone-hétérographe ni soit à la forme ny. Enfin, Marie agglutine fréquemment l’adverbe aujourd’hui (aujourdhui) ainsi que des locutions adverbiales telles que à présent (apresent et variantes) ou rien que (rienque). En revanche, le seul substantif qui apparaît soudé dans sa correspondance est le nom composé après-midi, sous les formes graphiques apremidie et aprémidie.
25Chez Marie, les sur-segmentations sont plus rares, comme ce tableau en témoigne :
CATÉGORIES GRAMMATICALES | OCCURRENCES |
Déterminants | qu’el (3) |
Pronoms | qu’elqu’un (4), chaqu’un (3) |
Conjonctions | qu’ant (76), l’orsque (8), qu’ar (4) |
Locutions prépositionnelles | au près (de) (et var., 12), qu’ant (à) (12) |
Noms | l’etre (et var., 88) |
Verbes | s est (4) |
Adverbes | qu’ant même (4), d’avantage (3) |
26Les deux sur-segmentations les plus fréquentes sont représentées d’une part par la forme qu’ant, qu’elle soit utilisée en tant que conjonction (quand) ou dans la locution prépositionnelle quant à, et, d’autre part, par les réalisations graphiques l’etre, l’ètre, l’etres, qui constituent la sur-segmentation du substantif lettre. Ces deux occurrences correspondent ainsi au phénomène de sur-segmentation par isolement d’un élément grammatical fréquent dans la langue, à savoir ici qu’ (conjonction ou pronom relatif élidé) et l’ (article défini ou pronom personnel élidé). Ce mécanisme de découpage est bien représenté chez Marie, où l’on trouve également des sur-segmentations telles que qu’el, qu’elqu’un, l’orsque, d’avantage. En revanche, dans la réalisation graphique au pre (et ses variantes), on peut reconnaître la tendance à isoler les deux éléments constitutifs de la composition du mot, sans doute influencée par l’analogie avec d’autres mots appartenant à la même classe grammaticale et s’écrivant en plusieurs unités.
3.3. Laurent Pouchet
27Dans les lettres écrites par Laurent, nous retrouvons une plus grande variété de découpages de la chaîne graphique. Afin de respecter l’espace attribué, pour ce scripteur également, nous présentons seulement certaines des soudures et sur-segmentations fréquemment attestées. Le tableau ci-dessous illustre des occurrences de sous-segmentation :
CATÉGORIES GRAMMATICALES | OCCURRENCES |
Déterminants | |
article défini + nom | létat (et var., 36), la dresse / ladresse (26), lendroi / la droit (et var., 23), largent (10) |
Pronoms | |
pronom + verbe (auxiliaire ou lexical) | jai (et var., 251), ma (250), tembrasse (et var., 45), lai (et var., 34), menvoyer / men voyer (et var., 32), javez (et var., 26), tembrasser (et var., 21), técri (et var., 19), la (16), men verra / menverra (et var., 16), medi (13) |
pronom + pronom | ja nai (et var., 49), men (et var., 19), jan (et var., 17) |
Conjonctions | |
conjonction + pronom | çil (et var., 24) |
conjonction + préposition | inci qua / inçi qua (42), qua (26), en méme temps qua (et var., 11) |
conjonction + verbe | édésire (et var., 44) |
Prépositions | |
préposition + nom | dobus (4), da lumette / dalumette (et var., 4) |
préposition + pronom | avous (43) |
préposition + infinitif | décrire / decrire (12) |
Noms | beaufrère (et var., 25) |
Adverbes | |
adverbe de négation ne + verbe | nai (et var., 63), na (24) |
adverbe de négation ne + pronom | ny / ni (20), nen (et var., 18) |
locution adverbiale | aprésent (et var., 85), peutétre (et var., 32), rienplus (31), cammème / qu’amméme (et var., 17), épuis (et var., 16) |
Interjections | ébien (et var., 83), veutu (20) |
28À côté de soudures déjà rencontrées, comme jai, ma, lai, jan, tembrasse, nai, na ou aprésent, les données ici présentées indiquent une spécificité de l’écriture de Laurent par rapport à celles de Pierre et Marie : dans de nombreuses occurrences, on relève des cas de re-segmentation. Il en est ainsi de réalisations graphiques comme la dresse, men voyer et men verra. Dans ces occurrences, bien que le découpage ne soit pas réalisé de façon standard, le nombre des éléments qui constituent chaque groupe sémantico-syntaxique est respecté (Dal Bo 2024) : [déterminant + nom] dans la dresse (l’adresse) et [pronom + verbe] pour men voyer (m’envoyer) et men verra (m’enverra). Soulignons enfin la forme ébien, utilisée très fréquemment par Laurent comme marqueur discursif dans sa correspondance.
29En ce qui concerne les sur-segmentations, le tableau ci-dessous répertorie des formes fréquemment réalisées par Laurent :
CATÉGORIES GRAMMATICALES | OCCURRENCES |
Déterminants | qu’elque (et var., 77), c’ette (et var., 8) |
Pronoms | il la n’est / il la n est (et var., 201), la qu’elle (et var., 112), ja nai / ja n’est (et var., 38), ce la (et var., 29), qu’elque chose (et var., 22), ce lui (et var., 13) |
Conjonctions | puis que (et var., 10), de puis que (7) |
Prépositions | de puis (43) |
Noms | la dresse (24) |
Adjectifs | par faite (7) |
Verbes | en na prenand / a na prenand (et var., 153), en brasser (et var., 51), en brasse (et var., 61), en voyer / en voyez (56) |
Adverbes | a laur (et var., 154), sur tout / sur tous (150), en fin (68), en core (et var., 38), en semble (et var., 21) |
30Certaines de ces occurrences attestent, chez Laurent également, l’utilisation de la séquence qu, isolée au moyen de l’apostrophe, dans la réalisation écrite d’autres mots, comme dans qu’elque et la qu’elle, tandis que d’autres suggèrent une sur-segmentation influencée par la transparence du processus de composition, comme de puis, puis que ou sur tout, et sans doute par l’analogie avec d’autres mots appartenant aux mêmes classes grammaticales s’écrivant en plusieurs mots, comme parce que. Parfois, plusieurs facteurs peuvent avoir favorisé le processus de sur-segmentation : dans des occurrences telles que a laur (et variantes), en fin, en brasse ou en brasser (et var.), la sur-segmentation pourrait être due davantage à l’utilisation d’un mot grammatical fréquent (comme les prépositions à et en) dans la mise à l’écrit d’autres mots qu’à un découpage fondé sur les éléments de composition du mot, qui sembleraient ici moins faciles à identifier. Le recours à un élément grammatical fréquent semble également motiver des sur-segmentations comme en voyer, en core et en semble.
31Des formes comme na, ja ou nai apparaissant dans le tableau ci-dessus méritent d’être commentées. En effet, elles font partie des formes graphiques disponibles pour Laurent, qui les utilise dans son écriture pour des réalisations différentes. Par exemple, na (220 occ.) peut correspondre : (i) à une re-segmentation du pronom en et du mot à initiale vocalique suivant (a na chetez, etc.), (ii) à la marque surnuméraire à l’écrit de la consonne de liaison n et de sa soudure au début du mot suivant (en na prenand, etc.) et (iii) à la soudure de l’adverbe de négation ne au verbe avoir11 (tu na pas, etc.). De façon similaire, la forme ja (53 occ.) est employée par Laurent pour réaliser : (i) des suites comportant je + verbe à initiale vocalique (je + avoir : ja vez ; je + attendre : ja tend, etc.) et (ii) des re-segmentations de la suite je + en + avoir (ja n’est vu, etc.). Enfin, la forme nai (78 occ.) se retrouve dans deux schémas principaux : (i) je + nai, où elle réalise la soudure entre l’adverbe de négation ne et le verbe avoir (je nai pas, etc.) et (ii) ja + nai, où elle correspond à la re-segmentation de la séquence je + en + ai (ja nai encore, etc.).
3.4. Joséphine Pouchet
32La production écrite de Joséphine présente également une grande variété de formes soudées et sur-segmentées. Dans le tableau suivant, on peut observer les sous-segmentations les plus fréquentes :
CATÉGORIES GRAMMATICALES | OCCURRENCES |
Déterminants | |
article défini + nom | lafamille (6) |
Pronoms | |
pronom + verbe (auxiliaire ou lexical) | anet (et var., 16), tenvoier / tent voier (et var., 16), sai / ses / se / sés (14), jai / jais (10), ta (8), tent voi / tenvois (6), ma (5) |
Conjonctions | |
conjonction + pronom | quil (11), quelle / quelles (5) |
Prépositions | |
préposition + adjectif | enbonne (et var., 12) |
Adverbes | |
adverbe de négation ne + verbe | net (3) |
adverbes | aujourdhui (et var., 6) |
locutions adverbiales | plurien / plurient (12) |
Interjections | vetu / vetus (3) |
33Parmi les soudures les plus fréquentes chez Joséphine, on remarquera l’agglutination de deux pronoms à la forme est du verbe être : le pronom en, qui produit la forme anet (et variantes), ainsi que le pronom démonstratif ce, réalisé sous les formes graphiques sai / ses / se / sés, qui sont en partie des formes homophones-hétérographes de c’est. Parmi les conjonctions, nous retrouvons les formes quil et quelles, dues à l’agglutination entre que et les pronoms personnels il(s) et elle(s), tandis que, pour ce qui est des prépositions, on relève la soudure entre en et l’adjectif bonne, qui produit la forme enbonne. Enfin, une locution adverbiale fréquemment soudée est plurien (et variantes).
34En parallèle de ces soudures conformes aux tendances déjà soulignées, dans l’écriture de Joséphine on relève également des segments soudés plus larges, qui sont attestés une seule fois chacun, relevant de certains patrons syntaxiques. Il en est ainsi de :
- groupes négatifs impliquant les adverbes de négation ne et/ou pas ou le pronom indéfini rien, tels que napas (n’a pas), navonpas (n’avons pas), nepouvaipa (ne pouvais pas), mais cripas (m’écris pas), ne sonpa (sont pas), apatrot (a pas trop), senet (ce n’est), sane fairien (ça ne fait rien), ne voiplurien (vois plus rien);
- groupes constitués de la suite [sujet + verbe], comme londemente (l’on demande), ou [(pronom +) auxiliaire + participe passé], comme serafinit (sera fini), mondit (m’ont dit), adit (a dit), arecus (a reçu) ;
- groupes nominaux formés de [déterminant + adjectif], nomeilleur carriese (nos meilleurs caresses), [déterminant + nom], mamère (ma mère), et [adjectif + nom], bautent (beau temps).
35Ces segmentations, bien qu’attestées une seule fois, ne sont pas sans rappeler des pratiques de segmentation relevées par Andrieux-Reix & Monsonégo (1998) dans des textes manuscrits médiévaux, comme leblanc cerf, medist, luya dit. Bien que les éléments concernés par la soudure ne soient pas exactement les mêmes, l’hypothèse explicative avancée par les deux autrices semble pouvoir s’appliquer en partie à l’écriture de Joséphine : les unités ainsi réalisées à l’écrit correspondraient à « des unités de compréhension », qui s’appuieraient sur des rapports sémantico-syntaxiques privilégiés (ibid.).
36En ce qui concerne les sur-segmentations, elles demeurent, chez Joséphine, plus rares :
CATÉGORIES GRAMMATICALES | OCCURRENCES |
Pronoms | la quelle (9), a nais / a net (3) |
Prépositions | de plui / de pluis (3) |
Verbes | tent voier (et var., 15), tent voi (5), et tes (4) |
Adverbes | au ci / au cie (3) |
37Nous retrouvons ici, comme chez Laurent, la sur-segmentation de la préposition depuis (de plui) ainsi que du pronom relatif laquelle (la quelle). Pour cette dernière occurrence, on peut faire l’hypothèse que la sur-segmentation de l’unité initiale de ce mot pourrait être influencée, chez ces scripteurs, par une formation par composition en unités qui demeurent reconnaissables.
38On remarquera que Joséphine, comme Laurent, utilise des re-segmentations. C’est le cas, par exemple, de certaines réalisations graphiques comportant en et est (en est), qui sont réalisées sous les formes a nais et a net et, surtout, de la séquence t’en voyer, qui est ici attestée dans les graphies suivantes : tent voier, tent vouier, ta voier, ten voiez, tan voiers, ten voier, ten voiers, ten voiier.
4 | Usages personnels des formes graphiques
4.1. Variations interindividuelles
39Les données présentées dans les tableaux de la section 3 mettent en lumière des usages fréquents des soudures et des sur-segmentations attestés dans la correspondance de chaque scripteur. Nous comparons ainsi les attestations de ces formes graphiques, afin de vérifier si ces réalisations écrites sont utilisées par tous les scripteurs ou bien si elles sont corrélées à des pratiques individuelles.
40D’une part, certaines formes graphiques sont employées, bien qu’à des fréquences différentes, par les quatre scripteurs. Parmi les soudures, nous pouvons citer à titre d’exemple ma, men, tai, ten, la, lai / les, quil, quelle, técrire et tembrasse12 et leurs variantes graphiques. Ces agglutinations impliquent toutes des pronoms personnels clitiques et, à l’exception des formes verbales técrire et tembrasse, constituent des unités monosyllabiques, dont certaines sont des formes homophones-hétérographes (ma - m’a, la - l’a, les - l’ai). Les soudures técrire et tembrasse pourraient se retrouver chez tous les scripteurs en raison de la fréquence d’emploi de ces deux verbes, qui sont récurrents dans la correspondance épistolaire.
41D’autre part, certains découpages ne sont pas attestés chez tous les scripteurs : leur emploi varie selon les usages écrits de chacun. Dans le tableau ci-dessous, nous comparons l’usage interscripteur de certaines soudures fréquentes dans l’ensemble du corpus :
Pierre | Marie | Laurent | Joséphine | |
ny | - | + | + | ∅ |
qua | - | + | + | + |
enbonne | - | - | - | + |
tenvoyer | ∅ | + | + | + |
largent | - | + | + | ∅ |
lafamille | - | - | - | + |
aujourdhui | - | + | + | + |
dessuite | + | + | - | - |
plusrien | - | - | - | + |
42Les sous-segmentations ci-dessus constituent des séquences existantes dans toutes les correspondances (à l’exception des séquences marquées par le symbole ∅), mais qui sont réalisées comme une forme soudée seulement par certains scripteurs. Ainsi, le tableau indique que Pierre n’utilise presque pas ces segmentations, tandis que Marie et Laurent s’en servent davantage. Quant à Joséphine, lorsque la séquence est attestée dans sa correspondance, elle a recours aux formes soudées, sauf pour de suite.
43En ce qui concerne les sur-segmentations, les seules occurrences partagées par plusieurs scripteurs sont les formes au pres (et variantes), que l’on retrouve chez Pierre, Marie et Laurent, d’avantage, utilisée par Pierre et Marie, ainsi que qu’el et qu’elqu’un, utilisées par Marie et Laurent. L’unité qu’ est également utilisée dans d’autres sur-segmentations par ces deux scripteurs, mais dans la réalisation de mots différents. Le tableau suivant reproduit certaines des sur-segmentations les plus fréquentes par scripteur13 :
Pierre | par ce que, au pres, plus tôt, toute fois, d’avantage |
Marie | qu’el, qu’elqu’un, chaqu’un, qu’ant, qu’ar, l’orsque, l’etre, s’est, au pres, d’avantage |
Laurent | qu’elque, qu’elque chose, la qu’elle, il la n’est, ja nai, de puis, la dresse, en na prenand, en brasser, en brasse, en voyer, a laur, sur tout, en fin, en core |
Joséphine | la quelle, a nais, de plui, tent voier, ten voi, et tes, au ci |
44Le phénomène de sur-segmentation semble ainsi relever d’un rapport relativement plus personnel à l’écrit : finalement, si les sur-segmentations semblent être globalement motivées par les mêmes facteurs, leur emploi diffère grandement d’un scripteur à l’autre14.
45Compte tenu des résultats mis en lumière par la comparaison des différentes formes utilisées par les quatre scripteurs, nous nous demandons s’il est possible d’identifier des régularités, en matière de découpage graphique, dans l’écriture de chaque scripteur.
4.2. Variations intraindividuelles
46Dans cette dernière partie de notre étude, nous nous focalisons sur certaines formes graphiques propres à l’écriture de chaque scripteur, c’est-à-dire non employées par les autres, afin de vérifier si certaines sous-segmentations et sur-segmentations constituent des usages réguliers. Est-il possible d’affirmer que les réalisations propres à chaque scripteur fonctionnent comme des routines graphiques ? Afin de répondre à cette question, nous comparons la fréquence d’emploi de chacune d’entre elles à la fréquence des réalisations standard et nous analysons les contextes d’emploi dans lesquels ces découpages apparaissent.
47Dans l’écriture de Pierre, les formes aussoir, au pres, davoir et d’avantage alternent avec leurs réalisations standard, tandis que tassure, par ce que, plus tôt et toute fois représentent les seules graphies attestées. Bien que assurer soit également utilisé comme une unité non soudée dans la correspondance de Pierre, lorsqu’il se trouve précédé du pronom personnel objet te dans la séquence te + assure, Pierre utilise la forme graphique tassure. Le tableau ci-dessous synthétise ces données en indiquant la fréquence d’emploi de la forme graphique « non standard » en relation à l’ensemble des réalisations attestées (standard et non standard).
Fréquence d’emploi | Nombre d’occurrences | |
tassure | 100 % | n=5/5 |
par ce que | 100 % | n=4/4 |
plus tôt | 100 % | n=6/6 |
toute fois | 100 % | n=6/6 |
aussoir | 89 % | n=8/9 |
au pres | 50 % | n=8/16 |
davoir | 50 % | n=3/6 |
d’avantage | 43 % | n=3/7 |
48Ces résultats semblent suggérer que, chez Pierre, les formes tassure, par ce que, plus tôt et toute fois constitueraient des habitudes graphiques spécifiques.
49Une remarque similaire peut être faite au sujet des formes graphiques tassure, seveille, sagit, apresmidie, parceque, aprésent (et leurs variantes graphiques) dans l’écriture de Marie, qui sont les seules réalisations attestées dans sa correspondance. Si éveiller n’est pas soudé à d’autres éléments dans d’autres contextes d’emploi, assurer et agir ne sont pas utilisés par cette scriptrice dans d’autres séquences : tassure et sagit semblent fonctionner comme des routines graphiques. On peut alors se demander si ces deux formes ne seraient perçues comme une seule unité de langue par Marie : elles sont en effet toujours employées dans les mêmes constructions syntaxiques, respectivement je + te + assure et (il) sagit que. De même, les suites après-midi, parce que et à présent sont toujours réalisées en une seule unité par Marie.
50En ce qui concerne les sur-segmentations, chaqu’un représente la seule réalisation écrite attestée (alors que l’on trouve la forme standard chacune) et qu’ant (quand, quant à) est utilisé dans 99 % des cas : on peut considérer que ces deux formes constituent également des habitudes graphiques propres à Marie. Les autres sur-segmentations alternent avec leurs réalisations standard, mais présentent des fréquences tout de même élevées, notamment l’etre et ses variantes (lettre) et qu’elqu’un. Le tableau ci-dessous résume ces données :
Fréquence d’emploi | Nombre d’occurrences | |
tassure | 100 % | n=15/15 |
seveille | 100 % | n=10/10 |
parceque | 100 % | n=5/5 |
apresmidie | 100 % | n=6/6 |
aprésent | 100 % | n=22/22 |
sagit | 100 % | n=8/8 |
chaqu’un | 100 % | n=3/3 |
qu’ant (conj. et loc. prép.) | 99 % | n=88/89 |
jusqua | 94 % | n=16/17 |
l’etre | 86 % | n=88/102 |
qu’elqu’un | 80 % | n=4/5 |
l’orsque | 67 % | n=8/12 |
qu’el (déterminant) | 25 % | n=3/12 |
51En ce qui concerne la correspondance de Laurent, certaines formes apparaissent toujours soudées ou re-segmentées dans des contextes d’emploi précis. Par exemple, le scripteur emploie les formes lendroi, décrire, técri et menvoyer (et leurs variantes graphiques) ou des re-segmentations comme lan droi ou men voyer dans les contextes d’emploi suivants : le + endroit, de + écrire, te + écris et me + envoyer15. De façon similaire, la séquence la + adresse est toujours réalisée sous la forme la dresse (et, en moindre mesure, ladresse), bien que le nom adresse apparaisse isolé dans d’autres contextes, lorsqu’il est précédé d’un autre déterminant ou adjectif. On peut donc émettre l’hypothèse que ces réalisations constituent des routines graphiques pour Laurent, sans doute favorisées par l’élision orale du premier élément de la séquence (l’, d’, t’, m’).
52Pour ce qui est des sur-segmentations, les pronoms quelque chose et laquelle sont généralement sur-segmentés par Laurent en détachant l’unité qu-, ce qui donne qu’elque chose et la qu’elle (et variantes)16. On remarque que la forme la qu’elle est toujours employée dans une des formules d’ouverture que Laurent utilise dans ses lettres : elle fait en effet partie du patron syntaxique qui, de façon schématique et simplifiée, correspond à « je fais réponse à ta (+adj.) carte/lettre (daté du) laquelle m’a fait plaisir »17. Cette routine épistolaire semble ainsi constituer également une routine graphique pour Laurent18. La même remarque peut s’appliquer aux sur-segmentations très fréquentes en na prenand et il la n’est : ces formes appartiennent à la deuxième partie des routines épistolaires d’ouverture de la correspondance, dont le patron simplifié correspond à : « je fais réponse à ta (+adj.) lettre qui m’a fait plaisir en na prenand que vous êtes tous en bonne santé car il la n’est de même pour moi ». Ce contexte d’emploi semblerait donc avoir favorisé l’établissement de ces deux réalisations graphiques en routines.
53Pour d’autres formes verbales et adverbes qui alternent réalisations standard et sur-segmentations (cf. tableau ci-dessous), l’identification de routines graphiques est moins aisée. Si, d’une part, les adverbes alors et surtout ainsi que la locution adverbiale à présent sont majoritairement sur-segmentés, ce qui peut suggérer tout de même une forme de routine graphique, d’autre part, pour envoyer, embrasser et embrasse il n’est pas possible de dégager des éléments qui auraient favorisé l’emploi d’une forme plutôt que de l’autre, puisque les deux réalisations apparaissent dans les mêmes contextes d’emploi. De façon similaire, les contextes d’utilisation d’enfin et encore ne nous fournissent pas d’indices. Le tableau suivant synthétise ces données :
Fréquence d’emploi | Nombre d’occurrences | |
lendroi | 100 % | n=23/23 |
décrire | 100 % | n=12/12 |
técri | 100 % | n=19/19 |
menvoyer | 100 % | n=32/32 |
la dresse | 100 % | n=26/26 |
qu’elque chose | 100 % | n=22/22 |
la qu’elle19 | 100 % | n=109/109 |
qu’elqu’un | 100 % | n=5/5 |
en na prenand | 100 % | n=153/153 |
il la n’est | 99 % | n=201/203 |
qu’elque | 97 % | n=77/79 |
a laur | 94 % | n=154/164 |
sur tout | 79 % | n=150/191 |
aprésent | 78 % | n=85/109 |
veutu | 74 % | n=20/27 |
en voyer | 60 % | n=56/93 |
en brasser | 54 % | n=51/94 |
en fin | 53 % | n=68/129 |
en core | 45 % | n=38/84 |
em brasse | 37 % | n=51/164 |
avous | 36 % | n=43/118 |
rienplus | 35 % | n=31/89 |
beaufrere | 28 % | n=25/90 |
54Enfin, dans l’écriture de Joséphine, le recours à des routines graphiques semble être plus évident. En effet, parmi les formes analysées, la plupart constitue la seule réalisation écrite produite par cette scriptrice : c’est le cas de sai (c’est), anet (en est), ta (t’a), la quelle (laquelle), tent voi (t’envoie/t’envoyer), tent voier (t’envoyer) et et tes (était), ainsi que de leurs variantes graphiques. Seulement la préposition depuis, l’adverbe aussi et la forme verbale été alternent avec des réalisations standard, comme le tableau ci-dessous l’indique :
Fréquence d’emploi | Nombre d’occurrences | |
sai | 100 % | n=14/14 |
anet | 100 % | n=16/16 |
ta | 100 % | n=8/8 |
la quelle | 100 % | n=9/9 |
tent voi | 100 % | n=6/6 |
tent voier | 100 % | n=16/16 |
et tes (était) | 100 % | n=3/3 |
de plui | 75 % | n=3/4 |
au ci | 50 % | n=3/6 |
et tes (été) | 20 % | n=1/5 |
5 | Conclusion
55Pour conclure, les résultats des analyses menées dans cette étude ont mis en lumière des habitudes graphiques particulièrement fréquentes chez Pierre, Marie, Laurent et Joséphine en matière de découpage de la chaîne graphique.
56D’une part, certaines soudures et sur-segmentations se sont révélées partagées par l’ensemble des scripteurs, bien qu’employées à des fréquences différentes. D’autre part, plusieurs formes se sont avérées propres à l’écriture de chaque scripteur : ces réalisations graphiques sont corrélées à des pratiques individuelles, que l’on pourrait analyser en termes de variation idiolectale. Parmi celles-ci, certaines semblent fonctionner comme des routines graphiques, en constituant des prêts-à-écrire dont chaque scripteur se sert lors de son écriture. Les formules épistolaires d’ouverture et clôture des lettres sont ainsi, pour certains scripteurs, des lieux de routine non seulement discursive, mais aussi graphique. En outre, des unités qui sont souvent réalisées sous la même forme, comme tassure (t’assure) ou la dresse (l’adresse), semblent également constituer des habitudes graphiques propres à chaque scripteur.
57Les données analysées indiquent également que les mots grammaticaux clitiques20 sont aussi bien concernés par les sous-segmentations que par les sur-segmentations. En effet, moins saillants que les unités lexicales, ils semblent témoigner d’une tendance à l’agglutination. En même temps, ils font également partie du stock d’unités graphiques disponibles pour les scripteurs peu lettrés, qui peuvent s’en servir pour réaliser à l’écrit d’autres unités linguistiques.
58Cette étude se doit d’être prolongée, afin d’établir avec davantage de certitude les profils propres à chaque scripteur en matière de découpage de la chaîne graphique et de corréler ces profils au niveau des compétences orthographiques générales de chaque scripteur. Nous pourrions ainsi tester l’hypothèse selon laquelle les scripteurs moins à l’aise à l’écrit, comme Joséphine, segmenteraient plus souvent la chaîne graphique en ayant recours à des usages plus personnels par rapport aux scripteurs qui seraient plus lettrés, comme Pierre.
- 1 Nous empruntons ce terme et sa définition à Branca-Rosoff & Schneider, qui présentent les peu lettrés comme le « groupe de ceux qui emploient une langue non conforme » (1994 : 9). Ils se situent ainsi entre le groupe des lettrés, qui maîtrisent la langue de façon conforme à la norme linguistique, et celui des illettrés, qui, au contraire, ne savent pas écrire. Dans le cadre du projet Corpus 14, le niveau de scolarisation indiqué sur les fiches matricules des soldats correspond au niveau 3, qui indique une instruction élémentaire (« sachant lire, écrire et compter »), sans obtention du certificat d’études.
- 2 Pour une réflexion similaire à propos du français au Québec, voir aussi Martineau & Bénéteau, 2018 [2010].
- 3 Nous utilisons l’étiquette employée par Manesse & Cogis : « tous les signes qui ne sont ni les lettres de l’alphabet ni les signes de ponctuation : accents, apostrophe, trait d’union, cédille » (2007 : 77).
- 4 Dans cette étude, nous analysons les soudures sans la marque de l’apostrophe (comme menverrais) au même titre que les soudures sans espace (comme aurevoir).
- 5 En raison de l’espace limité dont nous disposons, nous ne pouvons que renvoyer à ces études pour plus d’informations.
- 6 Nous avons considéré comme fréquentes les formes qui présentent au minimum trois occurrences sur la totalité des soudures et des sur-segmentations relevées dans chaque sous-corpus. Ceci nous a permis d’écarter les occurrences qui sont des hapax ou qui pourraient être dues à des erreurs de transcription.
- 7 Notons que des études précédentes ont montré, à partir de corpus échantillons, que le phénomène de la sur-segmentation est bien moins fréquent que celui de la soudure dans les écrits des scripteurs peu lettrés de Corpus 14 (Dal Bo 2020 et 2024).
- 8 Pour une analyse détaillée des soudures entre pronoms personnels de 1ère et 2ème personne et les verbes dans ce sous-corpus, nous renvoyons à Dal Bo (2020).
- 9 On peut noter que la graphie d’avantage est attestée en ancien français au sens de « sans contrepartie », « d’avance » et « en outre » (TLFi, s.v. davantage). Selon Rey et al. (1998), c’est une autre valeur, « de plus », qui est à l’origine de l’adverbe davantage (Dictionnaire historique de la langue française, s.v. davantage). Catach et al. (1995) indiquent qu’Estienne, Thierry & Nicot enregistrent la graphie d’avantage et que Richelet 1680 et Furetière 1690 retiennent la forme davantage, comme les dictionnaires de l’Académie française, dès la première édition en 1694 (Dictionnaire historique de l’orthographe française, s.v. davantage).
- 10 Pour une analyse détaillée des soudures entre pronoms personnels de 1ère et 2ème personne et les verbes dans ce sous-corpus, nous renvoyons à Dal Bo (2020).
- 11 Pour une analyse plus détaillée, voir Dal Bo (2024).
- 12 Cette forme n’est pas attestée dans la correspondance de Joséphine, mais il convient de préciser qu’elle n’emploie jamais ce verbe, préférant la formule de clôture « bien le bonjour » à « je t’embrasse ».
- 13 Nous signalons que, d’un point de vue diachronique, certaines unités sur-segmentées par les scripteurs de Corpus 14, telles que par ce que, plus tôt, en fin ou sur tout, ont connu de tels découpages dans des états antérieurs de la langue : par ce ke (ca 1200, s.v. parce que, TLFi) ; plus tost / plutôt, définitivement soudé dans le dictionnaire de l’Académie française de 1835 (Catach et al. 1995, s.v. plutôt ; Pellat 1998) ; en fin (1119, s. v. enfin, TLFi) ; sur tout (fin XVe s., s.v. surtout, TLFi).
- 14 Les sur-segmentations réalisées au moyen d’une apostrophe semblent témoigner d’une bonne connaissance des possibilités qu’offre le système graphique du français. L’apostrophe est en effet souvent placée à l'initiale du mot, entre la première consonne ou la suite qu- et la voyelle qui suit. De plus, les données n’indiquent pas des séquences comme b’, f’, etc.
- 15 Les unités endroit, écrire, écris et envoyer sont utilisées de façon isolée dans d’autres contextes.
- 16 Le recours à cette unité se trouve également dans la sur-segmentation d’autres mots grammaticaux commençant par qu- : quelqu’un et sa flexion, dont les formes sont réalisées uniquement comme sur-segmentées, et quelque(s), sur-segmenté à 97 %.
- 17 Pour une analyse des formules épistolaires dans Corpus 14 voir Große et al. (2016) ; Steuckardt et al. (2022).
- 18 On remarquera que les autres flexions du pronom lequel, également réalisées par les formes sur-segmentées le qu’el, les qu’elle(s), apparaissent souvent dans le même contexte (par exemple, « je fais réponse à ta (+ adj.) carte et lettre les qu’elle mon fait plaisir »).
- 19 Ce calcul ne prend pas en compte les trois occurrences où laquelle est réalisée sous la forme la quelle.
- 20 Nous employons le terme clitique selon l’acception de Riegel, Pellat & Rioul : il désigne des mots atones qui « ne peuvent recevoir d’accent en aucun cas et qui font nécessairement corps avec le mot suivant ». Entrent dans cette catégorie les déterminants simples, les pronoms conjoints, les prépositions, les conjonctions et le premier élément ne de la négation (2016 [1994] : 108).