1 | Introduction
1Jusqu’à présent, l’analyse linguistique de la fabrication des produits médiatiques s’est principalement occupée des processus de rédaction (voir NTT 2011 et Cotter & Perrin 2017, pour un état des lieux), au détriment du travail proprement vocal engagé par la production des nouvelles, notamment lorsqu’elles sont destinées à être diffusées à la radio ou à la télévision. Ceci s’explique, pour partie du moins, par le fait que les linguistes traitant de la production médiatique se sont intéressés en priorité à la presse (Bell 1991), considérée pendant longtemps comme le média de référence. Or, c’est une évidence, le travail journalistique considéré dans toute sa latitude, se caractérise par une combinaison d’activités de communication orales et écrites (Mondada & Oloff 2013). Cela est vrai sur le plan des produits médiatiques, mais aussi de leur production : en salle de rédaction, l’écrit se prépare par oral et l’oral par écrit.
2Notre contribution vise à comprendre l’interaction entre écrit et oral dans la production des nouvelles télévisées. Plus concrètement, nous cherchons à identifier par quels moyens les journalistes construisent la contrepartie orale de la nouvelle qu’ils ont rédigée. Pour ce faire, nous proposons d’étudier la production d’un segment de nouvelle télévisée : de sa rédaction aux multiples lectures à haute voix qui précèdent son enregistrement sur images. L’intérêt d’une telle étude de cas est qu’elle permet de suivre pas à pas, dans son déroulement, la pratique même d’individus qui sont alternativement, et parfois simultanément, locuteurs et scripteurs. Le cas choisi a, en outre, cela de remarquable qu’il voit l’oralisation d’un segment de texte posant problème en ce qu’il pourrait opérer une dramatisation trop importante des événements rapportés, mettant dès lors en tension finalités d’information et enjeux de captation.
2 | Données
3Le cas étudié est issu d'un corpus de données récoltées dans les locaux des rédactions des télévisions suisses en 2007 lors du projet Idée Suisse (Perrin 2013). Ce projet, investiguant les façons par lesquelles différents médias suisses remplissent leur mandat de service public, a pu entrer dans le lieu très clos que sont les rédactions des journaux télévisés pour capturer de manières variées les processus de production de l’information (enregistrement audio-vidéo des séances de travail des journalistes, capture numérique des processus d’écriture, entretiens semi-directifs, commentaires rétrospectifs des journalistes sur leur propres productions, nouvelles télédiffusées et documents d’archive). Nous nous focalisons sur la production de la première partie d’une nouvelle relayant un accident d’avion ayant eu lieu le 7 mars 2007 en Indonésie :
…Quelques instants après le crash, la fuite éperdue loin du Boeing de l’un des survivants… ce passager n’est pas encore à l’abri mais sa caméra est enclenchée… (Bloc 1, état du texte à 11:17)
4Cette première partie sert à contextualiser les images qui ouvrent la nouvelle. Celles-ci ont été tournées quelques heures auparavant sur les lieux même de la catastrophe aérienne. Ce bloc textuel1 est rédigé, entre 11:09 et 11:17, par un journaliste qui travaille sur la nouvelle en compagnie d’un monteur. Au fil de la matinée, ce premier bloc est complété par quatre autres blocs, qui forment avec lui l’entier de la nouvelle. Celle-ci sera diffusée lors de l’édition de la mi-journée du journal télévisé. Nous avons fait le choix de nous concentrer uniquement sur le premier bloc textuel, qui du fait d’être lu à plusieurs reprises tout au long du processus d’élaboration de la nouvelle, offre d’intéressants lieux de comparaison et permet de rendre compte d’une diversité d’enjeux associés à l’oralisation de l’écrit en contexte de production de l’information télévisuelle. Dès lors, les données sur lesquelles s’appuie notre étude de cas sont les suivantes : la nouvelle dans sa version télédiffusée, la nouvelle telle que rédigée dans le traitement de texte du journaliste (dont le bloc 1, ci-dessus, est un fragment), le processus de son écriture (capturé numériquement), 7 extraits sonores de l’oralisation dudit bloc, 2h30 d’enregistrement audio-vidéo en salle de montage documentant le processus de production de la nouvelle et la collaboration entre le journaliste et le monteur.
3 | Méthodologie
5Tenir compte de la diversité de ces données et analyser le rôle de l’écrit et de son oralisation dans la production d’une nouvelle télévisée supposent des choix méthodologique variés, que l’on peut situer par rapport à trois traditions : (a) l’ethnographie de la production de l’information (Van Hout 2015) a servi à documenter les étapes de réalisation de la nouvelle (au niveau macrogénétique) ainsi que les pratiques langagières y étant attachées (au niveau microgénétique) ; (b) l’analyse textuelle du discours a été mobilisée pour appréhender les structures intra- et interphrastiques (Adam 2008) ainsi que le déploiement de points de vue (Rabatel 2017) ; (c) l’analyse de la prosodie (Simon et alii 2013) a permis de rendre compte des phénomène de rythme et d’intonation. En conjuguant différentes méthodes, notre approche n’est pas sans rapport avec celle proposée, en son temps, par l’anthropologue Clifford Geertz sous le nom de thick description – description denses ou description épaisse – visant à déplier les complexités d’une situation sociale (Geertz 1973). Dans notre cas, à la perspective ethnographique s’ajoute la technicité de l’analyse rendue possible par les outils des sciences du langage, inscrivant de ce fait notre propos dans le courant de l’ethnographie linguistique (Rampton, Maybin & Roberts 2015). On peut dès lors concevoir notre approche comme complémentaire de celle développée en anthropologie de l’écriture, notamment celle de l’écriture en milieu professionnel (Fraenkel 2001 ; Denis & Pontille 2012, 2013). Notre méthodologie d’analyse s’inspire par ailleurs des travaux de génétique textuelle portant sur la catégorie des avant-dire : des textes écrits préparant des énonciations orales (voir l’introduction à ce numéro). Elle en retient deux faits majeurs. Premièrement, les textes de cette catégorie présentent divers degrés de « prêt-à-dire » (notes, textes rédigés, partitions) qui se rapportent à leurs horizons communicatifs (Philippe 2014). Deuxièmement, l’écrit, par sa durabilité et sa spatialité (vision simultanée des signes dans un espace graphique), comporte une force organisatrice qui explique son usage en situation de préparation d’une énonciation, qui demande ensuite à être performée en situation (Mahrer 2014).
4 | Étude de cas
6L’analyse est structurée en deux temps. Est tout d’abord décrit le processus de production : les étapes de fabrication de la nouvelle, les processus de rédaction du bloc textuel étudié et ses oralisations successives. Vient ensuite une étude prosodique des lectures successives en termes de rythme et d’intonation. S’intègrent à ces deux parties des éléments d’analyse textuelle permettant d’appréhender de manière complémentaire certains mécanismes de dramatisation en jeu dans la production puis l’oralisation du texte.
4.1. Documentation du processus de production
7La fabrication de la nouvelle se déroule entre 8h30 et 12h35. Se distinguent un temps de pré-production (8:30-10:57) – composé des réunions éditoriales et de recherches documentaires – et un temps de production (10:57-12:35) lors duquel la nouvelle est rédigée et ses images montées. Le bloc de texte qui nous occupe est rédigé dans les vingt premières minutes de ce second temps2.
8Avant la rédaction du texte (10:57 à 11:09), le monteur (M) impose au journaliste (J) de commencer la nouvelle par des images tournées en caméra subjective, considérées comme spectaculaires par toute la rédaction. Peu convaincu par l’emploi de telles images, le journaliste s’y résigne. Il en rend compte comme étant celles de la fuite éperdue d’un survivant (11:06), comme l’indique la transcription ci-après3.
9Bien que le monteur ne partage pas le cadrage de l’expérience que construit la description employée par le journaliste, la trouvant trop dramatisante, celui-ci la conserve pour en faire l’un des éléments centraux de ce premier bloc textuel. Au-delà de ce désaccord, il faut ici observer qu’avant d’écrire pour dire, le journaliste dit pour écrire. Ceci s’observe également lorsqu’au cours de la rédaction du texte (11:09-11:17), le journaliste dit (et peut-être lit) ce qu’il est en train d’écrire, à l’exemple de ce moment lors duquel le journaliste teste des formulations alors que le monteur travaille sur les images qui composeront le début de la nouvelle (11:15)4.
10Les formulations dites et écrites par le journaliste – aux lignes 2, 16, 21 – ne seront pas conservées telles quelles dans le bloc textuel 1. Mais ce qui mérite ici plus d’attention, c’est que la profération du texte écrit ou à écrire paraît à la fois être une ressource réflexive (intralocutive) guidant le journaliste dans son activité rédactionnelle et un moyen d’assurer la collaboration (interlocutive) en communiquant ses choix langagiers au monteur. Ceci apparaît clairement au moment où le journaliste lit pour la première fois à haute voix l’entier du bloc textuel (11:17).
11À la suite directe de cette première lecture (nommée extrait 2 dans le tableau ci-dessous)5, faite en quelque sorte à brûle-pourpoint, le monteur, sans véritablement se positionner quant à la demande d’évaluation du journaliste (« est-ce que ça semble rikiki ? », l.1) propose au journaliste de lire le texte sur les images qu’il vient de monter. S’ensuivent 6 autres lectures (nommées extrait 3, 4, etc.) distribuées sur l’ensemble du temps de production et généralement faites « sur les images ».
12Au fur et à mesure que la rédaction de la nouvelle avance, le journaliste lit non seulement le premier bloc textuel mais aussi les parties de la nouvelle qui sont rédigées à sa suite (blocs 2, 3, 4 et 5). Bien que nous n’étudiions ici que le premier bloc textuel, il convient de rendre compte brièvement du contexte de chacune de ces lectures (voir le tableau 1).
13À la suite de la première lecture sur images (extrait 3, 11:18) faite par le journaliste, le monteur réagit en s’opposant à l’interprétation dramatisante que le texte donne des images. Il est vrai que l’absence de prédication verbale dans la première clause6 composant le bloc 1 (« quelques instants après le crash la fuite éperdue loin du Boeing de l’un des survivants ») peut contribuer à un effet d’immédiateté et d’expressivité. En outre, les deux clauses suivantes (« ce passager n’est pas encore à l’abri mais sa caméra est enclenchée » ) par la relation concessive qu’elles entretiennent donnent à voir un personnage agissant au mépris du danger.
14Dans les minutes qui suivent (11:19-11:20), les deux praticiens débattent de la dramatisation présumément opérée par le texte, sans aboutir à un accord. Ils le conservent dès lors en l’état. De 11:20 à 11:23, le journaliste rédige le deuxième bloc de la nouvelle :
//.pas moins de cent douze voyageurs sur les cent trente-trois transportés par la compagnie indonésienne Garuda ont survécu, et six membres de l’équipage sur sept. (Bloc 2, état du texte à 11:23)
15Puis, avant de rédiger le troisième bloc de la nouvelle, le journaliste propose de lire le texte qu’il a écrit sur les images que son collègue a montées. Cette lecture concerne les premier et deuxième blocs et se répète deux fois (extrait 4, 11:23 ; extrait 5,11:24). Suite à ces lectures, les praticiens décident d’adapter le débit de parole à la vitesse de déroulement des plans, notamment pour que la pause entre le premier et le deuxième blocs laisse mieux entendre la respiration du survivant.
16Le journaliste et le monteur traduisent ensuite le témoignage d’une personne ayant participé aux secours (bloc 3) :
Le témoignage d’un agent de sécurité de l’aéroport de Yogyakarta :
J’ai entendu deux explosions et j’ai tiré quatre personnes hors de l’avion… saines et sauves. une trentaine de personnes se trouvaient déjà hors de l’appareil… elles aussi toutes en vie.” (Bloc 3, état du texte à 11:30)
17Alors qu’ils travaillent sur ce nouveau bloc textuel, les deux collègues décident de relire le texte « sur les images » (extrait 6, 11:31-32). Suite à cette lecture, le monteur modifie légèrement la sonorisation des plans pour que la respiration apparaisse un peu plus tôt et que le journaliste ait moins à attendre, avant de commencer à lire le deuxième bloc textuel (« //.pas moins…»). Il n’y a ensuite plus de lecture à haute voix jusqu’à ce que les deux praticiens décident d’enregistrer la version finale, qui comprend encore deux blocs textuels supplémentaires, écrits entre 11h34 et 11h43.
21 personnes sont cependant mortes carbonisées, coincées par les flammes à l’avant de l’appareil… (Bloc 4, état du texte à 11:54)
Au moment de l’aterrissage, les passagers ont été avertis que le Boeing allait connaître de fortes turbulences…il aurait touché la piste à une vitesse excesssive…..l’avion a rebondi deux fois sur le tarmac avant de s’échouer violemment dans une rizière et de brûler complétement …300 mètres plus loin. (Bloc 5, état du texte à 11:54)
18Les deux dernières lectures du bloc 1 (extrait 7, 12:22-12:23 ; extrait 8, 12:23-12:24) ont lieu dans une cabine d’enregistrement séparée par une paroi vitrée de la salle de montage. Dans l’extrait 7, le journaliste, seul dans la cabine, lit son texte, sans encore avoir accès aux images. Pendant ce temps, son collègue règle les niveaux sonores en prévision de l’enregistrement. Le monteur propose ensuite au journaliste de commencer la prise de son. C’est cet enregistrement, réalisé d’un seul trait (extrait 8, 12:23-12:24), qui sera utilisé pour l’édition de midi7.
5 | Analyse prosodique des lectures
19Dans une perspective génétique étudiant le processus par lequel un journaliste passe d’un texte écrit à une oralisation répondant aux critères phonostylistiques de sa profession, la comparaison des lectures successives sous l’angle de la prosodie nous apprend « où va » le praticien, « ce qu’il cherche » et « par où il passe pour y arriver ». Du fait de la qualité sonore limitée des données8, nous en rendons compte par le biais d’une analyse du rythme et de l’intonation.
20L’analyse du rythme a été réalisée, pour chacun des extraits (extraits 2 à 8 ainsi que la version télédiffusée), par le moyen d’une annotation du nombre et de l’emplacement des pauses ainsi que du nombre d’unités prosodiques. D’un point de vue macroscopique9, les extraits 3 à 7, qui servent tous d’essai au journaliste, présentent une forte homogénéité avec à chaque fois quatre unités prosodiques majeures, alors que l’extrait 2 en voit 3 et que l’extrait 8 et la version télédiffusée en ont 6. Sur un plan méthodologique, ces unités prosodiques ont été délimitées en fonction de trois indices : les montées de continuation majeures (hausse caractéristique de la fréquence fondamentale indiquant à la fois une fin de groupe prosodique et le début du groupe suivant), les pauses démarcatives (pauses silencieuses placées entre deux unités), et les contours intonatifs finaux (chute significative de la fréquence fondamentale qui indique une fin d’énoncé)10. La présence d’un ou plusieurs de ces indices (continuation majeure + pause, ou contour final + pause) constitue dans nos travaux un marqueur de fin d’unité.
21L’homogénéité des extraits 3 à 7 n’est pourtant qu’apparente (voir Tableau 2). L’analyse de détail met en lumière la variation de chaque unité prosodique majeure en termes de composition lexicale et de durée, ainsi qu’une forme de vas-et-viens entre plusieurs possibilités de structuration du bloc 1 (la structuration de l’extrait 4 est reprise dans le 6, et celle de l’extrait 5 appliquée dans le 7).
22Les variations observées n’empêchent néanmoins pas des lieux de congruence entre les pauses dans les réalisations orales et la ponctuation du texte écrit. Hormis dans l’extrait 211, la pause entre « survivant » et « ce passager », correspondant dans le texte écrit à un point de suspension (« … »), est toujours réalisée. Ceci vaut également pour celle suivant « crash », qui coïncide avec une virgule. Si la virgule est souvent considérée comme servant à noter les pauses (Léon 1993 ; pour une discussion approfondie et critique, Mahrer 2017 : 345-354), l’emploi de points de suspension est fréquemment signalé dans sa capacité à marquer une interruption ou une hésitation causant une incomplétude (Mahrer 2017 : 366-369). Ce n’est pas le cas dans nos données où le point de suspension a valeur de pause, comme le remarque le journaliste lors de l’entretien rétrospectif :
c’est comme une respiration. Ça me permet de ((le journaliste souffle)), voilà. Ça me permet de reprendre le souffle, de voir la coupure, plus ou moins. C’est un truc, c’est presque un tic. Bon chacun ses tics. Effectivement, c’est pas dans la presse écrite qu’il y a beaucoup de points de suspension ((le journaliste rit)) (Entretien rétrospectif, 19:42, 7 mars 2007).
23Il faut remarquer que dans nos données (blocs 1-5), le point de suspension est tendanciellement12 utilisé avant l’entame d’une nouvelle clause, signe d’une certaine systématicité du procédé que le journaliste qualifie d’ailleurs à la fois de truc et de tic, soulignant à la fois sa dimension stratégique et récurrente. Les pauses ne sont ainsi pas seulement contraintes par la syntaxe mais se rapportent à un ensemble de moyens mis en place par le journaliste pour rythmer son texte. Ces pauses, et leur préparation par l’écrit, ont également rapport avec la gestion des images animées et sonorisées qui composent par ailleurs la nouvelle. Ainsi, le journaliste fait l’observation suivante quant à l’emploi des barres obliques qui suivent le bloc 1 (voir: bloc 2, état du texte à 11:23) : « Moi, j’utilise ces slashs. Ça veut dire des pauses. Laisser parler l’image, c’est ça que ça veut dire. » (Entretien rétrospectif, 19:38, 7 mars 2007.) Il apparaît par conséquent que le journaliste adapte certaines ressources de la ponctuation (virgule, point de suspension) et de la typographie (barre oblique) pour préparer l’oralisation de son texte.
24L’observation du tableau 2 indique par ailleurs que les extraits 3 à 7 sont tous composés de quatre unités prosodiques majeures. Il n’y a dès lors qu’une pause dont le lieu varie, celles marquées par la ponctuation étant à chaque fois réalisées. Dans l’extrait 3, la pause est réalisée à la jonction des deux clauses (« ce passager n’est pas encore à l’abri mais sa caméra est enclenchée ») dont le contenu fait débat en raison de sa portée potentiellement dramatisante (voir section documentation du processus de production). Dans les extraits suivants (extraits 4 à 7), la pause est toujours réalisée au sein de la clause averbale (« la fuite éperdue loin du Boeing de l’un des survivants »), même si le lieu de sa réalisation varie entre deux positions13 : soit à l’intérieur du syntagme nominal (entre « fuite » et « éperdue »), soit entre le syntagme adverbial à fonction de circonstant spatial (« loin du Boeing ») et le syntagme prépositionnel complément du syntagme nominal précité (« de l’un des survivant »). Lors de l’enregistrement final (extrait 8), le journaliste cumule tous les choix de segmentation prosodique qu'il a effectués au cours de ses lectures d’essai (extraits 3 à 7). Le journaliste ne commente pas la teneur du travail prosodique qu’il réalise quand il lit son texte. En revanche, l’analyse de la variation des lieux de pause dans les extrait 3 à 7 témoigne de l’emploi, conscient ou non, d’une méthode par essais successifs qui alterne entre différents choix rythmiques.
25S’agissant maintenant de l’intonation, son analyse14 montre généralement une congruence avec la syntaxe du texte écrit, avec peu de variation mélodique et d’accents « didactiques » pourtant habituellement attachés au style journalistique (Simon et alii 2013) ; ceci pourrait s’expliquer par la saturation dramatique déjà présente dans les images et le lexique. En guise d’illustration, nous proposons ci-après une brève description de l’extrait 8, la performance finale du journaliste.
26La réalisation du circonstant temporel ouvrant le bloc 1 voit un pattern rythmique assez canonique pour le français (fig. 1). L’unité se termine par une montée de continuation indiquant à la fois la préparation d’un groupe subséquent et la dépendance du groupe terminé avec le groupe qui suivra. La plage de variation de la fréquence fondamentale est assez réduite (moins de 50Hz), ceci d’autant plus que l’on se trouve en contexte médiatique, dans un phonostyle journalistique, caractérisé par une grande amplitude de la fréquence fondamentale (Simon et alii 2013).
27La profération de la suite (hormis le syntagme prépositionnel « de l’un des survivants ») se caractérise par un accent initial sur « éperdue » au début d’une unité interpausale15 (fig. 2). Les unités « loin » et « Boeing » sont ensuite accentuées avec une montée de continuation sur la dernière. Ceci est encore assez canonique vis-à-vis des patterns accentuels du français. La plage de variation de la F0 reste située entre 100 et 150Hz.
28La réalisation du syntagme prépositionnel « de l’un des survivants » ne déroge en rien aux patterns accentuels classiques du français. La plage de variation de la fréquence fondamentale est néanmoins un peu plus étendue (entre 80 et 150 Hz), se rapprochant de ce fait des caractéristiques du style journalistique.
29La profération de la seconde phrase graphique composant le bloc 1 présente, elle aussi, un profil prosodique attendu en français, à l’exception d’un contour en cloche sur « mais » (fig. 4), qui pourrait être interprété comme un contour d’implication (Delattre 1966). Quant au contour montant qui termine le bloc 1, il s’explique par l’enchaînement qu’il annonce avec le bloc suivant.
30En synthèse de cette brève analyse de l’extrait 8, il faut donc noter qu’il y a généralement congruence entre intonation et syntaxe à l’exception d’un accent d’insistance sur [e] dans « éperdue » qui correspondrait à l’accent initial représentatif du style journalistique (Léon 1993 ; Mertens 2005) et d’un accent sur « mais » qui se rapporterait à un phénomène d’implication. Ces deux derniers points, remarquables, doivent être mis en relation avec une analyse des points de vue (Rabatel 2008)16, en ce que l’accent d’insistance sur [e] dans « éperdue » et le contour d’implication présumé sur « mais » correspondent à deux points de vue qui sont externes au locuteur primaire (le journaliste), responsable par défaut du texte.
[L1/E1] …Quelques instants après le crash, la fuite [e2] éperdue loin du Boeing de l’un des survivants… ce passager n’est pas encore à l’abri [e3] mais sa caméra est enclenchée… (Bloc 1, état du texte à 11:17)
31Outre le point de vue configurant du journaliste (L1/E1]), l’analyse des points de vue montre la présence de deux points de vue externes : l’adjectif « éperdue » paraît signaler un point de vue embryonnaire [e2] par une qualification de l’action (« la fuite ») qui implique de se mettre à la place de l’individu qui la réalise (Rabatel 2014) et indique une vive émotion ou une sorte d’affolement ; l’emploi de « mais » convoque, quant à lui, une entité abstraite [e3] et signale que le contenu de la dernière proposition (« sa caméra est enclenchée ») est inattendu au vu de la situation décrite préalablement (« ce passager n’est pas encore à l’abri »). La présence de ces deux points de vue participe de la dramatisation de l’événement par évocation de l’intériorité du protagoniste (comment l’événement est-il vécu pour celui-ci?) et par construction d’une tension narrative (Baroni 2007) pour l’audience spectatrice (que va-t-il se passer?).
32Cette mise en avant prosodique de deux points de vue externes s’élabore au fil des lectures, ainsi qu’en témoigne l’analyse des contours intonatifs réalisés sur « éperdue » et « mais » dans les extraits 2 à 8 (voir Tableau 3).
33L’extrait 2 présente un contour intonatif haut sur la première syllabe de « éperdue » que l’on peut considérer comme un accent initial. En revanche, dû à la qualité du signal, aucune fréquence fondamentale n’a pu être détectée sur « mais ». De même que dans l’extrait 2, l’extrait 3 voit également une montée de la fréquence fondamentale sur la première syllabe de « éperdue ». Dans cet extrait, bien que l’analyse de la prosodie soit entravée par la qualité du signal, on peut remarquer que « mais » est mis en valeur par une F0 plus haute et une pause. Il n’a pas été possible de faire d’analyse de l’intonation de l’extrait 4 en raison de la qualité du signal. L’extrait 5 montre, quant à lui, un contour intonatif haut sur la première syllabe de « éperdue », à interpréter comme un accent initial. Est également insérée une courte pause (14ms). Quant au « mais », il est mis en valeur par une fréquence fondamentale légèrement plus haute, sans qu’il y ait de pause au préalable. Cette absence de pause pourrait conduire à percevoir moins d’insistance sur le « mais » et donc une dramatisation réduite. Il est néanmoins difficile de l’affirmer sans procéder à une étude de la perception. Dans l’extrait 6, s’observe à nouveau un contour intonatif haut sur la première syllabe de « éperdue », à comprendre comme un accent initial. Il n’y a en revanche pas de pause insérée avant « éperdue ». La fréquence fondamentale du « mais » n’a pas pu être examiné en raison de la mauvaise qualité du signal. Quant à l’extrait 7, il présente un contour intonatif haut sur la première syllabe de « éperdue », à valeur d’accent initial, et le journaliste réalise à nouveau la pause qu’il avait insérée dans l’extrait 5 mais non dans l’extrait 6. Encore une fois, il n’a pas été possible de détecter la fréquence fondamentale sur « mais ». Enfin, l’extrait 8 témoigne des choix définitifs réalisés par le journaliste : d’une part, la réalisation d’une pause avant « éperdue » et d’un accent initial sur [e], se rapportant non seulement au style journalistique mais également à un effet de dramatisation attaché à la mise en avant d’un point de vue embryonnaire ; d’autre part, la suppression définitive de la pause avant « mais » avec néanmoins conservation du contour intonatif.
34Toute proportion gardée, le travail intonatif réalisé sur « éperdue » et « mais » fait écho aux enjeux de dramatisation de l’information engagés par sa textualisation. Ceci semble d’autant plus vraisemblable que la comparaison avec une version synthétisée17 montre dans l’extrait 8 un important aplatissement intonatif, à l’opposé de ce que l’on observe généralement pour le style journalistique (Simon et alii 2013). L’aplatissement intonatif constaté dans nos données témoigne de la marge de manœuvre dont dispose le phonostyle journalistique (Hupin & Simon 2009), pour répondre à la double logique d’information et de captation du discours médiatique (Charaudeau 2005). Ainsi, cet aplatissement pourrait se rapporter soit à la mise en valeur des accents d’insistance, soit à la factualisation de la description dramatisante d’images spectaculaires. Il semble qu’il faille ici favoriser la seconde hypothèse. L’intonation permet de gérer la tension entre faits (information) et dramatisation (captation) à laquelle font face les deux praticiens dès le début du processus de production (images trop spectaculaires pour le journaliste, texte trop dramatisant pour le monteur). Pour le vérifier, il apparaîtrait intéressant de procéder à un test de perception portant sur les différents choix prosodiques et leur association aux images.
6 | Conclusion
35Nos données et leur analyse rendent compte d’un cas dans lequel la production et l’oralisation d’un texte écrit en vue de sa diffusion télévisée sont le résultat de l’interaction entre un journaliste et un monteur se déroulant dans le hic et nunc d’une salle de rédaction. La mise en voix peut bénéficier ici de l’évaluation de plusieurs acteurs, avec pour effet une adaptation conjointe du matériel verbal et audio-visuel. Le monteur image n’est en outre pas considéré comme un technicien mais comme participant à la fabrication de l’information au même titre que le journaliste, bien que sous des modalités différentes et avec des contraintes symboliques moins fortes. Ce mode de co-construction n’est bien entendu pas le seul possible, et les données du projet Idée Suisse documentent également des situations où les journalistes se chargent eux-mêmes du montage ou font appel à un monteur dans un second temps.
36Dans le cas étudié, le journaliste paraît s’orienter vers une Gestalt, articulant factualité (aplatissement mélodique) et dramatisation (éperdue, mais). Néanmoins, cette orientation n’est jamais explicitée par le locuteur-scripteur. Il reste dès lors difficile de savoir ce qu’elle doit à la situation locale d’une part et au phonostyle journalistique d’autre part, c’est-à-dire à une identité vocale professionnelle. Ainsi, dans le cas étudié, nous retiendrons trois observations sur la manière dont l’écrit prépare son transcodage vers l’oral.
- L’absence de commentaires du journaliste touchant à la prosodie pourrait être l’indice d’une faible conscientisation ou d’une absence de besoin de thématisation de cet aspect du travail journalistique.
- L’écrit produit pour l’oralisation ne comporte pas toutes les instructions prosodiques. Le monitorage de la prosodie est relativement lâche et sa « découverte » résulte d’essais successifs et, fait notoire, cumulatifs.
- Le texte écrit préparatoire est définitif sur le plan segmental : le journaliste ne le remet pas en question, alors même que la mise en voix n’est pas opérée sans peine. Il semble donc y avoir une séquentialisation forte du processus : le segmental d’abord, le suprasegmental ensuite.
37Plus largement, il paraìt pertinent de concevoir que les journalistes possèdent une forme d’audition professionnelle18 de leur propre lecture19. Par les réénonciations d’un même bloc textuel, sans que n’intervienne aucune variation morphosyntaxique, c’est bien la prosodie qui est en phase de réglage. Un tel travail est probablement caractéristique de la production d’oraux destinés à être archivés, existant au-delà de la seule performance de leur énonciation, et à être potentiellement réécoutés dans des contextes divers20.
38Les compétences langagières des journalistes sont souvent définies en termes de compétences de communication (Perrin & Ehrensberger 2008) : trouver des sources ; délimiter un sujet, choisir un angle et organiser l’information ; s’adapter à l’auditoire et tenir les restrictions de temps et d’espace. Une meilleure compréhension des processus de mise en voix (compris ici comme l’actualisation prosodique et vocale d’une donnée segmentale graphique préalable) pourrait servir à la formation professionnelle des journalistes. Rédiger pour la télévision – et plus largement pour tout média faisant usage de l’oral – engage des compétences langagières spécifiques en comparaison d’autres métiers langagiers (Thurlow 2019, 2020) : les journalistes doivent témoigner d’un savoir écrire autant que d’un savoir dire, il leur faut en outre savoir écrire pour dire et savoir dire ce qu’ils ont écrit ; ils doivent savoir s’adapter aux ressources sémiotiques limitées à leur disposition et savoir s’accommoder aux pressions stylistiques les rattachant à leur corporation. Se pose par conséquent la question suivante et à laquelle on ne donnera pas, pour l’instant, de réponses : de quels modèles/représentations des rapports entre oral et écrit les professionnels des médias ont-ils besoin pour mener à bien les tâches qui leur sont confiées?
Remerciements
39Les contributeurs signifient toute leur reconnaissance au projet Idée Suisse et aux praticiens de la télévision suisse romande ainsi qu’aux organisateurs et participants du colloque Oral/écrit : quelle place dans les modèles linguistiques ?. Nos remerciements vont particulièrement aux relecteurs, à Rudolf Mahrer, Julie Lefebvre et Anne-Catherine Simon. Toutes les erreurs restent nôtres.
- 1 Au sens de bloc de production du texte, avec l’hypothèse que « chez tous les scripteurs, la production est rythmée par des phases d’interruption, de sorte qu’on peut identifier des périodes de travail» (Lebrave 2009 : 16).
- 2 Pour une analyse détaillée de cette étape de production, voir Merminod 2019.
- 3 Les conventions de transcriptions s’inspirent d’ICOR 2005.[]chevauchements (.) micro-pause (max. 0.3) (..) pause (min. 0.3 - max. 0.6 ) (...) pause (max. 1 sec.) (sec.) pause comptabilisée en seconde : allongement vocalique / \ intonation montante/ descendante\ exTRA segment accentué <> délimitation des commentaires entre (( )) (()) commentaires xxx segment inaudible par- troncation & continuation du tour de parole = enchaînement rapide .h aspiration .hh aspiration saillante
- 4 Dans la transcription, sous text, nous indiquons uniquement ce que le journaliste ajoute dans son traitement de texte, sans signaler les autres opérations effectuées (par exemple, corriger ou effacer).
- 5 Cette première lecture est nommée dans les tableaux et graphiques « extrait 2 », car le journaliste a lu le texte une fois à voix haute alors qu’il ne l’avait pas encore complétement rédigé. Du fait que le texte n’était à ce moment pas encore dans sa forme définitive, cette lecture préalable (que l’on a nommée « extrait 1 ») n’est pas prise en compte dans la présente étude, notamment pour des raisons de comparabilité entre les extraits dans le cadre de l’analyse prosodique.
- 6 Au sens d’unité syntaxique autonome (Groupe de Fribourg 2012 : 47).
- 7 Il faut néanmoins noter que le niveau des volumes sera légèrement modifié et que le monteur va ralentir quelque peu le débit du journaliste, probablement pour mieux synchroniser le texte enregistré et les images. Il y a en effet une différence entre l’extrait 8 et la version diffusée au téléjournal, alors que les deux extraits devraient être identiques, l’extrait 8 étant celui que le journaliste a enregistré et que le monteur a intégré au reportage.La régie remixera par ailleurs le sujet avant diffusion.
- 8 Les données n’ont pas été enregistrées en prévision d’une analyse fine de la matérialité sonore mais pour documenter généralement le processus de production en salle de rédaction.
- 9 L’analyse a été réalisée par le moyen d’une catégorisation visuelle des contours de la fréquence fondamentale de la voix obtenus sous Winpitch via la méthode d’autocorrélation (Martin 2000).
- 10 Voir par exemple les travaux de Martin (2006).
- 11 Cet extrait a un statut particulier, car il n’a ni valeur d’essai, ni de performance finale.
- 12 On remarquera que le bloc 3, une traduction française d’un texte en anglais, voit la présence de points de suspension avant des segments extraposés (« saines et sauves », « elles aussi toutes en vie »), ceux-ci étaient des clauses à part entière dans la version anglaise (« and they were safe » ; « they were safe too ») (Merminod 2019 : 187-208).
- 13 La variation témoigne peut-être de la complexité syntaxique de cette clause averbale.
- 14 Elle a été réalisée par le moyen d’une analyse visuelle des contours de la fréquence fondamentale de la voix obtenus sous Winpitch via la méthode d’autocorrélation (Martin 2000).
- 15 C’est-à-dire détachée par deux pauses.
- 16 À la suite de Rabatel, nous codons le locuteur/énonciateur primaire du texte avec une majuscule suivie du chiffre 1 : L1/E1. Les locuteurs/énonciateurs secondaires sont codés par des minuscules et numérotées selon leur ordre de succession dans le texte : l2/e2, l3/e3, l4/e4, etc. S’il n’y pas d’acte de parole représenté, on ne code que l’énonciateur : e2, e3, e4, etc.
- 17 La version synthétisée, effectuée à partir de l’outil de synthèse vocale de Winpitch (Martin 2000), réalise une intonation standardisée en regard du profil syntaxique du premier bloc textuel.
- 18 Pour faire écho à la notion de vision professionnelle définie comme « des façons socialement organisées de voir et de comprendre des événements qui répondent aux intérêts distincts d’un groupe particulier » (Goodwin 1994 : 606, notre traduction), celles-ci impliquant qu’ « un objet de savoir émerge à travers le jeu réciproque (interplay) d’un domaine d’examen (scrutiny) […] et d’un ensemble de pratiques discursives […] déployées dans le cadre d’une activité spécifique » (Ibidem).
- 19 S’agissant des journalistes de la télévision suisse romande, cette audition se forme au fil de la pratique – l’exercice répété de l’activité professionnelle au quotidien – mais aussi dans le cadre de cours de pose en voix destinés aux journalistes stagiaires (MAP 2017).
- 20 On notera que suite à son enregistrement, la nouvelle considérée dans notre étude circule auprès de nombreux auditoires. Ses premières diffusions impliquent non seulement le public de la télévision suisse romande (auditoire premier) mais aussi celui de TV5 monde (organe de diffusion s’adressant aux francophones du monde entier et reprenant le journal télévisé romand). S’ajoute ensuite le fait que la nouvelle est par ailleurs conservée dans les archives de la Radio Télévision Suisse et est consultable sous certaines conditions. Sans compter l’inhabituelle intrusion des chercheurs en salle de rédaction qui la fait circuler dans une multiplicité d’arènes inattendues (séances de travail, conférences, formations, etc.).