Oral et écrit/Introduction
Si une langue, orale ou écrite, reste une même langue, on distingue code oral et code écrit. Sur les 6 000 ou 7 000 langues du monde, environ 200 s'écrivent. En sociolinguistique, discipline étudiant les interactions entre langage et société, on évoque la différence oral/écrit comme diamésique. Des études sur corpus oraux ont ainsi démontré qu'en français oral, dans différents pays francophones, le "ne" de la négation était omis. De même, on observe à l'oral l'omission du complémenteur "que", par exemple dans "je suis sûre il va venir". D'un point de vue de la norme (un usage admis comme correct par un groupe social dominant), et non de l' usage, on pourrait en conclure que le langage écrit est plus "correct", plus "soutenu" ou "recherché". Ce serait oublier les canaux récents (internet, langage SMS). Ainsi, les formes "tkt" ou "jpp" sont typiquement écrites et les locuteurs ne les prononcent pas. De même, l'usage des émoticônes remplaçant l'expression du visage ou plus traditionnellement la ponctuation remplaçant l'intonation. De manière plus ancienne, le langage télégraphique utilise une syntaxe réduite aux mots lexicaux (par opposition aux mots grammaticaux).
L' API (alphabet phonétique international) permet de noter ce que l'on entend. Ce n’est pas le cas des alphabets comme les abjad (consonantiques) arabe ou hébraïque, ni même comme le nôtre. Le caractère univoque (un son = un graphème, un graphème = un son) n'existe pas en français. De nombreuses règles orthographiques (lettres muettes, graphèmes constitués de plusieurs lettres comme an, graphème constituant deux sons (x), graphèmes pouvant correspondre à plusieurs sons (s correspond à [s], [z] ou peut être muet…) sont contraire à cette univocité. En français, il n'existe aucun graphème univoque, même si [ŋ], dans "bing", s'écrit presque toujours ng. (La seule exception est "swinguer", où il s'écrit ngu). D'autres langues, comme l'italien, ont une orthographe plus proche de l'oral. La langue construite espéranto a une orthographe univoque.
Lorsqu'on annote l'oral, pour constituer un corpus par exemple, on peut le faire de manière plus ou moins précise. Il n'est pas rare que les corpus retranscrivent des données suprasegmentales comme l'intonation (flèche montante ou descendante), les "euh", écrivent "chépa" pour "je ne sais pas" si c'est ce que dit le locuteur… Retranscrire exactement ce que l'on entend connaît cependant des limites : dans le cadre de l' acquisition du langage, imaginons qu'un enfant dise "crocrodile". Faudra-t-il retranscrire le mot exact, sachant qu'il sera plus difficile à traiter automatiquement (crocrodile ne sera pas reconnu comme nom) ? Des questions se posent donc en traitement automatique des langues, ou TAL. Les corpus oraux retranscrits (ce qui est très long) ou écrits peuvent être comparés : les premiers sont reconnaissables par des occurrences comme "ben", "euh", "donc"… La séparation des mots, ou séquence de la chaîne parlée, se pose aussi quand on souhaite écrire. Jusqu'au septième siècle, en latin, l'écriture n'était pas segmentée. Au début du neuvième siècle, des paragraphes, majuscules et ponctuations forment une première séquence. C'est au douzième siècle que l'on écrit des mots séparés (à l'écrit, on décrit comme occurrence ce qui apparaît entre deux espaces. Un mot syntaxique n'est pas nécessairement une occurrence : "pomme de terre" ou "grand magasin" (un mot pour plusieurs occurrences) et du quand il signifie "de le" constituent des contre-exemples). La séquence de la chaîne parlée est un enjeu dans l'acquisition du langage, ce sont les espaces graphiques qui la représentent à l'écrit. Pourtant, cette séquence a quelque chose d'artificiel : on ne parle pas en marquant des espaces entre les mots, ou très rarement (énervement…). Dans ce dernier cas, une personne pourra dire [ʒɑ̃#nɛ#maʁ] (j'en ai marre, en prononçant la liaison du n sur ai et non sur j'en. Le signe dièse représente un espace), si bien que les espaces de l'écrit ne suivent pas ce qui est dit. De même, on peut parler de "chefs d'Etat z'africains", marquant une liaison n'existant pas à l'écrit.
Il arrive qu'oral et écrit interfèrent. Si l'oral précède l'écrit, la graphie peut influencer la prononciation. En français, dans les mots aout et but, et peut-être dans donc, la prononciation de la consonne finale est influencée par l'écrit. De même, la prononciation de cognitif ou celle de gageure relèvent de cette influence, que l'on nomme l' effet Buben. L'oral et l'écrit, en dépit de ces interférences, cultivent leurs différences propres. Ainsi, l'écriture inclusive (que l'on préfère parfois appeler langage épicène) relève surtout de l'écrit, bien que parfois employée à l'oral (toutes celles et ceux, ou Françaises, Français, par exemple, ou le célèbre appel "travailleuses, travailleurs" d'Arlette Laguiller. Il est toute une part sociolinguistique que nous n'évoquerons pas ici malgré son intérêt). Si certaines formes, comme ami.e.s ne posent pas de problèmes, il faut parfois ruser à l'oral (il existe une forme "celleux", et l'on peut dire "les contributeurices de Wikiversité"). Même ainsi, des formes comme fou.olle.s ne sont pas prononçables (on coordonnera alors les deux mots, fous et folles ou folles et fous). L'intonation (Quel chapeau il a ! vs quel chapeau il a ?) est parfois retranscrite par la ponctuation, mais parfois, l'intonation lève une ambiguïté qui demeure à l'écrit. Il existe de célèbres exemples de phrases ambiguës, comme "Le garçon regarde la fille avec des jumelles". Dans cette phrase, le garçon peut regarder la fille au moyen de jumelles (dans ce cas, "la fille" et "avec des jumelles" sont des constituants séparés), ou il regarde la fille qui porte des jumelles (la fille avec des jumelles est un unique constituant). Sans développer des notions de syntaxe comme les constituants, disons simplement que si ce type de phrase est théoriquement appréciée des linguistes, les ambiguïtés réelles, du fait de l'intonation, sont très rares, et les pauses que l'on marque à l'oral lèvent les ambiguïtés de l'écrit.
Si intéressant que puisse être l'écrit (la graphie conserve ainsi un intérêt diachronique, qui relève de l'évolution de la langue), la linguistique s'intéresse davantage à l'oral. En grammaire scolaire, c'est l'écrit qui est mis en avant : ainsi, la grammaire scolaire considère qu'il y a six voyelles en français (a, e, i, o, u, y) alors que, pour les linguistes, le français compte de 14 à 16 voyelles selon les variantes, et une voyelle = un son vocalique ("on" est ainsi une voyelle). De même, une phrase est définie par "une suite de mot qui veut dire quelque chose et qui commence par une majuscule et se termine par un point", définition qui, dans sa deuxième partie, n'est vraie qu'à l'écrit (bien que les enseignants précisent parfois "à l'écrit"). Le Cours de Linguistique Générale de Saussure indique que préférer l'écrit à l'oral, c’est préférer regarder la photographie d'une personne plutôt que son visage (le Cours, 1916, compte de nombreuses analogies). De fait, alors que la linguistique traditionnelle s'intéressait à l'écrit, ce n'est plus le cas de nos jours. Pourtant, le langage SMS et les abréviations et mots utilisés sur internet constituent, comme indiqué plus tôt, une nouvelle forme d'écrit qu'il peut être intéressant d'analyser.
Nous pourrions ouvrir cette leçon sur d'autres domaines : la littérature, la philosophie et la culture. Ricoeur théorise aussi les différences entre texte et parole. Plus loin de nous, Platon, dans le Phèdre, évoque l'invention de l'écriture, d'après le mythe de Toth. L'écriture, contrairement à l'oral, ne permet pas de dialoguer. Dans la mythologie grecque, c'est Hermès qui inventa l'écriture. Citons l’art de la calligraphie, dont les traditions arménienne, chinoise et arabe figurent au patrimoine culturel immatériel de l'humanité, ainsi que d'autres traditions (occidentale, hébraïque…). De manière moins flatteuse, on entend parfois que l'écriture est la science des ânes : cet adage, d'après le journal le Monde, date de l'époque où l'épreuve d'écriture consistait à recopier un texte à l'école primaire, épreuve considérée comme facile.