Les orthographes qui utilisent des alphabets et des syllabaires reposent sur le principe que les symboles écrits (graphèmes) correspondent aux unités sonores de la langue parlée : les phonèmes dans le premier cas, les syllabes dans le second. Toutefois, dans la quasi-totalité des cas, cette correspondance n’est pas exacte. Les orthographes des différentes langues offrent différents degrés de correspondance entre l’orthographe et la prononciation. L’orthographe anglaise, l’orthographe française et l’orthographe danoise, par exemple, sont très irrégulières, tandis que les orthographes de langues telles que le russe, l’allemand et l’espagnol représentent la prononciation de manière beaucoup plus fidèle, bien que la correspondance entre les lettres et les phonèmes ne soit toujours pas exacte. Les orthographes finnoise, turque et serbo-croate sont remarquablement cohérentes : approximation du principe » une lettre par son « .
Une orthographe dans laquelle les correspondances entre l’orthographe et la prononciation sont très complexes ou incohérentes est appelée orthographe profonde (ou moins formellement, on dit que la langue a une orthographe irrégulière). Une orthographe dont les correspondances sont relativement simples et cohérentes est dite peu profonde (et la langue a une orthographe régulière).
L’une des principales raisons pour lesquelles l’orthographe et la prononciation s’écartent est que les changements sonores qui ont lieu dans la langue parlée ne sont pas toujours reflétés dans l’orthographe, et donc que les orthographes correspondent à une prononciation historique plutôt qu’actuelle. L’une des conséquences de cette situation est que de nombreuses orthographes en viennent à refléter la structure morphophonémique d’un mot plutôt que sa structure purement phonémique (par exemple, le morphème du passé régulier anglais est systématiquement orthographié -ed malgré ses différentes prononciations dans divers mots). Ce point est discuté plus en détail à Orthographe phonémique § Caractéristiques morphophonémiques.
Les systèmes syllabaires du japonais (hiragana et katakana) sont des exemples d’orthographes presque parfaitement superficielles-les kana correspondent avec une cohérence presque parfaite aux syllabes parlées, avec toutefois quelques exceptions où les symboles reflètent des caractéristiques historiques ou morphophonémiques : notamment l’utilisation de ぢ ji et づ zu (plutôt que じ ji et ず zu, leur prononciation dans le dialecte standard de Tokyo) lorsque le caractère est un voisement d’un ち ou つ sous-jacent (voir rendaku), et l’utilisation de は, を et へ pour représenter les sons わ, お et え, en tant que reliques de l’usage historique des kana.
Le système coréen hangul était également à l’origine une orthographe extrêmement superficielle, mais en tant que représentation de la langue moderne, il reflète aussi fréquemment des caractéristiques morphophonémiques.
Pour une discussion complète des degrés de correspondance entre l’orthographe et la prononciation dans les orthographes alphabétiques, y compris les raisons pour lesquelles cette correspondance peut se rompre, voir Orthographe phonémique.
Orthographies défectueusesModification
Une orthographe basée sur le principe que les symboles correspondent aux phonèmes peut, dans certains cas, manquer de caractères pour représenter tous les phonèmes ou toutes les distinctions phonémiques de la langue. C’est ce qu’on appelle une orthographe défectueuse. Un exemple en anglais est l’absence de toute indication de l’accentuation. Un autre exemple est le digraphe th, qui représente deux phonèmes différents (comme dans then et thin) et a remplacé les anciennes lettres ð et þ. Un exemple plus systématique est celui des abjads comme les alphabets arabe et hébreu, dans lesquels les voyelles courtes ne sont normalement pas écrites et doivent être déduites par le lecteur.
Lorsqu’un alphabet est emprunté à sa langue d’origine pour être utilisé avec une nouvelle langue – comme cela a été fait avec l’alphabet latin pour de nombreuses langues, ou le katakana japonais pour les mots non japonais – il s’avère souvent défectueux pour représenter les phonèmes de la nouvelle langue. Ce problème est parfois résolu par l’utilisation de dispositifs tels que les digraphes (comme sh et ch en anglais, où des paires de lettres représentent des sons uniques), les diacritiques (comme le caron sur les lettres š et č, qui représentent ces mêmes sons en tchèque), ou l’ajout de symboles complètement nouveaux (comme certaines langues ont introduit la lettre w dans l’alphabet latin) ou de symboles provenant d’un autre alphabet, comme la rune þ en islandais.
Après la période classique, le grec a développé un système de lettres minuscules qui a introduit des marques diacritiques pour permettre aux étrangers d’apprendre la prononciation et, dans certains cas, les caractéristiques grammaticales. Cependant, comme la prononciation des lettres a changé au fil du temps, les marques diacritiques ont été réduites à la représentation de la syllabe accentuée. Dans la composition du grec moderne, ce système a été simplifié pour n’avoir qu’un seul accent pour indiquer quelle syllabe est accentuée.