L’étude du système graphémique du tchèque est importante pour la compréhension du fonctionnement des niveaux phonologique et morphologique (flexion et dérivation). Elle est également d’une importance primordiale pour l’analyse automatique du tchèque, en particulier pour les processus de reconnaissance automatique de formes.
L’ensemble des graphèmes du tchèque est constitué de:
a, á, b, c, č, d, ď, e, é, ě, f, g, h, ch, i, í, j, k, l, m, n, ň, o, ó, p, q, r, ř, s, š, t, ť, u, ú, ů, v, w, x, y, ý, z, ž.
I. Aperçu de la prononciation
La liste des graphèmes ci-dessous est accompagnée, lorsque le son associé au graphème est différent de la valeur en français, d’exemples permettant d’appréhender la prononciation. On trouvera plus loin dans la grammaire des exposés phonétiques.
Graphème |
Prononciation |
a (bref), á (long) b c č d (dur) et ď (mou) e (bref), é (long) et ě (mou) f g h ch i (mou bref), í (mou long) j k l m n (dur) et ň (mou) o (bref), ó (long) p q r (dur) et ř (mou) s š t (dur) et ť (mou) u (bref), ú (long), ů (long) v w x y (dur bref), ý (dur long) z ž |
avec la valeur de ts dans tsar avec la valeur de tch dans tchèque plus mouillé que dans le mot français dieu avec la valeur de ai en français
avec la valeur qu’il a en français dans gâteau aspiré. A rapprocher du « h » allemand p. ex. Hilfe (aide, secours) ou anglais, p. ex. dans « ham and eggs 1 » semblable au « ch » de l’allemand dans « doch » (si, cependant) ou « Bach » (ruisseau)
avec la valeur du français y devant voyelle: « yeux »
mouillé comme dans « bagne »
r apical roulé et r apical roulé mouillé
prononcer « che » comme dans « cheveu », « chèvre » « ť » est plus mouillé que dans le mot français « tien » avec la valeur du français « ou »
avec valeur de i
prononcer « ge » / « je » comme dans « jeune » |
II. Valeurs particulières de certains caractères
II.1. valeur étrangère
Nous allons examiner les caractères de l’alphabet tchèque qui indiquent que le mot qui les contient est d’origine étrangère.
II.1.a. Nous avons en premier lieu des caractères présents dans l’alphabet uniquement pour permettre d’écrire des mots étrangers. Il s’agit de « q », « w » et « x ».
II.1.b. caractère « f »
Le cas de “f” est semblable à celui des caractères précédents, mais avec la présence de quelques mots tchèques. “f” est un graphème qui a été adopté tardivement. Avant son existence dans l’alphabet tchèque, dans les mots empruntés “f” était transformé en “b” ou en “p” (également des bilabiales). C’est ainsi que le mot “faisan” emprunté du français par l’intermédiaire de l’allemand devient “bažant” en tchèque et “Lucifer” devient “Luciper”. L’interjection « fuj ! » (beurk), expression de dégoût, vient vraisemblablement de l’allemand « Pfui ! ».
Les exceptions tchèques sont les verbes “doufat” (espérer) et “zoufat” (désespérer) d’une part et le verbe “foukat” (souffler), d’autre part. Dans le premier cas, la racine est “uf” avec un préfixe régulier en “do” (bien que non prononcé séparément) et un préfixe unique en “zo”. Dans le second cas, la racine est “fouk / fuk”. Il s’agit d’une onomatopée: le bruit de quelqu’un ou quelque chose qui souffle. Connaître l’expression populaire “to je mi fuk” (cela m’est égal) ne peut pas nuire.
II.1.c. caractère « g »
Le cas de “g” est aussi très intéressant, mais d’une autre nature. En effet, il s’agit dans ce cas d’une transformation historique de “g” en “h” en tchèque, en slovaque et en haut-sorabe. Dans ces langues, le “g” slave s’étant transformé systématiquement en “h” en dehors de la famille de mots formée sur la racine “gramot” (lettré) issue du grec et empruntée par l’intermédiaire du russe, tous les “g” présents dans un texte tchèque marquent nécessairement une origine étrangère des mots concernés, par exemple “integrovat” (intégrer).
II.1.d. caractère « ó »
Le cas de « ó » s’explique aussi par une évolution phonologique. Ce o long est devenu d’abord une diphtongue « uo » qui, en tchèque, a finalement évolué vers « ů » (« u s kroužkem »: mot-à-mot « u avec un petit rond »). En slovaque, nous avons comme résultat « ô » (« o s vokaňom », graphème unique qui conserve une prononciation de diphtongue en « uo »). La correspondance entre tchèque et slovaque existe très souvent: « původ » = « pôvod » (origine).
Cette transformation ne connaît pas d’exception en tchèque, si bien qu’il n’existe plus de o longs tchèques, mais uniquement des u longs avec petit rond. Par conséquent, tout « o » long marque nécessairement une origine étrangère, par exemple “móda” (mode), « tón » (ton), acetón, ambiciózní, chór, cirhóza, medailón, mykóza, ozón, penzión, prognóza, sezóna, skleróza, viróza… tous mots immédiatement compréhensibles pour un francophone.
II.1.e. « a », « e » et « i » / « y » en début de mot
Signalons la valeur de mot étranger donnée par les voyelles « a », « e » et « i », lorsqu’elles sont en tête de mot (premier caractère du mot). En effet, les mots slaves ont tendance à ne pas commencer par une voyelle, cette tendance étant diversement représentée suivant la langue slave en question. En haut-sorabe, aucun mot ne peut débuter par une voyelle, sauf non réalisation de la métathèse dont un exemple marquant est le mot « ert » (bouche) qui est « ret » (lèvre) en tchèque (avec métathèse). Pour le tchèque, ce sont les trois premières voyelles « a », « e », « i » qui ne peuvent pas se trouver en première position contrairement à « o » et « u ». Il existe une douzaine d’exceptions de mots tchèques commençant par “a”. Il y a une ou deux exceptions pour « e » et « i ». Le « y » en début de mot n’apparaît également que dans des mots étrangers par exemple « ypsilon ».
Les mots tchèques débutant par « a » sont des mots grammaticaux. Nous trouvons : « a » (et), « ač » (bien que), « ačkoli(v) » (bien que), « ale » (mais), « alespoň » et « aspoň » (au moins), « aneb(o) » (ou bien), « ani » (ni … ni), « aniž » (sans que), « ano » (oui), « asi » (à peu près), « ať » (que), « avšak » (mais, bien que), « až » (jusqu’à) et toutes les formes fléchies de « aby » (pour que il(s) / elle(s)) à savoir « abych » (pour que je …), « abys » (pour que tu …), « abychom » (pour que nous …), « abyste » (pour que vous …) ainsi que les abréviations « apod. » (ainsi de suite) et « atd. » (et cetera).
Les exceptions pour « e » et « i » sont « ejhle » (tiens, voici), « inu » (ben…!), « ihned » (immédiatement).
II.2. valeur grammaticale
Des graphèmes peuvent avoir en fin de mot une valeur grammaticale univoque et ceci sans exception ou presque. C’est notamment le cas de « ý » et de « ů ».
II.2.a. « ý » en fin de mot
Il s’agit de « ý » qui en tant que dernier caractère d’un mot donne la valeur d’adjectif dur masculin singulier au nominatif ou à l’accusatif associé à un substantif masculin inanimé. Il n’existe que trois exceptions: « prý » (à ce qu’il paraît), « úterý » (mardi) et « čehý » (hue dans à hue et à dia).
II.2.b. « ů » en fin de mot
Nous avons également “ů” en tant que dernier caractère qui donne la valeur de substantif masculin au génitif pluriel et ceci quel que soit le type de substantif masculin, consonantique ou vocalique, dur ou mou. Seuls “dolů” et “domů” sont ambigus, soit substantifs masculin au génitif pluriel, soit adverbes de lieu avec mouvement face respectivement à “dole” (en bas [sans mouvement]) et “doma” (à la maison [sans mouvement]).
III. Remarques sur l’ordre des caractères dans le classement alphabétique
La liste verticale présentée ci-dessus rend compte de la classification des dictionnaires. Dans les sections vocaliques, les mots débutent par la voyelle brève, sauf pour « u » où deux formes sont concernées : « u » et « ú ».
Les couples de consonnes, consonnes dures et consonnes molles, sont une seule section de dictionnaire. Parmi ces couples de consonnes « ň » n’apparaît pas en première position de mot. Par contre, on trouve par exemple « ďábel » (diable), « ředidlo » (diluant), « ťukat2 » (taper, tapoter, trinquer).
Le digraphe « ch », opposition sourde au « h » sonore, est classé derrière ce caractère et non pas avec « c ».
Nous ajouterons à la liste des graphèmes, le digraphe « dž » qui, bien qu’il ne soit pas reconnu « institutionnellement », correspond à un phonème unique, visiblement étranger (anglo-saxon?) en dehors des mots “džbán” (cruche) et “džber” (baquet) dont l’origine nous est obscure, p. ex. “bandžo”, “džus”, “džem”, “džob”, “džíp”, “džin”, “džez”, “džungle”, “džudo”, “džiu-džitsu”,…
Notes:
1 souvent écrit en tchèque sous la forme « hamenex ».
2 Ce verbe est construit sur l’onomatopée « ťuk » (toc).