Les graphèmes du tchèque

 

L’étude du système graphémique du tchèque est importante pour la compréhension du fonctionnement des niveaux phonologique et morphologique (flexion et dérivation). Elle est également d’une importance primordiale pour l’analyse automatique du tchèque, en particulier pour les processus de reconnaissance automatique de formes.

L’ensemble des graphèmes du tchèque est constitué de:

a, á, b, c, č, d, ď, e, é, ě, f, g, h, ch, i, í, j, k, l, m, n, ň, o, ó, p, q, r, ř, s, š, t, ť, u, ú, ů, v, w, x, y, ý, z, ž.

 

I. Aperçu de la prononciation

La liste des graphèmes ci-dessous est accompagnée, lorsque le son associé au graphème est différent de la valeur en français, d’exemples permettant d’appréhender la prononciation. On trouvera plus loin dans la grammaire des exposés phonétiques.

 

Graphème

Prononciation

a (bref), á (long)

b

c

č

d (dur) et ď (mou)

e (bref), é (long) et ě (mou)

f

g

h

ch

i (mou bref), í (mou long)

j

k

l

m

n (dur) et ň (mou)

o (bref), ó (long)

p

q

r (dur) et ř (mou)

s

š

t (dur) et ť (mou)

u (bref), ú (long), ů (long)

v

w

x

y (dur bref), ý (dur long)

z

ž

 

 

avec la valeur de ts dans tsar

avec la valeur de tch dans tchèque

plus mouillé que dans le mot français dieu

avec la valeur de ai en français

 

avec la valeur qu’il a en français dans gâteau

aspiré. A rapprocher du « h » allemand p. ex. Hilfe (aide, secours) ou anglais, p. ex. dans « ham and eggs 1 »

semblable au « ch » de l’allemand dans « doch » (si, cependant) ou « Bach » (ruisseau)

 

avec la valeur du français y devant voyelle: « yeux »

 

 

 

mouillé comme dans « bagne »

 

 

 

r apical roulé et r apical roulé mouillé

 

prononcer « che » comme dans « cheveu », « chèvre »

« ť » est plus mouillé que dans le mot français « tien »

avec la valeur du français « ou »

 

 

 

avec valeur de i

 

prononcer « ge » / « je » comme dans « jeune »

 

 

II.  Valeurs particulières de certains caractères

II.1.  valeur étrangère

Nous allons examiner les caractères de l’alphabet tchèque qui indiquent que le mot qui les contient est d’origine étrangère.

II.1.a. Nous avons en premier lieu des caractères présents dans l’alphabet uniquement pour permettre d’écrire des mots étrangers. Il s’agit de « q », « w » et « x ».

II.1.b.  caractère « f »

Le cas de “f” est semblable à celui des caractères précédents, mais avec la présence de quelques mots tchèques. “f” est un graphème qui a été adopté tardivement. Avant son existence dans l’alphabet tchèque, dans les mots empruntés “f” était transformé en “b” ou en “p” (également des bilabiales). C’est ainsi que le mot “faisan” emprunté du français par l’intermédiaire de l’allemand devient “bažant” en tchèque et “Lucifer” devient “Luciper”. L’interjection « fuj ! » (beurk), expression de dégoût, vient vraisemblablement de l’allemand « Pfui ! ».

Les exceptions tchèques sont les verbes “doufat” (espérer) et “zoufat” (désespérer) d’une part et le verbe “foukat” (souffler), d’autre part. Dans le premier cas, la racine est “uf” avec un préfixe régulier en “do” (bien que non prononcé séparément) et un préfixe unique en “zo”. Dans le second cas, la racine est “fouk / fuk”. Il s’agit d’une onomatopée: le bruit de quelqu’un ou quelque chose qui souffle. Connaître l’expression populaire “to je mi fuk” (cela m’est égal) ne peut pas nuire.

II.1.c.  caractère « g »

Le cas de “g” est aussi très intéressant, mais d’une autre nature. En effet, il s’agit dans ce cas d’une transformation historique de “g” en “h” en tchèque, en slovaque et en haut-sorabe. Dans ces langues, le “g” slave s’étant transformé systématiquement en “h” en dehors de la famille de mots formée sur la racine “gramot” (lettré) issue du grec et empruntée par l’intermédiaire du russe, tous les “g” présents dans un texte tchèque marquent nécessairement une origine étrangère des mots concernés, par exemple “integrovat” (intégrer).

II.1.d.  caractère « ó »

Le cas de « ó » s’explique aussi par une évolution phonologique. Ce o long est devenu d’abord une diphtongue « uo » qui, en tchèque, a finalement évolué vers « ů » (« u s kroužkem »: mot-à-mot « u avec un petit rond »). En slovaque, nous avons comme résultat « ô » (« o s vokaňom », graphème unique qui conserve une prononciation de diphtongue en « uo »). La correspondance entre tchèque et slovaque existe très souvent: « původ » = « pôvod » (origine).

Cette transformation ne connaît pas d’exception en tchèque, si bien qu’il n’existe plus de o longs tchèques, mais uniquement des u longs avec petit rond. Par conséquent, tout « o » long marque nécessairement une origine étrangère, par exemple “móda” (mode), « tón » (ton), acetón, ambiciózní, chór, cirhóza, medailón, mykóza, ozón, penzión, prognóza, sezóna, skleróza, viróza… tous mots immédiatement compréhensibles pour un francophone.

II.1.e.  « a », « e » et « i » / « y » en début de mot

Signalons la valeur de mot étranger donnée par les voyelles « a », « e » et « i », lorsqu’elles sont en tête de mot (premier caractère du mot). En effet, les mots slaves ont tendance à ne pas commencer par une voyelle, cette tendance étant diversement représentée suivant la langue slave en question. En haut-sorabe, aucun mot ne peut débuter par une voyelle, sauf non réalisation de la métathèse dont un exemple marquant est le mot « ert » (bouche) qui est « ret » (lèvre) en tchèque (avec métathèse). Pour le tchèque, ce sont les trois premières voyelles « a », « e », « i » qui ne peuvent pas se trouver en première position contrairement à « o » et « u ». Il existe une douzaine d’exceptions de mots tchèques commençant par “a”. Il y a une ou deux exceptions pour « e » et « i ». Le « y » en début de mot n’apparaît également que dans des mots étrangers par exemple « ypsilon ».

Les mots tchèques débutant par « a » sont des mots grammaticaux. Nous trouvons : « a » (et), « ač » (bien que), « ačkoli(v) » (bien que), « ale » (mais), « alespoň » et « aspoň » (au moins), « aneb(o) » (ou bien), « ani » (ni … ni), « aniž » (sans que), « ano » (oui), « asi » (à peu près), « ať » (que), « avšak » (mais, bien que), « až » (jusqu’à) et toutes les formes fléchies de « aby » (pour que il(s) / elle(s)) à savoir « abych » (pour que je …), « abys » (pour que tu …), « abychom » (pour que nous …), « abyste » (pour que vous …) ainsi que les abréviations « apod. » (ainsi de suite) et « atd. » (et cetera).

Les exceptions pour « e » et « i » sont « ejhle » (tiens, voici), « inu » (ben…!), « ihned » (immédiatement).

II.2.  valeur grammaticale

Des graphèmes peuvent avoir en fin de mot une valeur grammaticale univoque et ceci sans exception ou presque. C’est notamment le cas de « ý » et de « ů ».

II.2.a.  « ý » en fin de mot

Il s’agit de « ý » qui en tant que dernier caractère d’un mot donne la valeur d’adjectif dur masculin singulier au nominatif ou à l’accusatif associé à un substantif masculin inanimé. Il n’existe que trois exceptions: « prý » (à ce qu’il paraît), « úterý » (mardi) et « čehý » (hue dans à hue et à dia).

II.2.b.  « ů » en fin de mot

Nous avons également “ů” en tant que dernier caractère qui donne la valeur de substantif masculin au génitif pluriel et ceci quel que soit le type de substantif masculin, consonantique ou vocalique, dur ou mou. Seuls “dolů” et “domů” sont ambigus, soit substantifs masculin au génitif pluriel, soit adverbes de lieu avec mouvement face respectivement à “dole” (en bas [sans mouvement]) et “doma” (à la maison [sans mouvement]).

 

III.  Remarques sur l’ordre des caractères dans le classement alphabétique

La liste verticale présentée ci-dessus rend compte de la classification des dictionnaires. Dans les sections vocaliques, les mots débutent par la voyelle brève, sauf pour « u » où deux formes sont concernées : « u » et « ú ».

Les couples de consonnes, consonnes dures et consonnes molles, sont une seule section de dictionnaire. Parmi ces couples de consonnes « ň » n’apparaît pas en première position de mot. Par contre, on trouve par exemple « ďábel » (diable), « ředidlo » (diluant), « ťukat2 » (taper, tapoter, trinquer).

Le digraphe « ch », opposition sourde au « h » sonore, est classé derrière ce caractère et non pas avec « c ».

Nous ajouterons à la liste des graphèmes, le digraphe « dž » qui, bien qu’il ne soit pas reconnu « institutionnellement », correspond à un phonème unique, visiblement étranger (anglo-saxon?) en dehors des mots “džbán” (cruche) et “džber” (baquet) dont l’origine nous est obscure, p. ex. “bandžo”, “džus”, “džem”, “džob”, “džíp”, “džin”, “džez”, “džungle”, “džudo”, “džiu-džitsu”,…

 


Notes:

1   souvent écrit en tchèque sous la forme « hamenex ».

2   Ce verbe est construit sur l’onomatopée « ťuk » (toc).