L’étude de la morphologie nécessite que l’on reconnaisse les différentes « parties du discours » ou « catégories lexicales ». Nous reprenons ici une vision classique de cette répartition, puisque nous utilisons la définition de Havránek et Jedlička présentée dans « Česká mluvnice ».
Ce sont 10 catégories lexicales qui font consensus:
-
-
-
- 01. substantif (podstatné jméno)
- 02. adjectif (přídavné jméno)
- 03. pronom (zájmeno)
- 04. numéral (číslovka)
- 05. verbe (sloveso)
- 06. adverbe (příslovce)
- 07. préposition předložka)
- 08. conjonction (spojka)
- 09. particule (částice)
- 10. interjection (citoslovce)
-
-
Les prépositions et les conjonctions sont des catégories en listes closes. En ce qui concerne l’analyse automatique du tchèque, elles constituent des données qui sont connues des programmes.
Les catégories du substantif, de l’adjectif et du verbe sont des catégories ouvertes analysées automatiquement par un certain nombre de processus de reconnaissance de formes.
La catégorie d’adverbe est mixte: une partie est composée de ce que j’appelle des adverbes « vrais », c’est-à-dire dérivés de formes adjectivales, ce qui est calculable et l’autre partie n’est pas motivée par la forme, que ce soient des mots divers pris pour leur valeur syntaxique adverbiale ou des syntagmes figés par l’agglutination.
La catégorie des particules est abondamment étudiée depuis plusieurs années. C’est pourtant la catégorie qui me fait difficulté. Les autres catégories lexicales ont une valeur fonctionnelle plus ou moins prononcée. Le terme de particule, issu de la chimie et de la physique, évoque une parcelle de matière, éventuellement périphérique. Ce sont des éléments divers sans régularité.