Skip to content

Erreurs et cas fréquents

Jean-Baptiste-Camps edited this page May 24, 2020 · 12 revisions

Le but de cet page n'est pas de faire un tutoriel complet à l'annotation du corpus Geste, ni de se substituer à la documentation fournie par Cattex2009, mais simplement de synthétiser quelques cas fréquents et signaler quelques particularités dans l'annotation des textes du corpus.

Mots fréquents homographes à distinguer

Attention aux distinctions entre

  • ne1 (ne, n', nen) / ne2 (ne, ni, n') (ADVneg / CONcoo)  ;
  • se (CONsub) / si (ADVgen) ;
  • en1 (PRE) et en2 (ADV) ;
  • cant1 (< quando, qui peut être ADVint, ADVsub, CONsub, ADVgen) et cant2 (< quantum) ;
  • ce1 pronom démonstratif neutre (ço en AN) et ce2 (cis, ce, ces) cf. cel, cest ;
  • TL (aussi AND) distingue : ainz (< ANTES), avant, au contraire ≠ ainc (< *ANQUE, cf. FEW), jamais (plus rare). Les graphies des manuscrits sont par contre à peu près interchangeables (ainz, ainc, aincs, einz, etc.)

Attention également à quelques nuances d'étiquetage, selon la doc. de Cattex2009:

  • « car initial est ADVgen lorsqu’il précède un subjonctif d’ordre ou un impératif. Dans les autres cas, il est CONcoo » ;
  • « es/as/ais [TL ez] dans la construction es vos est ADVgen ».

Quelques erreurs à éviter

Erreurs observées dues à des modèles de lemmatisation fautifs

  • pas aller mais aler
  • pas sarazin, mais sarrasin
  • pas tenir, mais tenir1
  • pas des mais des2
  • pas mu mais mu1 (< MUTUS)
  • Ogier le danois, pas NOMcom, mais NOMpro

Vérifier qu'il ne reste plus de lemmes inconnus (&lt;unknown&gt;).

Quelques distinctions de lemmes

  • chastel (CASTELLUM) ≠ chatel (cheptel)
  • ferrer ≠ ferir (frapper)
  • font1 (fonts baptismaux) ≠ fonz (< FUNDUS, cours d'eau ou fond, etc.)
  • mal2 (mât) ≠ mal1 (mal)
  • marz (mois de mars) ≠ marc1 (marc d'argent)
  • mi1 (note de musique) ≠ mi2 (moitié)
  • put (adj.) ≠ pute (nom)

Pronoms

⚠ pour les pronoms à la distinction entre régime direct (r, le pronom est COD) et régime indirect prépositionnel ou non prépositionnel (i, le pronom est COI, et se trouve derrière une préposition ou non).

Par ex ; il li dit sa pensee = il dit sa pensee [COD] à lui [COI]

Autre ex. : Karles mes sire vos rendra toz voz drois = Karles rendra toz voz drois [COD] vos [COI]

Pronoms relatifs ou interrogatifs

Tableau synthétique

Masc. et fém. Neutre Lemmes TL
CS qui, ki (dial., surt. AN et E., que, ke) qui, ki ; que, ke qui ; que2, que3
CR1 que, ke que, ke que2, que3
CR2 cui, qui ; coi, quoi coi ; quoi cui ; coi2

**C'est un peu compliqué, chez TL, au niveau des lemmes pour que ** (surtout quand on le confronte à la vision Cattex), qui distingue :

  • que1 (< quam) : Vergleichspart. ; qu', ke (8; 6; 26) => que comparatif (al. als), par ex. plus tost…que …, plus bel que…, n'en a que…, fors que…, etc. ; dans Cattex, il s'agit du que CONsub, avec le lemme que1 [peut-être aussi que ADVgen, dans ne…que, ne mais que]
  • que2 (< qui, quem, quam, quod) : pron. rel., adv. rel. ; qu', ke (8; 9; 18) => que PROrel, (la chose que j'ai mangée…), avec le lemme que2,
  • que3 (< quid) : pron. interrog. ; qu', ke (8; 19; 34) => que PROint, avec le lemme que3
  • que4 (< quia) : conjunct. ; ques, ke (8; 23; 28) => que conj. sub., (al. daß), par ex. il avint que… ; aussi consécutif, il fist tant que…, etc., dans Cattex, c'est aussi le que CONsub, avec le lemme que4

N.B. : Cattex a également un que ADVgen, « dans la négation restrictive (ne [...] que) est étiqueté ; idem dans la construction ne [...] mais [...] que [...] ou ne [...] mais [...] ». On lui donne également le lemme que1. Ex. Franceis se taisent, ne mais que Guenelun.

Pronoms personnels

**pers.**

**Lemme retenu**

1 sg.

CS je, …, gié

CR me, mei, moi, mi

je

2 sg.

CS tu (pic. te)

CR te, tei, toi, ti

tu

3 sg.

masc.

CS il, ilh, i

CR le, lui

CRI li, lui

fém.

ele

la (pic. le), li, lei, lié

li, li, lei, lié

neutre

il, el

le, lo,…

réfl.

se, sei, soi

il ; soi1

1 pl.

nos, nus

nos1

2 pl.

vos, vus

vos

3 pl.

masc.

CS il, ilh, i

CR les, els, eus

CRI lor, els, eus

fém.

eles, els, eus

les, eles, els, eus

lor, eles, els, eus

réfl.

se, sei, soi

il

Pronoms, déterminants et articles possessifs : les paradigmes et leurs lemmes ⛄

**Rappel de la distinction traditionnelle: **

Celle-ci oppose « article » possessif, faible, et adjectif possessif fort. Les deux paradigmes sont distincts au sg., mais en grande partie communs au pl. TL propose des lemmes pour chaque personne.

« article » possessif, possesseur unique

Masc.

Fém.

Lemme TL

 

Sg.

Pl.

Sg.

Pl.

 

1re pers.

CS mes, mis (AN)

CR mon, mun (AN), men (pic.)

mi

mes

ma, me (pic.)

mes

mon1

2e pers.

CS tes, tis

CR ton, tun, ten

ti

tes

ta, te

tes

ton4

3e pers.

CS ses

CR son, sun, sen

si

ses

sa, se

ses

son4

(en réalité, pas une vraie entrée, mais un renvoi à suen)

Adjectif possessif fort, possesseur unique

 

Masc.

Fém.

Lemme TL

 

Sg.

Pl.

Sg.

Pl.

 

1re pers.

CS miens, mens (AN)

CR mien, men (AN)

mien, men

miens, mens

meie, moie ;  mieue, miue (pic)

meie, …

mien

2e pers.

CS tuens, tuns (AN), toens (O)

CR tuen

tuen, …

tuens,…

toe, toue, teue, tue (AN), …

toes,…

tuen

(renv. à ton4…)

3e pers.

CS suens, suns, soens

CR suen, sun, soen

suen, …

suens,…

soe, soue, seue,…

soes,…

suen

Possesseurs multiples

Certains grammairiens distinguent, et d'autres non, deux paradigmes séparés pour « article » et adjectif possessif. Les formes sont en tous cas assez largement communes… et TL ne fait pas de distinction de lemmes.

NB : il sera intéressant de voir, une fois l'étiquetage fini, si certains de nos manuscrits distinguent des formes selon les emplois.

 

Masc.

Fém.

Lemme TL

 

Sg.

Pl.

Sg.

Pl.

 

1re pers.

CS nostre(s), nos (pic.)

CR nostre, no (pic.)

nostre, no (pic.)

noz, nos (dt pic.)1

nostre ; no, noe (pic.)

noz, nos ; nos, noes (pic.)1

nostre

2e pers.

CS vostre(s), vos (pic.)

CR vostre, vo (pic.)

vostre, vo (pic.)

voz, vos (dt pic.)1

vostre ; vo, voe (pic.)

voz, vos ; vos, voes (pic.)1

vostre

3e pers.

lor, lour, leur, lur (AN)

lor2

ne pas confondre avec lor >> il, pron. pers.

1 : G. Hasenohr distingue des formes nostres, vostres caractéristiques du masc. CR pl. et fém. pl. de l'adj. poss.

N.B. : il existe un neutre de l'adj. poss., équivalent au CR masculin (ex. Tout ert vostre aprés sa fin).

Lemmes absents de Tobler-Lommatzsch et ajoutés

Se rapporter à la section des référentiels sur ce wiki.

Remarques diverses

Selon la norme Cattex, les participes présents doivent être indiqués en tant que tels dans MS, sauf certaines exceptions, explicitées dans le manuel, pour lesquelles l'écart avec le verbe justifie de les étiqueter en adj en MS (et toujours VERppa en M).

Comment traiter le cas des locutions adverbiales, du type « en haut » ?

Distinguer apert VERppe de aparoir (<APERIRE), ouverte, claire, évidente, de apert ADJqua (<APERTUS/EXPERTUS), agile, vif, rapide.

Clone this wiki locally