Ces présentes normes ont été pensées et créées au regard du critère suivant :
- la fidélité de la transcription par rapport à l'image.
(Alix Chagué, Thibault Clérice, Laurent Romary. HTR-United : Mutualisons la vérité de terrain !. 2021. hal-03398740. https://hal.archives-ouvertes.fr/hal-03398740)
En effet, comme ce projet s'inscrit dans un cadre de travail en HTR, nous avons voulu transcrire le plus fidèlement possible l'écriture manuscrite de H. Berlioz.
Les règles de transcription ont donc été élaborées en prenant en compte ce critère, mais elles ont été pensées aussi en fonction des caractéristiques propres au corpus choisi.
Les règles de transcriptions ont été appliquées de la façon la plus homogène possible sur l'ensemble des transcriptions.
Ces transcriptions fidèles des lettres pourront permettre une réutilisation simple de ces dernières dans le cadre d'un autre projet ayant d'autres objectifs.
Orthographe :
- Aucune modification opérée sur l'orthographe, même en présence de fautes.
- L'orthographe ancienne est laissée telle quelle.
- Aucune restitution des accents manquants. Aucune correction des accents fautifs. Restitution de la bonne graphie de l'accent, lorsque nous considérons qu'il y a une variation de la graphie de celui-ci à cause de la rapidité d'écriture.
- Aucune restitution des traits d'union manquants.
- Séparation des mots collés dès lors que la ligature entre ces mots semble due à la rapidité de l'écriture.
Abréviations :
- Aucune résolution d'abréviation.
- Utilisation du symbole monétaire de la livre tournois → ₶ (Unicode U+20B6).
Mots en exposant :
- Restitution seulement du mot sans le mettre en exposant.
Majuscules et minuscules :
- Aucune restitution des majuscules, même lorsqu'elles sont absentes en début de phrase ou de nom propre.
Ponctuation :
- Aucune restitution de la ponctuation manquante. Aucune correction de la ponctuation fautive.
- Emploi du tiret cadratin (—, unicode U+2014) de part et d'autre d'une incise.
- Emploi du tiret demi-cadratin (–, unicode U+2013) pour marquer le changement d’interlocuteur dans les dialogues et devant les éléments des listes/ énumérations.
Attention : un "passage" correspond à deux mots minimum.
Attention : le système d'écriture grec a été retenu pour marquer les particularités d'un certain nombre d'éléments.
-
Éléments lisibles avec particularités :
-
Mot ou passage souligné : Représentation du soulignement à l'aide du caractère grec majuscule Xi (Unicode : U+039E) de la manière suivante → ΞmotSoulignéΞ, Ξpassage soulignéΞ (exemple : si le passage mon oeuvre est souligné, cela sera transcrit Ξmon oeuvreΞ).
Attention : nous ne marquons pas de distinction entre le soulignement simple et le soulignement multiple.
-
Élément barré lisible : Restitution des lettres, des mots, des passages barrés lisibles, tout en précisant la caractéristique "barré" de ces informations à l'aide du caractère grec majuscule Phi (Unicode : U+03A6) → ΦlettreBarréeΦ, ΦmotBarréΦ, Φpassage barréΦ (exemple : si le passage mon oeuvre est barré et lisible, cela sera transcrit Φmon oeuvreΦ).
-
-
Éléments illisibles avec particularités :
-
Élément barré illisible : Transcription des éléments barrés illisibles à l'aide du caractère grec majuscule Oméga (Unicode : U+03A9).
-
S'il s'agit d'une ou plusieurs lettre(s) illisible(s) barrée(s), la transcription se fait de la manière suivante → [lettre]Ω[lettre](exemple : JΩ n'ai pΩs compΩs").
-
S'il s'agit d'un mot illisible barré, la transcription se fait de la manière suivante → Ω (exemple : "Je n'ai Ω compris").
-
S'il s'agit d'un passage illisible barré, la transcription se fait de la manière suivante → Ω Ω (exemple : "Je Ω Ω").
-
-
Élément effacé illisible : Aucune restitution, même si, grâce au contexte, la lettre, le mot ou le passage peut être deviné.
Attention : une "lettre effacée illisible"/ un "mot effacé illisible"/ un "passage effacé illisible" correspondent à des éléments où l'encre a été effacée et dont le déchiffrage n'est plus possible.
-
Mot ou passage manquant : Aucune restitution, même si grâce au contexte, le mot ou le passage peut être deviné.
Attention : un "mot ou passage manquant" peut être lié à une omission de l'auteur, ou à une détérioration du manuscrit (passage déchiré par exemple). Il est difficile de déterminer, dans ce cas-ci, le nombre de lettres/ mots manquants. Nous avons donc décidé d'utiliser une unique règle pour représenter ces manques.
Les mots/ passages manquants sont représentés à l'aide du caractère grec Pi minuscule (Unicode : U+03C0): π.
-
Cachets postaux :
- Ne pas inclure les cachets postaux dans les transcriptions.
Éléments de conservation :
- Ne pas transcrire les informations ajoutées a posteriori, présentes au bas des lettres manuscrites.
Éléments indéterminés :
- Tous les éléments dont nous n'avons pas réussi à interpréter/ comprendre l'usage n'ont pas été restitués. Se référer aux images PDF pour les voir. (Par ex : sorte de signature sur les feuillets contenant la vedette).