-
Notifications
You must be signed in to change notification settings - Fork 1
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
Validite #1
Comments
Cher Lou,
Je confirme qu'une grande partie des textes sur Dramacode ne sont pas
TEI conformant. On les avait mis en commun entre autres pour essayer de
les corriger. J'ai travaillé, avec mes étudiants, sur les textes de
Marivaux (mais j'avoue que je suis très à la traine sur beaucoup de
sujets et je n'ai pas remis les versions corrigées sur Dramacode, parce
qu'il faut que je vérifie les corrections; d'ailleurs, du fait de ces
dernières je prévois d'autres problèmes de conformité schéma). Ce qui
est apparu en corrigeant (sur Marivaux, mais aussi d'autres comédies de
façon ponctuelle), c'est qu'au delà de la non-conformité TEI certains
textes présentent parfois des écarts par rapport au témoin à partir
duquel ils sont censés avoir été établis (pas par moi ou mon équipe).
Bref: Dramacode offre un volume de données considérable, tout à
l'honneur de ceux qui l'ont produit (surtout sans aide institutionnelle)
et qui peut s'avérer très utile pour des macro-lectures. Cependant, il y
reste beaucoup à reprendre et du côté XML, et du côté établissement du
texte (scholarly edition).
Désolée de m'immiscer ainsi dans la discussion, surtout compte tenu de
ma longue inactivité sur Dramacode, mais je pensais utile d'apporter ces
précisions.
Ioana Galleron
Le 29/09/2017 à 14:21, Lou a écrit :
…
894 des fichiers rassemblés dans ce dossier ne sont pas conformes au
schéma teinte proposé. Par ex les attributs @born
<https://github.com/born> @academie <https://github.com/academie> etc
ne sont pas mis a dispoition par ce schéma. D'ailleurs, l'ensemble de
ces documents est loin d'etre TEI conformant!
—
You are receiving this because you are subscribed to this thread.
Reply to this email directly, view it on GitHub
<#1>, or mute the thread
<https://github.com/notifications/unsubscribe-auth/APp_rRvsfAemznqr8AIoZOYAS1UJIWPJks5snODZgaJpZM4PomJr>.
|
Bonjour,
Petits éclaircissements complémentaires.
Ces textes n'ont jamais eu vocation à être conformant... et ne le seront
jamais. Ces textes sont utilisés ailleurs sur www.theatre-classique.fr . où
le texte supposé "prononcé sur scène" est séparé de la forme qui appartient
à l'imprimeur libraire ou à l'éditeur selon l'époque. La mise en forme est
pris en compte par d'autres programmes et non des feuilles XSLT qui sont
peu rapides dans les navigateurs.
L'utilisation de la TEI a été un bon-mauvais prétexte de mise en forme
générale des textes, dont les principes remontent à une vingtaine
d'années... au temps où les humanités numériques n'avaient pas de nom et où
il y avait peu d'acteurs et peu de compétences.
Je ne recommande pas d'utiliser ces textes ni pour quelque recherche ou ni
pour quelque publication. C'est un bac à sable et uniquement cela.
D'ailleurs ce bac à sable devrait disparaitre de Dramacode, il enduit en
erreur ceux qui y accède et fait un mauvais procès à ceux qui les ont
constitués. Pour faire une métaphore facile, le visiteur croit rouler sur
le circuit de Monza et il est en fait la route qui relie Astana à
Vladivostok. Et franchement, cette route est plus utile et utilisée que le
circuit de Monza.
Par ailleurs, ces textes ont tous été remaniés très lourdement depuis. Tant
du point de vue de cohérence générale que de la rigueur éditoriale. Ils ne
seront plus partagés. Depuis le corpus est 1050 pièces, série en cours.
La conformité est jouable pour un individu quand on a un tout petit corpus
: i.e. jusqu'à 50 textes. Après il faut mettre en place un processus
industriel (type BnF) et qui est hors de portée de la recherche
universitaire traditionnelle.
La conformité coute cher au regard du bénéfice acquis. Sur une échelle de
100, on peut estimer - au doigt mouillé - que les cinq derniers points
d'indice de conformité coute 50% du temps en plus.
Comme, il n'existe - à ma connaissance - pas de projet d'interopérabilité
sur plusieurs dizaines de milliers de textes qui justifierait un ajustement
rigoureux, la conformité devient alors - comment dire - une coquetterie
pédagogique.
La conformité absolue est un exercice très pédagogique qui fait prendre la
mesure des choses, indique des échelles de temps quand on aborde un projet
ambitieux. Je recommande cette conformité mais je la méprise pour
convenance personnelle.
Enfin, je dois avouer que la non-conformité est une garantie contre le
pillage.
Bon courage.
En restant à disposition pour répondre à question sur ls sujet avec
toujours un regard et des pratiques décalées.
Le 29 septembre 2017 à 14:21, Lou <notifications@github.com> a écrit :
… 894 des fichiers rassemblés dans ce dossier ne sont pas conformes au
schéma teinte proposé. Par ex les attributs @born
<https://github.com/born> @academie <https://github.com/academie> etc ne
sont pas mis a dispoition par ce schéma. D'ailleurs, l'ensemble de ces
documents est loin d'etre TEI conformant!
—
You are receiving this because you are subscribed to this thread.
Reply to this email directly, view it on GitHub
<#1>, or mute the thread
<https://github.com/notifications/unsubscribe-auth/APswhXJBdqMXFKlfjOAnUcOeTfQSoJi9ks5snODZgaJpZM4PomJr>
.
|
Ioana, merci beaucoup d’avoir donné ces précisions à Lou. J'ai repris la substance de ton commentaire ci-dessus pour le README de cet entrepôt. |
Paul : « D'ailleurs ce bac à sable devrait disparaitre de Dramacode » |
C’est peut-être l’occasion de clarifier quelque chose qui est resté implicite dans Dramacode. Il s'agit d’une organisation dans une forge de logiciel libre, ce qui induit nécessairement une licence, et le droit pour n’importe qui de forker les ressources exposées, et à les sortir de notre responsabilité, comme du code mort peut être repris par n’importe qui. C’est une conséquence technique de la définition même du protocole Git. L’objectif est d’établir des données pour la recherche, car un résultat qui ne peut pas être reproduit parce que les données sont privées n’est pas réfutable, donc pas scientifique. |
Tout ça est bien dommage.
Mais peut on dire d'un côté que rien n'est conformant techniquement, rien
n'est valide intellectuellement et dire que plusieurs personnes basent leur
travaux universitaires et publication dessus.
Je ne souhaite pas de crédit sur cet entrepot, en aucun cas, puisqu'il est
à mes yeux, vieux de plusieurs années.
Comme tu e suggères, je souhaite que mon nom ne soit plus associé à ce
répertoire. Je renie son contenu.
Je ne revendique aucun droit car je sais bien que cela n'a aucun sens. Je
dis juste que la non conformité est aussi une précaution, et que le cout de
la mise au carré de l'ensemble évite de se faire doubler pour ceux qui sont
tenter par une appropriation pour une carrière à poursuivre et à finir. Tu
sais bien que je suis très au delà de ces choses là puisque je ne suis pas
dans la boucle universitaire.
Je goute avec une certaine délectation que des travaux et publications
sortent à partir de ces fichiers mais je ne connais que des contributions
allemandes et canadiennes qui aient fait mentions d'une manière convenable.
Il est des projets outre-atlantiques qui semblent plus sensibles avec ma
manière de procéder.
Pour ma part, je n'y ai gagné strictement rien. Quand tu fournis 10 ans de
travaux sans retour autre que tes forts sympathiques encouragements et nos
échanges amicaux.
Je te garde toute mon estime et mon amitié.
Je répondrai aux messages privés qui me solliciteront pour une démarche ou
un travail collabratif.
Paul
Le 29 septembre 2017 à 16:45, Frédéric Glorieux <notifications@github.com>
a écrit :
… Paul : « D'ailleurs ce bac à sable devrait disparaitre de Dramacode »
Si tu supprimes cet entrepôt, tu risques de fâcher plusieurs personnes qui
fondent désormais leurs travaux et publications sur ces fichiers. Il y a eu
du travail fait sur ces textes.
https://github.com/dramacode/tcp5/commits/gh-pages
Cet entrepôt se nomme tcp5, et non Théâtre Classique, tout le crédit que
l’on peut t’est donné si tu le souhaites. Toutes mentions de ton nom peut
être supprimée, si tu préfères.
Mais tu ne peux pas revendiquer de droits d’auteur sur les textes, ni les
fichiers. La jurisprudence a été établie
https://scinfolex.com/2014/04/13/une-victoire-pour-le-
domaine-public-un-cas-de-copyfraud-reconnu-par-un-juge-francais/
—
You are receiving this because you commented.
Reply to this email directly, view it on GitHub
<#1 (comment)>, or mute
the thread
<https://github.com/notifications/unsubscribe-auth/APswhd22GV3VeNQKutQFwO00m1Hu9yOwks5snQKigaJpZM4PomJr>
.
|
Effectivement, tu es dans le juste.
Mon appel à la mise en place d'un espace contributif en décembre 2015 au
colloque sur les Registres de la Comédie Française voulait cela. Je pensais
réellement que Git était la solution la plus facile à mettre en place et tu
l'a créé et tu la manages parfaitement depuis. D'ailleurs, je me suis
aligné que quelque unes de tes recommandations fort
Au fond, j'aspirais plus à un groupe happy-few (tel les échanges avec G.F.)
où un nouvel objet d'étude ou intérêt de recherche pourrait inviter à
échanger et pour améliorer le support original, avec le fork on perd tout :
vous mes milliers de mises à jour incessantes et moi vos suggestions.
Le forkage c'est bon pour le code source applicatif. Je suis moins
convaincu avec le temps pour le reste.
Le 29 septembre 2017 à 17:19, Frédéric Glorieux <notifications@github.com>
a écrit :
… C’est peut-être l’occasion de clarifier quelque chose qui est resté
implicite dans Dramacode. Il s'agit d’une organisation dans une forge de
logiciel libre, ce qui induit nécessairement une licence, et le droit pour
n’importe qui de forker les ressources exposées, et à les sortir de notre
responsabilité, comme du code mort peut être repris par n’importe qui,
c’est uen conséquence de la définition technique du protocole Git.
L’objectif est d’établir des données pour la recherche, car un résultat qui
ne peut pas être reproduit parce que les données sont privées n’est pas
réfutable, donc pas scientifique.
—
You are receiving this because you commented.
Reply to this email directly, view it on GitHub
<#1 (comment)>, or mute
the thread
<https://github.com/notifications/unsubscribe-auth/APswhef6qYTpCgBni1Zk44mnCs06ylciks5snQpugaJpZM4PomJr>
.
|
Pardon d’avoir été procédurier, tu m’as fait peur. « Pour ma part, je n'y ai gagné strictement rien. » |
Je suis d’accord avec toi sur le fork, ça n’a pas de sens pour nous, je le fais écrire dans les licences dans les fichiers TEI auxquels je contribue. Licence CC BY NC ND Pas de Modification : TOTO s’engage à améliorer et à corriger cette ressource électronique, notamment en intégrant toutes les contributions extérieures, la diffusion de versions modifiées de cette ressource n’est pas souhaitable. Mais pour l’intérêt général, cela permet aussi de sauver des corpus qui meurent, dans des communautés injoignables. Il y a un risque de concurrence un peu sauvage, avec des OPA, mais au fond, personne ne s'y trompe, on va à ceux qui travaillent. |
Je vous prie de m'excuser d'avoir involontairement provoqué un debat sur les principes open source! Ma question toute naive (que j'ai d'ailleurs posée dans d'autres de vos dépots) est la suivante: ces fichiers XML prétendent deux choses (a) conformité au schéma XML "teinte.rng" (b) plus généralement conformite à la TEI (parce que tout élément est formellement dans l'espace de nom TEI, et l'element racine s'appelle "TEI"). Ne serait il pas avantageux de corriger le premier problème, sinon le deuxième? Je m'engage volontairement pour vous aider et j'attends des propositions comment mieux en pratique avancer la chose! |
@marcdouguet, très occupé par sa rentrée à Grenoble auprès de Thomas Lebarbé et CAHIER, me semble une personne importante à entendre avant de conclure quoi que ce soit. Comme tu l’as compris, les noms des éléments témoignent de l’histoire de fichiers, et de ce qu’ils doivent devenir. Pour d’autres sombres raisons, étant exactement dans mon dernier jour à l’OBVIL, je ne me sens plus du tout concerné, sauf par l’amitié que j’ai pour les personnes. Pour https://github.com/dramacode/bibdramatique et https://github.com/dramacode/moliere, Marc reste concerné, @ameliecanu et @ClaireDuCellf aussi, l’objectif semble plus rapide à atteindre. |
Frédéric,
Je m'énerve mais je ne suis pas méchant. Je pensais aussi à Marc et à sa
très bonne idée de Manadram... d'ailleurs je suis très fâché de ne pas
avoir eu l'idée avant lui. Marc m'a fait part de ses corrections sur
Corneille, je ne sais pas les chasser car j'ai tout revu Corneille depuis.
Il est très difficile à réintégrer des évolutions qui viennent de
l'extérieur pour moi. Non pas égoïsme ou isolationisme mais mon corpus
bouge beaucoup et merger le tout me fait un peu peur.
Paul
Le 29 septembre 2017 à 19:04, Frédéric Glorieux <notifications@github.com>
a écrit :
… @marcdouguet <https://github.com/marcdouguet>, très occupé par sa rentrée
à Grenoble auprès de Thomas Lebarbé et CAHIER, me semble une personne
importante à entendre avant de conclure quoi que ce soit. Comme tu l’as
compris, les noms des éléments témoignent de l’histoire de fichiers, et de
ce qu’ils doivent devenir. Pour d’autres sombres raisons, étant exactement
dans mon dernier jour à l’OBVIL, je ne me sens plus du tout concerné, sauf
par l’amitié que j’ai pour les personnes.
Pour https://github.com/dramacode/bibdramatique et
https://github.com/dramacode/moliere, Marc reste concerné, @ameliecanu
<https://github.com/ameliecanu> et @ClaireDuCellf
<https://github.com/claireducellf> aussi, la tâche semble plus rapide à
atteindre.
—
You are receiving this because you commented.
Reply to this email directly, view it on GitHub
<#1 (comment)>, or mute
the thread
<https://github.com/notifications/unsubscribe-auth/APswhVB7qc71zrhsDNT-KO7Unieza4Mdks5snSMKgaJpZM4PomJr>
.
|
Paul, Je me figure très bien tes difficultés. Un copain me disait toujours, la révolution avancera aussi vite que le dernier des guerilleros. Faut-il l’abattre ? Évidemment, c'est de l’humour, mais en un premier temps, on avance en effet beaucoup plus vite tout seul. Mais la révolution tout seul, ça touche moins de monde. À tête reposée, dans une semaine, tu me diras d’où je dois retirer ton nom si tu le souhaites toujours. |
Chère Lou,
Ne vous formalisez pas de nos échanges.
Votre proposition est très généreuse.
teinte.rng est sous la responsabilité de F. GLorieux. Rapprochez vous de
lui comme vous le fîtes plutôt aujourd'hui.
Un longue conversation s'imposerait pour aborder le sujet de la TEI qui est
un modèle absolu mais trop gros et à certains endroits insuffisant quand
une nouvelle question s'impose. Personnellement TEI pourrait être remplacé
par TOTO que ça ne changerait rien du tout pour moi. La validation du XML
par le navigateur est suffisant.
Mais j'ai une pratique atypique et très marginale. Il ne faut pas suivre
mon exemple. Je n'envisage pas de réviser 850 000 vers pour ce qui est un
non-besoin pour ma pratique. Ou alors il faut mettre 500 000 euros sur la
table et là je m'engage en un an de tout mettre au carré.Ce n'est surtout
pas dans les projets de l'OBVIL qui regarde les choses autrement : je ne
connais pas stratégie documentaire globale. Il y a des projets thématiques,
voyez le site.
Il y a aussi des couplages avec la BnF dont j'ai du mal à cerner la vrai
contour, si ce n'est l'agglutination d'initiative de petite équipes. Ces
inititives sont d'ailleurs assez enthousiasmantes et émanent de grandes
compétences. Mais je rêve d'un projet tel le CERN en physique, cela
arrivera mais je serai mort.
http://obvil.paris-sorbonne.fr/actualites?evenement=seminaire
Cordialement
Le 29 septembre 2017 à 18:49, Lou <notifications@github.com> a écrit :
… Je vous prie de m'excuser d'avoir involontairement provoqué un debat sur
les principes open source! Ma question toute naive (que j'ai d'ailleurs
posée dans d'autres de vos dépots) est la suivante: ces fichiers XML
prétendent deux choses (a) conformité au schéma XML "teinte.rng" (b) plus
généralement conformite à la TEI (parce que tout élément est formellement
dans l'espace de nom TEI, et l'element racine s'appelle "TEI"). Ne serait
il pas avantageux de corriger le premier problème, sinon le deuxième? Je
m'engage volontairement pour vous aider et j'attends des propositions
comment mieux en pratique avancer la chose!
—
You are receiving this because you commented.
Reply to this email directly, view it on GitHub
<#1 (comment)>, or mute
the thread
<https://github.com/notifications/unsubscribe-auth/APswhYqBFlXKNf32SDvTBHl7Olv68XwDks5snR98gaJpZM4PomJr>
.
|
Ok Fred.
Le 29 septembre 2017 à 19:57, Frédéric Glorieux <notifications@github.com>
a écrit :
… Paul,
Je me figure très bien tes difficultés. Un copain me disait toujours, la
révolution avancera aussi vite que le dernier des guerilleros. Faut-il
l’abattre ? Évidemment, c'est de l’humour, mais en un premier temps, on
avance en effet beaucoup plus vite tout seul. Mais la révolution tout seul,
ça touche moins de monde.
À tête reposée, dans une semaine, tu me diras d’où je dois retirer ton nom
si tu le souhaites toujours.
—
You are receiving this because you commented.
Reply to this email directly, view it on GitHub
<#1 (comment)>, or mute
the thread
<https://github.com/notifications/unsubscribe-auth/APswhbR043_nhSEwfA46eoFG6q5idxp-ks5snS9tgaJpZM4PomJr>
.
|
Lou,
Après une longue réflexion, Je me résous à lentement mais sûrement à
m'aligner sur le recommandation.
Je vais vous suivre et supprimer les attributs personnels de <author> qui
avait une visée mais qui ne sont finalement pas exploités. Etape 1.
J'y introduirais l'ISNI pour être universel. Etape 2.
Cordialement
Paul
Le 29 septembre 2017 à 14:21, Lou <notifications@github.com> a écrit :
… 894 des fichiers rassemblés dans ce dossier ne sont pas conformes au
schéma teinte proposé. Par ex les attributs @born
<https://github.com/born> @academie <https://github.com/academie> etc ne
sont pas mis a dispoition par ce schéma. D'ailleurs, l'ensemble de ces
documents est loin d'etre TEI conformant!
—
You are receiving this because you are subscribed to this thread.
Reply to this email directly, view it on GitHub
<#1>, or mute the thread
<https://github.com/notifications/unsubscribe-auth/APswhXJBdqMXFKlfjOAnUcOeTfQSoJi9ks5snODZgaJpZM4PomJr>
.
|
894 des fichiers rassemblés dans ce dossier ne sont pas conformes au schéma teinte proposé. Par ex les attributs @born @academie etc ne sont pas mis a dispoition par ce schéma. D'ailleurs, l'ensemble de ces documents est loin d'etre TEI conformant!
The text was updated successfully, but these errors were encountered: