Skip to content

Formato y guías para la codificación

Aldo Ismael Barriente edited this page Jan 21, 2022 · 6 revisions

Nota: Para una introducción a la codificación de textos usando TEI, se recomienda esta lección del ProgrammingHistorian en español

Formato y guías para la codificación

Los temas de esta guía:

  1. Partes
  2. Capítulos
  3. Líneas y tabulación
  4. Numeración de páginas
  5. Notas

1. Partes

Colop divide el texto en cinco partes. Cada parte se nombra en números K'iche's. El orden del texto:

  1. Nab'e
  2. Ukab'
  3. Rox
  4. Ukaj
  5. Ro'

Codificamos estas partes con el elemento y atributo siguiente: <div type="nima-tasik">. El atributo @type indica el nombre de esta división en K'iche', traducido como "sección mayor". Este elemento define la división más grande del texto.

El primer elemento hijo del <div> es <head>, donde se pone el nombre de la parte (en mayúscula) como aparece en el texto. Por ejemplo:

<div type="nima-tasik">
     <head>NAB'E</head>

2. Capítulos

El capítulo es la división siguiente del texto. Aparecen en el texto como líneas grises, en mayúscula, y en letras negritas. El capítulo se codifica usando el elemento <lg> y el atributo @type con el valor tasik ("sección" en K'iche', recomendado por Ajpub' Pablo García Ixmatá), y el atributo @xml:id con el valor lgPARTE.CAPÍTULO; Por ejemplo, el primer capítulo en la primera parte (NAB'E) sería lg1.01.

El título del capítulo funciona a la vez como encabezado y parte del mismo texto. Aquí nombraremos cómo el título del capítulo interactúa con el texto, y cómo cada caso se realiza en la codificación. En particular, el elemento <seg> se usará para indicar el encabezado para no interrumpir la codificación.

Primer caso: El título del capítulo es distinto del texto del capítulo

En caso de que el título del capítulo no interactúe con el texto del capítulo, el título se codifica como líneas usando el elemento <l> (más información próximamente), pero alrededor de este elemento será el elemento <seg> con los atributos siguientes: <seg rend="caps" type="uwach-tasik">. El atributo @rend tiene como valor caps para definir letra mayúscula; el atributo @type tiene como valor uwach-tasik (encabezado en K'iche'). Por ejemplo, en el comienzo del primer capítulo de Colop:

<lg n='0' xml:id='lg1.01" type="tasik">
     <l n='1'><seg rend='caps' type='uwach-tasik'>ARE' UXE' OJER TZIJ WARAL K'ICHE' UB'I'</seg></l>
     ...
</lg>

Segundo caso: El título del capítulo interactúa con el texto del capítulo

Examinemos el siguiente ejemplo:

K'EJE K'UT UTIJOB'EXIK CHIK WINAQ TZ'AQ
                            WINAQ B'IT KUMAL Tz'aqol
                                             B'itol;
                                             Alom
                                             K'ajolom;

                                             (Colop 1999: 30)

Para codificar adecuadamente la diferencia entre el fin del título (...KUMAL) y el comienzo del texto (...Tz'aqol), usamos el elemento <l> para cada línea, pero envolvemos la parte de la línea que es título con el elemento <seg>. Esto nos da el siguiente resultado:

<lg xml:id='lg0PART.SECTION' type='tasik'>
<l n='x'><seg rend='caps' type='uwach-tasik'>K'EJE K'UT UTIJTOB'EXIK CHIK WINAQ TZ'AQ,</l>
<l n='x+1'><space quantity="29" unit="chars" /><seg rend='caps' type='uwach-tasik'>WINAQ B'IT KUMAL</seg> Tz'aqol</l>
<l n='x+2'><space quantity="46" unit="chars" />B'itol;</l>
<l n='x+3'><space quantity="46" unit="chars" />Alom,</l>
<l n='x+4'><space quantity="46" unit="chars" />K'ajolom;</l>*

*Discusión del uso del elemento <space> más tarde.

3. Líneas y tabulación

La edición del Popol Wuj de Colop usa el alineamiento para mostrar visualmente los grupos poéticos que ocurren en el texto. El alineamiento se hace por medio de tabulación; la palabra or la parte de la palabra (es decir, el morfema) se alinea con el grupo determinado. Considera los ejemplos siguientes:

Primer Caso: Alineamiento básico de palabras

K'o nab'e wujil,
ojer tzib'am puch,
xa ewal uwach ilol re,
              b'isol re.

Había un libro original,
que fue escrito antiguamente,
sólo que están ocultos quienes lo leen
                       quienes lo interpretan.

                       (Colop 1999: 22; Colop 2007: 23)

Segundo Caso: Alineamiento de parte de palabra (morfema)

xa ajkun xk'amowik ri k'uwal,
           yamanik,

fue un médico quien tomó sus joyas y
                         sus gemas;

                         (Colop 1999: 45; Colop 2007: 50)

Para codificar lo que Sam Colop llama rima semántica, los alinemientos se codifican por medio del elemento <space> de TEI. Esto nos deja preservar la tabulación adecuada usando caracteres blancos (es decir, el espacio blanco como ) como la medida principal. Usando un algoritmo de Python en un archivo del texto en formato simple (.txt) con la tabulación del texto preservada, podemos generar el número preciso de caracteres blancos para alinear las líneas. Entonces codificamos los ejemplos ya dichos de esta manera:

Codificación de primer caso

<l n='x'>K'o nab'e wujil,</l>
<l n='x+1'>ojer tzib'am puch,</l>
<l n='x+2'>xa ewal uwach ilol re,</l>
<l n='x+3'><space quantity='14' unit='chars' />b'isol re.</l>

Codificación de segundo caso

<l n='x'>xa ajkun xk'amowik ri k'uwal,</l>
<l n='x+1'><space quantity='11' unit='chars' />yamanik</l>

4. Numeración de páginas

Esta codificación del Popol Wuj por Colop captura la forma lógica del texto. Aun así, quizás será útil para diferentes visualizaciones en el futuro si preservamos la división de páginas de la copia original. Para mantener esta división, la codificamos usando el elemento <pb> y su atributo @xml:id con el valor de una identificación única compuesta de "colop1999-" y el número de página. Por ejemplo, la página 24 del texto tendrá el elemento y atributo: pb xml:id="colop1999-024".

5. Notas

Referencias a notas aparecen en el texto con un número en superíndice después del término o frase determinada. El contenido de la nota puede estar en el margen a mano izquierda o derecha. Seguiremos las guías de codificacion con TEI del sistema bibliotecario de la Universidad de Virginia para codificar notas. Según las guías, diferenciamos entre la referencia de la nota, la cual se representa con un número es superíndice, y el contenido de la nota que contiene el texto relacionado al término o frase mencionando.

Para la referencia de la nota, números en superíndice se marcan usando el elemento <ref> con un atributo @target que tiene valor igual al @xml:id del contenido de la nota. El número en superíndice se preserva usando el elemento <hi> y el atributo @rend con valor "superscript".

El contenido de la nota se pone después de la línea en que la referencia aparece. De ahí, la nota se codifica con el elemento <note>. El primer atributo es @xml:id con el valor único a la nota, con formato n y el número en superíndice con suficientes 0 para mentener 3 dígitos. El segundo atributo es @place con valor al margen en donde aparece la nota ("left", "izquerda"; o "right", "derecha"). El elemento <note> tiene como elementos hijos <seg> y <hi> para marcar el número en superíndice como símbolo de la referencia. Luego, el contenido de la nota se formatea como en el texto, como en el ejemplo siguiente:

<l n='x'>-Maja b'i qab'i, xa ojub'om<ref target='n109'><hi rend='superscript'>109</hi></ref>,</l>
<note xml:id='n109' place='right'><seg type='note-symbol'><hi rend='superscript'>109</hi></seg>'Somos cerbataneros/cazadores'; viene de <hi rend="bold">ub' ~ wub'</hi>, cerbatana'.</note>
<l n='x+1'>...</l>