TEI
Un archivo XML puede recurrir a una definición de esquema que determina la “gramática”, es decir, qué elementos existen y cómo o dónde pueden utilizarse. Basándose en esta definición de esquema, el software puede comprobar si el documento implementa el esquema correctamente (si es válido) o no.
En el caso de ediarum.BASE, se utiliza una definición de esquema basada en las directrices TEI P5 proporcionadas por la “Text Encoding Initiative” (TEI). La TEI trabaja desde 1987 en estas directrices, que proveen elementos con los que, entre otras cosas, se pueden marcar o describir los manuscritos. XML-TEI es, por tanto, un lenguaje de marcado desarrollado específicamente para proyectos de investigación en las humanidades. En lugar de utilizar determinados formatos y abreviaturas, se utilizan elementos adecuados. Ejemplos:
En ediciones impresas | En XML-TEI |
---|---|
señor |
s<i>eñor</i> |
[además] sobre la línea |
<add place="superlinear">además</add> |
Como puede verse en el ejemplo, los pasajes de texto se marcan semánticamente mediante
las etiquetas TEI, es decir, los elementos ya llevan el significado del marcado. Así,
<i>
significa “cursiva” y <add>
significa “adición”. Esto hace que los marcados sean independientes de su formato
posterior en las ediciones digitales e impresas. Ejemplo:
De lo que estoy <hi rendition="#u">muy seguro</hi> es de mi buena intención
Aquí solo se señala que en el manuscrito las palabras “muy seguro” están subrayadas. No es necesario decidir aquí si en la edición digital o impresa el pasaje correspondiente aparece realmente subrayado o tal vez en un formato diferente.
Dado que la TEI está diseñada para muchos tipos de texto y casos de uso diferentes, incluye muchos más elementos de los que normalmente se necesitan en un proyecto. En el Centro Teuchos para la Investigación de Manuscritos y Textos de la Universidad de Hamburgo se ha elaborado una directriz con la ayuda de TEI sobre cómo se pueden estructurar y marcar con XML las diferentes partes de la descripción de un manuscrito. Sobre esta base, TELOTA ha desarrollado un esquema XML para el entorno de trabajo digital, con el que los documentos XML podrán ser validados, es decir, comprobados en el futuro.
El árbol de un documento XML codificado en TEI siempre consiste en dos partes: el
<teiHeader>
y el <text>
. Mientras que
la descripción del manuscrito misma se encuentra en <text>
, los
metadatos del documento XML se anotan en el <teiHeader>
. La
estructura general de un documento XML codificado en TEI es la siguiente:
Estructura | Estructura en el documento XML |
---|---|
Metadatos sobre el documento XML |
<teiHeader> <fileDesc> <titleStmt> … </titleStmt> <editionStmt> … </editionStmt> <publicationStmt> … [Información sobre los editores y las editoras] </publicationStmt> <sourceDesc> … </sourceDesc> </fileDesc> <profileDesc> … </profileDesc> </teiHeader> |
Texto |
<text> <body> … [Texto editado] </body> <text> </TEI> |