Sección de texto en idioma extranjero
ediarum.BASE
Por “texto en idioma extranjero” se entiende textos (o partes de texto) que difieren del idioma principalmente utilizado en el corpus o de un idioma definido como estándar. Puede tratarse de palabras individuales, pasajes de texto más largos o textos completos (cartas o similares). Siempre se debe marcar el cambio de idioma o el idioma de un texto. De este modo, se facilita tanto el uso de servicios web externos, como el “Cascaded Analysis Broker” del DTA, como el uso posterior de los textos editados en corpus lingüísticos.
Hay que distinguir entre el marcado de texto en idioma extranjero y el marcado de cambios de tipografía, con la que el primero iba asociado a menudo en el mundo de habla alemana. Por ejemplo, las cartas en alemán de la primera mitad del siglo XIX solían estar escritas en letra alemana. Si el autor utilizaba una palabra extranjera, ésta se representaba en escritura latina.
Codificación
Las palabras y los pasajes de texto individuales en idioma extranjero pueden marcarse con
un elemento <foreign>
. En el atributo @xml:lang
se
indica la abreviatura del idioma extranjero correspondiente:
Idioma extranjero | Valor para @xml:lang |
---|---|
griego | grc |
latín | lat |
hebreo | heb |
alemán | deu |
francés | fra |
inglés | eng |
ruso | rus |
español | spa |
Das <lb/>2te und 3te <foreign xml:lang="spa">vela</foreign> Rufen machte sichtbar weniger Eindruk.
Además, se puede utilizar el atributo @xml:lang
tanto a nivel de las
estructuras de texto habituales (por ejemplo, párrafos) como para documentos completos (en
el elemento raíz <TEI>
).