Sección de texto en idioma extranjero

ediarum.BASE

Por “texto en idioma extranjero” se entiende textos (o partes de texto) que difieren del idioma principalmente utilizado en el corpus o de un idioma definido como estándar. Puede tratarse de palabras individuales, pasajes de texto más largos o textos completos (cartas o similares). Siempre se debe marcar el cambio de idioma o el idioma de un texto. De este modo, se facilita tanto el uso de servicios web externos, como el “Cascaded Analysis Broker” del DTA, como el uso posterior de los textos editados en corpus lingüísticos.

Hay que distinguir entre el marcado de texto en idioma extranjero y el marcado de cambios de tipografía, con la que el primero iba asociado a menudo en el mundo de habla alemana. Por ejemplo, las cartas en alemán de la primera mitad del siglo XIX solían estar escritas en letra alemana. Si el autor utilizaba una palabra extranjera, ésta se representaba en escritura latina.

Codificación

Las palabras y los pasajes de texto individuales en idioma extranjero pueden marcarse con un elemento <foreign>. En el atributo @xml:lang se indica la abreviatura del idioma extranjero correspondiente:

Idioma extranjero Valor para @xml:lang
griego grc
latín lat
hebreo heb
alemán deu
francés fra
inglés eng
ruso rus
español spa
Das <lb/>2te und 3te <foreign xml:lang="spa">vela</foreign> Rufen machte sichtbar weniger Eindruk.

Además, se puede utilizar el atributo @xml:lang tanto a nivel de las estructuras de texto habituales (por ejemplo, párrafos) como para documentos completos (en el elemento raíz <TEI>).