Fremdsprachiger Text
ediarum.BASE
Unter „fremdsprachigem Text“ sind Texte (bzw. Textteile) zu verstehen, die entweder von der im Korpus normalerweise vorkommenden Sprache oder einer als Standard definierten Sprache abweichen. Dabei kann es sich um einzelne Wörter, längere Textpassagen oder ganze Texte (Briefe o. ä.) handeln. Der Sprachwechsel bzw. die Sprache eines Textes sollte stets ausgezeichnet werden; dadurch wird sowohl die Verwendung von externen Webservices, wie dem „Cascaded Analysis Broker“ des Deutschen Textarchivs, als auch die Nachnutzung der edierten Texte in linguistischen Korpora erleichtert.
Zu unterscheiden ist die Auszeichnung fremdsprachigen Textes von der Auszeichnung eines Schriftwechsels, mit dem ersterer häufiger einhergeht. Beispielsweise wurden deutschsprachige Briefe der ersten Hälfte des 19. Jahrhunderts häufig in deutscher Schrift verfasst. Verwendete der Schreiber ein Fremdwort, wurde dies in lateinischer Schrift wiedergegeben.
Kodierung
Einzelne fremdsprachige Wörter und Textstellen können mit in einem
<foreign>
-Element ausgezeichnet werden. Im Attribut
@xml:lang
wird ein Kürzel der jeweiligen Fremdsprache angegeben:
Fremdsprache | Wert für @xml:lang |
---|---|
Griechisch | grc |
Latein | lat |
Hebräisch | heb |
Deutsch | deu |
Französisch | fra |
Englisch | eng |
Russisch | rus |
Spanisch | spa |
Das <lb/>2te und 3te <foreign xml:lang="spa">vela</foreign> Rufen machte sichtbar weniger Eindruk.
Darüber hinaus kann das Attribut @xml:lang
sowohl auf Ebene der üblichen
Textstrukturen (z. B. Absätze) gesetzt werden als auch für gesamte Dokumente (dann im
Wurzelelement TEI).