Allgemeine und Typologische Sprachwissenschaft
print


Navigationspfad


Inhaltsbereich

Münchener Interlineartext-Bibliothek

Die "Münchener Interlineartext-Bibliothek" (MILB) soll Studierende zum "typologischen Arbeiten" mit fremdsprachlichen Texten anregen. Gleichzeitig stellt sie eine (in ihrem Umfang notgedrungen sehr schmale) Datengrundlage zur Verfügung, die für bestimmte typologische Fragestellungen bes. aus dem Bereich Morphosyntax konsultiert werden kann. Hierfür sind in der MILB kürzere Texte bzw. Textausschnitte unterschiedlicher Provenienz gesammelt, die allesamt mit einer englischen oder deutschen Interlinear-Version, meist auch mit einer entsprechenden Übersetzung versehen sind. Die verwendeten Glossen orientieren sich an der in der Typologie erprobten Standardetikettierung, wenn auch im Einzelfall Veränderungen bzw. Spezifikationen vorgenommen worden sind. Eine Glossensammlung nebst Erläuterungen ist hier zu finden.

Zur Frage der Sprachauswahl: MILB ist bislang weder als repräsentatives oder als sonstwie motiviertes Corpus angelegt. Vielmehr sind vor allem diejenigen Sprachen berücksichtigt, die in der Vergangenheit am IATS unterrichtet worden sind. Dabei werden vor allem solche Sprachen illustriert, für die bislang kaum umfangreicheren, glossierten Texte zur Verfügung stehen. Daher wird zunächst auch von einer Dokumentation "großer" bzw. "gängiger" Sprachen wie Englisch, Französisch, Deutsch, Russisch, Chinesisch oder Japanisch etc. abgesehen.

Die Texte in den Einzelsprachen sind in Bezug auf die Glossen nicht harmonisiert (und im Einzelfall auch niemals ’endgültig’). Dies liegt vor allem daran, dass die Glossierungen zu unterschiedlichen Zeitpunkten angefertigt worden sind. In einem späteren Schritt soll eine Harmonisierung auf der Basis der Munich Glossing Conventions (der Münchener Variante der "Leipzig Glossing Rules") erfolgen.

Die MILB-Texte sind zunächst als PDF-Dateien erreichbar. In einem zweiten Schritt soll über eine einheitliche Kodierung (Unicode) auch eine HTML-Version erstellt werden. Hierfür und für die Erstellung weiterer Interlineartexte soll auch das am IATS gepflegte Programm KURA zum Einsatz kommen.

MILB ist eine "offene" Bibliothek: Demnach sind die Betreuer von MILB sehr daran interessiert, dass andersweitig in elektronischer Form vorliegende Interlineartexte, die den o.g. Standards in etwa folgen, für MILB zugänglich gemacht werden. Dabei gelten keinerlei Einschränkungen in Bezug auf die Sprache und ihren "Status"’ (e.g. "lebend" oder "tot"). Wichtig ist nur, dass das Format in etwa eingehalten wird, eine "Unicodierung" vorliegt und die Glossen-Metasprache Englisch ist (nicht notwendigerweise die Übersetzung). Desidarata sind vor allem Sprachen Afrikas, Nordamerikas, Südamerikas und des Papua-Raums.

Das MILB-Projekt versteht sich als verwandt mit Projekten zur Schaffung typologischen Metadatenbanken sowie mit dem Titus-Projekt zur linguistischen Textdokumentation. Seine Eigenständigkeit liegt in der Pflege typologisch valider Interlineartexte, wodurch mittelfristig eine "suchbare" Datenbank, die Interlinearglossen mit Textbelegen und einer terminologischen Datenbank verbindet.

Die bislang in MILB eingespeisten Texte sind sicherlich nicht fehlerfrei. Fehler in der grammatischen Interpretation, aber auch Tippfehler, Fehler in der lexikalischen Analyse oder sonstige Unstimmigkeiten bitten wir uns zu melden (Kommentarfunktion in der Datenbank).

Copyright: Die vorliegenden Texte sind für jegliche Form der wissenschaftlichen Verwendung freigegeben. Allerdings müssen Verwendungen jeglicher Art auf die Textquelle und die Urheberschaft der Interlinearversion/ Übersetzung verweisen.

München, 24.9.04 IATS

Downloads