Alpenwort

Alpenwort. Korpus der Zeitschrift des Deutschen und Österreichischen Alpenvereins

Projektleitung: Claudia Posch, Gerhard Rampl

Projektlaufzeit: 15.10.2014 - 14.10.2017

Mitarbeiterin: Bettina Larlehem.: Daniela Feistmantl, Irina Windhaber

 please scroll down for English description


Die im Titel genannte Zeitschrift des Alpenvereins (ZAV, Jahrgänge 1872 – 1998) soll im vorliegenden Projekt digitalisiert und mit linguistischer Annotation versehen werden, um sie als elektronisches Korpus der Forschungsgemeinschaft zur Verfügung zu stellen. Die ZAV ist aufgrund ihrer inhaltlichen Homogenität und des langen Zeitraums über den sie durchgehend erscheint eine einzigartige Textquelle: Österreich nimmt im Alpenraum eine zentrale Stelle ein und so reflektieren die ersten Jahrzehnte der ZAV die beginnende Erschließung der Alpen und den einsetzenden Tourismus. Im 20. Jahrhundert findet eine Ausweitung der Themen auf die Berge der Welt statt, bei deren Erschließung Österreich ebenfalls eine wichtige Rolle einnahm.

Auf Basis des entstehenden Korpus werden Forschungen in den Feldern der Feministischen Diskursanalyse und der Onomastik durchgeführt. Fragestellungen zur Rhetorik des Alpinismus und deren Bezug zur linguistischen Konstruktion femininer/maskuliner Perzeptionen sollen mithilfe des Korpus beantwortet werden. Wiederkehrende Muster des Sprachgebrauchs, z.B. n-gramme, der Gebrauch von Personalpronomina, Intensivierer, „Geocollokationen“ u.v.m. können somit systematisch erforscht werden. In der Onomastik bietet das Korpus Möglichkeiten jüngere Namen im Kontext des Alpinismus zu untersuchen, zum Beispiel, die Namen alpiner Strukturen wie Wände, Pfeiler usw. Dadurch werden neue Einsichten in Benennungsmotive erwartet. Gleichzeitig bietet das Projekt auch einen Nutzen für die Korpuslinguistik, da z.B. Namendatenbanken beitragen können, NER und Annotation zu verbessern.


In the project Alpenwort. Korpus der Zeitschrift des Deutschen und Österreichischen Alpenvereins the almanac of the Austrian alpine club 1872 – 1998 (Zeitschrift des Deutschen und Österreichischen Alpenvereins ZAV) will be digitized and annotated. The ZAV is a very important source especially in Austria, which shares, by area, the biggest part of the Alpine arc. In its first decades the magazine contributions reflect the ongoing touristic and cartographic exploration of the Alps and the economic and scientific discoveries involved. During the 20th century perspectives expanded to the mountains of the world. Globally relevant topics such as environment and nature protection are discussed as well as questions of regional identity and cultural heritage.

The main goal of the project is to make this unique source accessible for the scientific community enhanced by exhaustive linguistic annotation conformant with CLARIN-DARIAH standards. The processed data will be valuable for variety of research fields, such as for (computer)linguists, historians, geographers, ecologists and last but not least the OeAV, which actively supports and endorses this project. The project will adhere to the following workflow: extracting the logical structure of the sources and storing them in TEI-conformant formats, correcting structural elements, enhance OCR (esp. for gothic script), tokenizing, sentence boundary disambiguation, Parts-Of-Speech tagging and Named Entity Recognition. It is our aim to swiftly publish the linguistically annotated corpus in corpus_shell (at the ICLTT). Versioning will ensure visible results in yet an early project-stage and guarantee that improvements and corrections made during the above processes are continually integrated. Innovations can be expected on a technical and scientific level. Technically especially innovative are the process of OCR-enhancement, which will be carried out by project partner DEA (Innsbruck), as well as enhancements in NER and the integration of names into large-scale ontologies.


Kooperationen:

Martin Achrainer - Österreichischer Alpenverein, Alpenverein-Archiv

Günther Mühlberger - Digitalisierung & Elektronische Archivierung (DEA), Andy Stauder@transidee, Universität Innsbruck; tools: FEP - Functional Extension Parser

Eva Zangerle - Databases and Informations Systems, Inst. f. Informatik, Universität Innsbruck

Noah Bubenhofer und Martin Volk, Institut für Computerlinguistik, UZH

Michel Généreux und Verena Lyding, Institut für Fachkommunikation und Mehrsprachigkeit, EURAC

Institut für Corpuslinguistik und Texttechnologie (ICLTT), ÖAW

Gerald Hiebl, Arbeitsbereich Vermessung und Geoinformation, Universität Innsbruck


DOWNLOADS

download poster: A Mountain of Work. Building an Alpine Heritage Text Corpus. 9th International Corpus Linguistics Conference, 24 to Friday 28 July, University of Birmingham.


download poster: Mit -wärts geht's abwärts. The descent of a German suffix(-oid)Spatial Boundaries and Transitions in Language and Interaction - 23.-28.04.2017 Ascona, Switzerland