The TüTeAM Corpus
Description
The TüTeAM corpus contains about 2800 entries from Ancient Greek, German, English, Italian, Hungarian, Latin, Swedish, Russian, Ukrainian, Bulgarian. The data come from various sources: linguistic literature (the "classics" on tense and aspect), fiction, documentary evidence. Examples appear in the original script, if necessary with transliteration, English or German gloss and translation. The examples also contain an indication of the source or a complete denotation of the bibliographic source. Sentences are analysed according to various criteria: tense and aspect morphology, types of time adverbials, Aktionsarten. The analysis allows a specific search for similar phenomena in a variety of languages and makes the discovery of typological regularities easier.
Other (German)
Das TüTeAM-Korpus umfasst etwa 2800 Einträge aus den Sprachen Altgriechisch, Deutsch, Englisch, Italienisch, Ungarisch, Latein, Schwedisch, Russisch, Ukrainisch und Bulgarisch. Die Daten stammen aus verschiedenen Quellen, unter anderem aus der linguistischen Literatur (die Klassiker zu den Bereichen Tempus und Aspekt). Beispiele wurden in der ursprünglichen Schrift notiert, teilweise wurden sie transliteriert, in Deutsch oder Englisch übersetzt und glossiert. Die Beispiele enthalten zusätzlich einen Hinweis auf die jeweilige Quelle oder eine vollständige Literaturangabe. Sätze werden in Bezug auf verschiedene Kriterien analysiert: Morphologie (Tempus und Aspekt), unterschiedliche Typen temporaler Adverbiale, Aktionsarten. Die Analyse erlaubt die spezifische Suche ähnlicher Phänomene in verschiedenen Sprachen und erleichtert die Entdeckung typologischer Regularitäten.
Other (English)
Research carried out in work package B10 of the SFB 441.