The TüTeAM Corpus

Penka, Doris

doi:10.57754/FDAT.5s35h-x2m86

Published March 15, 2008 | Version v1

Dataset Restricted

The TüTeAM Corpus

Penka, Doris (Researcher)¹

1. University of Tübingen

The TüTeAM corpus contains about 2800 entries from Ancient Greek, German, English, Italian, Hungarian, Latin, Swedish, Russian, Ukrainian, Bulgarian. The data come from various sources: linguistic literature (the "classics" on tense and aspect), fiction, documentary evidence. Examples appear in the original script, if necessary with transliteration, English or German gloss and translation. The examples also contain an indication of the source or a complete denotation of the bibliographic source. Sentences are analysed according to various criteria: tense and aspect morphology, types of time adverbials, Aktionsarten. The analysis allows a specific search for similar phenomena in a variety of languages and makes the discovery of typological regularities easier.

Other (German)

Das TüTeAM-Korpus umfasst etwa 2800 Einträge aus den Sprachen Altgriechisch, Deutsch, Englisch, Italienisch, Ungarisch, Latein, Schwedisch, Russisch, Ukrainisch und Bulgarisch. Die Daten stammen aus verschiedenen Quellen, unter anderem aus der linguistischen Literatur (die Klassiker zu den Bereichen Tempus und Aspekt). Beispiele wurden in der ursprünglichen Schrift notiert, teilweise wurden sie transliteriert, in Deutsch oder Englisch übersetzt und glossiert. Die Beispiele enthalten zusätzlich einen Hinweis auf die jeweilige Quelle oder eine vollständige Literaturangabe. Sätze werden in Bezug auf verschiedene Kriterien analysiert: Morphologie (Tempus und Aspekt), unterschiedliche Typen temporaler Adverbiale, Aktionsarten. Die Analyse erlaubt die spezifische Suche ähnlicher Phänomene in verschiedenen Sprachen und erleichtert die Entdeckung typologischer Regularitäten.

Other (English)

Research carried out in work package B10 of the SFB 441.

Files

Restricted

The record is publicly accessible, but files are restricted to users with access.

Additional details

Deutsche Forschungsgemeinschaft
SFB 441: Linguistische Datenstrukturen: Theoretische und empirische Grundlagen der Grammatikforschung 5483349

Accuracy: Not specified.
Completeness: Not specified.
Conformity: Not specified.
Consistency: Not specified.
Credibility: Not specified.
Processability: Not specified.
Relevance: Not specified.
Timeliness: Not specified.
Understandability: Not specified.

	All versions	This version
Views	0	0
Downloads	0	0
Data volume	0 Bytes	0 Bytes

The TüTeAM Corpus

Other (German)

Other (English)

Files

Restricted

Additional details

Funding

Data quality

The TüTeAM Corpus

Creators

Description

Other (German)

Other (English)

Files

Restricted

Additional details

Funding

Data quality