Published March 15, 2008 | Version v1
Dataset Restricted

The TüTeAM Corpus

  • 1. ROR icon University of Tübingen

Description

The TüTeAM corpus contains about 2800 entries from Ancient Greek, German, English, Italian, Hungarian, Latin, Swedish, Russian, Ukrainian, Bulgarian. The data come from various sources: linguistic literature (the "classics" on tense and aspect), fiction, documentary evidence. Examples appear in the original script, if necessary with transliteration, English or German gloss and translation. The examples also contain an indication of the source or a complete  denotation of the bibliographic source. Sentences are analysed according to various criteria: tense and aspect morphology, types of time adverbials, Aktionsarten. The analysis allows a specific search for similar phenomena in a variety of languages and makes the discovery of typological regularities easier.

Other (German)

Das TüTeAM-Korpus umfasst etwa 2800 Einträge aus den Sprachen Altgriechisch, Deutsch, Englisch, Italienisch, Ungarisch, Latein, Schwedisch, Russisch, Ukrainisch und Bulgarisch. Die Daten stammen aus verschiedenen Quellen,  unter anderem aus der linguistischen Literatur (die Klassiker zu den Bereichen Tempus und Aspekt). Beispiele wurden in der ursprünglichen Schrift notiert, teilweise wurden sie transliteriert, in Deutsch oder Englisch übersetzt und glossiert. Die Beispiele enthalten zusätzlich einen Hinweis auf die jeweilige Quelle oder eine vollständige Literaturangabe. Sätze werden in Bezug auf verschiedene Kriterien analysiert: Morphologie (Tempus und Aspekt), unterschiedliche Typen   temporaler Adverbiale, Aktionsarten. Die Analyse erlaubt die spezifische Suche ähnlicher Phänomene in verschiedenen Sprachen und erleichtert die Entdeckung typologischer Regularitäten.

Other (English)

Research carried out in work package B10 of the SFB 441.

Files

Restricted

The record is publicly accessible, but files are restricted to users with access.

Additional details

Funding

Deutsche Forschungsgemeinschaft
SFB 441: Linguistische Datenstrukturen: Theoretische und empirische Grundlagen der Grammatikforschung 5483349

Data quality

Accuracy

Not specified.

Completeness

Not specified.

Conformity

Not specified.

Consistency

Not specified.

Credibility

Not specified.

Processability

Not specified.

Relevance

Not specified.

Timeliness

Not specified.

Understandability

Not specified.