Verhuizing TST-materialen

Vanaf april 2016 zijn de digitale taalmaterialen van de TST-Centrale niet langer ondergebracht bij de Nederlandse Taalunie, maar bij het Instituut voor de Nederlandse Taal. Lees meer...

Autshumato English-Afrikaans Parallel Corpora

Prijs per product (download)€0,00
“Exclusief btw en verzend- en afhandelingskosten”
Verzend- en afhandelingskosten:
Stel een vraag over dit artikel
Preloader

Kenmerken

Categorie: Corpus
Taligheid: Bilinguaal

20150804_Autshumato_English-Afrikaans_Parallel_Corpora_1.0.zip

Omschrijving

English and Afrikaans parallel corpora aligned on sentence level through a combination of automatic and manual alignment techniques. The parallel corpora were obtained from the SA government domain.

 

Specificaties

Versie 1
Aantal woorden Text: 421 319 sentences (tokens)
Opdrachtgever Department of Arts and Culture
Financier Department of Arts and Culture
Eigenaar North-West University , Centre for Text Technology (CTexT)
Annotaties UTF8 , Aligned , Sentence segmented
Bestandsgrootte 6.2 Mb
Controlegetal (MD5) 3535897bd8f12352ba509146750b683a
Dataformaat text
Talen Afrikaans, English
Documentatie Readme contained in download
Licentiesoort Creative Commons Attribution-NonCommercial-ShareAlike 2.5 South Africa

Licentie
CC Attribution-NC-ShareAlike 2 5 SA