Verhuizing TST-materialen

Vanaf april 2016 zijn de digitale taalmaterialen van de TST-Centrale niet langer ondergebracht bij de Nederlandse Taalunie, maar bij het Instituut voor de Nederlandse Taal. Lees meer...

Autshumato English-Sesotho sa Leboa Parallel Corpora

Prijs per product (download)€0,00
“Exclusief btw en verzend- en afhandelingskosten”
Verzend- en afhandelingskosten:
Stel een vraag over dit artikel
Preloader

Kenmerken

Categorie: Corpus
Taligheid: Bilinguaal

20150804_Autshumato_English-Sesotho_sa_Leboa_Parallel_Corpora_1.0.zip

Omschrijving

English and Sepedi parallel corpora aligned on sentence level aligned on sentence level through a combination of automatic and manual alignment techniques. The parallel corpora were obtained from the SA government domain.

 

Specificaties

Versie 1
Aantal woorden Text: 44 981 sentences (tokens)
Opdrachtgever Department of Arts and Culture
Financier Department of Arts and Culture
Eigenaar North-West University , Centre for Text Technology (CTexT)
Annotaties UTF8 , Aligned , Sentence segmented
Bestandsgrootte 2.6 Mb
Controlegetal (MD5) 69d1e2cc1fb64c31bacf445976945fdb
Dataformaat text
Talen English , Sesotho sa Leboa (Sepedi)
Documentatie Readme available with download
Licentiesoort Creative Commons Attribution-NonCommercial-ShareAlike 2.5 South Africa

Licentie
CC Attribution-NC-ShareAlike 2 5 SA