Main Content
Catalogus taalmaterialen
Deze catalogus bevat bronnen, data en tools voor taalkundig onderzoek en taal- en spraaktechnologie (TST) binnen het Nederlandse taalgebied, zoals tekstverzamelingen, woordenlijsten, wetenschappelijke woordenboeken, spraakcorpora en taal- en spraaktechnologische software.
Om taalmaterialen te kunnen downloaden moet u eerst inloggen
Nieuw
Gold Standard Parallel Corpus of Sign and spoken Language (GoSt-ParC-Sign)
GoSt-ParC-Sign is een multimodaal corpus van VGT met een vertaling in geschreven Nederlands als doeltaal. Alle VGT materiaal in dit corpus bestaat uit reeds bestaande video's die werden gemaakt door oorspronkelijke VGT sprekers voor een VGT publiek. The Gost-ParC-Sign is a multimodal corpus of VGT as source and a translation into written Dutch as target language. All VGT material included in this corpus consists of already existing VGT videos which were produced by authentic VGT signers for a signing audience.
Lees meerHotel Review Corpus in Vlaamse Gebarentaal (VGT_HoReCo)
Een multimodaal parallel corpus met de talen Nederlands en Vlaamse Gebarentaal (VGT). 297 geschreven hotelbeoordelingen werden vertaald uit het Nederlands in NGT door 6 professionele, dove vertalers. Elke beoordeling is vertaald door slechts 1 vertaler. Het aantal woorden in de beoordelingen varieerde tussen 15 en 400. De duur van de VGT-video's varieerde tussen 10 seconden tot ongeveer 4 minuten. Het resulterende corpus bevat 21.825 woorden in het Nederlands en ongeveer 4 uur aan VGT-videomateriaal. A multimodal parallel corpus of Dutch and Flemish Sign Language (VGT). 297 hotel reviews in written Dutch were translated into VGT videos by 6 professional, deaf translators. Each review was translated by only one translator. The word length of the Dutch reviews varies from around 15 to 400 words; the duration of the VGT videos ranged from around 10 seconds to around 4 minutes. The total amount of words contained in the corpus is 21,825; the VGT translations consist of about 4 hours of videos.
Lees meerMuST-Cinema-PE: post-editing in automatic subtitling
MuST-Cinema-PE is een corpus met post-editingdata van automatisch gegenereerde ondertitels. MuST-Cinema-PE is a corpus containing post-editing data of automatically-generated subtitles.
Lees meerOosterveld & Vuyk Juridisch Woordenboek Nederlands – Spaans II
Oosterveld & Vuyk Juridisch Woordenboek Nederlands – Spaans II is een digitaal, corpusgebaseerd woordenboek in wording. Oosterveld & Vuyk staat onder redactie van Consuelo Oosterveld-Egas Repáraz en mr. Theresa Munneke-Lourens, met medewerking van drs. Margriet Muris. Oosterveld & Vuyk Legal Dictionary Dutch - Spanish II is a digital corpus base dictionary in progress. Oosterveld & Vuyk is edited by Oosterveld-Egas Repáraz and mr. Theresa Munneke-Lourens, in cooperation with drs. Margriet Muris.
Lees meerHotel Review Corpus in Nederlandse Gebarentaal (NGT_HoReCo)
Een multimodaal parallel corpus met de talen Nederlands en Nederlandse Gebarentaal (NGT). 297 geschreven hotelbeoordelingen werden vertaald uit het Nederlands in NGT door 6 professionele, dove vertalers. A multimodal parallel corpus of Dutch and Sign Language of the Netherlands (NGT). 297 hotel reviews in written Dutch were translated into NGT videos by 6 professional, deaf translators.
Lees meer