Verhuizing TST-materialen

Vanaf april 2016 zijn de digitale taalmaterialen van de TST-Centrale niet langer ondergebracht bij de Nederlandse Taalunie, maar bij het Instituut voor de Nederlandse Taal. Lees meer...

Corpora

Corpora zijn verzamelingen teksten of spraakfragmenten met toegevoegde taalkundige annotaties, die gebruikt kunnen worden voor taalkundig onderzoek en taal- en spraaktechnologische toepassingen.


Resultaten 1 - 24 van 62


Afrikaans Genre Classification Corpus

This language resource contains training and testing data for genre classification for Afrikaans.

Niet-commerciële prijs
€0,00

AUTONOMATA-namencorpus

Een database van in totaal circa 5.000 voorgelezen voornamen, achternamen, straatnamen, plaatsnamen en controlewoorden.

Niet-commerciële prijs
€0,00

AUTONOMATA-POI-corpus

Het corpus is een database van 800 voorgelezen Points-Of-Interest (POI's) uit Nederland en België, bestaande uit namen van restaurants, hotels, campings, cafés etc.

Niet-commerciële prijs
€0,00

Autshumato Afrikaans-English Translation Memory

Translation memory from Afrikaans to English (EN-GB), in the government domain for use in the Autshumato ITE application.

Niet-commerciële prijs
€0,00

Autshumato English-Afrikaans Parallel Corpora

English and Afrikaans parallel corpora aligned on sentence level.

Niet-commerciële prijs
€0,00

Autshumato English-Afrikaans Translation Memory

Translation memory from English (EN-GB) to Afrikaans, in the government domain for use in the Autshumato ITE application.

Niet-commerciële prijs
€0,00

Autshumato English-isiZulu Parallel Corpora

English and isiZulu parallel corpora aligned on sentence level.

Niet-commerciële prijs
€0,00

Autshumato English-isiZulu Translation Memory

Translation memory from English (EN-GB) to isiZulu, in the government domain for use in the Autshumato ITE application.

Niet-commerciële prijs
€0,00

Autshumato English-Sesotho sa Leboa Parallel Corpora

English and Sesotho sa Leboa (Sepedi) parallel corpora aligned on sentence level.

Niet-commerciële prijs
€0,00

Autshumato isiZulu-English Translation Memory

Translation memory from IsiZulu to English (EN-GB), in the government domain for use in the Autshumato ITE application.

Niet-commerciële prijs
€0,00

Autshumato Sesotho sa Leboa-English Translation Memory

Translation memory from Sesotho sa Leboa to English (EN-GB), in the government domain for use in the Autshumato ITE application.

Niet-commerciële prijs
€0,00

BasiLex-corpus

Het BasiLex-corpus is een geannoteerde verzameling van teksten geschreven voor kinderen in de basisschoolleeftijd.

Niet-commerciële prijs
€0,00

CD-ROM Middelnederlands

Cd-rom Middelnederlands (verschenen in 1998): bevat het Middelnederlands Woordenboek, de teksten van het Corpus Gysseling en een collectie van bijna 300 rijm- en prozateksten.

Niet-commerciële prijs
€0,00

CGN-annotaties

De CGN-annotaties bevatten het volledig geannoteerde corpus in getranscribeerde vorm.

Niet-commerciële prijs
€0,00

CHOREC-spraakcorpus

Een verzameling van 130 uur voorgelezen kinderspraak.

Niet-commerciële prijs
€0,00

COREA-coreferentiecorpus

Het corpus bestaat uit Nederlandse teksten waarin coreferentierelaties systematisch gemarkeerd zijn.

Niet-commerciële prijs
€0,00

Corpus Gesproken Nederlands (CGN)

Een verzameling van ongeveer 900 uur gesproken Standaardnederlands afkomstig van Vlamingen en Nederlanders.

Niet-commerciële prijs
€0,00

Corpus Gysseling

Een verzameling van alle dertiende-eeuwse teksten die als bronnenmateriaal hebben gediend voor het Vroegmiddelnederlands Woordenboek.

Niet-commerciële prijs
€0,00

Corpus Hedendaags Nederlands

Een tekstverzameling van meer dan 800.000 teksten uit kranten, tijdschriften, journaaluitzendingen en juridisch materiaal (1814-2013). Het corpus is een samenvoeging van het oude 5, 27 en 38 Miljoen Woorden Corpus en het PAROLE Corpus, aangevuld met krant

Direct toegang
Zie productdetails

Corpus Middelnederlands

Corpus Middelnederlands: een verzameling van 336 Middelnederlandse literaire teksten uit de periode 1250-1500, in TEI gecodeerd (oorspronkelijk gepubliceerd op de cd-rom Middelnederlands).

Niet-commerciële prijs
€0,00

Corpus Oudnederlands

Een verzameling van al het overgebleven Nederlandse woordmateriaal uit de periode 475-1200.

Direct toegang
Zie productdetails

Corpus Pathologische en Normale Spraak (COPAS)

Een verzameling opnames van bijna 200 sprekers met een hoorbare spraakstoornis en van 122 controlesprekers.

Niet-commerciële prijs
€0,00

D-TUNA-corpus

Het D-TUNA-corpus bestaat uit 2400 geschreven en (getranscribeerde) gesproken referentiële expressies.

Niet-commerciële prijs
€0,00

DAESO-corpus: Parallelle Nederlandstalige monolinguale treebank

Een parallelle monolinguale treebank voor het Nederlands.

Niet-commerciële prijs
€0,00