Verhuizing TST-materialen

Vanaf april 2016 zijn de digitale taalmaterialen van de TST-Centrale niet langer ondergebracht bij de Nederlandse Taalunie, maar bij het Instituut voor de Nederlandse Taal. Lees meer...

TST-materialen

Deze catalogus bevat bronnen, data en tools voor taalkundig onderzoek en taal- en spraaktechnologie (TST) binnen het Nederlandse taalgebied: o.a. tekstverzamelingen, woordenlijsten, wetenschappelijke woordenboeken, spraakcorpora en taal- en spraaktechnologische software.

Resultaten 25 - 48 van 108


Corpus Gysseling

Een verzameling van alle dertiende-eeuwse teksten die als bronnenmateriaal hebben gediend voor het Vroegmiddelnederlands Woordenboek.

Niet-commerciële prijs
€0,00

Corpus Hedendaags Nederlands

Een tekstverzameling van meer dan 800.000 teksten uit kranten, tijdschriften, journaaluitzendingen en juridisch materiaal (1814-2013). Het corpus is een samenvoeging van het oude 5, 27 en 38 Miljoen Woorden Corpus en het PAROLE Corpus, aangevuld met krant

Direct toegang
Zie productdetails

Corpus Middelnederlands

Corpus Middelnederlands: een verzameling van 336 Middelnederlandse literaire teksten uit de periode 1250-1500, in TEI gecodeerd (oorspronkelijk gepubliceerd op de cd-rom Middelnederlands).

Niet-commerciële prijs
€0,00

Corpus Oudnederlands

Een verzameling van al het overgebleven Nederlandse woordmateriaal uit de periode 475-1200.

Direct toegang
Zie productdetails

Corpus Pathologische en Normale Spraak (COPAS)

Een verzameling opnames van bijna 200 sprekers met een hoorbare spraakstoornis en van 122 controlesprekers.

Niet-commerciële prijs
€0,00

D-TUNA-corpus

Het D-TUNA-corpus bestaat uit 2400 geschreven en (getranscribeerde) gesproken referentiële expressies.

Niet-commerciële prijs
€0,00

DAESO-corpus: Parallelle Nederlandstalige monolinguale treebank

Een parallelle monolinguale treebank voor het Nederlands.

Niet-commerciële prijs
€0,00

DPC - Dutch Parallel Corpus (commercieel)

Een parallel corpus van 8,77 miljoen woorden voor de taalparen Nederlands-Engels en Nederlands-Frans.

Niet-commerciële prijs
€0,00

DPC - Dutch Parallel Corpus (niet-commercieel)

Een parallel corpus van 10 miljoen woorden voor de taalparen Nederlands-Engels en Nederlands-Frans.

Niet-commerciële prijs
€0,00

DuELME

Een lexicon met ruim 5.000 Nederlandstalige meerwoordexpressies.

Niet-commerciële prijs
€0,00

DuOMAn-subjectivitylexicon

Een verzameling van ongeveer 9.000 woorden waarvoor aangegeven werd of ze een negatieve, neutrale of positieve gevoelswaarde hebben.

Niet-commerciële prijs
€0,00

Dupira

Parser voor het Nederlands voor toepassingen in Information Retrieval

Niet-commerciële prijs
€0,00

e-Lex

Lexicon met ruim 200.000 lemma's en ruim 640.000 woordvormen voorzien van o.a. POS-tag, complementatiepatroon, semantisch type en uitspraakinformatie.

Niet-commerciële prijs
€0,00

Eindhoven Corpus

Een verzameling Nederlandstalige geschreven en getranscribeerde gesproken teksten uit de periode van 1960 tot 1976.

Niet-commerciële prijs
€0,00

Etymologisch Woordenboek van het Nederlands

Een wetenschappelijk etymologisch woordenboek voor het moderne bovenregionale Nederlands.

Direct toegang
Zie productdetails

Frequentielijsten Corpora

De 5000 meest voorkomende woorden uit de Miljoenencorpora, het PAROLE-corpus 2004, het CGN, het ANW-corpus, het Eindhoven Corpus, het D-Coi-corpus en het SoNaR-corpus.

Niet-commerciële prijs
€0,00

Frog

Een tokenizer, tagger, lemmatizer, morphological segmenter, shallow parser, named-entity recognizer, en dependency parser in één.

Direct toegang
Zie productdetails

IFA-corpus

Een database voor fonetisch onderzoek die bestaat uit Nederlandse spraakdata van 8 personen; 4 mannelijk en 4 vrouwelijk.

Niet-commerciële prijs
€0,00

IFA-dialoog-videocorpus

Video- en geluidsopnamen van spontane dialogen tussen proefpersonen.

Niet-commerciële prijs
€0,00

isiNdebele Custom Dictionary for Government Domain

This language resource contains an alphabetic list of words which are exclusive to the government domain or which are not part of the official orthography of isiNdebele.

Niet-commerciële prijs
€0,00

isiNdebele Genre Classification Corpus

Contains training and testing data for genre classification for isiNdebele.

Niet-commerciële prijs
€0,00

isiXhosa Custom Dictionary for Government Domain

This language resource contains an alphabetic list of words which are exclusive to the government domain or which are not part of the official orthography of isiXhosa.

Niet-commerciële prijs
€0,00

isiXhosa Genre Classification Corpus

Contains training and testing data for Genre Classification for isiXhosa.

Niet-commerciële prijs
€0,00

isiZulu Custom Dictionary for Government Domain

This language resource contains an alphabetic list of words which are exclusive to the government domain or which are not part of the official orthography of isiZulu.

Niet-commerciële prijs
€0,00