Verhuizing TST-materialen

Vanaf april 2016 zijn de digitale taalmaterialen van de TST-Centrale niet langer ondergebracht bij de Nederlandse Taalunie, maar bij het Instituut voor de Nederlandse Taal. Lees meer...

TST-materialen

Deze catalogus bevat bronnen, data en tools voor taalkundig onderzoek en taal- en spraaktechnologie (TST) binnen het Nederlandse taalgebied: o.a. tekstverzamelingen, woordenlijsten, wetenschappelijke woordenboeken, spraakcorpora en taal- en spraaktechnologische software.

Resultaten 1 - 24 van 108


Woordenboek der Nederlandsche Taal

Een historisch, wetenschappelijk, beschrijvend woordenboek van het Nederlands van 1500-1976.

Direct toegang
Zie productdetails

Neologismen Online v3

Lijst met ca. 19.000 nieuwe Nederlandse woorden en uitdrukkingen.

Direct toegang
Zie productdetails

Corpus Oudnederlands

Een verzameling van al het overgebleven Nederlandse woordmateriaal uit de periode 475-1200.

Direct toegang
Zie productdetails

COREA-coreferentieservice

Een systeem dat automatisch coreferentiële relaties tussen nominale constituenten in teksten op kan lossen.

Direct toegang
Zie productdetails

Frog

Een tokenizer, tagger, lemmatizer, morphological segmenter, shallow parser, named-entity recognizer, en dependency parser in één.

Direct toegang
Zie productdetails

Oudnederlands Woordenboek

Een wetenschappelijk woordenboek van het oudste Nederlands.

Direct toegang
Zie productdetails

Vroegmiddelnederlands Woordenboek

Een wetenschappelijk woordenboek dat ruim 2.200 ambtelijke bescheiden uit de dertiende eeuw bevat.

Direct toegang
Zie productdetails

Algemeen Nederlands Woordenboek

Een corpusgebaseerd, elektronisch woordenboek van het eigentijdse Nederlands in Nederland en Vlaanderen.

Direct toegang
Zie productdetails

Woordenboek der Friese Taal

Het "Wurdboek fan de Fryske taal" is een wetenschappelijk, descriptief woordenboek en bevat ongeveer 120.000 lemma's.

Direct toegang
Zie productdetails

Spelspiek

Interactieve online spellinghulp, benaderbaar via de browser.

Direct toegang
Zie productdetails

Etymologisch Woordenboek van het Nederlands

Een wetenschappelijk etymologisch woordenboek voor het moderne bovenregionale Nederlands.

Direct toegang
Zie productdetails

Middelnederlandsch Woordenboek

Het Middelnederlandsch Woordenboek beschrijft de Nederlandse woordenschat uit de periode ca. 1250 tot ca. 1550.

Direct toegang
Zie productdetails

VU-DNC-corpus

Het VU-DNC-corpus is een diachroon Nederlands krantencorpus en bestaat uit data van vijf kranten. Voor elk van de kranten is data uit twee jaren beschikbaar (1950/1951 en 2002).

Direct toegang
Zie productdetails

Open Source Dutch Wordnet

Open Source Dutch Wordnet is een lexicale database voor het Nederlands en bevat 116.992 synsets.

Direct toegang
Zie productdetails

Corpus Hedendaags Nederlands

Een tekstverzameling van meer dan 800.000 teksten uit kranten, tijdschriften, journaaluitzendingen en juridisch materiaal (1814-2013). Het corpus is een samenvoeging van het oude 5, 27 en 38 Miljoen Woorden Corpus en het PAROLE Corpus, aangevuld met krant

Direct toegang
Zie productdetails

Lwazi Siswati ASR corpus

Complete audio recordings and orthographic transcriptions used for Lwazi speech recognition systems.

Direct toegang
Zie productdetails

AUTONOMATA-namencorpus

Een database van in totaal circa 5.000 voorgelezen voornamen, achternamen, straatnamen, plaatsnamen en controlewoorden.

Niet-commerciële prijs
€0,00

Corpus Gesproken Nederlands (CGN)

Een verzameling van ongeveer 900 uur gesproken Standaardnederlands afkomstig van Vlamingen en Nederlanders.

Niet-commerciële prijs
€0,00

Referentiebestand Nederlands (RBN)

Een verzameling van ongeveer 50.000 frequente Nederlandse woorden aangevuld met taalkundige informatie.

Niet-commerciële prijs
€0,00

Referentiebestand Belgisch-Nederlands (RBBN)

Een verzameling van 4.000 woorden en uitdrukkingen die typisch zijn voor het Nederlands in België.

Niet-commerciële prijs
€0,00

AUTONOMATA-POI-demo

Een demo van een spraakherkenner voor POIs (Points of Interest). Deze demo herkent overnachtingsadressen en eetgelegenheden in enkele grote steden (o.a. Amsterdam, Antwerpen, Gent, Rotterdam).

Niet-commerciële prijs
€0,00

e-Lex

Lexicon met ruim 200.000 lemma's en ruim 640.000 woordvormen voorzien van o.a. POS-tag, complementatiepatroon, semantisch type en uitspraakinformatie.

Niet-commerciële prijs
€0,00

Eindhoven Corpus

Een verzameling Nederlandstalige geschreven en getranscribeerde gesproken teksten uit de periode van 1960 tot 1976.

Niet-commerciële prijs
€0,00

CGN-annotaties

De CGN-annotaties bevatten het volledig geannoteerde corpus in getranscribeerde vorm.

Niet-commerciële prijs
€0,00