Verhuizing TST-materialen

Vanaf april 2016 zijn de digitale taalmaterialen van de TST-Centrale niet langer ondergebracht bij de Nederlandse Taalunie, maar bij het Instituut voor de Nederlandse Taal. Lees meer...

TST-materialen

Deze catalogus bevat bronnen, data en tools voor taalkundig onderzoek en taal- en spraaktechnologie (TST) binnen het Nederlandse taalgebied: o.a. tekstverzamelingen, woordenlijsten, wetenschappelijke woordenboeken, spraakcorpora en taal- en spraaktechnologische software.

Resultaten 1 - 24 van 108


Xitsonga Genre Classification Corpus

Contains training and testing data for Genre Classification for Xitsonga.

Niet-commerciële prijs
€0,00

Xitsonga Custom Dictionary for Government Domain

Custom dictionary developed in spelling checker project for the Department of Arts and Culture. Contains words exclusive to the government domain or words that are not part of the official orthography of the language.

Niet-commerciële prijs
€0,00

Woordenboek der Nederlandsche Taal

Een historisch, wetenschappelijk, beschrijvend woordenboek van het Nederlands van 1500-1976.

Direct toegang
Zie productdetails

Woordenboek der Friese Taal

Het "Wurdboek fan de Fryske taal" is een wetenschappelijk, descriptief woordenboek en bevat ongeveer 120.000 lemma's.

Direct toegang
Zie productdetails

VU-DNC-corpus

Het VU-DNC-corpus is een diachroon Nederlands krantencorpus en bestaat uit data van vijf kranten. Voor elk van de kranten is data uit twee jaren beschikbaar (1950/1951 en 2002).

Direct toegang
Zie productdetails

Vroegmiddelnederlands Woordenboek

Een wetenschappelijk woordenboek dat ruim 2.200 ambtelijke bescheiden uit de dertiende eeuw bevat.

Direct toegang
Zie productdetails

Tshivenda Genre Classification Corpus

Contains training and testing data for Genre Classification for Tshivenda.

Niet-commerciële prijs
€0,00

Tshivenda Custom Dictionary for Government Domain

Custom dictionary developed in spelling checker project for the Department of Arts and Culture. Contains words exclusive to the government domain or words that are not part of the official orthography of the language.

Niet-commerciële prijs
€0,00

SumNL-samenvattingencorpus

Het SumNL-samenvattingencorpus is gebaseerd op 30 clusters. Ieder cluster bestaat uit een onderwerp en 5-25 krantenartikelen die relevant zijn voor het onderwerp.

Niet-commerciële prijs
€0,00

Spelspiek

Interactieve online spellinghulp, benaderbaar via de browser.

Direct toegang
Zie productdetails

SoNaR-corpus

Het SoNaR-corpus bevat ruim 500 miljoen woorden en het bevat (standaard) Nederlandstalige teksten van na 1954.

Niet-commerciële prijs
€0,00

SoNaR Nieuwe Media Corpus

Het SoNaR Nieuwe Media Corpus 1.0 bevat nieuwemediateksten die verzameld werden binnen het STEVIN-project SoNaR: sms'en, tweets en chatberichten.

Niet-commerciële prijs
€0,00

SoNaR Klein-corpus commercieel

Het SoNaR Klein-corpus Commercieel bevat ongeveer 825.000 woorden tekst die semantisch geannoteerd werden.

Niet-commerciële prijs
€0,00

SoNaR Groot-corpus commercieel

Het SoNaR Groot-corpus Commercieel bevat ruim 271 miljoen woorden en het bevat (standaard) Nederlandstalige teksten van na 1954.

Niet-commerciële prijs
€0,00

Siswati Genre Classification Corpus

Contains training and testing data for Genre Classification for Siswati.

Niet-commerciële prijs
€0,00

Siswati Custom Dictionary for Government Domain

Custom dictionary developed in spelling checker project for the Department of Arts and Culture. Contains words exclusive to the government domain or words that are not part of the official orthography of the language.

Niet-commerciële prijs
€0,00

Setswana Genre Classification Corpus

Contains training and testing data for Genre Classification for Setswana.

Niet-commerciële prijs
€0,00

Setswana Custom Dictionary for Government Domain

Custom dictionary developed in spelling checker project for the Department of Arts and Culture. Contains words exclusive to the government domain or words that are not part of the official orthography of the language.

Niet-commerciële prijs
€0,00

Sesotho sa Leboa Genre Classification Corpus

Contains training and testing data for Genre Classification for Sesotho sa Leboa.

Niet-commerciële prijs
€0,00

Sesotho Genre Classification Corpus

Contains training and testing data for Genre Classification for Sesotho.

Niet-commerciële prijs
€0,00

Sesotho Custom Dictionary for Government Domain

Custom dictionary developed in spelling checker project for the Department of Arts and Culture. Contains words exclusive to the government domain or words that are not part of the official orthography of the language.

Niet-commerciële prijs
€0,00

Sepedi Custom Dictionary for Government Domain

Custom dictionary developed in spelling checker project for the Department of Arts and Culture. Contains words exclusive to the government domain or words that are not part of the official orthography of the language.

Niet-commerciële prijs
€0,00

Referentiebestand Nederlands (RBN)

Een verzameling van ongeveer 50.000 frequente Nederlandse woorden aangevuld met taalkundige informatie.

Niet-commerciële prijs
€0,00

Referentiebestand Belgisch-Nederlands (RBBN)

Een verzameling van 4.000 woorden en uitdrukkingen die typisch zijn voor het Nederlands in België.

Niet-commerciële prijs
€0,00