Verhuizing TST-materialen

Vanaf april 2016 zijn de digitale taalmaterialen van de TST-Centrale niet langer ondergebracht bij de Nederlandse Taalunie, maar bij het Instituut voor de Nederlandse Taal. Lees meer...

Lassy Groot-corpus

Prijs per product (harddisk)€0,00
“Exclusief btw en verzend- en afhandelingskosten”
Verzend- en afhandelingskosten:
Stel een vraag over dit artikel
Preloader

Kenmerken

Aantal Woorden: 70000000
Categorie: Corpus
Annotaties:
Lemma’s , Morfologie , Part of Speech , Syntaxis
Ontwikkelaar: RuG, K.U. Leuven

Omschrijving

Het Lassy Groot-corpus is een corpus van ongeveer 700 miljoen woorden met automatisch gegenereerde syntactische annotaties. De lemma's en POS-tags werden automatisch toegevoegd aan het corpus m.b.v. Tadpole. De syntactische dependentiestructuren werden toegevoegd m.b.v. Alpino.

Specificaties

Versie 4.0
Jaar 2016
Opdrachtgever NTU|STEVIN
Financier NTU|STEVIN
Eigenaar Taalunie
Bestandsgrootte 136 GB
Dataformaat xml (compact)
Talen Nederlands
Documentatie LREC2006-artikel
TLT2009-artikel
Project LASSY: Large Scale Syntactic Annotation of written Dutch
Projectwebsite http://www.let.rug.nl/~vannoord/Lassy/
Toepassing Waardevol voor o.a. taalkundig onderzoek (bv. zinsbouw) en als referentiemateriaal bij het maken van woordenboeken of lexica.

Verzend- en afhandelingskosten

Vanwege de hoeveelheid data wordt dit product gedistribueerd op een externe harde schijf. Hier rekent het INL € 100,00 verzend- en afhandelingskosten voor.


Licentie
Niet-commercieel