Verhuizing TST-materialen

Vanaf april 2016 zijn de digitale taalmaterialen van de TST-Centrale niet langer ondergebracht bij de Nederlandse Taalunie, maar bij het Instituut voor de Nederlandse Taal. Lees meer...

COREA-coreferentiecorpus

Prijs per product (download)€0,00
“Exclusief btw en verzend- en afhandelingskosten”
Verzend- en afhandelingskosten:
Stel een vraag over dit artikel
Preloader

Kenmerken

Aantal Woorden: 150000
Categorie: Corpus
Annotaties:
Semantiek , Syntaxis

COREA_Corpus_1.0.1p1.zip

Omschrijving

Het COREA-coreferentiecorpus (circa 150.000 woorden) bestaat uit Nederlandse teksten waarin coreferentierelaties systematisch gemarkeerd zijn. De teksten bestaan uit krantenartikelen (D-Coi), getranscribeerde spraak (CGN) en lemma's uit de Spectrum (Winkler Prins) Medische Encyclopedie.

Specificaties

Versie 1.0.1
Jaar 2014
Opdrachtgever NTU|STEVIN
Financier NTU|STEVIN
Eigenaar Taalunie
Bestandsgrootte 5,2 MB
Controlegetal (MD5) 07f303d9ce689f7b67ba6ba6a645c46d
Dataformaat xml, MMAX2
Talen Nederlands
Demo Voorbeelden van gemarkeerde corpusteksten
Documentatie LREC2008-artikel
Project COREA
Projectwebsite http://www.cnts.ua.ac.be/~iris/corea.html
Toepassing Automatische tekstanalyse, automatisch samenvatten.
Commerciële licentie Informatie over prijsbeleid.

Soort licentie