SoNaR nieuw media corpus: niet-commerciele versie

N. Oostdijk, M.W.C. Reynaert, V. Hoste, H. van den Heuvel, O. de Clercq, E. Sanders

    Research output: Non-textual formData set/DatabaseOther research output

    Abstract

    Het SoNaR Nieuwe Media Corpus 1.0 bevat nieuwemediateksten die verzameld werden binnen het STEVIN-project SoNaR. Het corpus bevat sms'en, tweets en chatberichten. De teksten werden getokeniseerd, ge-POS-tagd en gelemmatiseerd.

    Daar dit product teksten bevat die afkomstig zijn uit correspondentie zoals 'tweets' die via Twitter verzameld zijn, 'chats' die via publieke internetfora verzameld zijn en sms’en die individuele personen aan licentiegever verstrekt hebben ten behoeve van dit product, dient de aanvrager extra zorgvuldig met de data om te gaan.

    Het SoNaR Nieuwe Media Corpus 1.0 maakt geen deel uit van het SoNaR Corpus 1.0 maar is als apart product beschikbaar.
    Original languageDutch
    PublisherCentrale voor Taal- en Spraaktechnologie
    Edition1
    Media of outputOnline
    Size2,6 GB
    Publication statusPublished - 17 Apr 2014

    Cite this

    Oostdijk, N. (Author), Reynaert, M. W. C. (Author), Hoste, V. (Author), van den Heuvel, H. (Author), de Clercq, O. (Author), & Sanders, E. (Author). (2014). SoNaR nieuw media corpus: niet-commerciele versie. Data set/Database, Centrale voor Taal- en Spraaktechnologie. Retrieved from http://tst-centrale.org/nl/producten/corpora/sonar-nieuwe-media-corpus/6-88
    Oostdijk, N. (Author) ; Reynaert, M.W.C. (Author) ; Hoste, V. (Author) ; van den Heuvel, H. (Author) ; de Clercq, O. (Author) ; Sanders, E. (Author). / SoNaR nieuw media corpus : niet-commerciele versie. [Data set/Database].
    @misc{ac128452d97c42908e6512a1462ba47d,
    title = "SoNaR nieuw media corpus: niet-commerciele versie",
    abstract = "Het SoNaR Nieuwe Media Corpus 1.0 bevat nieuwemediateksten die verzameld werden binnen het STEVIN-project SoNaR. Het corpus bevat sms'en, tweets en chatberichten. De teksten werden getokeniseerd, ge-POS-tagd en gelemmatiseerd.Daar dit product teksten bevat die afkomstig zijn uit correspondentie zoals 'tweets' die via Twitter verzameld zijn, 'chats' die via publieke internetfora verzameld zijn en sms’en die individuele personen aan licentiegever verstrekt hebben ten behoeve van dit product, dient de aanvrager extra zorgvuldig met de data om te gaan.Het SoNaR Nieuwe Media Corpus 1.0 maakt geen deel uit van het SoNaR Corpus 1.0 maar is als apart product beschikbaar.",
    author = "N. Oostdijk and M.W.C. Reynaert and V. Hoste and {van den Heuvel}, H. and {de Clercq}, O. and E. Sanders",
    year = "2014",
    month = "4",
    day = "17",
    language = "Dutch",
    publisher = "Centrale voor Taal- en Spraaktechnologie",
    edition = "1",

    }

    Oostdijk, N, Reynaert, MWC, Hoste, V, van den Heuvel, H, de Clercq, O & Sanders, E, SoNaR nieuw media corpus: niet-commerciele versie, 2014, Data set/Database, Centrale voor Taal- en Spraaktechnologie.
    SoNaR nieuw media corpus : niet-commerciele versie. Oostdijk, N. (Author); Reynaert, M.W.C. (Author); Hoste, V. (Author); van den Heuvel, H. (Author); de Clercq, O. (Author); Sanders, E. (Author). 2014. Centrale voor Taal- en Spraaktechnologie.

    Research output: Non-textual formData set/DatabaseOther research output

    TY - ADVS

    T1 - SoNaR nieuw media corpus

    T2 - niet-commerciele versie

    AU - Oostdijk, N.

    AU - Reynaert, M.W.C.

    AU - Hoste, V.

    AU - van den Heuvel, H.

    AU - de Clercq, O.

    AU - Sanders, E.

    PY - 2014/4/17

    Y1 - 2014/4/17

    N2 - Het SoNaR Nieuwe Media Corpus 1.0 bevat nieuwemediateksten die verzameld werden binnen het STEVIN-project SoNaR. Het corpus bevat sms'en, tweets en chatberichten. De teksten werden getokeniseerd, ge-POS-tagd en gelemmatiseerd.Daar dit product teksten bevat die afkomstig zijn uit correspondentie zoals 'tweets' die via Twitter verzameld zijn, 'chats' die via publieke internetfora verzameld zijn en sms’en die individuele personen aan licentiegever verstrekt hebben ten behoeve van dit product, dient de aanvrager extra zorgvuldig met de data om te gaan.Het SoNaR Nieuwe Media Corpus 1.0 maakt geen deel uit van het SoNaR Corpus 1.0 maar is als apart product beschikbaar.

    AB - Het SoNaR Nieuwe Media Corpus 1.0 bevat nieuwemediateksten die verzameld werden binnen het STEVIN-project SoNaR. Het corpus bevat sms'en, tweets en chatberichten. De teksten werden getokeniseerd, ge-POS-tagd en gelemmatiseerd.Daar dit product teksten bevat die afkomstig zijn uit correspondentie zoals 'tweets' die via Twitter verzameld zijn, 'chats' die via publieke internetfora verzameld zijn en sms’en die individuele personen aan licentiegever verstrekt hebben ten behoeve van dit product, dient de aanvrager extra zorgvuldig met de data om te gaan.Het SoNaR Nieuwe Media Corpus 1.0 maakt geen deel uit van het SoNaR Corpus 1.0 maar is als apart product beschikbaar.

    M3 - Data set/Database

    PB - Centrale voor Taal- en Spraaktechnologie

    ER -

    Oostdijk N (Author), Reynaert MWC (Author), Hoste V (Author), van den Heuvel H (Author), de Clercq O (Author), Sanders E (Author). SoNaR nieuw media corpus: niet-commerciele versie Centrale voor Taal- en Spraaktechnologie. 2014.