Back to site

CSTBank

Source: http://tangra.si.umich.edu/clair/CSTBank/



Computational Linguistics ja tiedonhaku (CLAIR)

University of Michigan

Lisätietoja antavat: 

Dragomir Radev (radev@umich.edu) tai Jahna Otterbacher (jahna@umich.edu)


Cross-asiakirjan rakenne Theory (CST)

CST on toimiva teoria usean asiakirjan diskurssin rakennetta. Sitä käytetään kuvaamaan semanttisten yhteyksien joukossa yksiköt paikallisesti niihin liittyviä asiakirjoja, kuten "parafraasi" tai "ristiriidan". Se liittyy retoriikkaa Structure Theory (RST), mutta koska se kuvaa suhteita pitää hallussaan useiden asiakirjojen sijasta koko korttelia tekstiä samassa asiakirjassa, ei ole mitään oletuksia laatijoiden aikeita luomaan yhteenkuuluvuuden teksteissä.

Cross-asiakirjan rakenne teoria Bank (CSTBank)

CSTBank on corpus asiakirjan klusterien manuaalisesti selityksineen ja CST suhteita. Se sisältää klustereita luotuja asiakirjoja eri tavoin (esim. käsin ja ryhmitellä automaattisesti asiakirjat) ja järjestää perheille, jotka kuvaavat tekstin lähteet ja klusterointia menetelmistä ryhmään asiakirjoihin niiden aiheita. Lopulta CST suhde tuomiot (sentrels) ja lause apuohjelma tuomiot (sentjudges) ovat kaikkien saatavilla klustereita CSTBank.


Tietolähteitä CSTBank

Vaihe I CSTBank - sisältää linkkejä ladattavia julkisesti saatavilla olevat tiedot

Näytteen tiedot

Taksonomia ja CST suhteet [pdf] [ps]

Lisäykset ohjeet [pdf] [ps]

Jos käytät CSTBank, Pyydetään tämä ruokalappu merkintä: CST.bib

Muut julkaisut

translated by MS
Published (Last edited): Apr 11