Back to site

LDC Palvelut

Source: http://www.ldc.upenn.edu/About/facilities.shtml



Johdanto

Linguistic Data Consortium on omat toimistot ylimmässä kerroksessa 3600 Market Street Philadelphian University City Science Center. Kahdeksannesta kerroksesta sviitti, jossa yli 11.000 käyttökelpoinen neliömetriä, on määritetty erityisesti vähiten kehittyneiden ja 22 yhden, kahden ja kolmen hengen toimistot, suuret ja pienet kokoustilat, tallennus koppi, kohderyhmä huone ja kuudesta laboratoriosta myös erilliset Labsin Broadcast News kokoelma, osallistuja rekrytointi, kommentointi ja julkaisut sekä erityisesti varustettu tele-ja data komerot, corpus pakkaus työhuone/postituksen ja ruokakomero.

Iso kokoustila paikkaa 30 ja sisältää Windows-ja Unix työasemat, voima ja verkko menekkiä vieraille, langattoman verkon tukiasema, korkean resoluution tietokone, piirtoheitin ja iso tv kytketty yliopiston kaapeliverkkoon. Pieni kokoustila paikkaa neljä verkon myyntipisteistä vieraille.

Konsortio on myös erikoistunut palvelin alue Franklin Building liitteessä kytketty toimistoissa tarpeeton valokuitu Gigabit Ethernet-linkkiä.

[alkuun]

Tietotekniikan ja verkon infrastruktuurin

LDC IT-infrastruktuuri on laaja, itsenäinen ja sisäisesti hallinnoitu järjestelmän sisällä University of Pennsylvania tietojenkäsittely. Tämä mahdollistaa modulaarisuus ja joustavuus parhaiten vastaa tarpeita tutkimushankkeita. LDC infrastruktuuri sisältää: Seuraavassa luettelossa joitakin lisätietoja LDC-palvelimia ja IT-infrastruktuuri:

LDC ylläpitää useita järjestelmiä tukevat seuraavat toiminnot:

  • Verkko:
    • Julkinen
      • 2x24 kytkin Gigabit Ethernet-porttia
      • Optisen kuidun ja Internet
      • 1 CIDR/23 verkko (vastaa 2 C-luokan verkot)
      • Yksi CIDR/24 verkon (vastaa 1 luokka-C-)
    • Private - 264 täysin kytketty Gigabit Ethernet-porttia
    • 2 Langattomat verkot 802.11n
    • Valokuidun tärkein palvelin huone
    • Reaaliaikainen seuranta palvelin hälyttävää palvelut

    Lisäksi meillä on noin seitsemänkymmentä (70) Huomautukset/DSS työasemat eri käyttöjärjestelmiä, kuten Solaris, Windows, FreeBSD ja Linux.Kuusikymmentä näiden työpisteiden kerätään neljän yhteisen työpisteessä erikokoisia.

    [alkuun]

    Ihmisen Aiheet Tiedonkeruu Laboratories

    LDC ylläpitää tuottavat laitokset tallenteet puheen sekä paikan päällä ja puhelimitse.

    • Ensimmäinen on akustisesti hoitaa Soundboothissa. Soundbooth on tarkoitus eristää kaiuttimen vierailta melulähteitä, ovi on akustisen tiivisteen ja pudota pyyhkäisy-ja ikkuna on useita lasit. Jotta voitaisiin minimoida laitteen sijaitsevat Soundboothin, seinä-levyjen ja in-seinämän mikrofonijohdot sisällytettiin suunnittelussa. Kaikki valvontalaitteet voidaan sijoittaa ulkopuolella osastolla käyttäjänpaikka on suora kaapeliyhteys jopa neljä mikrofonia sisällä Soundboothissa.

    • LDC on kaksi toimistoa, jotka on muunnettu monikanavaisen äänen tallennus tiloissa. Vaikka mitat huoneet vaihtelevat, ulkoasu huonekaluja, mikrofonien ja valvontalaitteet on johdonmukaista kaikkialla kaksi huonetta. Koska johdonmukainen tilan suhdetta asennettu mikrofoneja, on mahdollista, että voimme tehdä tallenteita puhujat kaksi huonetta ja kontrolloi etäisyyden. Jokaisessa huoneessa voi tukea jopa kuusitoista erillistä mikrofonia, ja 16 erillistä ääniraitaa voidaan tallentaa samanaikaisesti. Jokaisessa huoneessa on moderni Digital Audio Workstation on 16 suoraa mikrofoniliitäntää, puhelin digitaalinen hybridi järjestelmä, analoginen matriisi mikseri ja räätälöityjä, pistorasia hallittavissa tallennusohjelmisto. Puhelin Digital Hybrid järjestelmiä mahdollistaa suoran yhteyden analogisen puhelinlinjan ja Digital Audio työasema, tämä on merkittävää, koska sen avulla voimme tehdä tallenteita henkilöiden päälle asennettujen mikrofonien ja puhelinlinjan samanaikaisesti. Analogiset matriisi mikserit mahdollistaa reitityksen, sekoittaminen ja uudelleenjako reaaliaikaisen puheen, tämä antaa meille mahdollisuuden välittää muutettu signaalit takaisin aiheeseen ollaan kirjattu varten vaikutuksia arvioitaessa peittää kohinaa puheen tuottaminen. Digitaalisen äänen työasemat on riittävä varastointi sijoittaa laajennettu tiedonkeruuta ja sisältää mukautettuja komentosarjoja automaattisesti siirtää tallennuksia tärkein LDC-verkon automatisoidusti.Tämän lisäksi infrastruktuurin LDC on joukko mikrofoneja kuten haulikko, paine alue, iso kalvo lauhdutin, lavalier, headmounted ja array mikrofonit.

    LDC on kolme CTI-järjestelmien nimenomaan kerätä puhetta puhelinverkossa.Jokainen järjestelmä on kytketty oma T-1 rivi, joka tarjoaa 24 äänikanavaa ja on maksuton palvelu käytössä. Järjestelmissä käytetään Dialoginen puhelin-laitteita, erikseen, kukin järjestelmä taloa Dialoginen D/480JCT-2T1 puhelinliikenteen hallitus, joka voi suorittaa Interactive Voice Response toiminnot ja puheluloki toimintoja. Lisäksi yksi järjestelmien sisältää AudioCodes DP6409 Passiiviset-Tap puheluloki aluksella. Puhelin laitteisto antaa mahdollisuuden tallentaa jopa to12 kahden hengen keskusteluja samanaikaisesti. Räätälöidyt IVR-ohjelmisto on asennettava jokaiseen järjestelmään, puhelin sovellus käsittelee yhteydenpito soittajat, yhdistää soittajat toisiinsa, ja käynnistää/pysäyttää tallennuksia. Jokainen järjestelmä sisältää joukon tukeva ohjelmisto, joka käsittelee automaattisesti siirrot tallennuksia tärkein LDC verkkoon.

     

    [alkuun]

    Broadcast Tiedonkeruu Laboratories

    LDC toimii laaja kokoelma järjestelmä omistettu talteenottoon ja käsittelyyn lähettää sisältöä useista eri lähteistä. Järjestelmä pystyy keräämään ääntä ja videota satelliitin, KTV ja off-the-air. Satelliittilähetysten vastaanottoon, mikä antaa meille mahdollisuuden käsitellä jopa kolme samanaikaista C-Band ja Ku-Band satelliitti-maayhteys sekä Dish Network ja DirecTV satelliitti-maayhteys.


    C-Band ja Ku-Band-syötteitä käytetään lähinnä DVB-S Free-To-Air ja Conditional Access International ohjelmointi Galaxy-19 ja Galaxy IIIC satelliitteja.Järjestelmä on tällä hetkellä sisältyy kaksitoista DVB-S satelliitti vastaanottimet, kaksitoista lautasen verkon vastaanottimet, yksi Scola vastaanotin ja yksi DirecTV vastaanotin. Jos Dish Network, LDC ylläpitää tilaukset laaja valikoima kansainvälisiä kanavia. Signaalin vastaanotto-osa keräysjärjestelmän sisältää myös kaksi ATSC vastaanottimien ja kuusi CATV demodulaattorit, jotka kaikki ovat tietokoneen hallittavissa. Nämä virittimet ovat sitoutuneet paikalliseen Englanti ohjelmointi Kaakkois Pennsylvaniassa lähetyksen alueella.


    Tämä laaja valikoima signaalin vastaanoton laitteiden syöttää tietokoneella ohjattavan Audio/Video Matrix-kytkimen, joka voi reitittää sisältöä mistä tahansa vastaanottimesta videomonitoreja, suljettu kuvateksti dekooderit, ja Recnode klusterin. Recnode cluster on yhdestä kahdeksan Linux tietokoneita, joista jokainen voi tallentaa kaksi samanaikaista audio/video-virtoja. AV-virrat ovat kiinni kuten DV25 yhdessä suljetun kuvatekstit ja ne prosessoidaan sitten purkaa audio-ja puristetaan MPEG-4. Kaikkiaan Recnode klusteri voi kirjautua kuusitoista samanaikaisesti audio/video purojen ja voi käsitellä jopa 192 tuntia sisältöä päivässä.


    Kaikki kokoelma toimintaa ohjaa valvoja tietokoneen räätälöityjä aikataulut tietokantaan. Ohjaaja Tietokoneen tehtävänä on valvoa vastaanottimien, audio video matriisi reititys ja tallennus työ alustus. Järjestelmä sisältää myös kahdeksan TB paikallisen varastoinnin, omistettu automaattinen puheentunnistuksen järjestelmiä, on omistettu multimedia muuntamiseen järjestelmissä, 24TB LTO4 nauha-järjestelmässä, ja kaksi kokeelliset kirjaus, joita voidaan käyttää kuvaamaan koko transponderin kuljetuksen virtojen satelliitista maayhteys. Broadcast Collection järjestelmä on suunniteltu erittäin modulaarinen, erittäin luotettava ja täysin automaattinen

    [alkuun]

    Palveluja Off-Site Broadcast Collection

    Lisäksi ensisijaisen lähettää keräysjärjestelmä, LDC on myös otettu käyttöön kaksi kannettavaa lähetystä kokoelma alustoja ulkopuolella Yhdysvalloissa. UN-alusta on TiVo tyyli digitaalinen video (DVR)-järjestelmä, jolla voi kuvata kahdeksi virraksi on/V materiaalia samanaikaisesti. Alusta sisältää integroidun analogisen KTV (NTSC ja PAL) sekä digitaaliset satelliitti DVB-S vastaanoton osia, se tukee kansainväliset vaatimukset ja pystyy äänittämään ohjelmoinnin ulkopuolella Yhdysvalloissa. Järjestelmä on hyvin pienikokoinen ja sopii kuljetukseen kuin pala käsimatkatavarana.

    Kannettava alusta ja tärkein LDC keräysjärjestelmään jakavat saman koodin pohjalta ja luottaa modulaarinen, yhtenäinen laitteisto erittely. Parannukset pääasiassa kokoelma alustan siis kääntää hyötyä molemmille alustoille.Kannettava järjestelmä toimii Ubuntu Linux käyttäen WinTV-PVR-500 analoginen kaapeli ja Technotrend Premium S-2300 PCI DVB-S vastaanotin DVB satelliitin vastaanottoon. dvbstream hyödynnetään satelliitti-tallennus, ja ivtv käytetään kaapelin tallennuksen.

    Kannettava alusta käyttöön Hong Kong on nykyään omistautunut kerätä useita koituvia CCTV ohjelmointi ja ylläpitää paikallista tekninen henkilöstö. Alusta käyttöön Pohjois-Afrikassa ylläpitää etänä henkilöstön LDC. Tallenteet on suunniteltu vuodesta LDC automaattisesti ladataan LDC kokoelmista palvelimelle. Kussakin tapauksessa LDC voi koota korkealaatuisen lähettää dataa minimaalinen laitteita ja kun tiedot on kerätty pohjoisafrikkalaisia, vastaanottaa että data välittömästi.

    [alkuun]

    Julkaisut laboratorio

    LDC Julkaisut Konsernilla on vahva tuotantokapasiteetti ja voi tuottaa julkaisuja eri materiaaleille. LDC: n julkaisu Laboratory on varustettu kahdella Rimage CD/DVD kopiokoneet ja OmniClone kiintolevyn replicator. CD/DVD kopiokoneet on kapasiteettia kaksisataa levyjä ja tulostaa värillisiä tarroja korkean resoluution grafiikkaa aivan levyn edessä. Kun lisätään Blu-Ray DVD kopiokone, LDC voivat nyt hyödyntää suuren kapasiteetin optisen median, joka mahdollistaa DVD-versioiden jopa 50 Gb kooltaan yhdellä levyllä. Suuria tietomääriä voidaan myös tuottanut span levyjä. Jokainen levy sisältää asennus komentosarjan koota osiin.

    Julkaisut käyttää JOT Varaston järjestelmään web-käyttöliittymän kautta tarjoamaan nopeaa ja reagoiva täyttää tilauksia. LDC voivat myös tuottaa hyvin suuria julkaisuja kiintolevyiltä, ​​jotka tuottavat jopa viisitoista kappaletta kerralla.Kovalevy replicator voi myös tehdä vianmäärityksen, poistaa arkaluonteisia tietoja asemista irtotavarana sekä korjaus huono kiintolevyille. Näin Julkaisut konserni säilyttää altaita uudelleenkäytettävien kiintolevyä tiettyihin hankkeisiin.Kaikki järjestelmät käyttävät laitteet ja ohjelmistot varmistaaksemme luotettavuuden ja laadun kaikki tiedotteet.

    [alkuun]

    Software Development Infrastruktuuri

     

    LDC: n tekninen henkilökunta on kehittynyt paljon räätälöityjä ohjelmistoja tiedonkeruu, tietojenkäsittely, manuaalinen merkintään tekstin, äänen, kuvan ja videon tiedot (esim. kääntäminen, käännös, nimeltään kokonaisuus kommentointi, suhde huomautus), merkintä työnkulun hallinta, Tekstin indeksointi ja haku, automaattinen merkintä (esim. kielen tunnistaminen, sisältö päällekkäiset tunnistaminen, segmentointi, Saneistus, koodaus, morfologinen analyysi), ja laadunvalvonta. Nämä ohjelmistot resurssit ovat käyttövalmista vastaaviin tulevaisuudessa tehtävissä. Erityisesti osa näistä resursseista, kuten AGBK, ovat osa-suuntautunut ja on erityisesti suunniteltu uudelleen erilaisissa sovelluksissa. LDC on kokemusta myös käyttämällä erilaisia ​​kolmannen osapuolen ohjelmistojen tutkimus, tiedon tuotantoa ja ohjelmistokehitystä. Kaikki nämä ohjelmistot resurssit ovat käytettävissä mistä tahansa meidän keskitetysti hallittavien Linux-ja FreeBSD työasemia NFS tiedosto määriä. Äskettäin kehitetty sovellus voidaan välittömästi käyttöön tiedonkeruun ja annotation tehtävät LDC henkilökunnan jäsentä.

    LDC: n ohjelmistokehittäjille on varustettu työpöytä kehityksen työasemiin, laskennallinen palvelimet, relaatiotietokannan palvelimet, www-palvelimet, ohjelmistokehityksen resursseja (esim. erilaiset kääntäjät, tulkit, debuggereita, tekstieditorit, GUI-rakentajia, IDE, tarkistus ohjausjärjestelmät), kysymys-ja seurantajärjestelmät, e-mail keskustelulistoja, wiki-pohjainen tietopohja ja muut asiakirjat.

    [alkuun]


  • translated by MS
    Published (Last edited): Apr 11