Back to site

Large Hadron Collider kuin Massive Grid Computer

Source: http://news.oreilly.com/2008/06/large-hadron-collider-as-a-mas.html




Kun Timothy M. O'Brien
26 kesäkuu 2008 

 


Compact Muon Solenoid CERNin LHC

Tämä artikkeli on julkaistu yhdessä 45 minuutin haastattelussa Brian Cox, joka työskentelee CERNissä on Atlas ja CMS kokeiluja.Voit kuunnella haastattelun, klikkaa tästä.

Osa O'Reilly News tehtävänä on kaivaa syvemmälle tarinoita Large Hadron Collider (LHC) on CERNin ja saada konkreettisemman tunteen tekniikan takana tarina. Kaikki tuntuvat tietävän, mitä LHC on ja että sitä aiotaan kytkeä päälle myöhemmin tänä vuonna, ja monet meistä katseli hämmästyttävän esityksen Brian Cox TED 2008. Silti, suurin osa tiedoista löydät tietoa koe on tislattu kulutukseen yleisön. Voit käyttää antropologian termi se on fetishized. Kaikki "tietää" että LHC tulee vastata ikivanhat mysteereistä rakenne asiasta ja aika-avaruuden, mutta harvoilla on käsitys konkreettisia kokeiluja ja esoteerinen tiede jälkeen yleisestä-yleisö uutisia. Kun NPR tai verkon uutisia raportit hiukkaskiihdytin se raportoi sen lähes uskonnollinen esine - se on kunnioitusta herättävä "magic". Halusimme yrittää kattaa tämän tarinan tekniikan näkökulmasta, tekemään konkreettisempaa ja teknisen yleisölle, ja niin tehdessään, paljastaa muutamia mielenkiintoisia tarinoita muut uutislähteet voinut hukata.Tiesitkö, että pääanalyysi käytettyyn CERNissä on vapaasti käytettävissä, yli 10 vuotta vanhoja, ja joita LGPL-lisenssin? Tiedätkö kuinka monta prosessoria tee sitten 1 MSI2K? Mitä teet, kun kokeilu tuottaa 2 Gt kymmenen sekunnin välein?

1. Large Hadron Collider: Computing laajamittaisesta

CERN on jo osoittanut kykyä vaikuttaa dramaattisesti computing - World Wide Web on luonut Tim Berners-Lee (ja Robert Cailliau) tukea edellyttämät asiakirjat CERNin toimintaan. Kuten näet tässä artikkelissa, tietojenkäsittelyä vaatimukset ATLAS-ja CMS-kokeiden CERNin LHC työntää kirjekuoren nykyajan tietotekniikka ja voima tutkijat ja insinöörit luoda uusia ohjelmistoja ja hardward käsitellä ainutlaatuisia vaatimuksia kärjessä tiedettä. On saatavuuden ja verkon suunnittelu haasteeseen kääpiöt mitä tulet koskaan työtä, ja on ihmisiä työskentelee järjestelmissä asteikolla tuttu vain ihmisiä, jotka sattuvat työskentelemään Google (tai salainen luoliin National Security Agency). On epäilemättä muita tahattomia seurauksia järjestelmiä, jotka piakkoin päälle koska suurin tieteellinen koe historiassa on päällä.

Kun LHC on päällä, se on enemmän kuin 27 km leveä hiukkaskiihdytin haudattu 100m syvälle Genevessä törmätä protoneja. Kun LHC on käynnissä se törmätä miljoonia protonien sekunnissa, ja tämä kaikki tiedot on kiinni ja käsitellä maailmanlaajuinen verkkoon tietokoneen resursseja.Korjaus, jonka massiivisesti kunnioitusta herättävä ja mielen-tyrmistyttävällä laaja valikoima laskentaresurssien ryhmitelty eri tasoilla niin suuri, että se mitataan yksiköissä kuten petatavua ja MSI2K.

1,1 Tier-0: Geneve

Ilmaisimet Compact Muon Solenoid (CMS) ovat riittävän herkkiä kaapata pienimmätkin osa-atomi hiukkaset. Ilmaisimet poimii tahansa 2-30 protoni-protoni vuorovaikutukset per tapahtuma tilannekuva, ja ne tuottavat tahansa 100-200 tapahtumaa tilannekuvia sekunnissa. Ilmaisin voidaan luoda 2 gigatavua dataa 10 sekunnin välein tallennetaan ns Tier-0 datakeskuksen Genevessä. Tier-0 konesali aikoo tehdä raskaita käyttää nauhaa ja yksi dia kansi vuodelta 2005 todetaan, että Tier-0 konesali on 0,5 PB levyä, CPU kapasiteetti 4,6 MSI2K ja WAN joiden tilavuus on suurempi kuin 5 Gbps. Kun tiedot kerätään se virtasi seitsemän Tier-1 datakeskuksia, jotka ottavat paljon vastuuta ylläpitää tietoja.

Mitä MSI2K seisomaan? "Mega SPECint 2000". SPECint 2000 on yleinen käytäntö voiman CPU.Jotta perusteellisen selvityksen katso Wikipediasta. Jos oletamme 2 x 3,0 GHz Xeon-suoritin on 2,3 KSI2K, se veisi noin 430 niistä prosessorien ja vastaa 1 MSI2K. 4,6 MSI2K aikoo ottaa tuhansien prosessorien omistettu tiedon louhinta ja analysointi.

1,2 Tier-1: Fermilab (US), RAL (Yhdistynyt kuningaskunta), GridKa, toiset

Tämä raaka-data on sitten analysoida esille erilaisia ​​hiukkasia ja "suuttimet" (luokkaa hiukkasista, jotka liittyvät vuorovaikutus). Kun raaka-data analysoidaan ja rekonstruoidaan se on sitten arkistoitu Tier-1 datakeskuksia, jotka jaetaan ympäri maailmaa (esim. Fermilab Chicago).CMS TWiki Sivu-Tier-1 Data Center sanoo, että vuosittaisesta tarpeesta Tier-1 konesali on 2,2 petatavua tallennustilaa (kyllä, petatavua) ja jokainen Tier-1-tietokeskus on voitava noin käsittelemään 200 MB/s Tier-0 (Geneve), joka toimii, on jotain 2,5 Gbps kiinteisiin linjoihin käytetään vain for LHC koetulokset (joidenkin asiakirjojen mukaan Tier-1 konesali on> 10 Gbps sillä on myös tukea yhteyksiä useisiin Tier-2 datakeskuksia). Tier-1 konesali on myös omistaa noin 2,5 MSI2K (~ 1000 high-end CPU) ja tietojen analysointi ja louhinta tietojenkäsittely vaivaa ja ylläpitää 1,2 petatavua levyä ja 2,8 petatavua tallennustarvikkeet. Näyttää siltä, ​​Tier-1 konesaleihin tulevat toimimaan arkiston ja keskeinen yhteistyö navat vieläkin enemmän Tier-2 konesaleihin.

2,5 Gbps Atlantin yli? En voi edes Comcast tulemaan korjata murtuneen kaapelimodeemiin. Miten tämä menee töihin? on projekti nimeltä DataTAG jonka tavoitteena on luoda kehittyneitä, korkean suorituskyvyn data yhteys tutkimukseen EU: n ja USA. Osallistuvat organisaatiot ovat laboratoriot, yliopistot ja verkostojen, kuten Internet2 joka tarjoaa jo 10 gigabitin verkkoyhteyksiä tutkimus yliopistojen ja järjestöjen kanssa.

1,3 Tier-2 Data Centers

Mukaan äskettäin uutiskirjeen Fermilab on yli sata Tier-2 konesaleihin. Kun vihdoin kuulla jokin valtava läpimurto hiukkasfysiikan se, että joku juoksi analyysi Tier-2 datakeskuksen analysoitu miljoonia (tai jopa miljardeja) partikkelien vuorovaikutus ja yksilöinyt joitakin tapahtumia, jotka sopivat teoria tai malli. Tier-2 konesali tarvitsee ainakin pari sataa teratavua, vain ujo 1 MSI2K, ja jotain 500 Mbps jatkuvaa toimien tukemiseen.

1.4 Useimmat Distributed Scientific Computing System koskaan

Kun kuulet, että he ovat vihdoin kääntää kytkimen, sinulla on idea siitä, raskas laskenta, mitä tapahtuu joka ikinen sekunti. Tämä ei ole vain 27 kilometrin lenkki Genevessä Smashing protoneja yhdessä, tämä on kaikkein monimutkaisin tieteellinen laskenta järjestelmän mennessä.Lisätietoja CMS Computing malliin CMS Computing malli on CMS TWiki.

2. Mitä näistä tiedoista?

Olemme keskustelleet arkkitehtuuri ja organisaatio tietokoneen resursseja, entä tiedot on tallennettu ja analysoitu. Saat vihjeitä tietojen muodon ja tallennusvälineen voimme katsoa web antaa meille vihjeitä. Löysin seuraavan talk nimeltään CMS AOD-malli esittelee maaliskuussa 2007. Tässä puhe, Lista disusses CMS Event Data Model (EDM), jossa puhutaan pääsy tietoja CMS Event. Tässä esityksessä näet joitakin teknisiä yksityiskohtia. On dia neljä, näet ilmoitus Tapahtumat kirjoitetaan allas juuresta kuin teknologisista.

Näyttää siltä, ​​että Pool ROOT ovat kaksi mukautettuja hankkeita CMS (Compact Muon Solenoid) projekti LHC. Se myös näyttää monia näistä hankkeista ovat avointa lähdekoodia ja vapaasti käytettävissä.

2.1 Seuranta Down Pool ROOT

Nopea Google-haku "LHC POOL root" tuo esiin useita viittauksia joista yksi on julkaistussa IEEE Transactions on Nuclear Science. Tyypillistä useimmille LHC liittyviä papereita vertaisarviointi lehdissä, tässä asiakirjassa on enemmän kuin kymmenen tekijöitä. Chytracek, et ai. Paperi on nimeltään "POOL kehittäminen ja tuotanto Experience", ja tämän kolmen vuoden vanha paperi on seuraava tiivistelmä:

Pool jatkuvasti objektien LHC (POOL) projekti, osa Large Hadron Collider (LHC) tietojenkäsittely grid (LCG), on tulossa kolmannen vuoden aktiivisen kehitystyön. POOL tarjoaa perustason pysyvyyden puitteet kolme LHC-kokeissa. Se perustuu tiukkaa komponentin, eristys kokeilla ohjelmiston eri varastoinnin teknologiat. Tässä asiakirjassa esitetään lyhyt katsaus POOL arkkitehtuurin tärkeimmät suunnitteluperiaatteet ja saadut kokemukset integroitumista LHC-kokeessa puitteissa.Lisäksi esitellään viimeaikaista kehitystä POOL toimii alueet relaatiotietokanta vedenotto ja esine tallennuskapasiteetin relaatiotietokantojen hallintajärjestelmiä (RDBMS) järjestelmiin.

Valitse POOL hankkeen sivustolla voit hakea aiemman version samalle paperille. Joka sisältää seuraavat ote:

Tärkein kehitysaskel ponnistelut POOL joukkue tällä hetkellä kohdistettava määrittelyä ja täytäntöönpanoa tekniikoihin mekanismi saatavuuden relaatiotietokantojen. Eräs lopullisiin tavoitteisiin tämän uuden kehittämislinjaa on laajentaminen esineen varastoinnin ominaisuuksia altaan voidakseen käyttää relaatiotietokantaan tekniikoita, täydentäen käyttö olemassa esineen streaming tekniikkaa.

2,2 POOL: ORM kokeellisen tietoa ja analyyseja

POOL hankkeen kotisivuilta CERNissä mukaan POOL sanoista "Poolin Pysyvät Objects for LHC", ja se näyttää olevan tapa sarjanumeroinnissa/deserialize esineitä eri relaatiotietokantojen. Se näyttää olevan verrattavissa jotain Hibernate tai ActiveRecord, ja se on integroitu muutamia kokeiluja CERNissä kuten CMS-ja ATLAS kaksi suurta ilmaisinta mukana LHC. Allas on kirjoitettu C++.

Selaaminen CVS pool huomaat että on olemassa "kuvastot" MySQL, Oracle, PyFile, XML. Siellä on muutamia koodi: TinyEventWriter.cpp näyttää keinotekoinen esimerkki, mutta se näyttäisi olevan jonkinlainen malli järjestelmiä, jotka on kirjattava tuotoksen kalorimetrillä.

Valitse CMS Computing malli, joka oli kirjoitettu vuonna 2004, ja jotkut PDF diat ROOT hankkeen kotisivuilta CERNissä sanoo, että root on "Object-Oriented Data Analysis Framework", enkä usko et voi saada enempää vauge ja muiden -erityinen kuin kuvauksen näin.Se kuulu LGPL v2.1 lisenssin. Jos katsomaan Johdanto juuren käyttäjän opas, löydät seuraavat (suora lainaus) "Root on oliopohjaisia ​​pyritään ratkaisemaan analysointi haasteista korkean energian fysiikka.". Löydät myös tämä käyttöön juuresta kuin kymmenen vuotta vanha pala avoimen lähdekoodin ohjelmisto on suunniteltu vastaamaan haasteisiin teratavu mittakaavan data-analyysi kehitettiin "Bazaar style".


Vuonna 1990-luvun puolivälissä René Brun ja Fons Rademakers oli vuosien kokemus kehittää vuorovaikutteisia työkaluja ja simulointi paketteja. Heillä oli johtanut onnistuneita hankkeita, kuten tassu, Piaf, ja GEANT, ja he tiesivät kaksikymmentä vuotta vanha FORTRAN kirjastot olivat saavuttaneet rajansa. Vaikka edelleen erittäin suosittuja, näitä välineitä ei skaalautuu jopa haasteiden tarjoamat Large Hadron Collider, jossa data on pari kertaluokkaa suurempia kuin mitään ennen nähty.

... ROOT kehitettiin osana NA49 kokeessa CERNissä. NA49 on tuottanut vaikuttavan 
tiedon määrä, noin 10 teratavua kohden aikavälillä. Tämä korko edellyttäen ihanteellisen ympäristön kehittää ja testata seuraavan sukupolven data analyysi...

Ei voi mainita ROOT mainitsematta CINT, sen C++-tulkki. CINT loi Masa Goto vuonna 
Japanissa. Se on itsenäinen tuote, joka ROOT käyttämänsä komentorivin ja script-prosessori. 
ROOT oli ja on edelleen kehitetty "Bazaar style", termi kirjasta "katedraali ja basaari", Eric S. Raymond. Se tarkoittaa liberaali, epävirallinen kehitys tyyli tukeuduttava vahvasti monipuolista ja syvää lahjakkuutta käyttäjäyhteisön. Tuloksena on, että fyysikot kehitetty ROOT itselleen, mikä teki siitä erityisen, asianmukaisia, hyödyllisiä ja ajan hienostunut ja erittäin tehokas. Kehittäminen Root on jatkuva keskustelun käyttäjien välillä ja kehittäjien kanssa linja kahden samentuminen kertaa ja käyttäjät tulee yhteistyössä kehittäjille.

Kun se tulee tallentaa ja kaivostoiminnan suuri määrä dataa, fysiikan kyntää tavalla sen teratavua, mutta muilla aloilla ja teollisuudessa seurata perässä, koska ne hankkimalla enemmän tietoa ajan. He ovat valmiita käyttämään tosi ja testattuja tekniikoita fysiikka on keksitty. Tällä tavoin muut kentät ja teollisuudessa on havaittu root käyttökelpoisia, ja ne ovat alkaneet käyttää myös.

Yhteenvetona, ROOT näyttää analyysin puitteisiin tiettyjä High Energy Physics, jonka avulla fyysikot kirjoittaa yksinkertaisia ​​makroja tehdä asioita kuten Piirrä Feynmanin Diagram (Mitä Feynmanin diagrammi? Katso Wikipedia.) Sitä voidaan käyttää myös kirjoittaa analyysiohjelma joka "etsii näkymättömiä Higgsin bosoni". Syntaksi root makro on C++, ja näyttää siltä, ​​että voit käyttää juuri niinkuin interaktiivinen kuori tai voit suorittaa makroja.

2,4 CMS Wiki: tietomuodot

CMS TWiki esimerkiksi on runsaasti tietoa kokeilun ja linkkejä kaikkiin mahdollisiin tieto sinua halua tietää tätä kokeilua. On sivu, joka sisältää tietoa ja yleiskuvaus eri muodoissa tietoa:tietomuodoille Workbook. Tämän sivun DAQ-RAW data jalostetaan RECO tiedot ja AOD tietoja, jotka sisältävät tietoja erityisvaatimusten hiukkasia. Alkaen lyhyttä haastattelu Brian Cox (ks. seuraava artikkelissa), on olemassa useita analysointiohjelmistoihin kirjoitettu sekä C++: n ja Fortran, jotka on sovellettu Tätä raaka ja RECO data tunnistamiseksi hiukkasia ja suuttimet, jotka johtuvat vuorovaikutuksesta hiukkasia.

Kun tiedot on analysoitu, on arkistoitu ja tutkijat käyttävät resursseja massiivinen, maailmanlaajuinen computing grid liittyy LHC tunnistaa suuntauksia ja ehdokasmaiden vuorovaikutusta.

3. Johtopäätös

Vaikka suurin osa ihmisistä lukee tämän artikkelin aio mennä ulos ja alkaa KTJet++ on usean teratavun kokoelma kokeelliset tiedot, sinulla on parempi yleinen käsitys paljon laskentatehoa, että istuu takana kokeilu, kuten Large Hadron Collider. Olen päässyt pois vaikutelman, että vaikka tekniikka katso.alla.oleva.herkkyyskaavio.Käytännön ja Collider itsessään on tärkeää, tietojenkäsittely on keskeinen rooli onnistumisen kokeen. Tässä haastattelussa, että seuraa tämän artikkelin, Brian Cox vertaa LHC on CPU wth kellotaajuus on 40 MHz. Koska mitä olemme oppineet tässä artikkelissa, olin soittaa Collider CPU massiivisesti yhteistyöhön, maailmanlaajuinen grid-infrastruktuurin.

Tim: Aion mennä muistiin heti ja ennustaa, että tämä asia tulee kertoa meille, että olemme tienneet vastauksen koko ajan. 42.

Kuva: Kuva on Compact Muon solenoidi kuva Flickr kuulu Creative Commons Nimeä-Ei Johdannaissopimukset 2,0 lisenssiä. Se otti käyttäjä cyclequark, erittäin lahjakas valokuvaaja ja omistaja erittäin mielenkiintoinen tekniikka blogi.

translated by OL
Published (Last edited): Apr 11