Posts tagged: replikacija

Urad Grid Computing uporabo virtualnih okolij - 4. del

Z in petek 4 december 2009 23:59

Predstavitev

Delam v podjetju, kjer deluje veliko delovnih mest paketno obdelavo milijone zapisov podatkov vsak dan in sem pred kratkim razmišljal o vseh naprav, ki sedijo okrog vsak dan nič ne delaš več ur. Ali ne bi bilo dobro, če bi lahko uporaba teh strojev za okrepitev procesorske moči naših sistemov? V tem sklopu člankov bom pogled na možne koristi zaposlovanja za pisarniško omrežje z uporabo virtualiziranih okolij.

V delu 3 smo ustvarili svoj ​​virtualni stroj za obdelavo in vzpostaviti stroji okna, da postane idle delovnim časom.

Nameščeno najnovejšo kodo

Neizogibno po ustvarjanju svoje delavce poslovno logiko bo spremenilo, bo mogoče najti hrošči bodo hitreje bolj učinkovito kodo proizvaja in tako ostane vaši delavci sedeli okoli obdelave podatkov z uporabo starega smrdljiv kodo . Kako potem ne bomo zagotovili, da smo vedno z najnovejšo in najboljšo različico naših obdelavo skript?

Obstaja nekaj zelo preprostih preprostih načinov, kar lahko storimo to, trik pa je zmanjšati procesorske moči in omrežnega prometa pri doseganju teh ciljev. Začnimo z najbolj enostavna rešitev in jo izboljšati počasi nekaj ponovitev.

Prvi način bi bil, da preprosto povezati na naš strežnik delovnih nadzor (prek sambe, FTP, ali podobno) in podirajo najnovejšo različico kode. Ni zelo učinkovito, vendar pa bo to delo. Omogoča izboljšanje na tem nekako, kaj pa ustvarja rsync scenarij in uporabo tega vsakič, namesto tega? Druga možnost je, kaj pa polaganje naše najnovejše obdelavo skript v Subversion preverjanje ven kodo na začetku in potem samo posodobiti našo kodo na vsaki vožnji ( svn update )?

Na koncu bi lahko na koncu z skripto (bash razpiše cron vsakih 10 minut), ki je videti tako enostavno, kot je ta:

  #! / Bin / sh
 če ps ax | grep-v grep | grep php > / dev / null
 Nato
     echo "Job trenutno obdelave, izhoda"
 drugega
     echo "Job se ne izvaja, začeti zdaj"
     cd / pot / do / delovne / kopije
     svn update
     php yourJobProcessingScript.php
 povezava 

Sedaj smo lahko prepričani, da se z vsako vožnjo bomo zagotovo teče zadnji kodo. Mi smo to zagotavlja s posodobitvijo našo kodo dale vsakič opravimo vožnjo in zmanjšanje omrežnega prometa, ki jih le prenos datotek razlike med našo mrežo.

Po mojem demonstracijskega namestitvi, sem točno tako, kot zgoraj. Subversion je bil nameščen na mojem strežniku delovnih mest za obdelavo in sem enostavno potegnil najnovejšo kodo iz "delavec" podružnice uporabljajo "svn posodobitev". Prav tako sem dodal oznako številko različice na moj obdelavo skript, ki se je vrnil v bazo podatkov kot del napovedi rezultatov. Tako sem videl, da je moja koda posodablja vsakič, ko sem prekopiral moj prtljažnik v tj delavcev panoge, da sem definitivno teče zadnji obdelavo skript.

Z uporabo najnovejših podatkov

Če vaše delo obdelava omogoča uporabo virov podatkov potem na neki točki ti se bodo tudi posodobiti. Razen če pokličete svoje vire podatkov na zelo redke osnovi si boš poplav svoje omrežje s prometom takoj, ko vaši delavci začeli prikazovati prinaša vse do mirovanja. Za moje rešitve sem se odločil, da bi rad, da se premaknete svoje vire podatkov okrog z mojimi imajo proizvajalci.

Drži, da si konji tam! Kaj pa, če moji viri podatkov so ogromne? Pa to res primer, koliko podatkov govorimo? To je lahko bolj stroškovno učinkovito namestiti dodaten večji trdi disk v vsakem stroju kot za nakup dodatnega strežnika za obdelavo. To je vprašanje proračuna in je določena s strani podjetja odločiti. Prav mogoče, da bodo vaši viri podatkov so tako velike, da je njena samo neizvedljiva, da bo to količino podatkov v svojih delavcev strojev. V tem primeru, kaj bi storili? No, lahko pogledamo kliče lokalno podatkovnega strežnika, vendar pa to lahko povzroči težave z omrežjem. V tem primeru lahko omrežji, kot je to postalo nerealno vključiti v pisarniško okolje. Lahko je tudi, da si lahko ogledate v alternativne potekajo strategij, na primer samo kliče svoje delavce med 8pm in 6am vsak večer in / ali dušenje virov podatkov zahteva.

Gremo naprej recimo našo podatkovno viri znašajo 100 GB podatkov. No ja to je zelo malo podatkov za premikanje po mreži na posodobitev. Kako bi zagotovili, da imamo najnovejšo kopijo podatkov v tem primeru? Rsync je možnost, vendar osebno mislim, da s prikazovanjem najnovejši vir podatkov na strežniku delovnih mest za obdelavo in vzpostavitev to gor kot mojster v replikacijo (z lepo dolgo dnevnik bin) je lahko pot:

replikacija Z določitvijo vsake vaše delavce, tudi kot sužnja na delovnih posodobitve server kontrole na vaše vire podatkov bo čezmejno nakupovanje lepo vaših delavcev brez veliko povečanje aktivnosti omrežja (to je, če ne opravlja veliko Posodabljanje podatkov in vsi vaši delavci brcnil v naenkrat). To ima prednosti pred rsync v tem, da si ne bi dobili dolgem premoru pred vsako delo, kot so podatkovne baze posodobitve, je mysql bo daemon na vašem delavec stalno obnavljati svoje podatke, medtem ko se predelava nadaljuje.

To je, kako sem ustanovil svoj predstavitveni strežnik. Če želite nastaviti replikacijo sem sledil navodilom na spletni strani mySQL ( Nastavitev replikacije ) in v 20 minutah sem imel inital delavca posnemanja strežnikov nabor podatkov za nadzor delovnih mest. Za vsako dodatno delavca so replikacije nastavitve in procesov dela vsakič, ko je bila kopirana VM.

Povzetek

V tem delu članka smo proučevali, kako enostavno in neboleče je, da vaš obdelavo kodo na tekočem z funkciji rsync ali using subverion (SVN), da ne dela in zmanjšanje omrežnega prometa ob istem time. Govorili smo tudi o tem, kako , da vaš vir podatkov podatke up-to-dan tako, da se je na čezmejno nakupovanje na vsako od vaših delavcev. Tako smo površina zagotavlja, da bomo sledili poslovno logiko in informacij v naš sistem pisarniškega omrežja. Tam bo zagotovo nešteto možnosti za izvedbo teh nalog, ampak tukaj sta dve preprosti primeri bi jih lahko pokazali, kako enostavno rešitev je, da dobiti.

Naslednjič

V zadnjem delu te serije, aptly imenovan 5. del , bomo razpravljali o uvajanju tega sistema. Jaz bom povzeti, kaj je bilo tisto, kar sem se naučil, in uspelo ustvariti.

Urad računalniške mreže z uporabo virtualne okolja - 5. del

Z in petek 4 december 2009 11:03 pm

Predstavitev

Delam v podjetju, kjer deluje veliko delovnih mest paketno obdelavo milijone zapisov podatkov vsak dan in sem pred kratkim razmišljal o vseh naprav, ki sedijo okrog vsak dan nič ne delaš več ur. Ali ne bi bilo dobro, če bi lahko uporaba teh strojev za okrepitev procesorske moči naših sistemov? V tem sklopu člankov bom pogled na možne koristi zaposlovanja za pisarniško omrežje z uporabo virtualiziranih okolij.

V delu 4, smo preučevali uporabo orodij za zagotovitev, da smo nameščeno najnovejšo različico virov kode in podatkov, tako da dobljeni rezultati so vedno up-to-date z najnovejšimi poslovnih informacij in logiko.

Pre-Deployment

Pred namestitvijo your omrežja sistem, če obstaja ena stvar, ki jo storite, in ena stvar, sam to je merilo vaš trenutni sistem! Ni važno, kaj poveste kolege o tem, koliko dodatno delo, vaš sistem bo naredil, če imate številke bi to potrdili vaše jamstev niso nič. Torej,

  • Koliko zapisov lahko obdelali trenutno? Na dan? Na uro?
  • Koliko časa običajno traja, da se obrnil službo?
  • Koliko več zmogljivosti imate?

Tam je tudi dodatna vprašanja:

  • Če je vaš strežnik za obdelavo (ali eden od vaših strežnikov za predelavo) gre dol, kako bo to vplivalo na vaše sposobnosti, vam bo invalid?
  • Kakšne prednosti vam upam / pričakujem, da bi dobili od omrežnega sistema?
  • So vaši pisarniški stroji pogon delovnih mest?
  • Ali vaš (ali pa ste lahko pretvori delovnih mest), da wrok v tem slogu vodenja?

Zadnji večji Bistvo je, da si vzemite čas za večje spremembe, kot je ta. Posodobite obdelavo kodo za delo z novo metodologijo, ki merilo znova. Mogoče nastaviti za obdelavo strežnik teči virtualni stroj, po vsem strežniku obdelave bo samo še en delavec (samo zelo močna 1 relativno). Pustimo, da se nov postopek za poravnavo.

Deployment

Moj predlog bi bil pop v pisarni enega tedna izvajanje vseh naprav in nastavitev. Ali to tik pred počitnicami štirinajstih dneh in pustite, da drugi revni chap za reševanje posledic ... morda pa tudi ne ...

Uvajanje sistem, kot je ta mora biti počasen. Kljub temu, da bi bilo razmeroma preprosto vzpostavitev tega sistema bo vplivala na vaše celotno infrastrukturo urada (tudi digitalni 1). Prvič, razvaljamo na nekaj strojev v času, monitor omrežnega prometa, kako se delavec gostitelji opravljajo na dan za dnem. Morda boste morali spremeniti svoje delo konfiguracijo kot odgovor na vaše ugotovitve.

Ko je sistem rešiti z nekaj strojev (recimo 10% vseh pisarniških strojev, tj 5) vodi za spremljanje prometa omrežja in gostiteljski stroj performance. Naslednja merilo še enkrat, bi morali sedaj predelavo 33% več delovnih mest kot vaših prvih meril. Preverite, to je tako, ali da ste vsaj v tem Športni teren. Če ne, raziskati, kaj se dogaja pred prehodom na. Ponovite ta cikel, dokler ne boste z veseljem vsi pisarniški stroji teče brez ubijanja individualno stroja ali mletje omrežje do zastoja.

Ves čas vodi primerjalno analizo, tudi po tem, ko so na vseh uvajalnih. Preverite, kako nove posodobitve koda vpliva na hitrost vašega sistema, preverite, ali so vsi delavci v poročanje in obdelavo delovnih mest. Počasi (zelo počasi), prirastek svoje delo konfiguracijo, da bi dobili najboljše iz svojih delavcev in mreže.

Stop!

Kaj pa, če želite ustaviti svoje delavce iz teče nekaj časa? Vsi so tam teče regeneracijo, in poskuša po svojih najboljših močeh za obdelavo podatkov, kot so žuželke lačnih. Odgovor se morda zdi očitno, vendar je vredno dodajanjem vsak slučaj njegov spregledati. Preprosto urejanje obdelavo skript, z izhodom (0) ali die () ali kakšno drugo izjavo, da bi ubil svojo obdelavo delo. Pomemben razlog, zakaj smo vedno poskušali posodobiti na najnovejšo scenarij obdelave pred vsako vožnjo!

Prikaz sistema

Da bi napisal to zbirko kratkih člankov sem ustvarila zelo majhen mrežo dokazati tehnologije in metodologije. Prebral sem veliko člankov, vaj in se uporabljajo različna orodja za namestitev in spremljati, kaj se dogaja. Nikakor sem šel ven in nasičenih celo pisarno s prometom in tudi ne sem imel dostop do rednega PC člane osebja, da vidite, kako je vplivala gostitelj delovanje.

Moja demonstracija sistem je bil zelo skromen res. Včasih sem svojo redno namizje ustanovi kot strežnik delovnih nadzora. Na to sem namestiti mySQL strežnik nameščen ustanovljena kot mojster v replikacije, PHP , A in SVN povezana s Apache (za dostop preko VM delavcev).

Nato sem ustvaril stroj delavcev CentOS na VirtualBox na 6 let star laptop Windows XP. Jaz nastaviti predvidene naloge, kot je določeno po kopiranju VM na stroj in pustite, da gredo.

Navidezni stroj je bila ustanovljena z PHP, Subversion in MySQL. Preveril sem ven podružnico z imenom "delavec" iz mojega nadzora delovnih skladišče strežnikov in je prepričan, da bi se lahko posodobijo po ilo posodobitev ". Nato sem nastavitev mySQL kot suženj in preveri, ali podatki so bili posnemanja iz mySQL na strežniku delovnih mest za vodenje delavcu VM. Po vsem tem sem setup bash skripto in cron službo.

Moj obdelavo skript v bistvu šli po vzoru to (zelo preprosta stvar):

  • Preberite v polje Ime
  • Prešteti število podobnih imen v tabeli iz vira podatkov, ki je potekala v VM
  • Prešteti število imen, kot zgoraj, vendar razdelitev imena s presledki (npr. ime, srednja, priimek)
  • Postopek se ponovi 1000 krat

Vsako delovno mesto je približno 20 minut teči. V nekem trenutku sem odprl tudi več izvodov delavcev VM na laptop okno in opazoval delovna mesta preveriti off vsaka od naslovov IP delavcev. Na tej točki sem tudi potrdil, da replikacije samodejno ponovno zažene.

Zapusti laptop v stanje povzročilo delavca začne za obdelavo delovnih mest iz strežnika delovnih mest nadzora. Ko nadaljevanje laptop navada je prišlo do zamude približno 30-60 sekund, je to pošteno časa in osebja bi bilo treba zavedati, da je njihova naprava lahko ustavite za kratek čas, ko se vrne na stroju. Novejši stroji ne smejo imeti pavzo, dolgo tako dolgo. Korist za znesek, ki ga opravi obdelavo teh strojev v prostem teku več obdobjih, ki bi prevladali nad uslužbencem, da počaka na kratko obdobje (recimo 1 minuto), ob prihodu na svojih strojih za zjutraj (I pogosto čakati dlje, da je to za Windows Defender posodobiti, da poteka), če so seznanjeni s tem (koristen čas, da zgrabite jutranjo kavo!).

Na splošno sem prepričani, da sem prikazal tehnologije, ki bi jih lahko uporabili za oblikovanje takšnega sistema. I so pokazale, da tak sistem ne dela na (zelo) majhnem obsegu in z nekaj več eksperimentirati lahko povečajo uporabiti sredstva strojev urada je. Če ne dobim do te mere, to bi mi bilo zelo zanimalo, / videli, ko nekdo drug ne.

Sklepi / ocene

Naslednji korak bi bil očitno dejansko dobil pravi zgled svetu in začeti uvajanje sistema, kot je to v pisarniško okolje in videli, kaj se zgodi. Zahtevati podjetja, da se zavežejo, da to brez sled Plamen podjetje dokazati, tehnologija in učinkovitost lahko malo težko. Mreža / porazdeljeni računalniški je zelo priljubljen, je nekaj krogov in ima nekaj velikih aplikacij (BIONC, SETI @ Home, Folding @ Home, itd.) Nisem pa našli v manjšem obsegu in enostaven sistem, kot je ta v svojih iskanjih, ki bi se lahko razvalja v pisarniško okolje.

Ustvaril sem v bistvu brez sistema z uporabo odprtokodne programske opreme v glavnem in orodij na voljo v skoraj vsaki pisarni. Tehnologije so v bistvu dokazati in pokazati, da opravlja delo, in kot je bilo pričakovano. Upajmo, da imam kažejo, da z ne preveč dela in z zelo preprosto namestitev lahko se uporabi računalniške pisarno omrežja sistem, ki je močan, poceni, a in prilagodljiva vse ob istem času.

Ko sistem je začela delovati skoraj ni konec znesek prilagoditev in izboljšav, ki jih lahko dajo. Na primer, lahko statistiko / benchmarking enostavno treba dodati, ki prikazuje vrednost takega sistema vsak dan. Nove naprave se lahko doda hitro in enostavno, če in ko prispejo z nadgradnjo obstoječe strojne opreme za krepitev svoje procesorske moči.

Upam, da ste uživali branju tega serijo člankov in njegove dal snov za razmišljanje o teče sistem pisarniškega omrežja. Rešitev, predstavljena tukaj, ne bo nujno delo v vseh situacijah, vendar morajo biti prilagojeni, da vam omogočajo, da se vaš obdelava podatkov opravi s pomočjo svoje rešitve.

Prosim, vas prosimo, da mi pošljete kakršne koli pripombe, popravke ali izboljšave in bom po svojih najboljših močeh, da bo ta članek posodobljene, da se ujemajo.













Panorama Tema, ki jo Themocracy

8 obiskovalcev zdaj
6 gostov, 2 bots, 0 članov
Največ obiskovalcev danes: 19 ob 01:56 uri UTC
Ta mesec: 26 04-04-2012 ob 10:27 pm UTC
V letošnjem letu: 69 27-02-2012 ob 09:56 uri UTC
Ves čas: 130 v 28-03-2011 10:40 pm UTC