Pagpapakilala
Magtrabaho ako sa isang kumpanya kung saan tumakbo namin ang maraming mga batch trabaho na pagproseso ng mga milyon-milyong ng mga talaan ng data sa bawat araw at ako ay iniisip kamakailan tungkol sa lahat ng mga machine na umupo sa paligid ng bawat at bawat araw paggawa ng wala para sa mga ilang oras. Hindi magiging mahusay na kung maaari naming gamitin ang mga machine sa magbolster ang pagproseso ng kapangyarihan ng aming mga system? Sa hanay ng mga artikulo na ako pagpunta sa tumingin sa mga potensyal na benepisyo ng employing ng isang tanggapan grid na gamit ang virtualised kapaligiran.
Sa Bahagi 1 ako nagbigay ng isang pangkalahatang-ideya ng system at mga teknolohiya na ako ay gumagamit pati na rin tinalakay ang ilan sa mga potensyal na mga kadahilanan kung bakit gusto mo na lumikha ng isang grid ng opisina.
Job Control
Kung ikaw ay pagpunta upang patakbuhin ang mga trabaho pagkatapos ikaw ay pagpunta sa kailangan ang ilang mga paraan upang pamahalaan ang mga ito. Kailangan ng sistema ng kontrol ng iyong trabaho (sa iyong server sa trabaho) ay talagang naisip bago kahit na sinusubukan mong magpatakbo ng isang grid ng opisina. Kaya una, ano ang mga gawain para sa isang sistema ng kontrol ng trabaho:
- Ibigay ang mga trabaho sa kahilingan mula sa mga manggagawa
- Sabihin manggagawa kung ano ang uri ng trabaho upang tumakbo
- Subaybayan ang mga trabaho
- Tiyakin na ang mga trabaho ay tatakbo lamang sa sandaling
- Magbigay ng data trabaho sa mga manggagawa, o hindi bababa sa sabihin sa kanila kung saan upang makakuha ng ito
Din ng sistema ang kailangang extensible, isang solusyon na gumagana para sa ngayon sa isang kaso ay maaaring pinalawak na magpatakbo ng ilang mga uri ng mga trabaho bilang ng negosyo nakikita ang halaga sa isang solusyon ng grid. Halimbawa, ang mga trabaho ay maaaring makakuha ng prayoridad, higit sa isang uri ng trabaho ay maaaring umiiral (ie mga ilang bases ng code), kalaunan maaari kang kahit na magpatakbo ng mga iba't ibang machine ng manggagawa na-optimize para sa bawat uri ng trabaho (bagaman na ilipat ang layo mula sa 'generic manggagawa 'ideya). Laging subukang mag-isip tungkol sa hinaharap kapag pagbuo ng sistema, ang isang maikling kataga ng paningin ay maaaring humantong sa na kataga ng pagkabigo at mas mataas na oras ng pag-unlad.
Job Server
Kami ay pagpunta sa kailangan sa isang lugar upang makontrol ang aming mga trabaho mula sa, ito ay dapat na lamang ang sistema sa iyong grid na may isang nakapirming tagahanap mapagkukunan, na ang isang IP address, pangalan ng host, URL (gamit ang panloob na DNS), atbp Ito ay dahil ang mga manggagawa na kailangan upang malaman kung saan upang tumingin para sa mga trabaho, mga manggagawa na kailangan upang mahanap ang kontrol ng sistema ng trabaho (hindi ang kontrol ng sistema ng trabaho mahanap ang ang mga manggagawa).
Ang server ng trabaho mismo ay hindi talagang magkaroon ng isang komplikadong gawain (sa isang pangunahing sistema sa paano't paano man), na kinakailangan nito upang mai-imbak ang isang listahan ng mga trabaho, kamay out trabaho, makatanggap ng mga resulta, at pagkatapos mag-imbak ang mga ito para sa mamaya pagsasauli. Paano ay tinukoy ang mga bahagi (tulad ng 'kamay ang trabaho) ay maaaring maging napaka-basic. Mamaya sa maaari naming palawakin ang sistema upang isama ang isang pangangasiwa interface upang idagdag, i-edit, tanggalin, isuspinde trabaho ngunit ito ay lampas sa pagsasanay na ito.
May ay walang dahilan sa kahit ano pa man pagkatapos na ang iyong trabaho server ay hindi maaaring maging isang virtual machine na tumatakbo sa loob ng iyong pangunahing processing server ibinigay ito ay hindi maubos ang masyadong maraming mga mapagkukunan mula dito. Gayunpaman ang trabaho server ay kailangan mataas availability, kung ito napupunta sa isang Biyernes gabi na kayo ay pagpunta sa mawalan ng isang buong linggo ng processing, potensyal na costing sa iyo ng isang pares ng mga linggo na halaga ng oras ng pagpoproseso (kapag inihambing sa iyong pangunahing processing server ay nag-iisa) . Baka gusto mong isaalang-alang ang paglalagay ng server ng iyong trabaho sa isang balanseng kapaligiran load para sa mataas na availability.
Basic Setup
Ang pangunahing setup para sa aming mga server ng trabaho ay binubuo ng kung ano ang ako ng pagtawag sa isa sa aking mga malata server (na Li nux, ang m ySql, P HP). Ang code na tumatakbo sa Thea manggagawa ay talagang gumagana out kung ano ang mga trabaho ang maaaring tumakbo sa pamamagitan ng nakikipag-ugnayan sa may trabaho database ng control sistema. Mamaya sa kami ay maaaring lumikha ng isang serbisyo ng web at talagang kamay ang trabaho kaysa sa pagkakaroon ng mga manggagawa na gawin ang mahirap na trabaho na kanilang sarili, ngunit sa ngayon kami ay patuloy na gamit ang Halik prinsipyo (Panatilihing ito Simple, bobo!).
Kaya, ay nagbibigay-daan sa lumikha ng tatlong MySQL talahanayan upang makitungo sa mga trabaho. Ito ay `trabaho`, `jobRecords`, at `jobResults`.
Narito ako gumagamit ng SQL Buddy isang magandang maliit na alternatibo sa phpMyAdmin dahil lang nito mas madaling i-install sa centOS (para sa iba na makita: 10 Mahusay na mga alternatibo sa phpMyAdmin )
Ang table na ito ay binubuo ng 5 simpleng patlang,
- id: natatanging kilalanin ang trabaho
- pangalan: Puwede maging isang reference ng client, o anumang bilang ng iba pang mga identifier
- Katayuan: Kailangan mong malaman kung saan ang trabaho ay sa, hal
- 0: Hindi makapagsimula
- 1: Napili up
- 2: Nakumpleto
- started_by: Sino ay nagsimula ng paggawa ng trabaho? Ito ay hindi ganap na kinakailangan ngunit ay isang magandang magkaroon. Gusto ko iminumungkahi ang pagsubaybay ng mga manggagawa sa pamamagitan ng kanilang mga IP address sa iyong network
- started_at: Kapag ang manggagawa simulan ang trabaho? Sa pamamagitan ng pagsubaybay sa mga trabaho na hindi nakumpleto sa loob ng X halaga ng oras na malaman namin na kailangan namin upang kunin ang trabaho sa sandaling muli at simulan ang pagproseso ng isa pang manggagawa. Manggagawa ay maaaring ihinto ang processing / pumunta ng offline para sa anumang bilang ng mga dahilan, kapangyarihan pagkabigo, pag-crash, pagkawala ng network, atbp
Ito ay madali kung paano ang talahanayan na ito ay maaaring pinalawak na may ilang mga karagdagang mga patlang upang pahintulutan para sa mga istatistika ng pagsubaybay, isang haligi ng Tapos na oras upang makita kung gaano katagal ang trabaho kinuha, isang kontra upang makita kung gaano karaming mga manggagawa ang pinili ang trabaho (malinaw naman ang pangangailangan na ito sa posibilidad na 1), priority ng trabaho, ang listahan ay maaaring pumunta sa at sa. Sa mga mas kumplikadong sitwasyon trabaho ay posible upang tukuyin kung gaano karaming memory ang manggagawa ay kailangan ng access sa (at samakatuwid lamang gumamit ng mga angkop na manggagawa), o kahit anong uri ng mga manggagawa ay kinakailangan.
Hinahayaan magdagdag ng ilang mga trabaho sa halimbawa:
Muli Ang susunod na talahanayan ay medyo simpleng upang maunawaan, ang mga ito ay ang aming mga talaan sa trabaho. Sila ay naka-link sa pangunahing talahanayan ng trabaho sa pamamagitan ng isang hanay ng `jobs_id`. Ang bumubuo ng talahanayan na ito napaka depende sa mga data na kailangan mo upang magbigay sa iyong mga manggagawa, ay nagbibigay-daan sa isang napaka-simpleng halimbawa na kung saan kami ay may apat na mga haligi:
- id: ID ng record
- pangalan: pangalan Tao
- address: address Tao
- jobs_id: Ang ID ng trabaho na ang tala na ito ay naka-link sa
Ang ikatlong at huling talahanayan ay binubuo ng isang talahanayan ng mga resulta, ito ay may magkano ang parehong bilang aming mga talaan ng talahanayan, at sa pagdagdag ng ilang mga haligi ay maaaring maging bahagi ng talahanayan ng mga talaang:
- job_record_id: I-link ang resulta sa trabaho ang talahanayan
- resulta: Ang mga resulta ng data
... At na ang lahat na kailangan mo para sa trabaho control! (Kahit na sa isang pangunahing antas) Sa aking kaso ako tulis sa ibang mesa na kung saan ang aking data sa proseso ay matatagpuan, ngunit ito ay maaari lamang bilang madaling naging isang file, ang mga parameter upang patakbuhin ang simulation code, mo pangalanan ito.
Pagpili ng isang trabaho
Tulad ng ipinahayag dati, ang manggagawa ay gawin ang aming trabaho sa pamamahala para sa amin para sa ngayon, kaya lahat ng kailangan namin talagang gawin ay mahanap ang isang trabaho na nangangailangan ng processing at makuha ang impormasyon. Paano namin gawin ito? Rin pumili sa aming mga pamantayan sa pagpili ng trabaho at hanapin para sa mga trabaho, sa SQL ko ang mga sumusunod:
- Gumawa ng anumang mga trabaho na hindi minarkahan bilang kumpletong ngunit mula sa aming mga manggagawa at i-reset ito (halili ang __ ME__ sa isang identifier, pinakamadaling IP address):
Update `trabaho` Itakda `status` = 0 SAAN `status` = 1 AT `started_by` = __ ME__;
- Gamit ang aming mga pamantayan sa pagpili ng trabaho, pumili ng isang trabaho at sabihin ang control system na manggagawa na ito ay pagharap dito:
Update `trabaho` Itakda `status` = 1, `started_by` = __ ME__, `started_at` = NGAYON () SAAN `status` = 0 O
(`Status` = 1 AT `started_at`> DATE_SUB (NGAYON (), interval X HOUR)) UPANG NG `id` ASC;
Sa pamamagitan ng daklot mga trabaho na hindi nagbalik ng mga resulta sa X halaga ng oras namin matiyak na ang lahat ng mga trabaho ay tatakbo sa kaganapan ng isang manggagawa sa pag-crash o pagpunta ng AWOL.
- Susunod grab ang mga detalye ng trabaho na sinusundan ng mga ng mga tala kanilang sarili:
Piliin ang * MULA `trabaho` SAAN `started_by` = __ ME__ LIMIT 1;
Piliin * mula sa `job_records` SAAN `id` = __ JOBID__;
Sa pagkumpleto ng trabaho ipasok namin ang aming mga talaan sa resulta at markahan ang mga trabaho ng kumpleto. Tandaan bilang maaaring suspindihin ng mga trabaho / ipagpatuloy sa anumang oras payagan para sa ilang mga katabaan sa iyong script. Maaaring ito ay na ang gawain ng suspends kalahati paraan sa pamamagitan ng pag-update ng kontrol sa sistema ng trabaho, kaya check ang bilang ng mga talaan sa isang trabaho at ang bilang ng mga resulta ng na-save pabalik sa sistema ng kontrol ng trabaho ay maging isang matalino ilipat.
Bilang karagdagan, habang ito ay nagpapakita kung paano trabaho ay maaaring piliin at pinamamahalaan mula sa isang SQL query frame Dapat mo ba talagang sa abstracting ng iyong trabaho control kaya na kung nagpasya kang lumipat sa paggamit ng isang web serbisyo, ng isang file na nakabatay sa sistema, XML , o anumang iba pang Ang bilang ng mga sistema na hindi ito makakaapekto ang code sa itaas nito.
Job Configuration
Ang susunod na aspeto upang isaalang-alang ang sukat at configuration ng trabaho. Sa pamamagitan ng naglalaro sa configuration ng trabaho namin hampasin ng isang mahusay na balanse sa pagitan ng bilis, pagtitiklop ng proseso, at kahusayan. Tumagal ng ilang of mga sitwasyon:
- Trabaho tumagal ng 1 araw sa bawat tumakbo: Ito ay nangangahulugan na ang iyong mga manggagawa ay kailangan ng 15 araw upang iproseso ang bawat trabaho (tandaan ang 10% ng kapangyarihan para sa mga 2/3rds ng oras). Ito ay malinaw na hindi isang matalino na pagsasaayos, ang sukat ng iyong trabaho ay paraan masyadong malaki! Tumagal ng hindi bababa sa double ang oras upang makakuha ng trabaho sa isang naproseso dapat ang unang manggagawa pumunta AWOL (oras upang pumili up na ito ay hindi nagbalik ng isang resulta plus reprocessing oras). Sa isang ideal na gusto mong magkaroon ng hindi bababa sa isang buong trabaho na madaling clear sa pamamagitan ng dulo ng bawat mahabang panahon na walang ginagawa, na paraan na panatilihin mo ang trabaho gris sa loob at sa pinakamalala kaso ang trabaho ng isang ay tumagal ng dalawang araw sa proseso dapat ang unang pumunta nawawala.
- Trabaho tumagal ng 1 minuto upang tumakbo: Ito ay nangangahulugan na ang iyong mga manggagawa ay tumagal ng halos 15 minuto upang patakbuhin ang bawat trabaho. Habang ito ay maaaring simula tila mainam, makakuha ng karagdagang pagproseso ng trabaho sa panahon ng tanghalian oras, coffee break, pagpupulong, atbp sitwasyong ito ay naglalagay ng pilay sa iba pang mga lugar ng iyong system at introduces kanyang sariling problema. Halimbawa, una ang iyong setup / oras ng pagpoproseso ratio ay pagpunta sa pumunta karapatan down na, kaya nawawala ang sistema ng kahusayan. Ang iyong network ay pagpunta sa patuloy streaming trabaho impormasyon sa iba't ibang mga manggagawa ng mga kawani ng nakakadismaya na dong ang kanilang araw-araw na gawain. Mo rin ay pagpunta sa ilagay ang higit pa pilay sa iyong server sa pagproseso ng trabaho dahil ito ay upang magbigay ng maraming at maraming ng mga maliliit na piraso ng trabaho sa isang regular na batayan. Panghuli, sa sitwasyong ito kung ang iyong server ng trabaho napupunta down na kayo ay pagpunta sa lumikha ng isang malaking log likod ng uncompleted gawain habang mas malaking trabaho ay maaaring ng patuloy pagproseso blissfully nakalimot na ang mga trabaho ng server ay nakakaranas ng mga paghihirap.
Sa katotohanan ay hindi isang mainam na configuration para sa iyong setup ng grid, magkano ay depende sa mga magagamit na mapagkukunan, mga uri ng trabaho, trabaho kinakailangan sa oras ng turnaround, kakayahan ng network, at iba pa. Subalit ang ilang mga alituntunin ay:
- Trabaho laki kaya na ang bawat manggagawa ay maaaring makakuha ng sa pamamagitan ng hindi bababa sa 3-4 na trabaho sa isang panahon ng 15 oras (ang pinakamahabang malamang na idle na oras ng panahon)
- Maglaro sa laki ng trabaho upang setup ng oras nagiging medyo hindi gaanong mahalaga kung ihahambing sa ang oras ng pagpoproseso (nadadala sa isip ang sa itaas point).
- Kung ang isang trabaho na hindi kumpleto sa double ang dami ng oras (maaaring mas mababa) na inaasahan mong ito upang makumpleto ito ay ipinapalagay na nito nawala na AWOL at magsisimulang iproseso ang mga ito sa ibang manggagawa. Nangangahulugan ito na maaaring mayroon ka upang maghintay ng hanggang sa tatlong beses ng normal na haba ng isang trabaho para sa mga ito upang makumpleto (marahil na kung ang kasunod na trabaho nabigo). Baka gusto mong bawasan ang oras na ito, ngunit maging maingat na hindi upang mabawasan ito masyadong maraming bilang maaari mong simulan duplicating ang mga gawain sa pagproseso sa isang regular na batayan.
- Trabaho ay dapat na hiwalay labas kinakailangan hangga't maaari. Ang server ng trabaho, halimbawa, ay dapat lamang makipag-ugnayan sa simula at dulo ng bawat trabaho.
- Huwag mababad ang iyong network, ito ay may dalawang negatibong mga epekto, ang iyong araw kawani ay mahanap gamit ang network nakakadismaya at mga problema ay maaaring naranasan sa koneksyon tiyempo ng isang problema na lamang makakuha ng mas masahol bilang mo masukat ang iyong grid.
- Mga matiyak trabaho ay maaaring tumakbo sa iyong mga manggagawa. Kung ang mga trabaho ay maging masyadong memory intensive o disk space mga intensive trabaho ay magsisimula aborting at ang tanging bagay na mapapansin mo ay isang drop sa bilang ng mga trabaho na-proseso sa hindi tunay na dahilan kung bakit.
Pagsusumite ng mga Resulta ng ng trabaho
Kapag ng pagsusumite ang mga resulta ng isang trabaho ay mahalaga upang suriin na nagreresulta hindi naisumite na ng ibang manggagawa, lalo na kung ang kasalukuyang manggagawa ay natutulog para sa ilang oras.
Kapag ang mga resulta ay isinumite matiyak na ang bilang ng mga resulta tumutugma ang bilang ng mga talaan sa loob ng trabaho.
Tulad ng isinasaad sa dati, at hindi maaaring maging higit sa emphasized, bumuo ng kasalanan pagpapaubaya sa pagkuha ng trabaho at pagsusumite ng mga resulta. Ang manggagawa ay maaaring (at malamang ay) pumunta sa suspindihin mode sa ang pinaka-maginhawa ng beses na at ito ay nangangailangan na catered para sa. Gayundin muli ng abstracting malayo ang iyong mga resulta ng pagsusumite ay makakatulong sa magsilbi sa mga hinaharap na pagbabago sa iyong system trabaho kontrol lubhang mas madaling makitungo sa.
Buod
Sa ito section namin tumingin sa kung ano ang isang server ng kontrol ng trabaho ay kailangang gawin at kung paano upang makakuha ng isang pangunahing sistema-set up. Tinalakay namin kung paano makuha ang isang trabaho mula sa control ng system at kung paano pinakamahusay na upang i-configure ang mga trabaho upang makuha ang karamihan sa aming ng iyong system sa grid ng opisina. Upang tapusin, isang talata o dalawang sa pagsusumite ng mga resulta pabalik sa server ng kontrol ng trabaho ay iniharap.
- Ang kontrol ng server ng trabaho ay namamahala ng mga trabaho at tinitiyak na ang lahat ng mga yunit ng trabaho ay nakumpleto
- Sa pamamagitan ng ng abstracting iyong trabaho piliin / resulta ng pagsusumite maaari naming baguhin ang teknolohiya ng control sa server walang magkano ang problema
- Isaayos ang iyong trabaho upang matiyak na sila ay tumakbo nang mabilis at mahusay na walang paglalagay ng masyadong maraming presyon sa iyong network infrastructure, at walang ng duplicating gawain ng pagproseso sa isang regular na batayan.
- Tiyakin na ang binuo mo kasalanan tolerance at ang error checking sa iyong mga gawain, ang mga manggagawa ay maaaring suspindihin at ipagpatuloy at ang pinaka-maginhawa ng beses. Tandaan upang suriin kung ang mga resulta na nai-isinumite ng ibang manggagawa.
Susunod na
Sa bahagi 3, kami ay lumikha ng aming mga virtual machine sa pagpoproseso at set up ng aming mga machine bintana upang maging idle-time na mga manggagawa.