Posts tagged: toplu

Sanal ortamlar kullanarak Office Grid - Bölüm 4

By , Cuma 4 Aralık 2009 11:59

Giriş

Birçok toplu iş veriler, her gün milyonlarca kaydın işlenmesi ve ben birkaç saat hiçbir şey yapmadan her gün oturup tüm makineler hakkında son zamanlarda düşünüyordum çalıştırmak nerede bir şirkette çalışmak. Bizim sistemlerinin işlem gücü desteklemek için bu makineleri kullanabilir olsa iyi olmaz mıydı? Bu makaleler set ben bir ofis istihdam potansiyel yararları bakmak için gidiyorum ızgara sanallaştırılmış ortamlarda kullanarak.

Yılında part 3 bizim sanal işleme makine oluşturulur ve boşta-zamanlı çalışanlar olmak pencere makineleri kurmak.

En son kod çalıştırma

Kaçınılmaz olarak da işçilerin iş mantığı değişecek oluşturduktan sonra, böcek bulundu olacak, daha hızlı daha verimli kod böylece işçilerin kullanarak veri işleme oturduk bırakarak üretilecek eski kötü kokulu kodu . Peki biz her zaman bizim işleme komut en son ve en iyi sürümü kullandığınızdan emin mi?

Bu yapabileceği bir kaç çok kolay basit yolları vardır, hüner, ancak bu ulaşmada işlem gücü ve ağ trafiğini azaltmak. Çözüm basit ile başlamak ve iterasyon bir çift üzerinde yavaş yavaş artırmak sağlar.

İlk yöntem, sadece işimizi kontrol sunucu (Samba, FTP veya benzeri ile) bağlanmak ve kodunun en son sürümüne yıkmak olacaktır. Henüz çok etkili, ama iş yapacak. Bu biraz geliştirmek, nasıl bir rsync komut dosyası oluşturma ve bunun yerine her zaman kullanma hakkında? Lets Alternatif ne subversion başlangıçta kod kontrol dışarı içine bizim son işlem komut dosyası koyarak ve sonra sadece her çalışma (bizim kod güncelleme hakkında svn update )?

Sonunda biz bu kadar basit görünen bir bash betiği (cron her 10 dakika da denir) ile son olabilir:

  #! / Bin / sh
 eğer ps ax | grep-v grep | grep php > / dev / null
 o zaman
     echo "İş, şu anda çıkış işliyor"
 başka
     echo "İş çalışmıyorsa, şimdi başlatın"
     cd / bir / yol / / çalışma kopyası
     svn update
     php yourJobProcessingScript.php
 fi 

Şimdi her çalışmaya biz kesinlikle son kod çalıştıran emin olabilirsiniz. Biz kod tabanı bir çalışma gerçekleştirmek her zaman güncellenmesi ve sadece ağ üzerinden dosya farkları aktararak ağ trafiğini azaltarak bu garanti ediyoruz.

Benim gösteri kurulum, ben aynen yukarıdaki gibi yaptım. Subversion işimi işleme sunucu üzerinde yüklü ve sadece 'svn update' kullanarak bir 'işçi' şubesinden son kod çekildi. Ben de sonuç dönüş parçası olarak veritabanına döndü benim işleme komut dosyası için bir sürüm numarası etiket eklendi. Bu şekilde benim kod ben kesinlikle en son işlem komut dosyası çalıştıran olduğu işçi şube yani içine bagajımda kopyalanan her zaman güncellenmekte olduğunu görebiliyordu.

En son verileri kullanarak

İşinizi işleme bir noktada sonra veri kaynaklarından yararlanarak yaparsa bu da güncelleştirilmesi için gidiyoruz. Eğer en kısa zamanda işçilerin durma noktasına getiren şey yayınlanmaya başlaması gibi, trafik ile ağ sel gidiyoruz çok seyrek olarak veri kaynakları aramak sürece. Benim çözüm için ben VM ile etrafında veri kaynakları taşımak istiyorum karar verdi.

Orada atlar sen tut! Benim veri kaynakları BÜYÜK ne olur? Peki bu gerçekten biz ne kadar veri konuşurken bir durumdur? Bu, ek bir işleme sunucu satın almak için daha her makinenin içine bir ek daha büyük sabit sürücü yüklemek için daha uygun maliyetli olabilir. Bu bütçe meselesi ve karar vermek için iş kalmıştır. Bu belki veri kaynakları öyle büyüktür ki bu, bunun için çalışan makinelerde bu miktarın veri tutmak için olanaksız. Bu durumda ne yapardınız? Peki biz yerel bir veri sunucusu arama bakmak olabilir, ancak bu ağ ile sorunlara neden olabilir. Bu durumda böyle bir grid sistemi ofis ortamında eklemek için gerçekçi olabilir. Ayrıca sadece her gece ve / veya azaltma veri kaynağı istekleri 20:00 ile 06:00 arasındaki işçi arama örneğin, alternatif çalışan stratejileri içine bakabilirsiniz olabilir.

Yapalım Hareketli veri 100GB bizim veri kaynakları miktarı söylüyorlar. Evet evet bu bir güncelleştirme ağ dolaşmak için veri yeraldığını var. Nasıl biz bu durumda veri son kopyasına sahip olduğundan emin misiniz? Rsync bir olasılık, ama ben şahsen iş işleme sunucu üzerinde son veri kaynağını çalışan ve çoğaltma konusunda master (güzel bir uzun bin log) olarak ayarlayarak gitmek için yol olabilir düşünüyorum:

çoğaltma Veri kaynaklarına iş denetimi sunucu güncelleştirmeleri bir köle olarak işçilerin her ayarlayarak (Eğer büyük bir veri güncelleme gerçekleştirmek ve tüm işçiler tekme sürece yani ağ etkinliği büyük bir artış olmadan işçilere güzel yavaş yavaş olacak kerede). Bu, her işi önce uzun bir duraklama elde edemeyeceğini belirtti rsync fazla avantajı vardır; veritabanı güncellemeleri gibi mysql işleme devam ederken İşçiye daemon sürekli olarak veri güncelleme olacak.

Bu benim gösteri sunucusu kurmak nasıl olduğunu. Çoğaltma kurmak için ben mySQL sitesinde (on kılavuzu takip çoğaltma kurma ) ve 20 dakika içinde ben iş denetimi sunucuları veri kümesi çoğaltarak benim inital işçisi vardı. VM kopyalanan her bir ilave işçi için çoğaltma ayarları ve süreç her zaman çalıştı.

Özet

Makalenin bu bölümde kolay ve ağrısız bir işi yapmak için rsync using veya subverion (SVN) tarafından bugüne ve aynı time. de ağ trafiğini azaltmak için işlem kodu tutmak için ne kadar baktım Biz de nasıl ele sizin işçilerin her birine vurur olanak sağlayarak veri kaynağı bilgilerini güncel tutmak için. Böylece bölgede bizim ofis ızgara sisteminde iş mantığı ve bilgileri takip sağlamak. Orada açıkça bu görevleri yerine getirmek için sayısız alternatif olabilir, ama burada bir çözüm gelmek ne kadar kolay olduğunu göstermek için basit iki örnek vardı olacaktır.

Bir dahaki sefere

Aptly adlı bu dizi, en son bölümünde Bölüm 5 , biz bu sistemi dağıtma ele alacağız. Ben yaratmayı başarmış öğrendim olmuştur ve ne özetlemeye olacak.

Sanal ortamlar kullanarak Office Grid - Bölüm 1

By , Cuma 4 Aralık 2009 11:23

Giriş

Birçok toplu iş veriler, her gün milyonlarca kaydın işlenmesi ve ben birkaç saat hiçbir şey yapmadan her gün oturup tüm makineler hakkında son zamanlarda düşünüyordum çalıştırmak nerede bir şirkette çalışmak. Bizim sistemlerinin işlem gücü desteklemek için bu makineleri kullanabilir olsa iyi olmaz mıydı? Bu makaleler set ben bir ofis istihdam potansiyel yararları bakmak için gidiyorum ızgara sanallaştırılmış ortamlarda kullanarak.

Olarak PHP geliştiricisi Ben, yani her gün Linux, kullandığınız araçları kullanmak için gidiyorum mySQL , PHP, VirtualBox ve subversion (SVN). Ancak ben bu kılavuz gibi diğer dillerde ve teknolojilere adapte umuyoruz.

Ben sağlayan çözüm çok gevşek biz Burada basitlik için şeyleri değiştirmek gerekir, ya da daha ilginç kullanım senaryoları üretmek için bu makalenin tümünü doğru olmayabilir ancak ulaşmak için ihtiyaç duyacağımı işlem türüne göre yapılacaktır.

Bu ofisler çoğunluğu çalıştırmak ne zamandan beri bu sanallaştırılmış ortamlarda pencereler makinelerde çalışacaktır. Büro makineleri yaptığımız işlem bu makineleri kullanarak personel ile müdahale etmemelidir, makinede herhangi bir bakım gerektirir ve kullanılabilir olduklarında yeni makinelerin kolayca konuşlandırılabilir olmalıdır. Bu büyük ölçüde ızgara sistemi uzatılabilir hangi ölçeklenebilirlik ve kolay azaltır olarak da, yeni sanal makineler herhangi bir ek yapılandırma gerektirmemelidir.

Neden bir Office hesaplama parmaklığı dağıtma?

Öncelikle düşünce olabilir, neden sadece gibi bir bulut bilgi işlem kaynağı kullanmaz Amazon'un EC2 platformu ? Sıra nedenlerle, örneğin, çeşitli olabilir:

  • Bir bulut bilgi işlem ortamı için belirli veri emanet olmaz
  • Siz yasal nedenlerle, örneğin NHS kayıtları için potansiyel olarak, yasal nedenlerle (örneğin veri ülkeyi terk) için bir bulut bilgi işlem ortamı içine belirli veri koyamazsınız.
  • Sen işleme üniteleri çok donanım üzerinde tam kontrol kapatmak ve sahip tutmak istiyor
  • Sen bulut örneklerini çalıştırmak üzere proje fon yok
  • Ofisiniz bir bulut kaynak kullanmak için internet bağlantısı olmayan ve bu nedenle mümkün değil
  • Sen yağmur sevmiyorum, bulutlar yağmur öneririm, bu nedenle de uzak tutun

Ben liste devam edebilir emin değilim, ama yeterli şimdilik olduğunu düşünüyorum.

Office Computing Grid Avantajları

Eh, biraz matematik (ve gerçek fizik tarzı bazı süpürme varsayımlar yapmanıza olanak sağlar) yapmanıza olanak sağlar. Eğer günde 100 iş çalışan büyük etli işleme sunucu var düşünün. Ofisinizde size günde 16 saat boşta 50 makinemiz var, bu makinelerin her biri kendi adeleli işleme sever gibi güçlü% 10'dur. (Buradaki tüm sonuçları performans artışı hafife yuvarlanır).

Yani, 1 makine *% 10 güç * 2/3 saat = boş zaman 0,067 yani 1 masaüstü işlemci günde 6 tam işlerini işlemek olabilir.

Şimdi bu kadar ölçeklendirilebilir Eğer ana işleme sunucu yaptığı gibi günde bir işlerini işlemek için 15 boşta masaüstü alır.

Yani 50 makinelerin bizim hayali ofiste biz 4 tam işleme sunuculara kadar 1 sunucu bizim işlemci gücü artabilir, ya da 100 yerine günde 400 işlerini işlemek olabilir.

Bildirim, yeni donanım hiçbir yatırım için şirket sadece kendi toplu işleme kapasitesi 4 kat arttı! Potansiyel size güç kullanımını artırmak için gidiyoruz ama çoğu ofis ortamlarına Ben makineleri ziyaretinde genellikle zaten gece boyunca, bu nedenle yeşil bir girişim olarak bu görebiliyordu.

Diğer avantajlar da büro makineleri yeterli iseniz ve büro makinelerinin gücü artırmak olarak ofis ızgara otomatik olarak daha güçlü hale gelmesi durumunda yeni bu yatırım (veya güncellenmiş) işleme sunucuları gecikebilir demek.

Teknolojileri

Neye ihtiyacın var? (Daha doğrusu ne kullanmalıyım vermedi):

  • Boşta büro makineleri (benim durumumda bir yedek eski windows XP dizüstü)
  • VirtualBox (veya başka bir istemci sanallaştırma yazılımı)
  • PHP, mySQL running OS aşağı bir kesim ile çalışan bir sanal makine, ben bu benim LIMP sunucular :) arıyorum
  • Çalıştırmak için İş
  • İş sunucusu (bir yerde başka bir sanal makine olabilir)

Tipik İşler

Aşağıdaki gibi, bu sistemin çalıştırmak için tasarlanmış bir iş türlerine şöyledir:

  • Sistem biz sonuçları maç ve dönmek gerek bunun üzerine veri listesini alır
  • Eşleştirme (oldukça statik) çeşitli veri kaynaklarına kontrol / arıyor içerir
  • Veri kaynaklarından Sonuçları sonuç yanıt olarak ek veri kaynaklarının denetimi, birleştirilmesi, daha doğrulama gerektirebilir
  • Veri, eşleşen kayıtları ile iade tamamen onaylanmadığı ve işlenir
  • Bir iş içindeki her kayıt geri kalanından bağımsız olduğunu

Yani temelde biz veritabanı aramalarına karışımı ve bazı numarası çıtırdatan, bir iş ortamında oldukça tipik bir senaryo gerektiren işlerde çalışan bakıyoruz.

Izgara çözümlerin bu tip işler işlenmesi için, sadece avantajlı değildir. Temel olarak, bağımsız birimler bölünebilir herhangi bir işlem paralel olarak çalıştırılabilir. Örnekler ve daha fazla bilgi için bu wikipedia bakınız: Grid , ancak ünlü birkaç örnek vardır Seti @ Home ve BIONC . Orada bilgisayar ızgaraları çalıştırmak için çerçeveler vardır ve bunlar içine bakarak iyi değer.

Ne elde edecek?

Bu maddelerin sonunda ben bir ofis ızgara dağıtma derece pahalı veya zaman alıcı olması gerekmez göstermek istiyoruz. Ben tartışmak için gidiyorum:

  • Iş yapılandırma, iş denetim sisteminin kurulması
  • Uygun bir işleme sanal makine oluşturma
  • Bir windows makinede sistemi kurmak için nasıl
  • En son kod ve veri kullanıyorsanız sağlanması
  • Dağıtım ve kıyaslama
  • İleriye

Ben (tamam ben bu yazdı, sonra yerleşik) Windows XP ve benim 'GridMachine' sanal makine kullanarak bir yerel makine üzerinde kavramları test etmek için örnek bir uygulama bina olacak. Benim işim kontrol sunucusu çalıştırır benim ana makine olacak Fedora 11 .

Bu, hiçbir şekilde tam çalışan sağlam bir sistem göstermek içindir, onun bir gösteri daha fazla ve bunları makul bir süre kısa ve az maliyetle elde edilebileceğini gösteren tartışılması anlamına geliyordu. Bana herhangi bir yorum, düzeltilmesi veya iyileştirmeler göndermek için çekinmeyin ve ben eşleşecek şekilde güncelleştirilir bu makalede tutmak için elimden geleni yapacağım olun.

Bir dahaki sefere

In part 2 ben iş denetim sistemi bakarak başlayacak ve işler her iş aksatmadan işlenir sağlarken işleme büyük miktarda elde etmek için nasıl yapılandırılmalıdır içine bakmak.

Sanal ortamlar kullanarak Office Grid - Bölüm 2

By , Cuma 4 Aralık 2009 11:23

Giriş

Birçok toplu iş veriler, her gün milyonlarca kaydın işlenmesi ve ben birkaç saat hiçbir şey yapmadan her gün oturup tüm makineler hakkında son zamanlarda düşünüyordum çalıştırmak nerede bir şirkette çalışmak. Bizim sistemlerinin işlem gücü desteklemek için bu makineleri kullanabilir olsa iyi olmaz mıydı? Bu makaleler set ben bir ofis istihdam potansiyel yararları bakmak için gidiyorum ızgara sanallaştırılmış ortamlarda kullanarak.

In Part 1 sana bir ofis ızgara oluşturmak için neden isteyeyim sıra potansiyel bazı nedenleri tartışıldı olarak kullanıyorum edilecek sistem ve teknolojileri konusunda bilgi verdi.

İş Denetimi

Eğer işler çalışıyor gidiyoruz, o zaman onları yönetmek için bir yol gerekir gidiyoruz. İşiniz kontrol sistemi (iş sunucuda) gerçekten iyi hatta bir ofis ızgara çalıştığınız önce düşünülmüş olması gerekir. Yani öncelikle bir iş denetim sisteminin görevleri nelerdir:

  • Işçilerin talebi üzerine işleri teslim
  • Ne tür işler çalıştırmak için işçi söyle
  • Parça işler
  • Işler sadece bir kez çalıştırmak emin olun
  • Işçilerin işi verileri sağlayın, ya da en azından bunu elde etmek için onlara

Sistem aynı zamanda genişletilebilir, bir ızgara çözüm değer gördüğü iş olarak işler çeşitli çalıştırmak için uzatılabilir tek bir durumda şu an için çalışan bir çözüm olması gerekir. Örneğin, iş öncelikleri elde edebilir, birden fazla iş türü (yani birkaç kod bazlar) var olabilir, sonuçta siz bile 'genel işçinin uzak hareket ediyor olsa da (iş her türü için optimize edilmiş çeşitli işçi makineleri çalıştırmak olabilir 'fikir). Daima sistemleri geliştirirken geleceği hakkında düşünmeye çalışacağım, kısa dönemli vizyonu uzun vadede hayal kırıklığı ve artan geliştirme süresini yol açabilir.

İş Sunucu

Biz işten kontrol etmek için bir yere ihtiyacımız olacak, bu gibi bir IP adresi, ana bilgisayar adı, URL (iç DNS kullanarak), Bunun nedeni olduğunu, sabit bir kaynak bulucu vardır sizin Izgarada sadece sisteminin olmalıdır işçiler nerede iş aramak için bilmeniz gereken, işçilerin iş denetim sistemi (değil, işi kontrol sistemi işçi bulma) bulmalıyız.

Iş sunucusu kendisini gerçekten (temel bir sistemde olsa) karmaşık bir görev yoktur, bu işleri el, işlerin bir listesini saklamak sonuçlar alırsınız ve daha sonra daha sonra geri alma için bunları saklamak gerekiyor. Bu parçalar (örneğin 'el işleri') nasıl tanımlanmaktadır çok basit olabilir. Daha sonra biz bir yönetim arayüzü eklemek, düzenlemek, silmek, işleri askıya ancak bu egzersizin ötesinde dahil etmek sistemi genişletebilirsiniz.

İşinizi sunucu bunu ondan çok fazla kaynak drenaj değil sağlanan ana işleme sunucu içerisinde çalışan bir sanal makine olamayacağı sonra hiçbir sebep yoktur. Bunu işleme bütün bir hafta sonu kaybedeceğiz bir Cuma akşamı aşağı giderse iş sunucusu Ancak potansiyel olarak sizin işlem süresi değerinde birkaç hafta (yalnız ana işleme sunucu göre) maliyet, yüksek erişilebilirlik ihtiyacı var . Bu yüksek kullanılabilirlik için bir yük dengeli çevreye verdiğiniz iş sunucusu koyarak düşünebilirsiniz.

Temel Kurulum

Bizim iş sunucusu için temel kurulum benim LIMP sunuculardan biri (ki Li nux, m ySql, P HP ise) aradığım ne oluşacaktır. Thea işçi çalıştıran kodu aslında işi kontrol sistemi veritabanları ile etkileşerek çalıştırabilirsiniz ne işler yoluna girecek. Daha sonra bir web hizmeti ve aslında el işleri yerine işçilerin zor işi kendileri yapmak zorunda yaratabilir, ama şimdi biz kullanmaya devam edeceğiz KISS prensibini (Basitleştirin, Stupid!).

Yani, üç oluşturmanızı sağlar mySQL işleri ile uğraşmak tablolar. Bunlar, `işler`, `jobRecords` ve `jobResults olacak`.

işler tablosu İşte kullanıyorum SQL Buddy için büyük bir küçük bir alternatif phpMyAdmin (: için diğerlerini görmek CentOS yüklemek için sırf onun kolay phpMyAdmin 10 Büyük alternatifler )

Bu tablo, 5 basit bir alandan oluşur

  • id: Tek işi tanımlamak
  • ad: Bir müşteri referansı veya diğer tanımlayıcıları herhangi bir sayı olabilir
  • Durum: Bu iş nerede olduğunu bilmek gerekir, örneğin
    • 0: Başlamadı
    • 1: aldım
    • 2: Tamamlandı
  • started_by: iş yapmaya başladı kim? Bu tamamen ihtiyaç var ama bir güzel değil. Ben ağınızdaki IP adresi ile izleme işçilerin öneririm
  • started_at: Ne zaman işçinin işe ne zaman başladınız? Zaman X miktar içinde tamamlamamış olan işleri takip ederek biz bir kez daha işi alıp başka bir işçi tarafından işleme başlamak gerekir biliyorum. İşçi işleme / stop herhangi sayısı nedenleri, elektrik kesintisi, crash, şebeke kaybı, vb için çevrimdışı gidebiliriz

Bu tablo istatistiklerini izleme, işi kaç işçi iş aldı görmek için, bir karşı ne kadar sürdüğünü görmek için bir bitiş saati sütunu için izin vermek için birkaç ek alanlar ile uzatılabilir ne kadar kolay olduğunu (tabi bu ihtiyaçları eğilimindedir 1), iş önceliği, liste uzayıp gidebilir. Daha karmaşık iş senaryolarda bu işçi (ve bu nedenle sadece uygun işçiler kullanın), hatta ne tür işçinin gerekli olacaktır erişimi gerekir ne kadar bellek belirtmek mümkün olacaktır.

Birkaç örnek işler ekleriz:

Örnek işler

Sonraki tablo yeniden anlamak için oldukça basit, bu bizim işimiz kayıtları vardır. Bunlar, bir kolon `jobs_id` tarafından ana işler tablosu ile bağlantılıdır. Bu tablo oluşturan çok sizin işçilere sağlamak için gereken verilere bağlıdır, biz dört sütun var çok basit bir örnek yapmanızı sağlar:

  • id: kaydın kimliği
  • Adı: Kişi adı
  • Adres: Kişinin adresi
  • jobs_id: Bu kayıt bağlı olduğu iş kimliği

Üçüncü ve son tablosu bir tablo içerir sonuçlar, aynı kayıtlarımızdan tablo olarak telafi kadar sahiptir ve bazı sütun ilavesi ile kayıt tablosu bir parçası olabilir:

  • job_record_id: iş tabloya sonucu Bağlantı
  • Sonuç: Sonuç olarak veri

... Ve size iş denetimi için gereken herşey! (Bir çok temel düzeyde de olsa) Benim durumumda süreç benim veri bulunduğu başka bir tabloya işaret ediyorum, ama bu kadar kolay bir dosya olmuş olabilir, simülasyon kodu çalıştırmak için parametreler, siz söyleyin.

Bir iş seçme

Daha önce belirtildiği gibi, işçilerin artık bizim için bizim iş yönetimi yapacak, bu yüzden gerçekten tüm yapmanız gereken işlem gerektiren bir iş bulmak ve bilgi almak olduğunu. Bunu nasıl yapardın? Eh bizim işimiz seçim kriterleri almak ve iş peşinde, SQL aşağıdaki yaptım:

  1. Tam olarak ama bizim görevliden işaretli olmayan herhangi bir işle alın ve (bir tanımlayıcı ile __ ME__ yerine, en kolay IP adresi olacak) bunları sıfırlamak:
     UPDATE `işler` SET `Durum` = 0 WHERE `durum` = 1 AND `started_by` = __ ME__; 
  2. Bizim işimiz seçim kriterleri kullanarak, bir iş seçin ve bu işçi onunla ilgili olduğunu kontrol sistemi söyle:
      UPDATE `işler` SET `Durum` = 1, `started_by` = __ ME__, `started_at` = ŞİMDİ () WHERE `durum` = 0 VEYA
     (`Durum` = 1 AND `started_at`> DATE_SUB (NOW (), ARALIK X SAAT)) id `ARTAN` ORDER BY; 

    Hepimizin işler AWOL çökmesini veya giden bir işçinin durumunda çalıştırmak emin zaman X miktar sonuçları dönmediği kapma işleri tarafından.

  3. Sonraki kayıtlarını kendileri tarafından takip işleri ayrıntıları yakala:
      `Işler` SELECT * FROM WHERE `started_by` = __ ME__ LIMIT 1;
     Job_records `SELECT * FROM` WHERE `id` = __ JOBID__; 

Iş tamamlandıktan sonra biz sonucu kayıt eklemek ve eksiksiz olarak iş işaretleyin. Işler istediğiniz zaman komut dosyası bazı sağlamlık için izin askıya alma / devam ettirebilirsiniz gibi hatırlıyorum. Bu görev çok akıllıca bir hareket olacak bir iş ve iş denetim sistemine geri kaydedilen sonuç sayısını kayıtların sayısını kontrol, iş denetim sisteminin güncellenmesi ile yarım askıya ki olabilir.

Ayrıca, bu işler gerçekten olması gereken bir SQL sorgusu çerçeve seçilir ve nasıl idare edilir gösterir iken soyutlayarak böylece iş kontrolü size bir web hizmeti, dosya tabanlı sistem kullanarak geçmek için karar verirseniz, XML , veya başka bir sistemlerinin numarası buna yukarıda kodu etkilemez.

İş Yapılandırma

Dikkate sonraki yönü iş boyutuna ve yapılandırma. Iş yapılandırma ile oynayarak biz mükemmel bir hızı arasındaki denge, süreç çoğaltma ve güvenilirlik grev olabilir. Bir çift OFA senaryoları atın:

  1. İşler 1 gün, her çalıştırmak için almak: Bu işçiler (zaman 2/3rds için güç% 10 hatırlamıyorum) her iş işlemek için 15 gün gerekiyor demektir. Bu açıkça akıllıca bir yapılandırma değildir, bu iş boyutuna şekilde çok büyük! İlk işçi AWOL (bir sonucu artı yeniden işleme zamanı iade etmediği pick up zamanı) gitmeli Bu bir iş işlenmiş olsun en az iki katı zaman alacaktı. İdeal olarak size ilk kayıp gitmeli, bir iş sürecini iki gün alacağını durumda tekrar ve en kötü geçiyor işler tutmak bu şekilde, kolayca her Cihaz uzun süre sonuna kadar temizlenmiş en az bir tam iş olurdu.
  2. İş çalıştırmak için 1 dakikanızı alacak: Bu işçilerin her iş çalıştırmak için yaklaşık 15 dakika sürer anlamına gelir. Bu başlangıçta idealdir görünebilir yaparken, öğle saatlerinde ek iş işleme kazanmak, kahve molaları, toplantılar, vs Bu senaryoda sistem diğer bölgelerinde yük koyar ve kendi sorunlarını tanıtır. Örneğin, öncelikle kurulum / işlem süresi oranı bu nedenle sistem verimliliğini kaybediyor, sağ aşağı gidecek. Ağ gün iş onların gün dong olan çeşitli işçi sinir bozucu personele sürekli akış iş bilgileri olacak. Ayrıca o çok ve düzenli bir çalışma küçük parçalar çok saçmak için olduğu gibi iş işleme sunucuda daha fazla zorlayacak gidiyoruz. İşinizi sunucu aşağı giderse Son olarak, bu durumda size iş sunucusu sorunlar yaşıyor olduğunu blissfully habersiz işleme devam verebilecek büyük işler tamamlanmamış ise çalışmaların büyük bir geri günlüğü oluşturmak için gidiyoruz.

Gerçekte, sizin ızgara kurulum için hiç kimse ideal bir yapılandırma olacak kadar böylece kullanılabilir kaynakları, iş türleri, iş gerçekleştirme süresi gereksinimleri, ağ yeteneği ve bağlıdır. Ancak bazı kurallar olacaktır:

  • Boyut işler böylece her işçinin 15 saatlik bir süre (en uzun olasılıkla boş zaman süresi) en az 3-4 işler aracılığıyla alabilirsiniz
  • Bu kurulum süresi işlem süresi (zihin yukarıdaki noktada rulman) ile karşılaştırıldığında oldukça önemsiz hale gelir böylece iş büyüklüğü ile oynayın.
  • Bir iş bunu tamamlamak için bekliyoruz zaman çift miktarı (belki daha az) tam olmazsa onun gitti AWOL ve başka bir işçi ile işlemeye başlayacağı varsayılmaktadır. Bu, sizin (sonraki iş başarısız olursa muhtemelen daha uzun) tamamlamak için bir iş üç kez normal uzunluğa kadar beklemek zorunda kalabilirsiniz demektir. Bu zamanı azaltmak istiyorum, ama çok fazla bir düzenli olarak işleme görevleri çoğaltarak başlayabilir olarak azaltmak için dikkatli olabilir.
  • İş dışında gereksinimleri mümkün olduğunca bağımsız olmalıdır. Iş sunucusu, örneğin, sadece her işin başında ve sonunda temasa geçilmelidir.
  • Ağınızda bombalamak etmeyin, bu iki olumsuz etkileri olacaktır, sizin gündüz personeli bağlantıları size ızgara ölçeklendirebilirsiniz olarak daha da kötüye gidecek bir sorun aşımından yaşanan olabilir ağ sinir bozucu ve sorunları kullanarak bulabilirsiniz.
  • Emin olun işler işçiler üzerinde çalıştırabilirsiniz. Işler çok bellek olursanız yoğun veya disk alanı yoğun işler durduruluyor başlayacak ve fark edeceksiniz tek şey hiçbir gerçek sebebi ile işlenen iş sayısı bir damladır.

İş ve gönderme Sonuçları

Bir işin sonuçları sunarken bu sonuçlar, mevcut işçi bir süre atıl olmuştur, özellikle eğer başka bir işçi tarafından teslim edilmemiş olması kontrol etmek önemlidir.

Sonuçları sonuç sayısını iş içindeki kayıtların sayısını eşleşen emin gönderildiğinde.

Daha önce de belirtildiği ve vurgulandığı üzerinde olamaz gibi, işi alma ve sonuç boyun hata toleransı oluşturmak. Işçilerin zamanların en uygunsuz anda askıya alma moduna geçer (ve muhtemelen) ve bunun için yiyecek ve içecek gerekiyor. Ayrıca bir kez daha sonuç verme uzakta soyutlayarak işinizi kontrol sistemi ile başa çıkmak çok daha kolay gelecek değişiklikler hitap yardımcı olacaktır.

Özet

Bu Bölümüa biz ne iş denetimi sunucusuna yapmak gerekiyor ve nasıl bir çok temel sistemi kurmak almak için baktım. Biz bir kontrol sisteminden iş ve en iyi nasıl çoğunu ofis ızgara sisteminin almak için işler yapılandırmak için almak için ele aldı. Bitirmek için, iş denetim sunucuya sonuçları geri göndererek bir paragraf ya da iki sunuldu.

  • Bir iş, kontrol sunucu işlerini yönetir ve tüm iş birimlerinin tamamlanmış olmasını sağlar
  • Seçmek / sonuç gönderme işinizi soyutlayarak biz çok sorun olmadan kontrol sunucu teknolojisi değiştirebilirsiniz
  • Onlar ağ altyapısı üzerinde çok fazla baskı olmadan hızlı ve verimli çalışması emin olmak için iş yapılandırın ve düzenli bir şekilde işleme görevleri çoğaltma olmadan.
  • Eğer rutin işlere hata toleransı ve hata checking inşa emin olun, işçilerin askıya alma ve sürdürme ve zamanların en rahatsız edici olabilir. Sonuçlar zaten başka bir işçi tarafından sunuldu olmadığını kontrol etmeyi unutmayın.

Bir dahaki sefere

Yılında part 3 bizim sanal işleme makine oluşturmak ve atıl zamanlı işçileri olmak için elimizden pencere makineleri kuracağım.

Sanal ortamlar kullanarak Office Grid - Bölüm 5

By , Cuma 4 Aralık 2009 11:03 pm

Giriş

Birçok toplu iş veriler, her gün milyonlarca kaydın işlenmesi ve ben birkaç saat hiçbir şey yapmadan her gün oturup tüm makineler hakkında son zamanlarda düşünüyordum çalıştırmak nerede bir şirkette çalışmak. Bizim sistemlerinin işlem gücü desteklemek için bu makineleri kullanabilir olsa iyi olmaz mıydı? Bu makaleler set ben bir ofis istihdam potansiyel yararları bakmak için gidiyorum ızgara sanallaştırılmış ortamlarda kullanarak.

Olarak Bölüm 4 biz elde edilen sonuçlar her zaman en son iş bilgilerini ve mantık ile güncel böylece biz kod ve veri kaynaklarının son sürümü kullanıp sağlamak için araçlarını kullanarak baktı.

Ön Dağıtım

Yaptığın bir şey ve bir şey tek başına var eğer ızgara sistemi dağıtmadan önce bu kriter mevcut sistemi olacak! Eğer numaralar teminatlar kadar bu yedeklemek için yoksa sistem yapacaksın ne kadar ekstra çalışma arkadaşları hakkında söylemek ne olursa olsun bir şey değildir. Bu yüzden,

  • Şu anda kaç kayıt işleyebilir? Günlük? Saat Başına?
  • Ne kadar tipik bir iş dönüp alır?
  • Ne kadar daha fazla kapasite var?

Ek sorular da var:

  • Sizin işleme sunucu (veya işleme sunuculardan biri) bu nasıl yeteneklerinizi etkileyecek aşağı giderse, sakat olacak?
  • Eğer / ızgara sistemi almak için bekliyoruz ne gibi avantajlar umuyorsunuz?
  • Ofisinizde makineleri işler çalıştırabilen var mı?
  • Sizin (veya iş dönüştürülebilir) çalışan bu tarzda wrok mıdır?

Son büyük nokta böyle önemli bir değişikliği üzerinde zaman almaktır. Tekrar yeni bir metodoloji, kriter kullanarak çalışmak için işlem kodu güncelleyin. Muhtemelen, bir sanal makine çalıştırmak için işleme sunucu kurmak, tüm işleme sunucu hemen sonra (nispeten sadece çok güçlü bir) başka bir işçi olacak. Yeni süreç yerleşmek için izin ver.

Dağıtım

Benim önerim ofis hafta içine pop, tüm tesisat ve kurulumu gerçekleştirmek olacaktır. Sadece bir iki haftalık tatil önce bunu yapın ve sonuçları ... belki de değil başa chap böylece diğer yoksul bırakmak ...

Bu gibi bir dağıtım sistemi için yavaş olması gerekmektedir. Bu sistemi kurmak oldukça basit olmasına rağmen, tüm ofis altyapısı (iyi dijital bir) etkileyecektir. Öncelikle, bir anda makinelerin bir çift için çalışan bilgisayarlar bir gün için günlük bazda nasıl performans monitör ağ trafiğini, dışarı rulo. Sen bulgulara tepki olarak iş yapılandırmasını değiştirmek gerekebilir.

Once the system has settled with a few machines (lets say 10% of all office machines, ie 5) keep monitoring network traffic and host machine performance. Next benchmark again, you should now be processing 33% more jobs than your first benchmarks. Check this is so, or that you're at least in this ballpark. If not, investigate what is going on before moving on. Repeat this cycle until you happily have all office machines running without killing individual machine performance or grinding your network to a standstill.

At all times keep benchmarking, even after all deployments are made. Check how new code updates affect speed of your system, check all workers are reporting in and processing jobs. Slowly (very slowly) increment your job configuration to get the best from your workers and network.

Dur!

What if you want to stop your workers from running at some time? They are all out there running, regenerating, and trying their best to process data like hungry insects. The answer may seem obvious but its worth adding just in case its overlooked. Simply edit your processing script with an exit(0) or die() or some other statement to kill your processing job. An important reason why we always try to update to the latest processing script before any run!

Demonstration System

In order to write this set of short articles I created a very small grid to demonstrate the technologies and methodologies. I read lots of articles, tutorials, and used various tools to setup and monitor what was going on. By no means have I gone out and saturated a whole office with traffic and nor have I had access to a regular staff members PC to see how host performance was affected.

My demonstration system was very humble indeed. I used my regular desktop set up as a job control server. On this I had installed mySQL server installed set up as a master in replication, PHP , and SVN linked through apache (for access via worker VM).

I then created a centOS worker machine on VirtualBox on a 6 year old windows XP laptop. I setup scheduled tasks as specified after copying the VM onto the machine and let it go.

The virtual machine was set up with PHP, subversion, and mySQL. I checked out a branch named 'worker' from my job control servers repository and made sure it could be updated using 'svn update'. Next I setup mySQL as a slave and checked that data was replicating from mySQL on the job control server down to the worker VM. After all this I setup the bash script and the cron job.

My processing script basically went along the lines of this (very simple stuff):

  • Read in the name field
  • VM yapılan veri kaynağından bir tablo içinde benzer isimler sayısı sayılır
  • Boşluklarla yukarıda ama yarma adı (yani adı, orta, soyadı) gibi isimlerin sayısı sayılır
  • Bu proses 1000 defa tekrarlanır

Her iş çalıştırmak için yaklaşık 20 dakika sürdü. Bir noktada ben pencereleri laptop işçi VM birkaç kopya açtı ve işler işçinin her bir IP adresi tarafından kapalı kontrol edilmesi izledi. Bu noktada ben de çoğaltmayı otomatik olarak yeniden doğruladı.

Iş kontrolü sunucudan işlerini işlemek için başlayan bir işçi sonuçlandı rölantide dizüstü bırakmak. Dizüstü bilgisayar kullanımı sürdürme 30-60 saniyelik bir gecikme oldu, bu zaman ve personelin adil bir miktar makine dönerken onların makine kısa bir süre duraklama olabilir farkında yapılması gereken olacaktınız. Yeni makineler bu uzun bir duraklama olmayabilir. Boşta dönemlerinde bu makineleri tarafından gerçekleştirilen işleme miktarı yararı daha bir sabah kendi makinelerine gelmeden kısa bir süre (1 dakika demek) beklemek zorunda personeli daha ağır olacak (Ben sık sık uzun süre beklemek bir Windows Defender için bu ) yer almak güncelleştirmek onlar (bir sabah kahvesi kapmak için yararlı bir zaman!) bunun farkında yapıldı sağladı.

Genel olarak ben böyle bir sistem oluşturmak için kullanılabilecek teknolojiler göstermiştir emin hissediyorum. I have shown that such a system does work on a (very) small scale and with some more experimenting could be scaled up utilise the resources of an office's machines. If I don't get to the point of doing this I would be very interested to know/see when someone else does.

Conclusions / Evaluation

The next obvious step would be to actually get a real world example and start to deploy a system such as this within an office environment and see what happens. Asking a business to commit to this without a trail blazing company to prove the technology and effectiveness may be a little difficult. Grid/Distributed computing is very popular is some circles and has some large applications (BIONC, SETI@Home, Folding@Home, etc). I did not, however, find a smaller scale and simple system like this in my searches that could be rolled out within an office environment.

I created a basically free system using mostly open source software and tools available in almost any office. The technologies were basically demonstrated and show to perform and work as expected. Hopefully I have show that with not much work and with a very simple setup you can deploy an office grid computing system that is powerful, cheap, and scalable all at the same time.

Bir kez, bir sistem ve orada çalışan neredeyse özelleştirme ve siz yapabilirsiniz gelişmeler miktarı sonu yoktur. For example statistics / benchmarking can easily be added showing the worth of such a system every day. New machines can be added quickly and easily as and when they arrive with upgrades to existing hardware bolstering your processing power.

I hope you've enjoyed reading this series of articles and its given you food for thought on running an office grid system. The solution presented here won't necessarily work in all situations but should be adaptable to allow you to get your data processing done using your own solution.

Please feel free to send me any comments, corrections, or improvements and I'll do my best to keep this article updated to match.













Tarafından Panorama Tema Themocracy

Şuanda online 6 ziyaretçi
3 guests, 3 bots, 0 members
Bugün Max ziyaretçiler: 07:18 23 UTC ÖS
This month: 26 at 04-04-2012 10:27 pm UTC
Bu yıl: 27-02-2012 09:56 de 69 UTC ÖS
Bütün Zaman: 28-03-2011 10:40 UTC de 130