辦公室網格計算使用虛擬環境-第1部分
介紹
我在一家公司上班,我們許多批處理作業處理數據每天數以百萬計的記錄,我一直在想最近所有的機器,周圍坐的每一天做幾個小時沒有運行。 如果我們可以使用這些機器,以增強我們的系統的處理能力,豈不是好? 在這組文章中,我要去看看用人辦公室電網使用虛擬環境的潛在好處。
作為一個PHP開發人員,我要使用的工具,我使用的每一天,即Linux中, MYSQL ,PHP,VirtualBox和顛覆(SVN)的。 不過,我希望本指南將適應其他語言和技術一樣好。
提供解決方案,我將非常鬆散的基礎上處理,我們就需要實現,但是這可能不是通過整篇文章的真實,我會改變為簡單的事情,或產生更有趣的使用場景類型。
這些虛擬環境將Windows機器上運行,因為這是大多數辦事處運行。 辦公室機器做了處理,不應該干涉員工使用這些機器,應該不需要在機器的維修,並很容易地部署到新機,因為他們成為可用。 此外,新的虛擬機,不需要任何額外的配置,因為這大大降低了在可擴展的網格系統的可擴展性和易用性。
為什麼要部署Office的計算網格嗎?
首先,你可能會想,為什麼不使用雲計算資源,如Amazon的EC2平台 ? 原因可能有幾個,例如:
- 你不會委託到雲計算環境中的某些數據
- 到雲計算環境中,你不能把某些數據(如數據離開該國)法律上的原因,可能出於法律原因,如NHS的紀錄。
- 你要保持加工單位關閉,並有超過硬件的完全控制
- 你沒有項目資金運行雲實例
- 你的辦公室並沒有連接到互聯網,因此它不可能使用雲資源
- 你不喜歡雨,雲建議雨,因此你保持良好
我敢肯定,這個名單可以繼續,但我認為這是足夠現在。
一個辦公室計算網格的優點
好吧,讓我們做一些數學(在真實的物理風格讓一些籠統的假設)。 試想一下,你有大的的仡處理服務器上運行100每一天的工作。 在你的辦公室有50台機器,每天16小時處於閒置狀態,這些機器是只要你仡處理SEVER強大的10%。 (四捨五入到這裡所有的結果都低估的性能提升)。
因此,1台* 10%的電力* 2/3的時間= 0.067 1,即在桌面空閒時間處理, 每天可處理6的全面工作 。
如果你現在擴展這件事,它需要15閒置的台式機,每天處理盡可能多的就業機會,作為你的主服務器進行處理。
因此,在我們假裝辦公室50台機器,我們可以增加1服務器我們4個全處理服務器的處理能力,或者我們可以處理400每一天的工作,而不是100。
通知,貴公司已沒有新的硬件投資只是增加其批量處理能力的4倍 ! 潛在的,你要你的用電量增加,但大多數辦公環境,我去過機一般都留下過夜了,所以你可以看到作為一個綠色倡議。
也意味著,在新的投資(或更新)處理服務器可以被延遲,如果你的辦公室機器充足,為您提高您的辦公設備的電源,你的辦公室網格變得更加強大,自動等優勢。
技術
你需要什麼? (或更正確,我沒有什麼用):
- 閒置辦公設備(備用的舊的Windows XP的筆記本電腦在我的情況)
- VirtualBox的(或其他虛擬化客戶端軟件)
- 與PHP,mySQL的runningÂ切割下來操作系統上運行的虛擬機,我打電話給我的這些LIMP服務器 :)
- 喬布斯運行
- 作業服務器(可以是另一台虛擬機的地方)
典型的工作
,該系統被設計為運行工作的類型如下:
- 系統接收到的數據,這就需要我們以匹配並返回結果列表
- 符合條件的涉及檢查/尋找數(相當靜態)的數據源
- 從數據源的結果,可能需要進一步驗證,合併,其他數據源的檢查結果
- 數據返回匹配的記錄,充分驗證和處理
- 內工作的每個記錄是獨立的休息
所以基本上我們尋找正在運行的作業,這需要一個數據庫查詢的混合物和一些數字運算,在一個商業環境相當典型的場景。
電網解決方案是處理這種類型的工作,不僅有利。 基本上可以並行運行,任何分裂過程可分為獨立單位。 為例子和詳細信息,請參見本維基百科: 網格計算 ,但幾個著名的例子是SETI @ HOME和BIONC 。 有運行計算網格框架,這些都值得探討。
我們會實現嗎?
通過這些文章的最後,我希望部署辦公網格,不需要非常昂貴或費時。 我要討論:
- 設置作業控制系統,工作配置
- 創建一個適當的處理虛擬機
- 如何設置在Windows機器上的系統
- 確保您使用的是最新的代碼和數據
- 部署和基準
- 展望未來
我會大樓(我建的,然後寫這)一個示例應用程序來測試使用Windows XP和我GridMachine“虛擬機上的本地機的概念。 我的作業控制服務器將成為我主要的機器上運行Fedora 11中 。
這絕不是為了展示一個完全工作的強大的系統,它意味著更多的示範和討論顯示,這些東西可以在相當短的時間空間,在較小的代價實現。 請隨時給我任何意見,更正,或改善,我會盡我最大努力保持更新以匹配本文。
下一次
第2部分 ,我會開始在尋找工作控制系統,並考慮工作應該如何進行配置,以達到處理量最大,同時確保每個作業無故障處理。

















































