云計算中分布式JobTracker節(jié)點模型的建立與優(yōu)化.pdf_第1頁
已閱讀1頁,還剩69頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、云計算是隨著大規(guī)模計算機、個人計算機、互聯網的發(fā)展而產生的第四次 IT產業(yè)革命,谷歌首先定義并發(fā)展了云計算。而云計算的開源模型Hadoop是一種基于Java的通過運行可分布式的密集型應用來分析和處理大數據的開源分布式計算平臺,其中的單點問題造成了Hadoop的性能瓶頸。針對存儲模型架構HDFS中的namenode節(jié)點的單節(jié)點優(yōu)化,Hadoop2.0提出了多節(jié)點高可用性方案,但是針對JobTracker節(jié)點的單節(jié)點優(yōu)化并沒有給出相應的解決

2、辦法。本文期望通過建立分布式 JobTracker節(jié)點模型來改善傳統(tǒng)的計算模型架構中的單 JobTracker節(jié)點故障,從而能夠自動避免單JobTracker節(jié)點故障導致的作業(yè)運行失敗。
  本文的主要工作內容及貢獻如下:
  在充分分析了前人對單 JobTracker節(jié)點模型的改進和對調度算法與負載均衡算法的調優(yōu)。首先通過對最短路徑算法Dijkstra算法、網頁權值判斷算法PageRank算法和網頁去重算法Bloom Fl

3、iter算法的研究,建立了分布式JobTracker節(jié)點模型,并通過Dijkstra算法對分布式JobTracker節(jié)點模型中多對多節(jié)點間的通信方式進行了優(yōu)化,以期望多節(jié)點模型下的多個 JobTracker節(jié)點和任務節(jié)點間能夠均衡的進行通信;其次基于PageRank算法對作業(yè)的調度方式進行了優(yōu)化;最后進一步通過Counting Bloom Filter算法改進各個節(jié)點上任務的復本數,從而對分布式JobTracker模型中節(jié)點的負載進行了

4、優(yōu)化。本文在分析完分布式 JobTracker節(jié)點模型的通信方式及其相關的調度優(yōu)化后,搭建了小型Hadoop實驗集群對結果進行了實驗驗證。
  由實驗結果可以看出,單 JobTracker節(jié)點模型與分布式 JobTracker節(jié)點模型相比,在集群發(fā)生宕機時,分布式JobTrackder節(jié)點模型具有更高的可靠性,基于Dijkstra算法的通信方式能夠更快速的選出JobTracker節(jié)點;對于改進的作業(yè)調度算法,在提交的作業(yè)具有依賴關

5、系時,基于PageRank的改進算法能夠更進一步的提高作業(yè)的整體處理時間;對于改進的負載均衡算法,從副本的存儲負載角度對集群的負載進行了優(yōu)化,從而提高了重復數據副本存儲空間利用率。實驗最后對集群的綜合性能進行了對比,由實驗結果可以看出,分布式 JobTracker節(jié)點模型下的優(yōu)化由于主要是針對特定作業(yè)的優(yōu)化與改進,處理作業(yè)的綜合性能并不如原有集群高,但是當集群發(fā)生 JobTracker節(jié)點宕機時,提高了集群的安全可靠性,并針對特殊場景的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論