Hadoop 托管Hadoop集群 UHadoop

ernest.wang 發(fā)布于2022-07-12 17:03 / 3403人閱讀

摘要：如果長時間之后，集群的數(shù)據(jù)量還是不均衡，可以在集群管理頁面提交數(shù)據(jù)均衡請求，如下圖數(shù)據(jù)均衡數(shù)據(jù)均衡也可以在節(jié)點提交均衡命令是判斷集群是否平衡的目標參數(shù)。

Hadoop

本篇目錄

訪問HDFS數(shù)據(jù)提示Operation category READ is not supported in state standby？為什么HDFS實際可用空間比配置的小？為什么/home/hadoop/etc/hadoop/slaves沒有指定其他節(jié)點IP，只配置了localhost？Hadoop回收站占用大量空間，數(shù)據(jù)文件未正常清理，如何清理空間占用？Hadoop lzo找不到Native的庫？如何調(diào)整task節(jié)點的配置？用戶給任務(wù)設(shè)置的內(nèi)存量為1000MB，為何最終分配的內(nèi)存卻比1000MB大？怎么在任務(wù)日志里定位損壞的文件？為集群添加了core節(jié)點以后，是否需要進行數(shù)據(jù)均衡？hdfs讀數(shù)據(jù)響應(yīng)慢怎么辦？hdfs并發(fā)寫入失敗？

訪問HDFS數(shù)據(jù)提示Operation category READ is not supported in state standby？

由于在UHadoop中Master配置是HA的，故NameNode也有2個，同一時刻一個節(jié)點為Active，另一個為Standby,一般內(nèi)存跑高或者網(wǎng)絡(luò)波動都可能會導(dǎo)致主從切換，不建議客戶端使用Master節(jié)點IP訪問HDFS數(shù)據(jù)。

正確使用方法：如果所在機器已經(jīng)部署好UHadoop客戶端（部署方法請參考hadoopdev#在UHost上安裝Hadoop客戶端），可直接通過hadoop fs -ls / 或者hadoop fs -ls hdfs://Ucluster/訪問

如果是客戶端代碼，可以將集群/home/hadoop/conf/hdfs-site.xml和/home/hadoop/conf/core-site.xml拷貝到本地程序中，通過conf.addResource加載2個文件，即可通過hdfs://Ucluster/訪問HDFS數(shù)據(jù)

為什么HDFS實際可用空間比配置的小？

core節(jié)點由于要啟動node-manager 服務(wù)，會存一部分本地數(shù)據(jù)。所以，會用到額外的空間。core1節(jié)點會被zookeeper和 jornal-node占用一部分空間。所以，會更少一點。標準是配置90%空間給HDFS。

為什么/home/hadoop/etc/hadoop/slaves沒有指定其他節(jié)點IP，只配置了localhost？

slaves相當于一份白名單機制，如果不配置此文件，默認新加core節(jié)點可以直接加入集群；新加節(jié)點是通過讀取hdfs-site.xml文件中的namenode相關(guān)信息找到并正確加入集群的，其他用戶節(jié)點或者網(wǎng)絡(luò)不通的節(jié)點是無法加入本集群的。

hbase的regionservers文件配置同理。

Hadoop回收站占用大量空間，數(shù)據(jù)文件未正常清理，如何清理空間占用？

".Trash" 的文件默認配置是按5天check一次的，如果 ".Trash" 目錄下的文件超過5天就會刪除，如果沒超過5天，這個文件會放到類似 "/.Trash/yyMMddHHmm" 命名的文件中，然后等待5天做下一次檢查，這些文件才會被刪除，因此 ".Trash" 文件會保存5-10天。

可以更改以下2個參數(shù)更改保存與check時間：

fs.trash.interval文件保存時間fs.trash.checkpoint.interval文件check時間，默認等于"fs.trash.interval"

Hadoop lzo找不到Native的庫？

- 錯誤1：Could not load native gpl library

確認當前客戶端配置和集群一樣的環(huán)境變量 “LD_LIBRARY_PATH”

- 錯誤2：java.lang.RuntimeException: native-lzo library not available

這個錯誤是執(zhí)行任務(wù)的機器沒有安裝lzo-devel，程序找不到liblzo2.so.2導(dǎo)致的，在該機器上執(zhí)行如下命令安裝即可：

yum install lzo lzo-devel

如何調(diào)整task節(jié)點的配置？

為了便于管理，目前task節(jié)點必須保持統(tǒng)一的配置。

所以需要調(diào)整task節(jié)點配置的時候，只能通過刪除現(xiàn)有的task節(jié)點后，選擇新的類型。

注意： 1.刪除task節(jié)點時，會影響到當前正在運行中的任務(wù)； 2.需要用戶自行備份的刪除節(jié)點上的數(shù)據(jù)。

用戶給任務(wù)設(shè)置的內(nèi)存量為1000MB，為何最終分配的內(nèi)存卻比1000MB大？

為了易于管理資源和調(diào)度資源，Yarn內(nèi)置了資源規(guī)整化算法，它規(guī)定了最小可申請資源量、最大可申請資源量和資源規(guī)整化因子，如果應(yīng)用程序申請的資源量小于最小可申請資源量，則Yarn會將其大小改為最小可申請量，也就是說，應(yīng)用程序獲得資源不會小于自己申請的資源，但也不一定相等；如果應(yīng)用程序申請的資源量大于最大可申請資源量，則會拋出異常，無法申請成功；規(guī)整化因子是用來規(guī)整化應(yīng)用程序資源的，應(yīng)用程序申請的資源如果不是該因子的整數(shù)倍，則將被修改為最小的整數(shù)倍對應(yīng)的值，公式為ceil(a/b)*b，其中a是應(yīng)用程序申請的資源，b為規(guī)整化因子。

以上介紹的參數(shù)需在yarn-site.xml中設(shè)置，相關(guān)參數(shù)如下：

- yarn.scheduler.minimum-allocation-mb：最小可申請內(nèi)存量，默認是1024

- yarn.scheduler.minimum-allocation-vcores：最小可申請CPU數(shù)，默認是1

- yarn.scheduler.maximum-allocation-mb：最大可申請內(nèi)存量，默認是8096

- yarn.scheduler.maximum-allocation-vcores：最大可申請CPU數(shù)，默認是4

對于規(guī)整化因子，不同調(diào)度器不同，具體如下：

- FIFO和Capacity Scheduler：規(guī)整化因子等于最小可申請資源量，不可多帶帶配置。

- Fair Scheduler：規(guī)整化因子通過參數(shù)yarn.scheduler.increment-allocation-mb和yarn.scheduler.increment-allocation-vcores設(shè)置，默認是1024和1。

通過以上介紹可知，應(yīng)用程序申請到資源量可能大于資源申請的資源量，比如YARN的最小可申請資源內(nèi)存量為1024，規(guī)整因子是1024，如果一個應(yīng)用程序申請1500內(nèi)存，則會得到2048內(nèi)存，如果規(guī)整因子是512，則得到1536內(nèi)存。

怎么在任務(wù)日志里定位損壞的文件？

如果上傳的文件使用了壓縮，并且有破損的時候，會導(dǎo)致執(zhí)行的任務(wù)失敗。可以通過查看任務(wù)的日志文件定位損壞的文件。

  - 從web-yarn的界面找到出錯的任務(wù)；
  - 點擊查看任務(wù)的詳細信息；
  - 打開任務(wù)的History鏈接，找到失敗的Mapper；
  - 查看具體失敗的mapper處理的是哪一個文件。

有兩種方法可以避免這個問題：

  - 如果這個文件對結(jié)果影響不大， 那么可以跳過這個錯誤。 可以通過交任務(wù)時指定mapreduce.map.skip.maxrecords來跳過這個錯誤，讓任務(wù)可以繼續(xù)下去；
  - 使用其他的壓縮格式。因為gzip壓縮需要保持整個文件完整才能解壓，推薦使用lzo格式，即使文件部分損壞，也可以保證任務(wù)繼續(xù)運行。

為集群添加了core節(jié)點以后，是否需要進行數(shù)據(jù)均衡？

添加節(jié)點成功后，后臺會自動進行數(shù)據(jù)均衡。如果長時間之后，集群的數(shù)據(jù)量還是不均衡，可以在“集群管理”頁面提交數(shù)據(jù)均衡請求，如下圖：

也可以在master節(jié)點提交均衡命令：

/home/hadoop/sbin/start-balancer.sh -threshold 10

threshold是判斷集群是否平衡的目標參數(shù)。默認值為10。表示當集群中所有core節(jié)點的可用磁盤容量百分比的差距小于10時，退出數(shù)據(jù)均衡。

因為在數(shù)據(jù)均衡的同時，也會有數(shù)據(jù)寫入，可以在/home/hadoop/conf/hdfs-site.xml中修改數(shù)據(jù)均衡時可以占用的帶寬：

<property> 
<name>dfs.balance.bandwidthPerSecname> 
<value>10485760value>
property>

這面是設(shè)置傳輸速率為20M/S。

注意：該值如果設(shè)置過大，可能會影響正常的hdfs讀寫和yarn任務(wù)執(zhí)行。

hdfs讀數(shù)據(jù)響應(yīng)慢怎么辦？

如果發(fā)現(xiàn)hdfs讀數(shù)據(jù)響應(yīng)慢，出現(xiàn)

WARN org.apache.hadoop.hdfs.server.datanode.DataNode: Slow BlockReceiver write data to disk cost

可以從以下幾個方面查找問題：

  - 檢查磁盤IO；
  - 檢查對于節(jié)點的GC情況；
  - 檢查網(wǎng)絡(luò)帶寬；

hdfs并發(fā)寫入失敗？

HDFS 支持并發(fā)讀、讀寫，但寫入不能并發(fā)。有且僅有一個客戶端時可同一時刻寫某個文件，但多個客戶端不能同時對HDFS寫文件。這是由于當一個客戶端獲得NameNode的允許去寫DataNode上的一個塊時，這個塊會被鎖住，直到操作完成。

文章版權(quán)歸作者所有，未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為，您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請注明本文地址：http://specialneedsforspecialkids.com/yun/126740.html

發(fā)表評論

登陸后可評論

0條評論

ernest.wang

男|高級講師

我要關(guān)注我要私信

TA的文章

特朗普勝任，將對跨境電商賣家產(chǎn)生哪些影響？

閱讀 351·2024-11-07 18:25
幻獸帕魯常見問題匯總

閱讀 130598·2024-02-01 10:43
在Linux和Windows上部署帕魯?shù)膮^(qū)別？

閱讀 914·2024-01-31 14:58
怎么重啟幻獸帕魯云服務(wù)器？

閱讀 879·2024-01-31 14:54
幻獸帕魯自建服務(wù)器存檔備份及回檔 - windows篇

閱讀 82884·2024-01-29 17:11
小白必讀教程，幻獸帕魯服務(wù)器手動部署教程 - Windows篇

閱讀 3176·2024-01-25 14:55
A800GPU租用-A800顯卡

閱讀 2028·2023-06-02 13:36
5G短信和普通短信的區(qū)別

閱讀 3108·2023-05-23 10:26

国产xxxx99真实实拍_久久不雅视频_高清韩国a级特黄毛片_嗯老师别我我受不了了小说

資訊專欄INFORMATION COLUMN

上云采購季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺、長期優(yōu)惠，快來選購！

Hadoop 托管Hadoop集群 UHadoop

Hadoop

本篇目錄

訪問HDFS數(shù)據(jù)提示Operation category READ is not supported in state standby？

為什么HDFS實際可用空間比配置的小？

為什么/home/hadoop/etc/hadoop/slaves沒有指定其他節(jié)點IP，只配置了localhost？

Hadoop回收站占用大量空間，數(shù)據(jù)文件未正常清理，如何清理空間占用？

Hadoop lzo找不到Native的庫？

如何調(diào)整task節(jié)點的配置？

用戶給任務(wù)設(shè)置的內(nèi)存量為1000MB，為何最終分配的內(nèi)存卻比1000MB大？

怎么在任務(wù)日志里定位損壞的文件？

為集群添加了core節(jié)點以后，是否需要進行數(shù)據(jù)均衡？

hdfs讀數(shù)據(jù)響應(yīng)慢怎么辦？

hdfs并發(fā)寫入失敗？

相關(guān)文章

**托管Hadoop集群快速上手 UHadoop**

**常用操作托管Hadoop集群 UHadoop**

**元數(shù)據(jù)管理托管Hadoop集群 UHadoop**

**Hue開發(fā)指南托管Hadoop集群 UHadoop**

**Hive 托管Hadoop集群 UHadoop**

發(fā)表評論

0條評論

ernest.wang

男|高級講師

TA的文章

特朗普勝任，將對跨境電商賣家產(chǎn)生哪些影響？

幻獸帕魯常見問題匯總

在Linux和Windows上部署帕魯?shù)膮^(qū)別？

怎么重啟幻獸帕魯云服務(wù)器？

幻獸帕魯自建服務(wù)器存檔備份及回檔 - windows篇

小白必讀教程，幻獸帕魯服務(wù)器手動部署教程 - Windows篇

A800GPU租用-A800顯卡

5G短信和普通短信的區(qū)別

最新活動