摘要:如果兩個(gè)都掛掉了,那就要做相對(duì)麻煩的操作了,而且相對(duì)對(duì)數(shù)據(jù)不安全以下是參考案例異常停止后無(wú)法正常啟動(dòng)
博客原文:hackershell
前段時(shí)間,standby的NN掛掉了,并且怎么起也起不來(lái),如下日志:
2016-01-03 14:04:19,293 FATAL org.apache.hadoop.hdfs.server.namenode.ha.EditLogTailer: Unknown error encountered while tailing edits. Shutting down standby NN. java.io.IOException: Failed to apply edit log operation ReassignLeaseOp [leaseHolder=DFSClient_NONMAPREDUCE_854707399_1, path=/tmp/jrdw/kafka2hdfs/log_mobile_gateway-21-1443245603647--6536501137915724876, newHolde r=HDFS_NameNode, opCode=OP_REASSIGN_LEASE, txid=20790808505]: error File is not under construction: /tmp/jrdw/kafka2hdfs/log_mobile_gateway-21-1443245603647--6536501137915724876 at org.apache.hadoop.hdfs.server.namenode.MetaRecoveryContext.editLogLoaderPrompt(MetaRecoveryContext.java:94) at org.apache.hadoop.hdfs.server.namenode.FSEditLogLoader.loadEditRecords(FSEditLogLoader.java:205) at org.apache.hadoop.hdfs.server.namenode.FSEditLogLoader.loadFSEdits(FSEditLogLoader.java:112) at org.apache.hadoop.hdfs.server.namenode.FSImage.loadEdits(FSImage.java:771) at org.apache.hadoop.hdfs.server.namenode.ha.EditLogTailer.doTailEdits(EditLogTailer.java:227) at org.apache.hadoop.hdfs.server.namenode.ha.EditLogTailer$EditLogTailerThread.doWork(EditLogTailer.java:321) at org.apache.hadoop.hdfs.server.namenode.ha.EditLogTailer$EditLogTailerThread.access$200(EditLogTailer.java:279) at org.apache.hadoop.hdfs.server.namenode.ha.EditLogTailer$EditLogTailerThread$1.run(EditLogTailer.java:296) at org.apache.hadoop.security.SecurityUtil.doAsLoginUserOrFatal(SecurityUtil.java:456) at org.apache.hadoop.hdfs.server.namenode.ha.EditLogTailer$EditLogTailerThread.run(EditLogTailer.java:292)
剛開(kāi)始懷疑是不是editlog的下載有問(wèn)題,后來(lái)發(fā)現(xiàn)editlog是可以解析出來(lái)的,但是不排除editlog的順序存在bug
我們采取的方案是:
因?yàn)槊看螁?dòng)都需要加載editlog,所以為了跳過(guò)此操作,我們將Active進(jìn)入安全模式,并進(jìn)行saveNameSpace將dump出來(lái)的fsimage和txid拷貝到Standby NN上,重啟就可以避免加載editlog了。
如果兩個(gè)NN都掛掉了,那就要做相對(duì)麻煩的操作了,而且相對(duì)對(duì)數(shù)據(jù)不安全
以下是參考案例:
Namenode異常停止后無(wú)法正常啟動(dòng)
文章版權(quán)歸作者所有,未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請(qǐng)注明本文地址:http://specialneedsforspecialkids.com/yun/65400.html
摘要:是如何實(shí)現(xiàn)的我們前面說(shuō)到,是如何判斷是否健康,接下來(lái)當(dāng)處于非健康狀態(tài)時(shí),是如何進(jìn)行切換的呢在這個(gè)類中,實(shí)行了兩個(gè)重要的函數(shù),一個(gè)叫,另一個(gè)叫,顧名思義就是選舉和健康檢查用的回調(diào)函數(shù),其中還有兩個(gè)重要的組成部分,,總體的就如上圖所示。 博客原文:hackershell 之前在準(zhǔn)備中級(jí)課程PPT,整理了下HA的基本內(nèi)容,并且感謝松哥為我們提供了HA不會(huì)切的問(wèn)題,以至于之后剛好出現(xiàn)的Name...
閱讀 2424·2021-11-23 10:04
閱讀 1494·2021-09-02 15:21
閱讀 891·2019-08-30 15:44
閱讀 1060·2019-08-30 10:48
閱讀 707·2019-08-29 17:21
閱讀 3553·2019-08-29 13:13
閱讀 1983·2019-08-23 17:17
閱讀 1784·2019-08-23 17:04