摘要:大量的和分區(qū)會(huì)嚴(yán)重影響集群性能。介紹可參考收到離線分區(qū)總數(shù)異常告警一般是某個(gè)節(jié)點(diǎn)宕機(jī)或者服務(wù)異常導(dǎo)致。若服務(wù)卡住,可在評(píng)估后在控制臺(tái)重啟該節(jié)點(diǎn)服務(wù)。若想了解當(dāng)前請求延時(shí)情況,建議關(guān)注平均請求延時(shí)監(jiān)控項(xiàng)。
副本數(shù)量一般建議為 3。Partitions 數(shù)量可根據(jù)集群所有節(jié)點(diǎn)磁盤塊總數(shù)(如普通實(shí)例每個(gè)節(jié)點(diǎn)只掛載一塊磁盤,而均衡I/O型根據(jù)配置不同掛載2-8塊磁盤不等)和客戶端需要的并發(fā)量設(shè)置,一般建議不要設(shè)置過大,影響集群性能。
集群可以支持任意數(shù)量的Topic,建議使用較大規(guī)模Topic代替大量較小規(guī)模的Topic,例如:需要將消息按天區(qū)分,應(yīng)該在每條消息上加上時(shí)間戳,而不是每天自動(dòng)創(chuàng)建一個(gè)新的Topic。大量的Topic和分區(qū)會(huì)嚴(yán)重影響集群性能。
參考官方文檔
節(jié)點(diǎn)kafka-logs目錄下consumer_offset相關(guān)目錄占用大量磁盤空間不釋放,怎么處理 ?在增加topic的副本時(shí),由于會(huì)復(fù)制數(shù)據(jù),建議節(jié)點(diǎn)數(shù)據(jù)盤保留有足夠的空間。
__consumer_offset
是 Kafka 用來存放客戶端消費(fèi)的 offset 信息的 Topic,默認(rèn)采用壓縮策略。
修改 log.cleaner.enable
參數(shù)為 ture
,然后按順序重啟每個(gè)節(jié)點(diǎn)kafka服務(wù)。
分區(qū)是Kafka中Topic的一個(gè)物理概念上的消息分塊,以實(shí)現(xiàn)服務(wù)的分布式與高可用。(Kafka介紹可參考intro)
收到離線分區(qū)總數(shù)異常告警一般是某個(gè)節(jié)點(diǎn)宕機(jī)或者服務(wù)異常導(dǎo)致。可通過UKafka console“節(jié)點(diǎn)管理”頁面,依次查看每個(gè)節(jié)點(diǎn)“關(guān)聯(lián)的Topic”信息,若為空,說明此節(jié)點(diǎn)異常,進(jìn)而
可在“節(jié)點(diǎn)管理”中查看server.log,觀察是否有異常日志。若kafka服務(wù)卡住,可在評(píng)估后在控制臺(tái)重啟該節(jié)點(diǎn)kafka服務(wù)。
排查過程中,每個(gè)Topic的復(fù)制因子replication-factor盡量大于等于3,以避免單機(jī)故障帶來的業(yè)務(wù)不可用
集群默認(rèn)配置 message.max.bytes
為 1MB,若需支持更大的消息,可通過集群參數(shù)配置管理修改 message.max.bytes
,replica.fetch.max.bytes
,consumer 端則需修改 fetch.message.max.bytes
。
暫不提供外網(wǎng)訪問集群功能。
默認(rèn)不支持單個(gè)節(jié)點(diǎn)縱向升級(jí),如果需要擴(kuò)充資源,可以橫向添加節(jié)點(diǎn);如果遇到內(nèi)存或其它單個(gè)節(jié)點(diǎn)的資源瓶頸,可以聯(lián)系我們提供后臺(tái)升級(jí)。
集群監(jiān)控視圖頁面提供集群流入、流出數(shù)據(jù)量、消息個(gè)數(shù)監(jiān)控,Kafka生產(chǎn)者、消費(fèi)者監(jiān)控?cái)?shù)據(jù),以及Zookeeper相關(guān)監(jiān)控?cái)?shù)據(jù),并提供每個(gè)Broker上的CPU、MEM、磁盤、網(wǎng)卡,Kafka服務(wù),以及Zookeeper監(jiān)控?cái)?shù)據(jù); 可通過Kafka Manager頁面查看每個(gè)Topic、Broker的實(shí)時(shí)流量。
zookeeper最大延時(shí)(zk_max_latency)是表示集群創(chuàng)建以來出現(xiàn)過的請求延時(shí)最大值,無法代表當(dāng)前狀態(tài)。若想了解當(dāng)前zookeeper請求延時(shí)情況,建議關(guān)注平均請求延時(shí)監(jiān)控項(xiàng)。
目前控制臺(tái)消費(fèi)者信息是根據(jù)消費(fèi)者類型分別通過訪問 zookeeper 或者調(diào)用 kafka api 得到的,但是 kafka 客戶端 sdk 可以靈活的決定對(duì)消費(fèi)者信息的存儲(chǔ)方式,所以在使用沒有以標(biāo)準(zhǔn)方式存儲(chǔ)信息的 sdk 時(shí),消費(fèi)者信息可能會(huì)獲取錯(cuò)誤。對(duì)于這些消費(fèi)者,我們目前沒有去多帶帶適配,已知會(huì)出現(xiàn)問題的 sdk 有:
pykafkahttps://github.com/Parsely/pykafka/issues/888https://github.com/Parsely/pykafka/issues/567jstorm:不會(huì)按標(biāo)準(zhǔn)的方式存儲(chǔ)消費(fèi)者組信息,是由自己管理消費(fèi)實(shí)例與 topic partition 的對(duì)應(yīng)關(guān)系以及對(duì)應(yīng)的 offset,部分信息存儲(chǔ)在 zookeeper 的/jstorm
路徑下flink 0.9 版本的 kafka 消費(fèi)信息由自己管理,不會(huì)在 kafka 這邊注冊生成 group 信息在遇到獲取信息錯(cuò)誤時(shí),可以先使用 kafka-consumer-groups.sh --bootstrap-server $(hostname):9092 --describe --group $group
命令確認(rèn)消費(fèi)者是否有信息缺失或者錯(cuò)誤。
擴(kuò)容節(jié)點(diǎn)后,在原來機(jī)器上的 topic partition 不會(huì)自動(dòng)均衡到新的機(jī)器,需要使用分區(qū)重新分配工具來均衡
控制臺(tái)提供的功能是Automatically migrating data to new machines的部分
文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請注明本文地址:http://specialneedsforspecialkids.com/yun/127092.html
摘要:集群管理集群管理集群管理本篇目錄創(chuàng)建集群創(chuàng)建集群調(diào)整集群參數(shù)調(diào)整集群參數(shù)創(chuàng)建集群創(chuàng)建集群創(chuàng)建集群點(diǎn)擊控制臺(tái)左上角全部產(chǎn)品選擇消息隊(duì)列也可鎖定到左側(cè)菜單欄。選擇完畢后,進(jìn)入集群設(shè)置頁面,可對(duì)集群參數(shù)進(jìn)行配置。 集群管理本篇目錄創(chuàng)建集群調(diào)整集群參數(shù)創(chuàng)建集群1. 點(diǎn)擊控制臺(tái)左上角全部產(chǎn)品選擇Kafka消息隊(duì)列 UKafka,也可鎖定到左側(cè)菜單欄。2. 進(jìn)入U(xiǎn)Kafka操作界面,點(diǎn)擊創(chuàng)建集群進(jìn)行UK...
摘要:快速開始本例以數(shù)據(jù)同步到來做說明。創(chuàng)建連接器點(diǎn)擊創(chuàng)建連接器按鈕,打開配置頁面。若下游為,則需配置路徑,若為,則需填寫信息。連接器列表詳情頁數(shù)據(jù)驗(yàn)證參考,為集群創(chuàng)建,并寫入消息到其中。快速開始本例以UKafka數(shù)據(jù)同步到UHadoop來做說明。創(chuàng)建連接器點(diǎn)擊【創(chuàng)建連接器】按鈕,打開配置頁面。配置連接器基本信息配置按需填寫。【上游】意為Kafka連接器上游的Kafka集群,【下游】意為Kafka...
摘要:性能測試性能測試性能測試上游,下游是的連接器節(jié)點(diǎn)數(shù)分區(qū)數(shù)數(shù)消息大小機(jī)型速度消息數(shù)核核核核核核核上游,下游是連接器節(jié)點(diǎn)數(shù)分區(qū)數(shù)數(shù)消息大小機(jī)型版本機(jī)型節(jié)點(diǎn)數(shù)分片數(shù)副本數(shù)速度消息數(shù)核核核核核核核核核 性能測試上游UKafka,下游是UHadoop的HDFS 連接器節(jié)點(diǎn)數(shù)分區(qū)數(shù)broker數(shù)消息大小/byteskafka機(jī)型hadoopmasterhadoopcore速度(消息數(shù)/s)1331024...
摘要:性能測試性能測試性能測試在不同機(jī)型集群默認(rèn)配置下,利用腳本進(jìn)行性能基準(zhǔn)測試測試結(jié)果下載 性能測試在不同機(jī)型 ukafka 集群默認(rèn)配置下,利用 kafka-producer-perf-test.sh 腳本進(jìn)行性能基準(zhǔn)測試測試結(jié)果下載
摘要:監(jiān)控視圖監(jiān)控視圖監(jiān)控視圖集群監(jiān)控集群監(jiān)控提供小時(shí)至天多個(gè)維度的集群流入流出數(shù)據(jù)量和消息個(gè)數(shù)監(jiān)控,生產(chǎn)者消費(fèi)者監(jiān)控?cái)?shù)據(jù),以及相關(guān)監(jiān)控?cái)?shù)據(jù)。節(jié)點(diǎn)監(jiān)控節(jié)點(diǎn)監(jiān)控提供每個(gè)上的磁盤網(wǎng)卡,服務(wù),以及監(jiān)控?cái)?shù)據(jù) 監(jiān)控視圖集群監(jiān)控提供1小時(shí)至15天多個(gè)維度的集群流入、流出數(shù)據(jù)量和消息個(gè)數(shù)監(jiān)控,Kafka生產(chǎn)者、消費(fèi)者監(jiān)控?cái)?shù)據(jù),以及Zookeeper相關(guān)監(jiān)控?cái)?shù)據(jù)。節(jié)點(diǎn)監(jiān)控提供每個(gè)Broker上的CPU、MEM、磁...
閱讀 284·2024-11-07 18:25
閱讀 130363·2024-02-01 10:43
閱讀 868·2024-01-31 14:58
閱讀 828·2024-01-31 14:54
閱讀 82766·2024-01-29 17:11
閱讀 3047·2024-01-25 14:55
閱讀 1985·2023-06-02 13:36
閱讀 3033·2023-05-23 10:26