摘要:相關文章從到學習介紹從到學習上搭建環境并構建運行簡單程序入門從到學習配置文件詳解從到學習介紹從到學習如何自定義從到學習介紹從到學習如何自定義
前面文章我們已經知道 Flink 是什么東西了,安裝好 Flink 后,我們再來看下安裝路徑下的配置文件吧。
安裝目錄下主要有 flink-conf.yaml 配置、日志的配置文件、zk 配置、Flink SQL Client 配置。
flink-conf.yaml 基礎配置# jobManager 的IP地址 jobmanager.rpc.address: localhost # JobManager 的端口號 jobmanager.rpc.port: 6123 # JobManager JVM heap 內存大小 jobmanager.heap.size: 1024m # TaskManager JVM heap 內存大小 taskmanager.heap.size: 1024m # 每個 TaskManager 提供的任務 slots 數量大小 taskmanager.numberOfTaskSlots: 1 # 程序默認并行計算的個數 parallelism.default: 1 # 文件系統來源 # fs.default-scheme高可用性配置
# 可以選擇 "NONE" 或者 "zookeeper". # high-availability: zookeeper # 文件系統路徑,讓 Flink 在高可用性設置中持久保存元數據 # high-availability.storageDir: hdfs:///flink/ha/ # zookeeper 集群中仲裁者的機器 ip 和 port 端口號 # high-availability.zookeeper.quorum: localhost:2181 # 默認是 open,如果 zookeeper security 啟用了該值會更改成 creator # high-availability.zookeeper.client.acl: open容錯和檢查點 配置
# 用于存儲和檢查點狀態 # state.backend: filesystem # 存儲檢查點的數據文件和元數據的默認目錄 # state.checkpoints.dir: hdfs://namenode-host:port/flink-checkpoints # savepoints 的默認目標目錄(可選) # state.savepoints.dir: hdfs://namenode-host:port/flink-checkpoints # 用于啟用/禁用增量 checkpoints 的標志 # state.backend.incremental: falseweb 前端配置
# 基于 Web 的運行時監視器偵聽的地址. #jobmanager.web.address: 0.0.0.0 # Web 的運行時監視器端口 rest.port: 8081 # 是否從基于 Web 的 jobmanager 啟用作業提交 # jobmanager.web.submit.enable: false高級配置
# io.tmp.dirs: /tmp # 是否應在 TaskManager 啟動時預先分配 TaskManager 管理的內存 # taskmanager.memory.preallocate: false # 類加載解析順序,是先檢查用戶代碼 jar(“child-first”)還是應用程序類路徑(“parent-first”)。 默認設置指示首先從用戶代碼 jar 加載類 # classloader.resolve-order: child-first # 用于網絡緩沖區的 JVM 內存的分數。 這決定了 TaskManager 可以同時擁有多少流數據交換通道以及通道緩沖的程度。 如果作業被拒絕或者您收到系統沒有足夠緩沖區的警告,請增加此值或下面的最小/最大值。 另請注意,“taskmanager.network.memory.min”和“taskmanager.network.memory.max”可能會覆蓋此分數 # taskmanager.network.memory.fraction: 0.1 # taskmanager.network.memory.min: 67108864 # taskmanager.network.memory.max: 1073741824Flink 集群安全配置
# 指示是否從 Kerberos ticket 緩存中讀取 # security.kerberos.login.use-ticket-cache: true # 包含用戶憑據的 Kerberos 密鑰表文件的絕對路徑 # security.kerberos.login.keytab: /path/to/kerberos/keytab # 與 keytab 關聯的 Kerberos 主體名稱 # security.kerberos.login.principal: flink-user # 以逗號分隔的登錄上下文列表,用于提供 Kerberos 憑據(例如,`Client,KafkaClient`使用憑證進行 ZooKeeper 身份驗證和 Kafka 身份驗證) # security.kerberos.login.contexts: Client,KafkaClientZookeeper 安全配置
# 覆蓋以下配置以提供自定義 ZK 服務名稱 # zookeeper.sasl.service-name: zookeeper # 該配置必須匹配 "security.kerberos.login.contexts" 中的列表(含有一個) # zookeeper.sasl.login-context-name: ClientHistoryServer
# 你可以通過 bin/historyserver.sh (start|stop) 命令啟動和關閉 HistoryServer # 將已完成的作業上傳到的目錄 # jobmanager.archive.fs.dir: hdfs:///completed-jobs/ # 基于 Web 的 HistoryServer 的地址 # historyserver.web.address: 0.0.0.0 # 基于 Web 的 HistoryServer 的端口號 # historyserver.web.port: 8082 # 以逗號分隔的目錄列表,用于監視已完成的作業 # historyserver.archive.fs.dir: hdfs:///completed-jobs/ # 刷新受監控目錄的時間間隔(以毫秒為單位) # historyserver.archive.fs.refresh-interval: 10000
查看下另外兩個配置 slaves / master
2、slaves里面是每個 worker 節點的 IP/Hostname,每一個 worker 結點之后都會運行一個 TaskManager,一個一行。
localhost3、masters
host:port
localhost:80814、zoo.cfg
# 每個 tick 的毫秒數 tickTime=2000 # 初始同步階段可以采用的 tick 數 initLimit=10 # 在發送請求和獲取確認之間可以傳遞的 tick 數 syncLimit=5 # 存儲快照的目錄 # dataDir=/tmp/zookeeper # 客戶端將連接的端口 clientPort=2181 # ZooKeeper quorum peers server.1=localhost:2888:3888 # server.2=host:peer-port:leader-port5、日志配置
Flink 在不同平臺下運行的日志文件
log4j-cli.properties log4j-console.properties log4j-yarn-session.properties log4j.properties logback-console.xml logback-yarn.xml logback.xmlsql-client-defaults.yaml
execution: # "batch" or "streaming" execution type: streaming # allow "event-time" or only "processing-time" in sources time-characteristic: event-time # interval in ms for emitting periodic watermarks periodic-watermarks-interval: 200 # "changelog" or "table" presentation of results result-mode: changelog # parallelism of the program parallelism: 1 # maximum parallelism max-parallelism: 128 # minimum idle state retention in ms min-idle-state-retention: 0 # maximum idle state retention in ms max-idle-state-retention: 0 deployment: # general cluster communication timeout in ms response-timeout: 5000 # (optional) address from cluster to gateway gateway-address: "" # (optional) port from cluster to gateway gateway-port: 0
Flink sql client :你可以從官網這里了解 https://ci.apache.org/project...
總結本文拿安裝目錄文件下的配置文件講解了下 Flink 目錄下的所有配置。
你也可以通過官網這里學習更多:https://ci.apache.org/project...
關注我本篇文章地址是:http://www.54tianzhisheng.cn/2018/10/27/flink-config/
另外我自己整理了些 Flink 的學習資料,目前已經全部放到微信公眾號了。你可以加我的微信:zhisheng_tian,然后回復關鍵字:Flink 即可無條件獲取到。
相關文章1、《從0到1學習Flink》—— Apache Flink 介紹
2、《從0到1學習Flink》—— Mac 上搭建 Flink 1.6.0 環境并構建運行簡單程序入門
3、《從0到1學習Flink》—— Flink 配置文件詳解
4、《從0到1學習Flink》—— Data Source 介紹
5、《從0到1學習Flink》—— 如何自定義 Data Source ?
6、《從0到1學習Flink》—— Data Sink 介紹
7、《從0到1學習Flink》—— 如何自定義 Data Sink ?
文章版權歸作者所有,未經允許請勿轉載,若此文章存在違規行為,您可以聯系管理員刪除。
轉載請注明本文地址:http://specialneedsforspecialkids.com/yun/72057.html
摘要:本篇文章連接是關注我微信公眾號另外我自己整理了些的學習資料,目前已經全部放到微信公眾號了。你可以加我的微信,然后回復關鍵字即可無條件獲取到。 前言 寫這篇文章其實也是知識星球里面的一個小伙伴問了這樣一個問題: 通過 flink UI 儀表盤提交的 jar 是存儲在哪個目錄下? 這個問題其實我自己也有問過,但是自己因為自己的問題沒有啥壓力也就沒深入去思考,現在可是知識星球的付費小伙伴問的...
showImg(https://segmentfault.com/img/remote/1460000019961426); 今天在 Apache Flink meetup ·北京站進行 Flink 1.9 重大新特性進行了講解,兩位講師分別是 戴資力/楊克特,zhisheng 我也從看完了整個 1.9 特性解讀的直播,預計 Flink 1.9 版本正式發布時間大概是 7 月底 8 月初左右正式發...
摘要:模塊中的類結構如下博客從到學習介紹從到學習上搭建環境并構建運行簡單程序入門從到學習配置文件詳解從到學習介紹從到學習如何自定義從到學習介紹從到學習如何自定義從到學習轉換從到學習介紹中的從到學習中的幾種詳解從到學習讀取數據寫入到從到學 Flink-Client 模塊中的類結構如下: https://t.zsxq.com/IMzNZjY showImg(https://segmentfau...
閱讀 3581·2023-04-26 02:55
閱讀 2849·2021-11-02 14:38
閱讀 4135·2021-10-21 09:39
閱讀 2841·2021-09-27 13:36
閱讀 3942·2021-09-22 15:08
閱讀 2642·2021-09-08 10:42
閱讀 2802·2019-08-29 12:21
閱讀 666·2019-08-29 11:22