温馨提示:这篇文章已超过400天没有更新,请注意相关的内容是否还可用!
摘要:,,本文介绍了Flink源码编译及作业提交的过程。需要下载并解压Flink源码,然后进行编译。编译完成后,可以通过Flink提供的作业提交工具将作业提交到Flink集群中进行处理。整个过程相对简单,但需要一定的技术基础和对Flink的基本了解。Flink是一个流处理框架,广泛应用于大数据处理领域。
在 standalone 集群中,用于启动 TaskManager 的类为 TaskManagerRunner。
通过快捷键 ctrl+n 找到并打开类:org.apache.flink.runtime.taskexecutor.TaskManagerRunner。
为了启动 TaskManager,你需要进行以下步骤:
1、打开 master 启动类。
在启动 TaskManager 之前,你需要确保 master 节点已经成功启动。
2、修改运行配置。
在运行 TaskManager 时,需要根据 master 的配置进行相应的调整,需要注意日志配置,特别是日志文件的名称需要稍作修改,可以设置如下参数:
-Dlog.file=./log/flink-taskmanager-1.local.log
以及选择合适的日志配置文件路径,如:
-Dlog4j.configuration=./conf/log4j.properties
或-Dlogback.configurationFile=./conf/logback.xml
。
3、修改 flink-conf.yaml 配置文件。
在项目的根目录下找到 conf 文件夹,并打开其中的 flink-conf.yaml 文件,在此文件中,你需要添加或修改以下配置(主要是关于 TaskManager 的内存配置):
taskmanager.resource-id
: 设置 TaskManager 的资源标识,例如tm_hitao
。
taskmanager.cpu.cores
: 设置 TaskManager 使用的 CPU 核心数,例如设置为 1。
taskmanager.memory.task.heap.size
: 设置任务堆外内存大小,例如512m
。
taskmanager.memory.managed.size
: 设置托管内存大小,例如512m
。
taskmanager.memory.network.min
和taskmanager.memory.network.max
: 分别设置网络内存的最小和最大值,例如都设置为128m
。
taskmanager.memory.task.off-heap.size
: 设置任务堆外内存大小,根据实际需求进行设置,例如设置为0m
。
上述配置中的数值仅供参考,实际部署时需要根据集群的硬件资源和业务需求进行调整,确保所有配置正确后,即可启动 TaskManager。
还没有评论,来说两句吧...