java开发笔记 - java开发笔记

hadoop2 作业执行过程之作业提交

hadoop2.2.0、centos6.5 hadoop任务的提交常用的两种，一种是测试常用的IDE远程提交，另一种就是生产上用的客户端命令行提交通用的任务程序提交步骤为： 1.将程序打成jar包； 2.将jar包...

2022-12-10 322 阅读

hadoop2 作业执行过程之map过程

在执行MAP任务之前，先了解一下它的容器和它容器的领导：container和nodemanager NodeManager NodeManager(NM)是YARN中每个节点上的代理，它管理Hadoop集群中的单个计算节点，包括与Resourc...

2022-12-10 278 阅读

yarn作业提交过程以及常用命令

1、yarn简介1、Hadoop1.x版本中最大的问题是资源问题对数据的处理和资源调度主要依赖MapReduce完成，只能运行MapReduce程序JobTracker负责资源管理和程序调度，压力较大2、Hadoop2.x版本添加...

2022-12-10 542 阅读

7.hdfs工作流程及机制

1. hdfs基本工作流程 1. hdfs初始化目录结构 hdfs namenode -format 只是初始化了namenode的工作目录而datanode的工作目录是在datanode启动后自己初始化的 namenode在format初始化的时候会...

2022-12-10 402 阅读

hadoop之hdfs、yarn、MR相关总结

简介：这里对之前的hdfs、yarn、MR相关概念做一个总结，方便快速阅读理解。一、HDFSHDFS是分布式文件系统，有高容错性的特点，可以部署在价格低廉的服务器上，主要包含namenode和datanode。...

2022-12-10 324 阅读

Hadoop集群的JobHistoryServer详解(转载）

Hadoop自带了一个历史服务器，可以通过历史服务器查看已经运行完的Mapreduce作业记录，比如用了多少个Map、用了多少个Reduce、作业提交时间、作业启动时间、作业完成时间等信息。默认情况下...

2022-12-10 419 阅读

YARN配置

说明最近关于YARN的配置，尤其是调试日志的信息，总是记不住，留个记录，方便以后查看。转自董西成的博客,在此感谢董西成老师的分享。如需转载，请注明出处，链接列表如下 RM与NM相关参...

2022-12-10 463 阅读

spring springboot+kafka+sparkstreaming 生产及消费数据-超简单实例

springboot+kafka+sparkstreaming 生产及消费数据-超简单实例 kafka生产者实例： import org.apache.kafka.clients.producer.Callback;import org.apache.kafka.clients.producer.KafkaProd...

2022-12-10 783 阅读

java java8下spark-streaming结合kafka编程（spark 2.3 kafka 0.10）

前面有说道spark-streaming的简单demo，也有说到kafka成功跑通的例子，这里就结合二者，也是常用的使用之一。 1.相关组件版本首先确认版本，因为跟之前的版本有些不一样，所以才有必要记录...

2022-12-10 628 阅读

kafka Spark 2.1.2 Streaming + Kafka 1.1.0 -- 在IDEA中通过Maven创建Spark项目

一、开发环境中需要安装和配置如下安装JDK，配置JDK环境变量(jdk1.8)安装Scala，配置JDK环境变量(scala2.11.8)最好安装一个Maven,虽然Idea已经集成自带的有Maven测试环境中已经安装有Zookeep...

2022-12-10 575 阅读

归档