大数据 Apache atlas liunx环境安装部署手册
一、 背景本文使用一台ubuntu虚拟机安装Apache-atlas,使用集成包unzip apache-atlas-2.1.0.zip进行快速安装部署,该集成包高度集成了hadoo...
大数据 DolphinScheduler 3.2.0(海豚调度) 安装部署
Zookeeper 安装1、下载安装包wget https://downloads.apache.org/zookeeper/zookeeper-3.8.4/apache-zookeeper-3.8.4-bin.tar.gz2、解压安装包,并存放到制定目录下 tar -xzf...
大数据 安装Oozie的x详细步骤
一、前提条件Java环境Oozie是基于Java开发的,所以需要先安装Java Development Kit(JDK)。确保系统中已经安装了合适版本的JDK,推荐使用JDK 8或者更高版本。可以通过在终端中输入java -ver...
springboot Spring Boot 项目中集成 Kafka 和 Flink:构建实时数据流处理系统
导语:在现代数据处理中,Spring Boot 项目集成 Kafka 和 Flink 流处理框架是实现实时数据处理和分析的关键。本文将为您介绍具体步骤和相关代码,帮...
大数据 Kylin 的 安装 和 启动
Kylin 依赖环境安装 Kylin 前需先部署好 Hadoop、Hive、Zookeeper、Hbase、Spark,并且需要在/etc/profile 中配置以下环境变量 HADOOP_HOME,HIVE_HOME,HBASE_HOME,SPARK_HOME 记 得 sourc...
Kylin apache kylin概述
1 Kylin是什么在大数据处理技术领域,用户最普遍的诉求就是希望以很简易的方式从大数据平台上快速获取查询结果,同时也希望传统的商 务智能工具能够直接和大数据平台连接起来,以便使用这些...
大数据 6、Flink的常用Sink
1.1 Data Sink 数据输出经过一系列Transformation转换操作后,最后一定要调用Sink操作,才会形成一个完整的DataFlow拓扑。只有调用了Sink操作,才会产生最终的计算结果,这些...
大数据 5、Flink本地模式添加web页面
将flink提交到集群中运行,可以看到job的的执行计划、占用的资源情况、Task的数量和并行度、内存、checkpoint等信息。但是将必须先job打成jar包,然后通过web页面或命令行提交到集群中执行。...
大数据 4、Flink的常用Source
1.1 Data Source数据源在实时计算DataStream API中,Source是用来获取外部数据源的操作,按照获取数据的方式,可以分为:基于集合的Source、基于Socket网络端口的Source、基...
大数据 3、flink编程入门
1 Flink编程入门1.1 初始化Flink项目模板1.1.1 准备工作要求安装Maven 3.0.4 及以上版本和JDK 81.1.2 使用maven命令创建java项目模板执行maven命令,如果maven本地仓库...