大数据 二、Flink环境搭建

1、standalone模式搭建standalone模式是Flink自带的分布式集群模式,不依赖其他的资源调度框架;这里使用三台主机搭建,86可以免密登录到88、89:172.17.28.86   cs-28-86172.17.2...

2023-11-03 547 阅读

fink 一、Flink简介

这几年,在整个大数据领域,Flink可算是火得一塌糊,不但将阿里Blink中的大部分特性merge到社区的Flink中,使得Flink在流式实时计算领域更是一骑绝尘,让其他实时计算框架只能望其项背,目前...

2023-11-03 460 阅读

大数据 ClickHouse:一款高效且强大的列式数据库管理系统

ClickHouse是一款开源的列式数据库管理系统,专为大规模数据仓库和数据分析应用而设计。它允许用户快速地存储和处理海量数据,同时提供了简单易用的SQL接口。本文将介绍ClickHouse的概念、技...

2023-08-11 429 阅读

大数据 深入浅出Apache DolphinScheduler

Apache DolphinScheduler 是一个大数据调度任务框架。从当前的CSDN的GitCode的热度来看,其在二月份排名第6位。那是相当的热门的。Apache DolphinScheduler 是Apache旗下的开源项目,目前已...

2023-07-18 413 阅读

大数据 大数据架构:全网最全大数据架构生态

1、数据采集框架    ----------------------------------------------------------------------2、数据存储框架-----------------------------------------------------...

2023-05-05 647 阅读

大数据 kettle 教程(一):简介及入门「建议收藏」

大家好,又见面了,我是你们的朋友全栈君。介绍kettle 是纯 java 开发,开源的 ETL工具,用于数据库间的数据迁移 。可以在 Linux、windows、unix 中运行。有图形界面,也有命令脚本还可以二...

2023-01-29 645 阅读

大数据 ETL转换工具 kettle——spoon 安装 使用

一、 kettle--spoon的安装kettle安装官网https://sourceforge.net/projects/pentaho/files/Data%20Integration/下载完解压就好。然后按以下步骤使用即可。二、使用1、启动进入安装路径/data-...

2023-01-29 729 阅读

大数据 记一次 基于Hadoop 3.3.0 安装部署 Spark 3.0.0 分布式集群 spark-shell 运行 WordCount

一、集群搭建基于Hadoop 3.3.0 安装部署 Spark 3.0.0 分布式集群https://blog.csdn.net/llwy1428/article/details/111569392官网教程http://spark.apache.org/docs/latest/quick-start.html...

2023-01-16 498 阅读

大数据 【Spark】Spark On Yarn 安装

一、下载和解压https://archive.apache.org/dist/spark/spark-2.3.1/tar zxv -f spark-2.3.1-bin-hadoop2.7.tgz mv spark-2.3.1-bin-hadoop2.7/ spark-2.3.1二、...

2023-01-16 448 阅读

大数据 Hadoop之Spark集群安装配置

1.  安装模式    1.  本地模式        仅在一台计算机上安装Spark      2.  集群模式        Standalone  独立部署模式,该模式下系统采用Spark自带的简...

2023-01-16 484 阅读