大数据 – 第 3 页 – java开发笔记

【Spark】Spark On Yarn 安装

2023-1-16 11:11

|

554

|

0

|

大数据

578 字

|

3 分钟

一、下载和解压https://archive.apache.org/dist/spark/spark-2.3.1/tar zxv -f spark-2.3.1-bin-hadoop2.7.tgz mv spark-2.3.1-bin-hadoop2.7/ spark-2.3.1二、配置2.…

Hadoop之Spark集群安装配置

2023-1-16 11:06

|

576

|

0

|

大数据

521 字

|

3 分钟

1.　　安装模式　　　　1.　　本地模式　　　　　　　　仅在一台计算机上安装Spark　　　　　　2.　　集群模式　　　　　　　　Standalone　　独立部署模式，该模式下系统采用Spark自带的简单集群管理器，不依赖第三方提供的集群管理器　　　　　　　　Hadoop Yarn　　使用hadoop2.0以上版本中的Yarn充当资源管理…

（五）springboot 配置多数据源连接mysql和hive

2023-1-15 16:28

|

1,817

|

0

|

大数据

205 字

|

1 分钟内

项目结构如下mysql 执行如下建表语句，并插入一条测试数据CREATE TABLE `user` ( `id` int(11) NOT NULL, `name` varchar(255) COLLATE&nbs…

使用hive的beeline连接报错hadoop is not allowed to impersonate hadoop (state=08S01,code=0)解决方案

2023-1-15 16:07

|

832

|

0

|

大数据

166 字

|

1 分钟内

使用hiveserver2时通过beeline -u jdbc:hive2://hadoop-master:21000 -n hadoop 连接hive执行insert语句报错 hadoop is not allowed to impersonate hadoop (state=08S01,code=0)原…

大数据 – Java实现提交作业到Hadoop集群

2023-1-04 11:20

|

871

|

0

|

java,大数据

2084 字

|

11 分钟

windows环境IntelliJ IDEAJDK1.8hadoop-2.8.5.tar.gz从官网上下载解压配置JDK，Hadoop https://hadoop.apache.org/releases.html 下载2.8.5版本Binary download并解压到自己喜欢的目录下。配置windows环境变量Java环境变量就不写了…

Nutch简介

2022-12-22 23:05

|

818

|

0

|

大数据

1077 字

|

5 分钟

Nutch简介原文出处：http://www.sanesee.com/Nutch作为当今最流行的开源爬虫之一，已被企业广泛使用。Nutch的插件机制使得开发者可以灵活地定制网页抓取策略。Nutch有着悠久的历史，当今大名鼎鼎的Hadoop就是由Nutch发展而来。Nutch不仅可以运行在单机模式下，还可以运行在分布式模式下。1 认识Nut…

大数据Hadoop生态圈介绍

2022-12-21 13:14

|

831

|

0

|

大数据

3312 字

|

14 分钟

大数据Hadoop生态圈-组件介绍 Hadoop是目前应用最为广泛的分布式大数据处理框架，其具备可靠、高效、可伸缩等特点。 Hadoop的核心组件是HDFS、MapReduce。随着处理任务不同，各种组件相继出现，丰富Hadoop生态圈，目前生态圈结构大致如图所示： …

（四）hive的搭建2

2022-12-21 7:27

|

705

|

0

|

大数据

494 字

|

3 分钟

在（三）hive的搭建1中我们搭建好了hive环境，但是只能本地访问，在本节中配置Hive的访问方式。1.元数据服务的方式1.1 编辑hive-site.xml sudo vi hive-site.xml在文件最后增加以下内容 …

（三）hive的搭建1

2022-12-20 0:07

|

562

|

0

|

大数据

504 字

|

3 分钟

下载访问官方网站https://hive.apache.org/点击downloads点击Download a release now!点击https://dlcdn.apache.org/hive/选择最新的稳定版复制最新的url在linux执行下载命令wget https://dlcdn.apache.org/h…

（二）hadoop搭建

2022-12-17 18:42

|

589

|

0

|

大数据

1208 字

|

7 分钟

1. 下载访问https://hadoop.apache.org/releases.html查看hadoop最新下载地址wget https://dlcdn.apache.org/hadoop/common/hadoop-3.3.4/hadoop-3.3.4.tar.gz2.解压tar zxvf hadoo…

分类： 大数据

分类：大数据