hive中的更新或者新建表impala 不能实时更新

hive中的更新或者新建表impala 不能实时更新不积跬步无以至千里 Impala是基于Hive的大数据实时分析查询引擎,直接使用Hive的元数据库Metadata,意味着impala元数据都存储在Hive的metastore中...

2022-12-10 342 阅读

Sqoop 使用详解(内含对官方文档的解析)

Sqoop 是 Cloudera 公司创造的一个数据同步工具,现在已经完全开源了。  目前已经是 hadoop 生态环境中数据迁移的首选,另外还有 ali 开发的 DataX 属于同类型工具,由于社区的广泛使用...

2022-12-10 563 阅读

Sqoop简介(1.4.7 最新版本)

Sqoop简介1. 背景1.1 概览 在大数据处理业务框架中,需要处理的数据一般是2个来源(行为日志和业务数据),有些公司如果有python部门,就需要加上python数据这一个。python数据因为各个公司...

2022-12-10 762 阅读

hadoop-2.10.0安装hive-2.3.6

公司建立数仓,hive是必不可少的,hive是建立在hadoop基础上的数据库,前面已经搭建起了hadoop高可用,要学习hive,先从搭建开始,下面梳理一下hive搭建过程 1.下载hive安装包 ,下载地址:h...

2022-12-10 286 阅读

mysql Centos7安装mysql8.0教程

准备工作1.查看是否有安装过mysqlrpm -qa | grep -i mysql2.删除mysqlyum -y remove MySQL-*一般用rpm -e 的命令删除mysql,这样表面上删除了mysql,可是mysql的一些残余程序仍然存在,并且通...

2022-12-10 374 阅读

linux linux关闭防火墙

1、首先打开xshell软件连接到centos主机,使用命令“systemctl status firewalld.service”查看防火墙状态:      2、按下回车键执行后,可以看到标注的“act...

2022-12-10 658 阅读

hive 初始化 时间问题 The server time zone value 'EDT' is unrecognized

初始化 hive 执行:    schematool -dbType mysql -initSchema    出现  :The server time zone value 'EDT' is unrecognized 原因:  MySQL 和 Linux 时区设置...

2022-12-10 422 阅读

kudu-安装

1. 环境准备 CentOS7 JDK8 2. 下载kudu仓库文件 http://archive.cloudera.com/kudu/redhat/7/x86_64/kudu/cloudera-kudu.repo 3. 安装yum仓库 wget http://archive.cloudera.com/kud...

2022-12-10 355 阅读

Sqoop笔记

Sqoop笔记 1.下载 https://mirrors.tuna.tsinghua.edu.cn/apache/sqoop/1.4.7/ 本次下载:https://mirrors.tuna.tsinghua.edu.cn/apache/sqoop/1.4.7/sqoop-1.4.7.bin__hadoop-2.6.0.tar.gz...

2022-12-10 258 阅读

security.AccessControlException): Permission denied: user=MANGOCOOL, access=WRITE, inode="/user/MANG(windwos调用hadoop集群设置用户)

在win环境下,执行spark任务时报错: ? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48...

2022-12-10 313 阅读