Hive的原理和基本用法
一、Hive的概述   1、Hive的定义      Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供类SQL进行数据读取、写入和管理。   2、Hive的架构图        hive的各个组成部分介绍…
Hive的基本概念
一、Hive基本概念 1.什么是Hive? hive是基于Hadoop的一个数据仓库工具,用来进行数据提取、转化、加载。可以存储、查询和分析存储在Hadoop中的大规模数据。 hive数据仓库工具能将结构化的数据文件映射为一张数据库表,并提供SQL查询功能,能将SQL语句转变成MapReduce任务来执行。 Hive的优点是学习成本低,可…
Hive 1、什么是Hive,Hive有什么用
   一、什么是Hive   Hive是建立在 Hadoop 上的数据仓库基础构架。它提供了一系列的工具,可以用来进行数据提取转化加载(ETL),这是一种可以存储、查询和分析存储在 Hadoop 中的大规模数据的机制。Hive 定义了简单的类 SQL 查询语言,称为 HQL,它允许熟悉 SQL 的用户查询数据。同时,这个语言也允许熟悉 M…
Kafka-为什么选择kafka(kafka的优点)
Kafka-为什么选择kafka(kafka的优点) 多个生产者 kafka可以无缝的支持多个生产者,不管客户端在使用单个主题还是多个主题。所以它很适合用来从多个前端系统手机数据,并以同一的格式对外提供数据。 例如:一个包含了多个微服务的网站,可以为页面视图创建一个单独的主题,所有服务都以相同的消息格式向该主题写入数据。消费者应用程序会获…
kafka事务原理与使用
项目要求使用kafka的事务,遇到了一些问题,研究了下kafka的事务机制记录一下。 kafka事务是为了实现: Exactly Once即正好一次语义 操作的原子性 有状态操作的可恢复性     kafka的幂等性可以实现Exactly Once语义,幂等性提供了单会话单分区的Exactly-Once 语义的实现,幂等性实现是事务性实现…
kafka消费者详解
一、消费者组                                               &n…
kafka简介
对于kafka的架构原理我们先提出几个问题?   1.Kafka的topic和分区内部是如何存储的,有什么特点?   2.与传统的消息系统相比,Kafka的消费模型有什么优点?   3.Kafka如何实现分布式的数据存储与数据读取?   一、Kafka架构图 1.kafka名词解释   在一套kafka架构中有多个Producer,多个B…
Kafka核心技术与实战
Kafka入门 消息引擎系统: 开源的消息引擎系统,实现松耦合的异步式数据传递 常见传输协议:点对点;发布/订阅模型 作用:削峰填谷 Kafka相关术语 消息record:kafka处理的对象 主题topic:承载消息的容器 分区partition:有序不变的消息序列,每个主题下可以有多个分区 消息位移offset:表示分区中每条消息的位…
Kafka 架构及基本原理简析
Kafka简介 Kafka是一个由Scala和Java编写的企业级的消息发布和订阅系统,最早是由Linkedin公司开发,最终开源到Apache软件基金会的项目。Kafka是一个分布式的,支持分区的,多副本的和多订阅者的高吞吐量的消息系统,被广泛应用在应用解耦、异步处理、限流削峰和消息驱动等场景。本文将针对Kafka的架构和相关组件进行简…
Impala 数值函数大全(转载)
  官网:https://www.cloudera.com/documentation/enterprise/latest/topics/impala_math_functions.html   转载链接1:https://blog.csdn.net/qq_24699959/article/details/79863664   转载链接2…