全栈工程师
本章介绍Hive中可用的内置功能。这些函数看起来与SQL函数非常相似,除了它们的用法。 内置函数 Hive支持以下内置函数: 返回类型 签名 描述 BIGINT round(double a) 它返回double的...
全栈工程师
Hive将表组织成分区。这是根据日期,城市和部门等分区列的值将表分成相关部分的一种方法。使用分区,很容易查询一部分数据。 表或分区被细分为 桶, 以向数据提供额外的结构,以用于更高效的查询。Bucketing基于某个表的某列的哈希函数的值进行工作。 例如,名为 Tab1 的表包含员工数据,例如i...
全栈工程师
本章介绍如何在Hive中删除表。从Hive Metastore中删除表格时,它将删除表格/列数据及其元数据。它可以是普通表(存储在Metastore中)或外部表(存储在本地文件系统中); Hive以同样的方式对待它们,不管它们的类型如何。 删除表格语句 语法如下: DROP TABLE ...
全栈工程师
本章介绍如何更改表的属性,例如更改表名称,更改列名称,添加列以及删除或替换列。 改变表格语句 它用于修改Hive中的表格。 句法 该语句根据我们希望在表中修改的属性采用以下任何语法。 ALTER TABLE name RENAME TO new_name ALTER TABLE na...
全栈工程师
本章介绍如何创建表格以及如何向其中插入数据。在HIVE中创建表格的惯例与使用SQL创建表格非常相似。 创建表格声明 创建表是用于在Hive中创建表的语句。语法和示例如下所示: 句法 CREATE [TEMPORARY] [EXTERNAL] TABLE [IF NOT EXISTS] ...
全栈工程师
本章介绍Hive的内置运算符。Hive中有四种类型的操作符: 关系运算符 算术运算符 逻辑运算符 复杂算子 关系运算符 这些运算符用于比较两个操作数。下表介绍了Hive中可用的关系运算符: 操作者 操作数 描述 ...
全栈工程师
Hive是一种数据库技术,可以定义数据库和表来分析结构化数据。结构化数据分析的主题是以表格形式存储数据,并传递查询来分析数据。本章介绍如何创建Hive数据库。Hive包含一个名为 default 的默认数据库。 创建数据库语句 创建数据库是用于在Hive中创建数据库的语句。Hive中的数据库是一...
全栈工程师
本章将带您了解Hive中涉及表创建的不同数据类型。Hive中的所有数据类型分为四种类型,具体如下: 列类型 字面 空值 复杂类型 列类型 列类型用作Hive的列数据类型。他们如下: 积分类型 整型数据可以使用整型数据类型INT来指定。当数据范围超出INT范围时,需要使...
全栈工程师
所有Hadoop子项目,如Hive,Pig和HBase都支持Linux操作系统。因此,您需要安装任何Linux风格的操作系统。为Hive安装执行以下简单步骤: 第1步:验证JAVA安装 在安装Hive之前,必须在您的系统上安装Java。让我们使用以下命令验证java安装: $ java ...
全栈工程师
Scala 简介 Scala 是 Scalable Language 的简写,是一门多范式的编程语言 联邦理工学院洛桑(EPFL)的Martin Odersky于2001年基于Funnel的工作开始设计Scala。 Funnel是把函数式编程思想和Petri网相结合的一种编程语言。 Odersky...
全栈工程师
本章介绍如何在Hive中放置数据库。SCHEMA和DATABASE的用法是一样的。 删除数据库语句 删除数据库是删除所有表并删除数据库的语句。其语法如下: DROP DATABASE StatementDROP (DATABASE|SCHEMA) [IF EXISTS] database...
全栈工程师
Scala 安装 Scala 语言可以运行在Window、Linux、Unix、 Mac OS X等系统上。 Scala是基于java之上,大量使用java的类库和变量,使用 Scala 之前必须先安装 Java(>1.5版本)。 Mac OS X 和 Linux 上安装 Scala 第一...
全栈工程师
Scala教程 Scala是一种现代多范式编程语言,旨在以简洁,优雅和类型安全的方式表达常见的编程模式。Scala由Martin Odersky创建,他在2003年发布了第一个版本.Scala平滑地集成了面向对象和功能语言的特性。本教程以简单易读的方式介绍了Scala的基础知识。 适合人群 ...
全栈工程师
Scala 运算符 一个运算符是一个符号,用于告诉编译器来执行指定的数学运算和逻辑运算。 Scala 含有丰富的内置运算符,包括以下几种类型: 算术运算符 关系运算符 逻辑运算符 位运算符 赋值运算符 接下来我们将为大家详细介绍以上各种运算符的应用。 算术运算符 ...
全栈工程师
Scala 访问修饰符 Scala 访问修饰符基本和Java的一样,分别有:private,protected,public。 如果没有指定访问修饰符符,默认情况下,Scala 对象的访问级别都是 public。 Scala 中的 private 限定符,比 Java 更严格,在嵌套类情况下,外层...
全栈工程师
Scala 变量 变量是一种使用方便的占位符,用于引用计算机内存地址,变量创建后会占用一定的内存空间。 基于变量的数据类型,操作系统会进行内存分配并且决定什么将被储存在保留内存中。因此,通过给变量分配不同的数据类型,你可以在这些变量中存储整数,小数或者字母。 变量声明 在学习如何声明变量与常量...
全栈工程师
如果你之前是一名 Java 程序员,并了解 Java 语言的基础知识,那么你能很快学会 Scala 的基础语法。 Scala 与 Java 的最大区别是:Scala 语句末尾的分号 ; 是可选的。 我们可以认为 Scala 程序是对象的集合,通过调用彼此的方法来实现消息传递。接下来我们来理解下,类,...
全栈工程师
Scala 与 Java有着相同的数据类型,下表列出了 Scala 支持的数据类型: 数据类型 描述 Byte 8位有符号补码整数。数值区间为 -128 到 127 Short 16位有符号补码整数。数...
全栈工程师
Scala 循环 有的时候,我们可能需要多次执行同一块代码。一般情况下,语句是按顺序执行的:函数中的第一个语句先执行,接着是第二个语句,依此类推。 编程语言提供了更为复杂执行路径的多种控制结构。 循环语句允许我们多次执行一个语句或语句组,下面是大多数编程语言中循环语句的流程图: 循环类型 ...
全栈工程师
Scala 提取器(Extractor) 提取器是从传递给它的对象中提取出构造该对象的参数。 Scala 标准库包含了一些预定义的提取器,我们会大致的了解一下它们。 Scala 提取器是一个带有unapply方法的对象。unapply方法算是apply方法的反向操作:unapply接受一个对象,然...