Hive理论基础和安装配置

HIVE体系结构简介: hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供完整的sql查询功能,可以将sql语句转换为MapReduce任务进行运行。 其优点是学习成本低,可以通过类SQL语句快速实现简单的MapReduce统计,不必开...

Linux下安装配置hadoop集群

上次我们搭建了单节点的hadoop(参见 http://www.niceru.com/topic/529.html)这次我们搭建一个由3台服务器(Centos 64位)组成的hadoop小集群。 在安装Hadoop之前,先介绍一下Hadoop对各节点的角色定义,Hadoop从三个角度将主机划分为两种角色。 第...

MongoDB Connector for Hadoop

The MongoDB engineering team has recently made a series of significant updates to the MongoDB Connector for Hadoop. This makes it easier for Hadoop users to integrate real-time data from MongoDB – the most popular database for big d...

Linux上安装配置单节点Hadoop

服务器环境:Centos6.2-64位  Java-1.7  OpenSSH-4.3  Hadoop-1.2.1 在Linux上安装单节点Hadoop之前,需要先安装两个软件 (1).JDK1.6或更高版本(Hadoop是用Java开发的,Hadoop的编译和MapReduce的运行都需要使用JDK) (2).SSH,推荐安装OpenSSH(Hadoop需...

Top