博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
hive基本操作与应用
阅读量:4938 次
发布时间:2019-06-11

本文共 613 字,大约阅读时间需要 2 分钟。

通过hadoop上的hive完成WordCount

启动hadoop

start-all.sh

 

Hdfs上创建文件夹

hdfs dfs -mkdir wcinputhdfs dfs -ls /user/hadoop

 

上传文件至hdfs

hdfs dfs -put ./1.txt wcinputhdfs dfs -ls /user/hadoop/wcinput

 

启动Hive

hive

 

创建原始文档表

create table docs(line string);

 

导入文件内容到表docs并查看

load data inpath '/user/hadoop/wcinput/1.txt' overwrite into table docs;select * from docs;

 

用HQL进行词频统计,结果放在表word_count里

create table word_count as select word,count(1) as count from (se lect explode(split(line,' ')) as word from docs) word group by word order by word;

 

查看统计结果

show tables;select * from word_count;

 

 

转载于:https://www.cnblogs.com/xuyizhu/p/9046155.html

你可能感兴趣的文章
jpa 多对多关系的实现注解形式
查看>>
Android开发——View绘制过程源码解析(一)
查看>>
Quartz和TopShelf Windows服务作业调度
查看>>
让ie9之前的版本支持canvas
查看>>
排序规则
查看>>
percent的用法
查看>>
中文词频统计
查看>>
Hibernate三种状态详解
查看>>
判断一个数是否是2^N次方
查看>>
js中几种实用的跨域方法原理详解
查看>>
打印图形
查看>>
《第一行代码》学习笔记7-活动Activity(5)
查看>>
ngx_http_core_module 模块
查看>>
两个常见的oracle索引
查看>>
一位有着工匠精神的博主写的关于IEnumerable接口的详细解析
查看>>
MySQL中特有的函数If函数
查看>>
安装Python3.6.2报错:zipimport.ZipImportError: can't decompress data; zlib not available
查看>>
【蓝桥杯】入门训练 Fibonacci数列
查看>>
实验十 指针2
查看>>
常见HTTP状态码
查看>>