
hive
bigdataf
这个作者很懒,什么都没留下…
展开
-
Python Windows pyhs2下模块安装
错误代码:C:\Python27\Scripts>pip2.7.exe install pyhs2Collecting pyhs2 Using cached pyhs2-0.6.0.tar.gzCollecting sasl (from pyhs2) Using cached sasl-0.2.1.tar.gzCollecting thrift (from pyhs2) Usin原创 2017-11-08 15:28:02 · 2373 阅读 · 0 评论 -
hive + tez
安装配置1.下载:wget http://mirrors.hust.edu.cn/apache/tez/0.8.5/apache-tez-0.8.5-bin.tar.gztar -zxf apache-tez-0.8.5-bin.tar.gzcd apache-tez-0.8.5-bin/confvim tez-site.xml增加一下配置<configuration><property原创 2017-12-27 15:32:22 · 1468 阅读 · 0 评论 -
spark hive hbase 结合
spark hive hbase 结合业务需求,需要整合需要读取hive数据导入hbase中,一下是环境配置流程以及中间遇到的问题1.spark读hive需要copy hive-site和hdfs-site 等配置文件到项目资源包下object hivesql { case class Record(key: Int, value: String) def ma原创 2018-01-18 14:04:41 · 1338 阅读 · 0 评论 -
hive1.2.1 分区表 增加列显示为null 问题
1.问题 hive中增加字段 发现之后之后添加的数据正常,之前数据无法读取 问题修复: 查找hive元数据的分区字段边 SDS MySQL [hive]&amp;gt; SELECT * FROM SDS WHERE location LIKE '%video_test%' ; +--------+-------+----------------------------------------...原创 2018-04-26 13:54:20 · 366 阅读 · 0 评论 -
python 操作hive pyhs2
使用kerberos时import pyhs2class HiveClient: # 初始化 def __init__(self, db_host, user, password, database, port=10000, authMechanism="PLAIN", configuration=None): self.conn = pyhs2.conne...原创 2018-07-25 18:17:37 · 1959 阅读 · 0 评论 -
hive如何使用json格式的数据
查看当前hive支持的json函数show functions like &quot;*json*&quot;;OKget_json_objectjson_tupleTime taken: 0.006 seconds, Fetched: 2 row(s) get_json_objectdescribe function get_json_object; OK get_json_object...原创 2018-09-26 14:12:09 · 2540 阅读 · 0 评论 -
hive 使用技巧
1.抽样从一个表中随机抽样得到一个不重复的数据样本,随机取样SELECT * FROM &amp;amp;amp;lt;Table_Name&amp;amp;amp;gt; DISTRIBUTE BY RAND() SORT BY RAND() LIMIT ;这是使用RAND()函数和LIMIT关键字来获取样例数据。使用DISTRIBUTE和SORT关键字来保证数据是随机分散到mapper和reducer的。ORDER BY ...原创 2018-10-10 12:06:45 · 1332 阅读 · 0 评论