修改 Hive 元数据库默认字符集,解决乱码问题
修改 Hive 元数据库默认字符集
·
Hive元数据库的字符集默认为Latin1,由于其不支持中文字符,故若建表语句中包含中文注释,会出现乱码现象。
如需解决乱码问题,须做以下修改。
1)修改Hive元数据库中存储注释的字段的字符集为utf-8
(1)字段注释mysql> alter table COLUMNS_V2 modify column COMMENT varchar(256) character set utf8;
(2)表注释mysql> alter table TABLE_PARAMS modify column PARAM_VALUE mediumtext character set utf8;
2)修改hive-site.xml中JDBC URL,如下
添加&useUnicode=true&characterEncoding=UTF-8
<property>
<name>javax.jdo.option.ConnectionURL</name>
<value>jdbc:mysql://hadoop102:3306/metastore?useSSL=false&useUnicode=true&characterEncoding=UTF-8</value>
</property>

DAMO开发者矩阵,由阿里巴巴达摩院和中国互联网协会联合发起,致力于探讨最前沿的技术趋势与应用成果,搭建高质量的交流与分享平台,推动技术创新与产业应用链接,围绕“人工智能与新型计算”构建开放共享的开发者生态。
更多推荐
所有评论(0)