下载安卓APP箭头
箭头给我发消息

客服QQ:3315713922

数据库:使用ClouderaManager管理的HBase的RegionServer无法启动(启动失败)的问题

作者:行无际     来源: 行无际点击数:948发布时间: 2020-02-20 15:43:34

标签: 数据库视频数据库视频课程数据库课程

ClouderaManager(简称CM)是Cloudera公司开发的一款大数据集群安装部署利器,这款利器具有集群自动化安装、中心化管理、集群监控、报警等功能,使得安装集群从几天的时间

问题概述

"新冠期间"远程办公,需要重新搭建一套ClouderaManager(CM)开发环境,一位测试同事发现HBase的RegionServer无法启动,在CM界面上启动总是失败,观察一下日志,也没有什么明显的报错。我就专门看了一下。

排查思路

  1. 因为有opentsdb在读写Hbase Region Server,我一开始怀疑RegionServer启动过程中在恢复一些数据,这个时候就有组件对它读写操作,可能压力较大起不来。后来停掉了opentsdb,依然如此,日志也没有明显报错,打着打着就断了,再看进程就没了。

  2. 后来我在界面上又重启了一下,迅速 jPS -mlv命令查看一下启动参数,这一看就明白了居然给的 堆内存50MB,难怪起不来,启动过程中应该就OOM了,很快,再执行一次jps -mlv命令 这个HRegionServer进程已经退出了。

  3. 于是我在网上搜了一下,果然ClouderaManager(CM)给HBase默认堆内存50M,豁然开朗。

解决

数据库:使用ClouderaManager管理的HBase的RegionServer无法启动(启动失败)的问题_隐式类型_数据库_数据库课程_课课家

根据实际情况修改一下HMaster、HRegionServer堆内存大小,在界面上重启,我这次用jps -mlv命令观察一下,配置生效了,然后看日志,正常启动中,至此,问题解决。

总结

有些时候 程序一启动就挂掉,而且没有什么明显报错日志,可能要观察一下程序的启动参数等。
比如说内存给的太小,程序压根就不能正常启动(OOM异常退出);
或者内存给的太大,向操作系统申请内存失败直接被kill掉。

 开始之前其实有很多的工作要做,比如配置IP地址、关闭防火墙、配置ssh免密登录等,这些都是比较常规的环境配置,这里不再赘述。

 

赞(12)
踩(0)
分享到:
华为认证网络工程师 HCIE直播课视频教程