
2021SC@SDUSC
目录
一、Hbase概述
二、配置准备
三、Hbase下载与配置
四、任务划分
Hbase是Hadoop的生态系统,是建立在Hadoop文件系统(HDFS)之上的分布式、面向列的数据库,通过利用Hadoop的文件系统提供容错能力。如果你需要进行实时读写或者随机访问大规模的数据集的时候,请考虑使用Hbase。
Hbase作为Google Bigtable的开源实现,Google Bigtable利用GFS作为其文件存储系统类似,则Hbase利用Hadoop HDFS作为其文件存储系统;Google通过运行MapReduce来处理Bigtable中的海量数据,同样,Hbase利用Hadoop MapReduce来处理Hbase中的海量数据;Google Bigtable利用Chubby作为协同服务,Hbase利用Zookeeper作为对应。
Hbase要求JDK
相关教程:ubuntu16.04搭建jdk1.8运行环境_朝花夕拾-CSDN博客_jdk ubuntu
官网地址:Apache Hbase – Apache Hbase™ Home
选择一个版本进行下载,解压下载的文件,然后进入到那个要解压的目录。
$ tar xfz hbase-0.95-SNAPSHOT.tar.gz
$ cd hbase-0.95-SNAPSHOT
编辑conf/hbase-site.xml,这是Hbase的主要配置文件。此时,您只需要在Hbase和ZooKeeper写入数据的本地文件系统上指定目录即可。默认情况下,在/tmp下创建一个新目录。许多服务器被配置为在重启时删除/tmp的内容,所以你应该在其他地方存储数据。以下配置将把Hbase的数据存储在hbase目录下的testuser用户主目录中。将
独立Hbase的hbase-site.xml:
hbase.rootdir file:///home/testuser/hbase hbase.zookeeper.property.dataDir /home/testuser/zookeeper
打开Hbase主文件夹,然后运行Hbase启动脚本,如下所示:
$cd /usr/local/Hbase/bin $./start-hbase.sh
如果一切顺利,当运行Hbase启动脚本,它会提示一条消息:Hbase已经启动
starting master, logging to /usr/local/Hbase/bin/../logs/hbase-tpmaster-localhost.localdomain.out
我负责的是Hbase读写过程的源码分析,后续可能会根据进度动态调整。
如有错误还请指出,感谢