
HBase是一个分布式的、面向列的开源数据库,具有高可靠性、高性能、面向列、可伸缩的分布式存储系统,利用HBase技术可在廉价PC Server上搭建起大规模结构化存储集群。
如何使用JAVA语言 *** 作Hbase、整合Hbase?
可分为五步骤:
步骤1:新创建一个Java Project 。
步骤2:导入JAR包,在工程根目录下新建一个“lib”文件夹,将官方文档中的lib目录下的jar全部导入。
步骤3:修改开发机的hosts文件,在文件莫为增加一行虚拟机IP的映射信息。
步骤4:修改虚拟机的配置文件,修改虚拟机的设备名称,名称需要与之前两个配置文件的映射名称一致。
步骤5:实现查询、新建、删除等。
案例代码展示如下:
package hbase import java.io.IOException import java.util.ArrayList import java.util.List import org.apache.hadoop.conf.Configuration import org.apache.hadoop.hbase.Cell import org.apache.hadoop.hbase.HBaseConfiguration import org.apache.hadoop.hbase.HColumnDescriptor import org.apache.hadoop.hbase.HTableDescriptor import org.apache.hadoop.hbase.TableName import org.apache.hadoop.hbase.client.Admin import org.apache.hadoop.hbase.client.Connection import org.apache.hadoop.hbase.client.ConnectionFactory import org.apache.hadoop.hbase.client.Delete import org.apache.hadoop.hbase.client.Get import org.apache.hadoop.hbase.client.Put import org.apache.hadoop.hbase.client.Result import org.apache.hadoop.hbase.client.ResultScanner import org.apache.hadoop.hbase.client.Scan import org.apache.hadoop.hbase.client.Table import org.apache.hadoop.hbase.exceptions.DeserializationException import org.apache.hadoop.hbase.filter.Filter import org.apache.hadoop.hbase.filter.SingleColumnValueFilter import org.apache.hadoop.hbase.filter.CompareFilter.CompareOp import org.apache.hadoop.hbase.util.Bytes import org.junit.Before import org.junit.Test public class HBaseDemo { // 与HBase数据库的连接对象 Connection connection // 数据库元数据 *** 作对象 Admin admin @Before public void setUp() throws Exception { // 取得一个数据库连接的配置参数对象 Configuration conf = HBaseConfiguration.create() // 设置连接参数:HBase数据库所在的主机IP conf.set("hbase.zookeeper.quorum", "192.168.137.13") // 设置连接参数:HBase数据库使用的端口 conf.set("hbase.zookeeper.property.clientPort", "2181") // 取得一个数据库连接对象 connection = ConnectionFactory.createConnection(conf) // 取得一个数据库元数据 *** 作对象 admin = connection.getAdmin() } /** * 创建表 */ public void createTable() throws IOException{ System.out.println("---------------创建表 START-----------------") // 数据表表名 String tableNameString = "t_book" // 新建一个数据表表名对象 TableName tableName = TableName.valueOf(tableNameString) // 如果需要新建的表已经存在 if(admin.tableExists(tableName)){ System.out.println("表已经存在!") } // 如果需要新建的表不存在 else{ // 数据表描述对象 HTableDescriptor hTableDescriptor = new HTableDescriptor(tableName) // 列族描述对象 HColumnDescriptor family= new HColumnDescriptor("base") // 在数据表中新建一个列族 hTableDescriptor.addFamily(family) // 新建数据表 admin.createTable(hTableDescriptor) } System.out.println("---------------创建表 END-----------------") } /** * 查询整表数据 */ @Test public void queryTable() throws IOException{ System.out.println("---------------查询整表数据 START-----------------") // 取得数据表对象 Table table = connection.getTable(TableName.valueOf("t_book")) // 取得表中所有数据 ResultScanner scanner = table.getScanner(new Scan()) // 循环输出表中的数据 for (Result result : scanner) { byte[] row = result.getRow() System.out.println("row key is:" + new String(row)) List listCells = result.listCells() for (Cell cell : listCells) { byte[] familyArray = cell.getFamilyArray() byte[] qualifierArray = cell.getQualifierArray() byte[] valueArray = cell.getValueArray() System.out.println("row value is:" + new String(familyArray) + new String(qualifierArray) + new String(valueArray)) } } System.out.println("---------------查询整表数据 END-----------------") } /** * 按行键查询表数据 */ @Test public void queryTableByRowKey() throws IOException{ System.out.println("---------------按行键查询表数据 START-----------------") // 取得数据表对象 Table table = connection.getTable(TableName.valueOf("t_book")) // 新建一个查询对象作为查询条件 Get get = new Get("row8".getBytes()) // 按行键查询数据 Result result = table.get(get) byte[] row = result.getRow() System.out.println("row key is:" + new String(row)) List listCells = result.listCells() for (Cell cell : listCells) { byte[] familyArray = cell.getFamilyArray() byte[] qualifierArray = cell.getQualifierArray() byte[] valueArray = cell.getValueArray() System.out.println("row value is:" + new String(familyArray) + new String(qualifierArray) + new String(valueArray)) } System.out.println("---------------按行键查询表数据 END-----------------") } /** * 按条件查询表数据 */ @Test public void queryTableByCondition() throws IOException{ System.out.println("---------------按条件查询表数据 START-----------------") // 取得数据表对象 Table table = connection.getTable(TableName.valueOf("t_book")) // 创建一个查询过滤器 Filter filter = new SingleColumnValueFilter(Bytes.toBytes("base"), Bytes.toBytes("name"), CompareOp.EQUAL, Bytes.toBytes("bookName6")) // 创建一个数据表扫描器 Scan scan = new Scan() // 将查询过滤器加入到数据表扫描器对象 scan.setFilter(filter) // 执行查询 *** 作,并取得查询结果 ResultScanner scanner = table.getScanner(scan) // 循环输出查询结果 for (Result result : scanner) { byte[] row = result.getRow() System.out.println("row key is:" + new String(row)) List listCells = result.listCells() for (Cell cell : listCells) { byte[] familyArray = cell.getFamilyArray() byte[] qualifierArray = cell.getQualifierArray() byte[] valueArray = cell.getValueArray() System.out.println("row value is:" + new String(familyArray) + new String(qualifierArray) + new String(valueArray)) } } System.out.println("---------------按条件查询表数据 END-----------------") } /** * 清空表 */ @Test public void truncateTable() throws IOException{ System.out.println("---------------清空表 START-----------------") // 取得目标数据表的表名对象 TableName tableName = TableName.valueOf("t_book") // 设置表状态为无效 admin.disableTable(tableName) // 清空指定表的数据 admin.truncateTable(tableName, true) System.out.println("---------------清空表 End-----------------") } /** * 删除表 */ @Test public void deleteTable() throws IOException{ System.out.println("---------------删除表 START-----------------") // 设置表状态为无效 admin.disableTable(TableName.valueOf("t_book")) // 删除指定的数据表 admin.deleteTable(TableName.valueOf("t_book")) System.out.println("---------------删除表 End-----------------") } /** * 删除行 */ @Test public void deleteByRowKey() throws IOException{ System.out.println("---------------删除行 START-----------------") // 取得待 *** 作的数据表对象 Table table = connection.getTable(TableName.valueOf("t_book")) // 创建删除条件对象 Delete delete = new Delete(Bytes.toBytes("row2")) // 执行删除 *** 作 table.delete(delete) System.out.println("---------------删除行 End-----------------") } /** * 删除行(按条件) */ @Test public void deleteByCondition() throws IOException, DeserializationException{ System.out.println("---------------删除行(按条件) START-----------------") // 步骤1:调用queryTableByCondition()方法取得需要删除的数据列表 // 步骤2:循环步骤1的查询结果,对每个结果调用deleteByRowKey()方法 System.out.println("---------------删除行(按条件) End-----------------") } /** * 新建列族 */ @Test public void addColumnFamily() throws IOException{ System.out.println("---------------新建列族 START-----------------") // 取得目标数据表的表名对象 TableName tableName = TableName.valueOf("t_book") // 创建列族对象 HColumnDescriptor columnDescriptor = new HColumnDescriptor("more") // 将新创建的列族添加到指定的数据表 admin.addColumn(tableName, columnDescriptor) System.out.println("---------------新建列族 END-----------------") } /** * 删除列族 */ @Test public void deleteColumnFamily() throws IOException{ System.out.println("---------------删除列族 START-----------------") // 取得目标数据表的表名对象 TableName tableName = TableName.valueOf("t_book") // 删除指定数据表中的指定列族 admin.deleteColumn(tableName, "more".getBytes()) System.out.println("---------------删除列族 END-----------------") } /** * 插入数据 */ @Test public void insert() throws IOException{ System.out.println("---------------插入数据 START-----------------") // 取得一个数据表对象 Table table = connection.getTable(TableName.valueOf("t_book")) // 需要插入数据库的数据集合 List putList = new ArrayList () Put put // 生成数据集合 for(int i = 0 i
通过对HBase API的使用,下面例子举例了常见对HBase的 *** 作,如下所示:
package net.csdn.jtlyuanimport org.apache.hadoop.conf.Configuration
import org.apache.hadoop.hbase.HBaseConfiguration
import org.apache.hadoop.hbase.HColumnDescriptor
import org.apache.hadoop.hbase.HTableDescriptor
import org.apache.hadoop.hbase.KeyValue
import org.apache.hadoop.hbase.client.HBaseAdmin
import org.apache.hadoop.hbase.client.HTable
import org.apache.hadoop.hbase.client.Result
import org.apache.hadoop.hbase.client.ResultScanner
import org.apache.hadoop.hbase.client.Scan
import org.apache.hadoop.hbase.io.BatchUpdate
public class HBaseDBDao {
//定义配置对象HBaseConfiguration
static HBaseConfiguration cfg =null
static {
Configuration configuration = new Configuration()
cfg = new HBaseConfiguration(configuration)
}
//创建一张表,指定表名,列族
public static void createTable(String tableName,String columnFarily)throws Exception{
HBaseAdmin admin = new HBaseAdmin(cfg)
if(admin.tableExists(tableName)){
System.out.println(tableName+"不存在!")
System.exit(0)
}else{
HTableDescriptor tableDesc = new HTableDescriptor(tableName)
tableDesc.addFamily(new HColumnDescriptor(columnFarily+":"))
System.out.println("创建表成功!")
}
}
//添加数据,通过HTable。和BatchUpdate为已经存在的表添加数据data
public static void addData(String tableName,String row,String columnFamily,String column,String data)throws Exception{
HTable table = new HTable(cfg,tableName)
BatchUpdate update = new BatchUpdate(row)
update.put(columnFamily+":"+column, data.getBytes())
table.commit(update)
System.out.println("添加成功!")
}
//显示所有数据,通过HTable Scan类获取已有表的信息
public static void getAllData(String tableName)throws Exception{
HTable table = new HTable(cfg,tableName)
Scan scan = new Scan()
ResultScanner rs = table.getScanner(scan)
for(Result r:rs){
for(KeyValue kv:r.raw()){
System.out.println(new String(kv.getColumn())+new String(kv.getValue()))
}
}
}
//测试函数
public static void main(String[] args){
try{
String tableName = "student"
HBaseDBDao.createTable(tableName, "c1")
HBaseDBDao.addData(tableName, "row1", "c1", "1", "this is row 1 column c1:c1")
HBaseDBDao.getAllData(tableName)
}catch(Exception e){
e.printStackTrace()
}
}
}
HBase是一个分布式的、面向列的开源数据库,该技术来源于 Fay Chang 所撰写的Google论文“Bigtable:一个结构化数据的分布式存储系统”。就像Bigtable利用了Google文件系统(File System)所提供的分布式数据存储一样,HBase在Hadoop之上提供了类似于Bigtable的能力。HBase是Apache的Hadoop项目的子项目。HBase不同于一般的关系数据库,它是一个适合于非结构化数据存储的数据库。另一个不同的是HBase基于列的而不是基于行的模式。
欢迎分享,转载请注明来源:内存溢出
微信扫一扫
支付宝扫一扫
评论列表(0条)