
如果要做的话。通常是使用hive(能够直接处理HBase中的数据),或者自己开发mapreduce程序;例子网上有很多。
你这个逻辑如果不很复杂,通过hive简单些,写几条语句就搞定。
另:
如果就是验证下功能,那做做没问题。要是生产的话基于HBase做分析基本不可用。
因为不管哪种方法都要查HBase表,数据多了这个效率你接受不了;多进程并发访问在服务端有缓存的情况下(通过一定条件过滤的场景)才能够达到几千条/秒,如果不做缓存(遍历整表时)只能达到每秒一两百条。慢的要死。
生产的话可以考虑使用hive基于HDFS文件做分析。
以上就是关于你好,我知道你对HBASE有一定的理解,现在我需要使用HBASE作为一个数据库,存放那些网站上的数据全部的内容,包括:你好,我知道你对HBASE有一定的理解,现在我需要使用HBASE作为一个数据库,存放那些网站上的数据、、等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!
欢迎分享,转载请注明来源:内存溢出
微信扫一扫
支付宝扫一扫
评论列表(0条)