
Storm提供了一种可扩展的实时处理框架,可以以可靠的方式处理大量的实时数据流。它支持多种数据源,如Kafka、HDFS、HBase、Twitter、ZeroMQ等,可以接收和处理流式数据,并以可靠的方式将处理结果发送到消费者系统。
Apache Storm的水平极高,它提供了一种强大的实时处理框架,可以处理大量实时数据流,满足不同行业的实时处理需求。Storm为开发者提供了一种灵活和可靠的编程模型,可以帮助他们快速构建分布式实时应用程序。此外,Storm还支持多种数据源,可以满足不同行业的实时数据处理需求。
最近公司有个需求,需要在后端应用服务器上实时获取STORM集群的运行信息和topology相关的提交和控制,经过几天对STORM UI和CMD源码的分析,得出可以通过其thrift接口调用实现这些功能。先下载一个thrift库进行编码和安装。关于thrift可以参见这个地方。安装完成后,从STORM源码中将storm.thrift拷贝到thrift目录下。输入:hrift -gen cpp storm.thrift
会得到一个gen-cpp目录,里面就是thrift先关脚本的C++实现。我们先看storm.thrift文件接口:
view sourceprint?
01.service Nimbus
02.{
03.//TOPOLOGY上传接口
04.void submitTopology(1: string name, 2: string uploadedJarLocation, 3: string jsonConf,4: StormTopology topology)
05.void submitTopologyWithOpts(1: string name, 2: string uploadedJarLocation, 3: string jsonConf, 4: StormTopology topology, 5: SubmitOptions options)
06.void killTopology(1: string name)
07.void killTopologyWithOpts(1: string name, 2: KillOptions options) throws (1: NotAliveException e)
08.void activate(1: string name)
09.void deactivate(1: string name)
10.void rebalance(1: string name, 2: RebalanceOptions options)
11.
12.//TOPOLOGY JAR包上传接口
13.string beginFileUpload()
14.void uploadChunk(1: string location, 2: binary chunk)
15.void finishFileUpload(1: string location)
16.string beginFileDownload(1: string file)
17.binary downloadChunk(1: string id)
18.
19.//获取NIMBUS的配置信息
20.string getNimbusConf()
21.//获取STORM集群运行信息
22.ClusterSummary getClusterInfo()
23.//获取TOPOLOGY的运行状态信息
24.TopologyInfo getTopologyInfo(1: string id)
25.//获取TOPOLOGY对象信息
26.string getTopologyConf(1: string id)
27.StormTopology getTopology(1: string id)
28.StormTopology getUserTopology(1: string id)
29.}
生成C++文件后,我们就可以对其接口进行调用,由于thrift c++框架是使用boost库实现的,必须安装boost库依赖。实现的代码如下:
view sourceprint?
01.#define HAVE_NETDB_H //使用网络模块的宏必须打开
02.#include "Nimbus.h"
03.#include "storm_types.h"
04.
05.#include <string>
06.#include <iostream>
07.#include <set>
08.
09.#include <transport/TSocket.h>
10.#include <transport/TBufferTransports.h>
11.#include <protocol/TBinaryProtocol.h>
12.int test_storm_thrift()
13.{
14.boost::shared_ptr<TSocket>tsocket(new TSocket("storm-nimbus-server", 6627))
15.boost::shared_ptr<TTransport>ttransport(new TFramedTransport(tsocket, 1024 * 512))//此处必须使用TFramedTransport
16.boost::shared_ptr<TProtocol>tprotocol(new TBinaryProtocol(ttransport))
17.try{
18.//创建一个nimbus客户端对象
19.NimbusClient client(tprotocol)
20.//打开通道
21.ttransport->open()
22.
23.ClusterSummary summ
24.std::string conf
25.//对STORM的RPC调用,直接获取信息,同步进行的。
26.client.getNimbusConf(conf)
27.client.getClusterInfo(summ)
28.//关闭通道
29.ttransport->close()
30.}catch(TException &tx){
31.printf("InvalidOperation: %s
32.", tx.what())
33.}
34.}
以上代码就可以直接获取nimbus的配置和集群信息,其他接口以此类推。值得注意的是storm.thrift to C++生成的storm_types.h文件里其中operator <函数都未实现,所以必须手动进行添加实现,否则编译会有问题。
不仅仅C++可以实现STORM的控制,PHP和其他的语言也可以实现,只要thrift支持就OK。有兴趣可以实现一下试试看。
转载
欢迎分享,转载请注明来源:内存溢出
微信扫一扫
支付宝扫一扫
评论列表(0条)