航班管家开放平台——打造航空铁路出行行业的企业级SaaS服务平台

航班管家开放平台——打造航空铁路出行行业的企业级SaaS服务平台,第1张

本项目案例由 航班管家 投递并参与数据猿&上海大数据联盟联合推出的“行业盘点季之数智化转型升级”大型主题策划活动之《2021中国企业数智化转型升级创新服务企业》榜单/奖项的评选。

航班管家开放平台是航空铁路出行行业首个SaaS级服务平台,聚焦大交通出行服务行业数字化升级,基于民航局空管局授权的官方动态数据,整合航空、铁路、场站、旅客、货运等多维度数据,结合拥有自主知识产权的算法模型与行业Know-how,面向行业提供多种数据服务产品和数据解决方案,赋能行业合作伙伴、帮助其提效降本。

如数字化程度有待提高的旅行社、票务代理、TMC、企业差旅部门等,用户在其平台购票后,需要通过其他第三方平台查询航班/列车动态信息,用户体验感和便利程度大大降低,航班管家面向这些企业,提供SaaS级产品【行程服务H5】,客户可根据自身需求进行页面个性化配置,然后将配置好的页面直接嵌入自有APP、公众号、小程序等产品中,方便用户在自有平台完成购票、动态查询等服务,形成服务闭环,提高用户体验,同时降低企业开发成本。

面向数据分散在各个部门、协调难度大,但正在进行数字化转型的航司、机场等企业,还有需要分析数据的金融、券商、媒体、院校、咨询公司、研究机构等行业,航班管家提供【智数出行】服务,包括数据分析平台、可视化大屏、大数据分析报告等产品,分析行业数据、洞察行业发展,提供有价值的分析结果与行业洞见,以满足行业日常工作及决策支撑需要,助力企业数字化转型升级。

实施时间

开始时间:2021年1月初完成项目立项

里程碑节点:

2021年1月25日

·官网V1.0版本上线。

·华为云上代码部署,正式环境搭建完成。

2021年4月8日

·平台V1.0版本上线,支持账号认证、产品服务开通。

2021年5月31日

·平台V2.0版本上线,行程服务产品支持套餐包购买,H5版本官网、产品介绍页上线。

·首批客户上线,分贝通、公务之家、QQ浏览器、UC浏览器等。

2021年6月30日

·平台V3.0版本上线,官网全新改版、行程服务产品支持功能模块可配置化、支持在线扫码支付。

截止时间:2021年年8月底

依托于航班管家多年的数据积累及服务B端、C端用户经验总结,打造一站式开放平台,致力于为多种行业用户提供民航、铁路、航空货运大交通数据及其衍生产品与服务,如行程服务H5、API接口、大数据分析报告、数据分析工具及可视化等,助力企业提升服务水平、降低成本、提高效率,并为企业决策提供辅助支持。

行程服务H5

为OTA/TMC/旅行社/企业差旅部门等,提供基于H5页面的航空/铁路行程全流程信息服务,企业可将H5页面直接嵌入自有移动端产品中,如APP、公众号、小程序,让出行旅客/员工不再依赖其他第三方产品,在自有产品中即可掌握行程动态信息,方便旅客/员工合理安排规划行程,提升出行体验,提高服务满意度,增强用户黏性,同时降低企业开发维护成本。

API接口

为各类需要航班/列车动态信息、航班/列车准点率、飞机/列车基础参数、机场/车站基础设施信息及其他相关数据的企业,提供API接口服务。如用车行业,基于实时的航班/列车动态信息,做好机场/车站接送业务支持,合理安排车辆调度,提高服务效率;保险业,基于准点率数据,实现延误险动态定价,基于航班/列车动态数据,自动判断航班延误/取消是否达到赔付标准,实现自动理赔,提高理赔效率;OTA,提供飞机/列车基础参数数据,如机型、车型、座椅间距、 娱乐 设施配备等,供用户在选择航班时做参考,提升服务体验感。

数据报告

基于航班管家多年的民航铁路数据积累,分析民航铁路交通运输和旅客出行状况,提供定期、专题等多种类型的专业分析报告,还可基于行业专家团队能力提供深度行业咨询服务,从整体上把握市场趋势,为日常工作及生产经营决策提供支持。如为发动机制造商,围绕机队数据、飞机利用率、停场时长等指标,提供机队分析报告,帮助其快速掌握航司机队状况;为机场、航司、金融、证券、媒体等行业,围绕计划/实际航班量、航班执飞率、航班座位数、航班拥挤度、旅客运输量等指标,提供民航运行周报,从整体上把握民航运行状况,了解行业趋势;节假日时发布专题报告,分析旅客出行数据, 探索 旅客出行规律,为航司、旅行社、酒店等企业,在制定节假日产品时,提供数据支持。

数据分析工具及可视化

基于行业领先且专业的民航铁路出行大数据及拥有自主知识产权的算法模型,通过可视化平台,将分析、预测数据深入浅出的展现出来。如Mapping System(航线网络图),提供航司、机场航线布局,并对数据进行分析展示,方便用户直观便捷的查机场/航司航线状况、通航点状况、空铁联运衔接状况;大数据平台,提供官方统计、机场分析、航司分析、航线分析、铁路分析等分析模块,帮助航司/机场快速掌握民航铁路整体运行状况,了解对标机场/航司运行状况,为机场/航司运行、服务提升、产品优化提供数据支撑;为文旅厅,提供空铁联运实时监测系统,帮助文旅厅实时掌握机场/火车站实时旅客流量、航班运行状况、旅客运行状况,提前做好景区开放、接待筹备等工作。

海量数据实时处理,及时准确对外输出。我们的数据覆盖全球1100+家航空公司,5000+座机场,境内航班数据覆盖率达100%,全球航班覆盖率达98%,每天处理超过20万趟航班的动态信息,智能推送40多类旅客行程关怀信息,国内航班实际起降时间准确率达99%。同时,自建铁路数据库已覆盖国内3138个车站,10000+班车次,每日覆盖中国国内90W+进出站车次。

航班动态的数据是由数据生产者实时解析的,数据生产者将解析的数据发送到Kafka,由消费服务对数据进一步消费处理,最终由消费服务将有效的数据同步到MySQL数据库中存储。

全球每天约有10万次航班的起降,预计每分钟产生5万条航班动态数据合计14M,每天产生的数据约20.4G,每月612G,每年7.2T 航班管家数据覆盖全球1100+家航空公司,5000+座机场,境内航班数据覆盖率达100%,全球航班覆盖率达98%,每日处理超过20万趟航班的动态信息。

为了面向行业提供多种数据服务产品和数据解决方案,赋能行业合作伙伴、帮助其提效降本,2021年01月06日,公司领导召集部分员工,确定了项目的大致方向,提出了依托现有的航班、高铁数据接口,开发一个“航班管家开放平台”的SaaS平台。

01

项目设计

研发人员根据项目提出的需求,第一时间画了简单的设计图。

航班管家开放平台可主要分为3个大模块和15个子模块:3个大模块分别是控制台模块、数据服务模块、数据中心模块。15个子模块分别是:用户模块、鉴权模块、产品模块、网关模块、API数据模块、H5数据模块、控制台模块、管理后台模块、账单模块、余额模块、批价模块、支付模块、时间轴模块、行程中心模块、行程消息模块。

控制台模块:

提供用户专属账号登陆“航班管家开放平台”的控制台,开通“行程服务”中的产品获取航班、高铁服务的专属API接口数据和下载“数据报告”产品中有价值的大数据分析报告等。

数据服务模块:

数据中心模块:

基于民航空管局授权的官方动态数据,整合航空、铁路、场站、旅客、货运等多维度数据,结合拥有自主知识产权的算法模型与行业Know-how,构建有价值的数据。

02

技术选型

技术团队了解完业务的需求,考虑到用户的类型和规模,为了保证系统的安全性、可用性、稳定性、可伸缩性和可维护性,确定了以下的架构模式:

2.1、分层模式:

控制台模块采用的是分层模式:表示层、应用层、数据访问层。

表示层:

使用Vue.js等进行前端展示,完成集成和数据展示功能。

应用层:

使用Spring Cloud、Log4j、MyBatis等开源框架,Spring Cloud使用的计算机编程语言是Java,保证了系统代码的可移植性、安全性、可维护性,同时它也是一个分布式系统,保证了系统的可伸缩性、可维护性、可用性。

数据访问层:

综合使用Kafka、MySQL、Redis等多种开源技术,高效完成数据存储、资源调度、数据计算等,为业务及其他环节做支撑。

2.2、主从设备模式

数据中心模块中的数据库MySQL采用主从设备模式:主设备储存数据最终的计算结果,从设备中返回主设备中的计算结果。

MySQL使用主从设备模式,实现了实时灾备,在单台机器发生故障的时候,可以迅速的切换到其它机器,即实现了数据的备份,又保证了服务的高可用,同时从设备可以有多个,也保留了服务的扩展性。

2.3、代理模式

采用Nginx服务器的反向代理,防止主服务器被恶意攻击,确保数据的安全,提供数据的防护能力。同时Nginx服务器提供有负载均衡和动静分离的实现支持,可以极大的提高服务的安全性、稳定性,可用性。为了进一步保证网络安全,所有的服务均采用HTTPS加密协议进行网络资源传输,为用户良好的体验效果提供保障。

03

实施过程

2021-01-18

以下模块分别完成了服务器端文档编写和接口开发并发布测试环境:

1. 产品模块完成了H5资源和API资源的在线配置相关接口;

2. 鉴权模块完成了资源访问的鉴权相关接口;

3. 用户模块完成账户信息的维护相关接口;

4. API数据模块完成了航班数据输出接口、高铁正晚点数据输出接口;

5. H5数据模块完成了航班详情页和高铁详情页服务器端接口;

6. 控制台模块完成产品列表、应用列表相关接口。

2021-01-25

1. 控制台模块和产品模块、鉴权模块、前端完成联调和上线;

2. 网关模块和鉴权模块、产品模块、H5数据模块、API数据模块完成联调并上线;

3. 管理后台模块完成了基础框架的搭建和权限系统的开发、测试和部署到线上华为云。

2021-02-25

以下模块分别完成了服务器端文档编写和接口开发并发布测试环境:

1. API数据模块完成高铁动态、列车时刻表输出相关接口;

2. H5数据模块完成航班详情页内部跳转链接页面、高铁详情页内部跳转链接页面;

3. 时间轴模块完成卡片元数据和阶段卡片关联的相关接口;

4. 控制台模块完成用户注册、找回密码、更换手机号、主题配置相关接口;

5. 管理后台模块完成产品货架的展示、产品上下架,用户信息,系统配置。

2021-03-08

1. API数据模块和网关模块完成高铁动态、列车时刻表输出的联调、上线;

2. H5数据模块和网关模块、前端完成航班详情页、高铁详情页内部跳转链接页面的联调、上线;

3. 时间轴模块和管理后台模块完成卡片元数据和阶段卡片关联的联调、上线;

4. 控制台模块和用户模块、前端完成户注册、找回密码、更换手机号、主题配置的联调、上线;

5. 管理后台模块完成产品货架的展示、产品上下架、用户信息、系统配置的上线。

2021-03-26

以下模块分别完成了服务器端文档编写和接口开发并发布测试环境:

2. 行程消息模块完成消息推送、消息列表展示的相关接口;

3. 控制台模块完成用户的认证、应用的动态配置、yhk对公转账充值的相关接口;

4. 批价模块完成了产品的批价处理相关接口;

5. 账单模块完成了生成产品的消费订单相关接口;

6. 余额模块完成了消费订单的扣费相关接口

7. 支付模块完成了企业账户信息的维护、yhk对公转账充值到余额、余额支付、余额查询的相关接口;

8. 管理后台完成用用户认证审核、户充值的订单和充值处理的相关接口。

2021-04-08

1. 行程中心模块和网关模块、控制台模块完成了联调、上线;

2. 行程消息模块和网关模块、控制台模块完成了联调、上线;

3. 账单模块和批价模块、余额模块、支付模块完成了联调、上线;

4. 控制台模块和支付模块、管理后台模块、前端完成了联调、上线;

5. 管理后台模块和控制台完成了联调、上线。

2021-05-15

以下模块分别完成了服务器端文档编写和接口开发并发布测试环境:

1. 支付模块完成支付宝、微信扫码支付的相关接口;

2. 账单模块完成了日账单、月账单统计和明细查询的相关接口;

3. 控制台模块完成了用户账单的汇总和明细的展示和导出、行程服务产品套餐包展示和购买和订单的支付、查询相关接口;

4. 批价模块完成行程服务产品套餐包的批价;

5. 管理后台模块完成产品套餐的录入、上下架,用户购买套餐的展示、用户订单的相关功能。

2021-05-31

1. 支付模块和控制台完成扫码支付的联调、上线;

2. 账单模块和控制台完成账单统计和明细查询的联调、上线;

3. 控制台模块和支付模块、前端完成套餐的展示、购买和订单列表的查询的联调和上线;

4. 批价模块和控制台模块完成套餐包相关产品的计费调整的联调和上线;

5. 管理后台模块完成了测试和上线。

2021-06-18

以下模块分别完成了服务器端文档编写和接口开发并发布测试环境:

1. 控制台模块完成支付宝、微信扫码充值到余额,航班详情页、高铁详情页支持功能模块可配置化;

2. H5数据模块完成航班详情页、高铁详情页功能模块的动态展示。

2021-06-30

1. 控制台模块和支付模块、前端完成扫码充值联调、航班/高铁详情页的功能模块动态配置的联调、上线;

2. H5数据模块和前端完成航班详情页、高铁详情页功能模块的动态展示的联调、上线;

3. 前端完成官网的全新改版上线。

民航局空管局官方授权数据,为航班信息提供了官方来源的数据,充实、完善了底层数据库。

·与交通行业专业院校、科研院所、金融券商等展开合作,特聘各领域专家组成专家团队,为客户提供深度的行业咨询服务及分析报告产品。

一、项目定位

1. 概述:大交通数据及服务开放平台,为多种行业用户提供民航、铁路、航空货运大交通数据及其衍生产品服务,并根据各行业特色和需求,提供个性化、配套完善的解决方案。

2. 目标:封装航班管家的各项能力,向平台用户输出多种类的产品服务及解决方案。提供一站式自助化线上服务,降低自身人力成本投入。

3.提供成熟稳定的行程服务H5页面,企业可在自有移动端产品中嵌入航班、列车行程服务及行程管理页面,以企业自己的品牌,在自有产品中一站式全流程服务出行用户,让用户能轻松管理自己的行程。帮助企业显著提升用户出行体验,更好服务用户,创造更多商业价值。

4. 可为企业高效快速对接以下成熟型行程服务产品降低企业开发成本、提升用户出行服务满意度,如行程管理、航班行程服务、列车行程服务、全场景服务信息推送。用户可随时查看已有行程/ 历史 行程

用户可自主添加航班、列车行程,支持航班号/起降地查询航班信息、车次号/出发到达站查询火车信息,航班行程服务,围绕用户航空出行场景,提供精准的航班动态信息,并将航空出行全流程划分为多个阶段,在不同阶段提供不同的数据和服务,企业可通过H5页面将服务嵌入自有产品中,为用户提供一站式全流程服务。不同行程阶段,给用户提供的服务,可以在平台进行配置。实时、精准呈现航班动态相关信息,大数据预测起飞及到达时间,准确告知值机柜台和登机口信息,详细指引登机路线,确保用户顺利登机,航班近期准点率及平均延误时长统计。

二、目标群体

1. 短期目标群体:

有数据使用需求的中小型用户,如券商、咨询公司、学者学生、创业开发者等(对标API接口产品)。

有数据分析需求,需要数字化分析工具的用户,如机场、航司、政府、制造商等(对标数据平台、数据报告产品)。为C端提供行程服务需求的用户如中小型OTA、TMC等(对标行程服务产品)。

2. 长期目标群体:

有货运数据需求的用户,如物流、货运代理等(对标货运服务产品)

为服务的各领域提供专业的解决方案,如OTA、物流、航司、机场、制造商、用车、保险、车联网、集成系统开发、云服务等。

成效:

保险:行业数据分析核算,实时核保,赔付周期提升99%,赔付率降低50%,优化用户服务体验。

网约车:合理优化网约车资源利用率,平均减少接送机司机空等时间75分钟/年。

酒店:为酒店提供用户行程管理,6小时酒店航班信息同步,提高房源利用率,提升“机+酒”服务体验。

物流:为物流快递行业提供发货前中后数据信息参考,航班管家为中国90%的航空快件服务商赋能提效。

航班管家

航班管家是国内领先的智能出行平台,以“航班+高铁”的行程服务为核心,服务全面覆盖航班、高铁以及专车接驳三大出行场景,服务所有大交通出行用户。面向C端,航班管家为用户提供航班/列车动态信息、票务/酒店预订、专车接送、出行攻略内容等在内的一站式出行服务,让出行成为美好的生活方式;面向B端,航班管家构建覆盖航班和铁路出行全场景的企业级SaaS平台,聚焦大交通出行服务行业数字化升级,为OTA、TMC等行业提供多场景服务解决方案,赋能合作伙伴,提效降本。

学习经济学需要熟悉哪些编程语言?

1)坛友arthur_2006

处理和分析数据都用得到,最基本的是excel,如果你的VBA用得好的话会有很大的帮助,如果你要分析数据的话,比如你要建模那么SAS还是不错的,不过比较难掌握如果你没有语言方面的基础,其他还有很多软件也能做得到。很多银行证券期货企业都使用的是oracle或者DB2,一些小企业可能使用的是SQL, 所以如果想在这方面发展就要掌握数据库的知识,毕竟金融和计算机兼备的人才还是稀缺的,而且国内很多行业都是用的是这几大数据库比如电信医疗航空等等,不会分析金融数据恐怕称不上什么金融专家吧,至于你分析得准还是不准那就要看你的金融知识掌握的程度啦,尤其是投资专业的学生学习一些这方面的知识是必要的,很多人是应用金融学专业的偏向于财务,那就去考考CFA,ACCA什么的,也没必要在这上面花费太多精力而且工作中很可能用不到的,金融数学金融工程精算专业的同学花点时间研究一下还是很有必要的,总而言之一句话,首先要看你的兴趣再就是你的专业和发展方向。

2)编程爱好者任坤

做统计和计量的话,想要跟当今的国际学术界接轨,最好学R,至少我所知道的目前美国的统计学术界被R占领的趋势很明显了。

如果只是做简单地回归随便解读一下,那随便选个傻瓜软件就可以了。如果只是应用现成的成熟的计量模型来做实证研究,那么傻瓜软件一般也就可以了。如果要以统计、计量为研究领域或者专业领域,那么编程性的东西是少不了的,即使是做实证如果涉及较为复杂的数据结构,懂编程也能帮你大幅提高生产力。另外,R的社区比较活跃,能够较好地跟上前沿。

如果涉及到处理较大的数据,一种办法是用SAS,如果不想用SAS可以学数据库方面的东西,比如把数据放在SQLite数据库中然后用{RSQLite}访问数据库,或者用{sqldf}通过SQL *** 作环境中的data frame。

如果觉得执行某项任务R单核速度慢,那么可以使用{parallel}或者{parallelMap}做并行计算,也可以利用云计算来处理数据。

如果涉及到其他社区的东西在R社区中没有实现,例如Java的东西,可以用{rJava}来调用Java的对象,不过速度有些慢。

比较好的办法是我在想从事数据分析工作,学什么软件或语言最好? 提到的F#函数式编程语言,用RProvider可以直接调用R,用JavaProvider直接调用Jar打包的Java程序,用PythonProvider(即将发布)直接调用Python程序,等等,很容易将各大社区的资源整合在一起使用。

目前我在GitHub上面弄一个通过R学习统计、计量、非参、数据可视化、数据库的repo: renkun-ken/learnR on GitHub ,虽然目前还没什么内容,不过可以跟踪一下。

以上说得都是经济学相关的统计和计量方面所需要的编程。事实上统计和计量所需的「编程」较为简单,基本也就是处理数据、应用已经提供的计量模型,更多需要编程的是:一、如果涉及较为前沿的计量模型,可能还需要自己实现;二、一些蒙特卡罗模拟需要一些编程。

从经济学相关的一些新型领域来说,计算经济学(Computational Economics)、计算统计学(Computational Statistics)以及计算计量学(Computational Econometrics)则需要较强的编程能力,包括算法实现、算法分析等等。举个例子,计算经济学中目前做的一块研究是Agent-based computational finance,就是建立一个模拟的金融市场,里面有几种资产,每种资产的基本面由随机的红利决定,里面有许多遵循各种逻辑的投资者,投资者对于红利发放持有的信念不同,因而从各自的逻辑触发的交易行为不同。在一个复式竞价(double auction)的交易市场中,什么样的投资者组成或者行为方式、什么样的记忆长短,能够最大程度地复制出我们在现实金融市场中观测到的资产价格或者资产收益率规律,例如资产收益率尖峰肥尾、不对称性。此时,研究者就需要较扎实的金融知识来设计一个不过于简单而又不过于复杂的模拟金融市场,也需要相应的编程能力把模型用程序语言编写出来。这中间会设计许多编程技术,例如数据库(有时要跟踪许多变量,例如投资者现金流动、财富分布)、并行计算(CPU多核并行、多进程并行、集群上的并行甚至GPU计算)等等。这方面的研究从1990s年代才开始。

3)知乎网友Jichun Si

计量经济学也有很多小的门类,请对号入座。有很多软件,Stata, matlab, R, SAS是相对来说用的比较多的。

如果是做应用计量(特别是横截面数据、面板数据),Stata是不二之选,因为不管是管理数据还是跑回归,实在太太太方便了。现在主流期刊的应用微观计量文章里面能用到的模型stata几乎都有,而且其中的绝大多数都是用stata做的。而且最大的优点是,简单!

如果做应用的时间序列,Eviews似乎是一个不错的选择。但是我一般不做这方面,也不是很有发言权。

如果做理论计量,stata eviews是没有现成的包的,而且即便Stata可以编程,可编程能力也是很差的,而且不稳健。所以懂R和Matlab就非常顺手。当然也可以用Python,最近Sargent就写了本用Python做计量的书。还有一个Julia,是这三种语言的混合,但是速度快很多,缺点是太过于小众。

如果对速度要求高,特别是金融计量很多对速度有要求的,可以考虑C、Fortran等语言。C和Fortran肯定是最快的。还有一个叫做OX的,速度快,但是也很小众。但是这些语言的缺点是学习难度比较高,开发时间比较慢。Julia据说速度堪比C,而且语法特别像Matlab、Python(意味着容易学习),但是处于刚起步阶段,用的人太少了。

如果是金融计量领域,强烈建议学会SAS。SAS是最权威,速度也很快,当然最大的问题是昂贵,而且可编程能力不是多么好。但是金融里面数据量都非常非常非常大,一般的软件都瘫的时候,SAS就派上用场了。

像我自己,做应用的时候都是用stata整理数据,能用stata的坚决不用其他软件。但是因为有的时候做一些理论计量的工作,所以matlab也是必不可少的。我也在学习Julia,因为matlab的速度实在太慢。Python我一般不用来做科学计算,用的人不多,而且速度慢,一般是用来抓数据的。

最后还是补充一点吧,为什么我推荐matlab而不是其他的软件,也是有道理的。很多模型,比如空间计量模型(spatial econometrics)、贝叶斯估计、以及宏观计量里面的DSGE model、SVAR等模型,在stata、Eviews里面都是没有什么现成的东西可以用的,但是matlab提供了丰富的包,比如Dynare就是基于Matlab的,还有LeSage的空间计量软件包等等,也是基于matlab的。所以几乎你想用的模型matlab里面都能找到codes然后直接用。就算没有,你自己在matlab里面写,也不是什么难事。

最后想起一句话来,关于这些软件的选择(stata除外,因为stata在应用计量领域的地位是几乎不可替代的)可以用两句话来概括:如果你自己的时间比计算机的时间宝贵的话,学习matlab、R、甚至Python、Julia是最合适的,如果计算机的时间比你的时间宝贵的话,学习C、Fortran是必须的。当然除非你的工作非常特殊(比如一些大型的结构模型的估计),一般来说,还是自己的时间更宝贵一点。

综上,做应用和做理论是不可能用一种软件解决的,建议根据自己的方向进行挑选。我觉着stata、matlab是比较推荐的,一个方便,一个灵活,都很强大,而且学习难度都不大,用的人都很多,交流起来相当方便。

4)网友张真实

数据,简单的用excel,直观,方便。复杂一些的…excel最多可以有6万多行,你确定你需要从那么大量的数据开始“学经济学么?

复杂的用R,各种模型,算法,实现,基本上R都有对应的软件包了,下载下来直接用即可,多读文档多练多用,半年左右就可以抛开excel直接用R作实战了。我博士论文全部回归和输出都是用R的,现在写的论文也都用它。替代品是Stata。也很好,但如果你和我一样是从0开始,那么强烈建议选R。

R的一个不足是没法作符号运算,这个免费的解决方案有python搭配scipy numpy等几个包,不过建议你用mathematica,它的符号计算功能最强大,输出格式也最好。你可以找个jacobian矩阵搞一下符号计算,比较一下结果就知道了。

Python这东西,熟悉了R之后,发现有功能是R实现不了的,到时候有实际需求了,再学也不迟。不是立刻就需要的。

此外,所有经济学研究(我是指empirics类型的,具体意思你懂的),都要会用latex,可以把它看做是一门编程语言。在word里排数学公式,用不了多久你就会疯掉。R中可以用ggplot2来绘图,输出到tex中。普通数据表用xtable包输出到tex,回归结果用stargazer输出到tex,都很方便。

5)网友bayes

首先要说的是R,绝对是目前国外学术界的主流,统计系基本除R以外没有其他了,计量作为和统计相关的方向,R也在逐渐渗透。所以推荐学习。

顺便说一句,R的学习曲线是比较陡峭的,所以我不太建议零基础的人从R开始,否则挫折感会比较强烈。而python会略好,所以我建议从python开始。

python并非是专用于统计或者计量的软件,而是一种非常流行的通用编程语言。经过多年发展,库也非常齐备。我试用过numpy,scipy和pandas等库,与其他通用编程语言相比,算是相当好用,不过个人感觉还是比不上R,比如画图,

ggplot2真心是神一般的存在,python的库还是略逊一筹。但是,除了数据处理之外,python可以干的事情太多了,也太牛了。我们主要要用到的,比如网页采集数据,需要正则表达式,解析网页等等。这些方面python就比R有优势多了。

当然,从趋势来看,未来似乎python比R更优。R是一群统计学家在编程序,python是一群计算机专家在争取搞数据处理。似乎python的基础更扎实。个人观点,仅供参考。

stata我认为是除了R以外最好的计量软件了,我两者均用过数年数个项目,但是依然感觉R更好用,整理和处理数据更方便。所以即使在楼上诸位所提到的微观计量领域,我依然更喜欢R。

除此以外spss,或者eviews等,感觉管理类学生用的更多,功能比较受限,不太推荐。这里不赘述。上述的几个软件,还有个问题,在于都是收费的,考虑到未来知识产权的保护,还是用免费的略靠谱。

R的主要缺点有两个:

1,面对大数据乏力。这方面sas确实有优势,但是不得不说,sas的语法太反人类了,完全接受不能。面对这个问题,我要说的是,你得看问题有多大。以我的经验,经济里面的数据量似乎还不足以超过R的处理上限很多。可能金融的高频数据会比较大,我个人没啥经验,如果遇到再补充。我尝试过10g的数据,最简单的办法,不是学sas,而是买16g的内存。:)以现在的内存价格,我觉得32g以下的问题不大。

2,性能不足。这方面python也有同样的问题,最好的解决方案是混合c/c++,不过这个就是无底洞了,耗时极多,都不见得能学好。建议的方法,还是买硬件,这个最简单。:)当然用并行包等,也是解决方法之一,我尝试过几次用机房的多台机器做集群,不是太成功。求高人指点。

上面诸位还提到过几个软件,我也略微说一下自己知道的一些软件的看法:

matlab:好东西,关键还是性能问题,同样可以靠c/c++来解决。但是我不喜欢比较大的软件,为了求个均值方差,等它启动就占了5分钟。。。

julia:好东西X2,目前关注中,可能还比较年轻,导致配套的库略少,不过看好未来发展,主要是吸取了matlab,python和c/c++的有点,写的快,运算的也快,未来看涨,紧密关注。

最后提一下函数式编程,是个好东西,但是不看好纯粹函数式编程的未来。它体现了一种颇先进的编程思想,但是在实际工作中,往往性能方面的问题较大。要解决这个问题,还是的混合函数式编程和其他方式,但这就是python,R等软件已经实现的方式,似乎又没有必要专门去学其他的函数式编程了。

6)上海财经大学博士 荣健欣

Stata微观计量中应用极多,主要是直接输命令回归,需要编程的地方不多。

至于编程,推荐R、Python.

R是非常好的统计分析软件,在计量经济学中的应用可以见Econometrics in R, Applied Econometrics with R Time Series Analysis with Applications in R这几本书

Python用来抓数据很好,并且有数学计算包SciPy可以部分替代Matlab之类科学计算的功能。

7)知乎网友justin

本科经济统计学,由于学校奇葩的课程设置,我们分别使用过:

EViews:计量经济学,时序和多元统计。

Stata:计量经济学。

SPSS:专门开的一门课,这个巨汗,权当复习了一遍统计学。

Excel:大一的统计入门课使用的,这个也巨坑,就是简单的函数使用,一点没有涉及VBA。

Matlab:这个没有专门的课,是上完了C语言程序设计以后副产品,后来接触了R和Mathematica就基本抛弃了它。

R/S-Plus:在回归分析的时候使用了S-Plus,不过那时候我已经使用R语言很久了,而且S-Plus基本兼容,所以没有使用过S-Plus。

Minitab:质量控制课程上用的,基本的统计加上一些实验设计。

SAS:这个在实验室中自学过几次,直接被其奇葩的语法雷到了,据说我们学校的研究生有专门的SAS课程(类似于本科的SPSS课程),呵呵了~

我们系的妹(xue)纸(ba)就曾经抱怨说使用的软件太多了,完全被逼疯的感觉,还给我们亲爱的系主任提过意见。作为学渣也就这个问题问过系主任,她的意思是不同的软件在处理不同的数据时候是各有所长的,而且你们课程还是蛮轻松的,就多学点吧,另外不同的老师有不同的软件使用爱好,上课使用不同的软件是必然的。

学习经济学的同学,Excel和SPSS,EViews(或者Stata)就蛮好的了,Stata和EViews都可以写一些程序的,SPSS的界面化 *** 作也是很友好的。本人使用的R,在上各种课中也都会在学了那些软件后再使用R来实现(其实绝大多数时候R都已经有现成的包了,我也大多是直接使用),R还是很不错的,推荐。

很多前辈也提出了,经济学学生学习编程适可而止就好了,要不然就是一条不归路啊,面临着彻底转行的危险,本人就是一枚反面例子(泪~。所以什么Python啊,C++啊,Julia啊就不要接触了。

1、中国知网:

知网,是国家知识基础设施的概念,由世界银行于1998年提出。CNKI工程是以实现全社会知识资源传播共享与增值利用为目标的信息化建设项目。由清华大学、清华同方发起,始建于1999年6月。

凭借优质的内容资源、领先的技术和专业的服务,中国知网在业界享有极高的声誉,在2007年,中国知网旗下的《中国学术期刊网络出版总库》获首届“中国出版政府奖”,《中国博士学位论文全文数据库》、《中国年鉴网络出版总库》获提名奖。

2、万方:

万方数据库是由万方数据公司开发的,涵盖期刊、会议纪要、论文、学术成果、学术会议论文的大型网络数据库;也是和中国知网齐名的中国专业的学术数据库。

其开发公司——万方数据股份有限公司是国内第一家以信息服务为核心的股份制高新技术企业,是在互联网领域,集信息资源产品、信息增值服务和信息处理方案为一体的综合信息服务商。

3、中国年鉴网络出版总库

中国年鉴网络出版总库是目前国内最大的连续更新的动态年鉴资源全文数据库。内容覆盖基本国情、地理历史、政治军事外交、法律、经济、科学技术、教育、文化体育事业、医疗卫生、社会生活、人物、统计资料、文件标准与法律法规等各个领域。

4、中国引文数据库

该库收录了中国学术期刊(光盘版)电子杂志社出版的所有源数据库产品的参考文献,涉及期刊类型、学位论文类型、会议论文类型、图书类型、专利类型、标准类型、报纸类型等超千万次被引文献。

该库通过揭示各种类型文献之间的相互引证关系,不仅可以为科学研究提供新的交流模式,同时也可以作为一种有效的科学管理及评价工具。

5、维普数据库系统

维普资讯网建成于2000年,现已成为全球著名的中文信息服务网站,是Google Scholar最大的中文内容合作网站,中国最大的数字期刊数据库,目前拥有2000余家集团用户,网站注册用户数超过200余万。

网站内容服务包括9000余种/2000万篇中文期刊全文;30余个国家/11300余种/800余万条外文期刊文献;400多种重要中文报纸信息,学科覆盖理、工、农、医、文、史、哲、法各个领域,并提供网上每日更新。


欢迎分享,转载请注明来源:内存溢出

原文地址:https://54852.com/sjk/10022023.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2023-05-04
下一篇2023-05-04

发表评论

登录后才能评论

评论列表(0条)

    保存