
- 准备条件
- 实验步骤
- 虚拟机 VMWare
- Linux 系统 Ubuntu
- Java JDK8
- Hadoop 2.7.3
- Hive 2.1.1
步骤1
启动 HDFS ,注意 Hive 是运行在 HDFS 之上的,必须安装好和 启动 HDFS 才能使用 Hive 启动 Hive 进入 Hive 命令行(CLI) cd ~/hive-2.1.1/bin hive
步骤2
创建数据库 testdb
.步骤3
创建 student 表,包含下面 5 列: 1. id 学号,使用 BIGINT 类型 2. name 姓名,使用 STRING 类型 3. fav 爱好,使用数组 Array 类型 4. scores 各科成绩,使用 Map 类型 5. info 个人信息:身高 height 和体重 weight,使用 Struct 类型
4.步骤4
创建文本文件 students.txt,写入如下内容: 15107011, zhangsan, programming|game|basketball, Java:95,Math:96, English:98, 175|70| 15107012, lisi, painting|game|hiking, Java:85,Math:76, English:88, 185|80| 15107013, wangwu, music|reading|badminton, Math:85,Java:86, English:90, 165|55|
步骤5
将 students.txt 导入表 student 中
步骤6
查询表 student 中所有学生的 Java 课程的最高成绩
步骤 7
查询表 student 中姓名包含 ang 的学生的成绩和爱好
欢迎分享,转载请注明来源:内存溢出
微信扫一扫
支付宝扫一扫
评论列表(0条)