
了解SELECT语句的工作方式。这其中包括研究逻辑查询处理的工作方式。逻辑查询处理描述了数据库引擎执行SELECT语句的子句的顺序。了解它会引导你编写更好,更准确的查询。
研究联接的工作方式
内部联接是最有效的。左,右和完全外部联接的效率较低,但有时必须使用它们。内部联接可以导致行被过滤掉,外部联接不能导致过滤。研究加入,因此你知道何时使用每种类型。只有最简单的数据库查询才不涉及联接。
了解如何使用GROUP BY子句进行聚合
了解窗口函数/有序分析函数。这些是在SQL中进行分析的缩影。最初很难将你的头缠绕在它们周围,但是这是值得的。一旦了解了它们,便会一直使用它们。
了解数据库规范化。如果你了解规范化,你将了解为什么架构师以这种方式构造数据库的理论。这有助于编写查询并确定要联接的表。
了解实体关系图(ERD)的工作方式。大多数ERD是使用鱼尾纹符号构建的。确保知道基数和可选性约束是如何工作的,这将帮助你解密连接表时要使用的连接类型。
一旦掌握了这些知识,就应该扩展到学习SQL的DML和DDL子类别。DML代表数据 *** 作语言,SELECT语句是该语言的一部分。DDL代表数据定义语言,这是数据库架构师用来创建表的语言。
本文禁止转载或摘编
本文为我原创
大数据
数据分析
数据分析师
1
收藏
分享
推荐文章
35岁转行数据分析师可以吗?
学习 · 56阅读
Excel之PowerQuery 提取单元格指定文字
学习 · 175阅读
[简述]答题验证系统部署说明
学习 · 865阅读
sql数据分析是结构化查询语言。
结构化查询语言(Structured Query Language)简称SQL,是一种特殊目的的编程语言,是一种数据库查询和程序设计语言,用于存取数据以及查询、更新和管理关系数据库系统。
结构化查询语言是高级的非过程化编程语言,允许用户在高层数据结构上工作。它不要求用户指定对数据的存放方法,也不需要用户了解具体的数据存放方式。
所以具有完全不同底层结构的不同数据库系统, 可以使用相同的结构化查询语言作为数据输入与管理的接口。结构化查询语言语句可以嵌套,这使它具有极大的灵活性和强大的功能。
SQL具有数据定义、数据 *** 纵、数据查询和数据控制的功能。
1、SQL数据定义功能:能够定义数据库的三级模式结构,即外模式、全局模式和内模式结构。在SQL中,外模式又叫做视图(View),全局模式简称模式(Schema),内模式由系统根据数据库模式自动实现,一般无需用户过问。
2、SQL数据 *** 纵功能:包括对基本表和视图的数据插入、删除和修改,特别是具有很强的数据查询功能。
3、SQL的数据控制功能:主要是对用户的访问权限加以控制,以保证系统的安全性。
本篇重点为大家讲解 组合数据、数据插入、更新和删除数据 相关内容。
多数SQL查询只包含从一个或多个表中返回数据的单条 SELECT 语句。但是,SQL也允许执行多个查询,并将结果作为一个查询结果集返回。这些组合查询通常称为并 (union) 或复合查询 (compound query)。
主要有 两种情况 需要使用组合查询:
在一个查询中从不同的表返回结构数据;
对一个表执行多个查询,按一个查询返回数据。
创建组合查询
利用 UNION ,可给出多条 SELECT 语句,将它们的结果组合成一个结果集。
使用方法: 给出每条SELECT语句,在各条语句之间放上关键字UNION。
假如需要Illinois、Indiana和Michigan等美国几个州的所有顾客的报表,还想包括不管位于哪个州的所有的Fun4All。
分析:这条语句由两条 SELECT语句 组成,之间用 UNION 关键字分隔。UNION指示DBMS执行这两条SELECT语句,并把输出组合成一个查询结果集。
在简单的例子中,使用UNION可能比使用WHERE子句更为复杂。但对于较复杂的过滤条件,或者从多个表中检索数据的情形,使用UNION可能会使处理更简单。
1、UNION规则
UNION必须由 两条或两条以上 的SELECT语句组成,语句之间用关键字 UNION分隔。
UNION中的每个查询必须包含相同的 列、表达式或聚集函数。
列数据类型 必须兼容 :类型不必完全相同,但必须是DBMS可以隐含转换的类型。
2、包含或取消重复的行
使用 UNION 时, 重复的行会被自动取消 ,这是UNION的默认行为,如果想返回所有的匹配行,可使用 UNION ALL 。
3、对组合查询结果排序
在用 UNION组合查询 时,只能使用一条 ORDER BY 子句,它必须位于最后一条SELECT语句之后。
TopBDA大数据分析师培训
除了SQL数据库学习,还有大量数据分析知识和实 *** 等你 探索 !
SELECT是最常用的SQL语句,还有其他3个常用的SQL语句需要学习,第一个就是 INSERT ,另外两个之后为大家介绍。
INSERT用来 将行插入或添加到数据库表 ,插入有几种方式:
插入完整的行;
插入行的一部分;
插入某些查询的结果。
插入完整的行
把数据插入表中的最简单方法是使用基本的 INSERT 语法。
分析:在插入行时,DBMS将用VALUES列表中的相应值填入列表中的对应项。VALUES中的第一个值对应于第一个指定列名,第二个值对应于第二个列名,如此等等。
插入部分行
使用这种语法,还可以 省略列 ,这表示可以只给某些列提供值,给其他列不提供值。
分析:没有给 cust_contact 和 cust_email 这两列提供值,这表示没必要在INSERT语句中包含它们。因此,这里的INSERT语句 省略了这两列及其对应的值。
插入检索出的数据
INSERT一般用来给表插入具有指定列值的行。
INSERT还存在另一种形式, 可以利用它将SELECT语句的结果插入表中, 这就是所谓的 INSERT SELECT 。
假如想把另一表中的顾客列合并到Customers表中,不需要每次读取一行再将它用INSERT插入,可以如下进行:
分析:使用INSERT SELECT从CustNew中将所有数据导入Customers。SELECT语句从CustNew检索出要插入的值,SELECT中列出的每一列对应于Customers表名后所跟的每一列。
从一个表复制到另一个表
可以使用 CREATE SELECT 语句(或者在SQL Server里也可用 SELECT INTO 语句)。
与 INSERT SELECT 将数据添加到一个已经存在的表不同,CREATE SELECT将数据复制到一个新表。
使用SQL Server,可以这么写:
分析:创建一个名为CustCopy的新表,并把Customers表的整个内容复制到新表中。
在使用 SELECT INTO 时,任何SELECT选项和子句都可以使用,包括 WHERE 和 GROUP BY ;可利用连接从多个表插入数据;不管从多少个表中检索数据,数据都只能插入到一个表中。
更新数据
更新表中的数据,可以使用 UPDATE 语句,使用UPDATE的方式有两种:
更新表中的特定行;
更新表中的所有行。
基本UPDATE语句由三部分组成,分别是:
要更新的表;
列名和它们的新值;
确定要更新哪些行的过滤条件。
举一个简单例子,客户1现在有了电子邮件地址,因此他的记录需要更新,语句如下:
分析:UPDATE语句以要更新的表名开始。要更新的表名为Customers。SET命令用来将新值赋给被更新的列。UPDATE语句以WHERE子句结束,它告诉DBMS更新哪一行。
更新多个列的语法稍有不同。
分析:在更新多个列时,只需要使用一条SET命令,每个“列=值”对之间用逗号分隔(最后一列之后不用逗号)。
要删除某个列的值,可设置它为NULL。
分析:NULL用来去除cust_email列中的值。
删除数据
从一个表中删除数据,使用DELETE语句,使用DELETE的方式有两种:
从表中删除特定的行;
从表中删除所有行。
分析:DELETEFROM要求指定删除数据的表名,WHERE子句过滤要删除的行。如果省略WHERE子句,它将删除表中每个顾客。
DELETE不需要列名或通配符 ,DELETE删除整行而不是删除列,要删除指定的列,使用 UPDATE 语句。
使用 UPDATE或DELETE 时所遵循的重要原则:
除非更新和删除每一行,否则绝对不要使用不带WHERE子句的UPDATE或DELETE语句。
保证每个表都有主键,尽可能像WHERE子句那样使用它。
在UPDATE或DELETE语句使用WHERE子句前,应该先用SELECT进行测试,保证它过滤的是正确的记录,以防编写的WHERE子句不正确。
使用强制实施引用完整性的数据库,这样DBMS将不允许删除其数据与其他表相关联的行。
有的DBMS允许数据库管理员施加约束,防止执行不带WHERE子句的UPDATE或DELETE语句。若是SQL没有撤销(undo)按钮,应该非常小心地使用UPDATE和DELETE。
以上就是今天分享的全部内容,下期重点为大家介绍 使用视图和创建和 *** 纵表 ,我们下期见!
欢迎分享,转载请注明来源:内存溢出
微信扫一扫
支付宝扫一扫
评论列表(0条)