SQL实战新手入门：关系型数据库管理系统_工具

关系型数据库管理系统

本书是讲述SQL的它是一种关系型数据库或者关系型数据库管理系统（RDBMS）的语言自从Codd博士在世纪年代奠定关系型数据库的理论基础以来已经产生了相当多的关系型数据库实现一些新的关系型数据库实现也不断出现

很多人将DB 视为所有数据库的鼻祖 IBM的研究员Edgar Frank Codd博士在年的一份IBM的研究报告中发表他的论文 Derivability Redundancy and Consistency of Relations Stored inLarge Data Banks 时给这种数据库理论定义了一个非常恰当的术语关系型关系型数据库被其他两种技术竞争一种是Honeywell Information Systems在年销售的Multics RelationalData Store 另一种是密歇根大学从年起作为实验性设计的Micro DBMS（它开创了Codd博士两年之后提出的规范化理论） Micro DBMS的最后一个产品已经于年退役这两种技术演变成了年发布的Oracle V 商业数据库在通往RDBMS的道路上包含了很多其他公司的产品所树立的里程碑（当然偶尔也有墓碑）这些产品包括 IBM PRTV（） IBM SQL/DS（） QBE（） Informix（） Sybase（） Teradata（） Ingres 一个给其他很多成功的系统带来灵感的开源项目例如PostgreSQL（） Nonstop SQL（）和MicrosoftSQL Server（）等这些系统使用了原始SQL的不同方言 SEQUEL QUEL Informix SQL等直到年人们才第一次试图为SQL语言制定标准毫无疑问各个厂商关于SQL语言的战争仍在继续

当前的RDBMS市场已经被几个重量级的专有关系型数据库瓜分 Oracle（ %） IBM（ %）和Microsoft（ %）更小的专有数据库系统Teradata和Sybase 每种不到 %的市场份额其他数据库厂商包括开源数据库大约占有 %的市场份额

对于大型企业来说选择一个数据库产品作为应用程序的基础并不是一个简单的任务这不仅仅是因为数据库系统软件需要花费好几万美元的许可证费用几十万美金的维护和技术支持费而且在于与其他软件硬件和人力资源投资相比数据库软件的投资还是一个决定整个企业架构的关键要素尽管近年来从一个RDBMS迁移到另一个RDBMS变得更加容易但考虑选择哪一种数据库依然会给CFO带来噩梦

IBM DB LUW

从带有MVS系列 *** 作系统的大型机到z/OS 以及后来的UNIX和Windows系统 IBM在RDBMS领域都是一个长期的领跑者 IBM数据库的当前版本是IBM DB LUW（Linux UNIX和Windows）

IBM DB 在事务处理速度上保持了绝对领先的记录（更多信息请参见第章）它具有多个不同的版本从Advanced Server Enterprise版本到免费的DB Express C版本（尽管功能上有限制）免费的DB Express C版本可用于运行本书中的示例

直到DB 的版本依然遵循ANSI/ISO SQL Entry标准（请参考本章后面的内容）并支持由其他标准化组织制定的一些高级功能例如Open Geospatial Consortium（开放地理信息联盟） JDBC X/Open XA 它还包含了最新SQL: 标准的部分功能除了自己内置的过程化扩展语言SQL PL之外它还支持使用Oracle的PL/SQL语言 Java语言甚至Microsoft的 NET家族的语言来创建存储过程（更多内容请参见第章）

Oracle

Oracle数据库可以追溯到年第一次发布的Oracle V 开始时用于VAX/VMS系统并于年支持UNIX系统经过多年发展对于SQL标准定义的绝大多数功能 Oracle数据库都添加了相应的支持在最新发布的Oracle g版本中功能支持达到了极致它声称遵循最新SQL: 标准的很多功能

在高性能事务处理的标杆上 Oracle占据了第二名的位置它是企业生态系统的核心 Oracle是一个安全的健壮的可伸缩的高性能的数据库系统它统治UNIX市场长达数十年除了对SQL标准的支持之外 Oracle还提供了一种内置的过程化语言PL/SQL（关于过程化扩展的更多内容请参见第章）另外它还支持通用的程序设计语言例如Java

在写作本书之时 Oracle的最新版本是Oracle g 只有Oracle g有免费的速成版该版本在数据存储的容量和RDBMS能够利用的处理器（CPU）数量上存在一定的限制速成版完全支持本书所讨论的所有SQL功能

Microsoft SQL Server

SQL Server来源于Microsoft Ashton Tate和Sybase合作的结果开始的目标是改写已有的仅适用于UNIX的Sybase SQL Server数据库使之适用于新的IBM *** 作系统OS/ Ashton Tate随后退出了这一合作 IBM OS/ *** 作系统也逐渐被人淡忘 Microsoft和Sybase为了分享成果开始小心地避免触犯彼此 Microsoft致力于发展并支持Windows和OS/ 系统上的SQL Server 而Sybase则致力于UNIX平台尽管在SQL Server的核心技术上Microsoft依然采用了相当多的Sybase技术但双方的合作关系于年正式结束 Microsoft于年发布了Microsoft SQLServer 它消除了Sybase余留的痕迹为世界（Windows系统的世界）带来了一个完全崭新的RDBMS系统时至今日 Microsoft占据了RDBMS大约 %的市场份额而在Windows系统上它占据了至高无上的位置

在写作本书之时最新版本是Microsoft SQL Server Release Microsoft还提供了一个免费但有限制的Express版本它支持本书所介绍的全部SQL功能

Microsoft Access

Microsoft Access也被称为Microsoft Office Access 它是一个桌面型关系数据库（相对来说是关系型的） Microsoft Access的设计目标是成为一个集成的解决方案结合关系型数据库引擎的要素和应用程序开发的基础结构（配套有内置的程序设计语言和程序设计模型）并作为一个报表平台与本书中讨论的其他RDBMS不同的是 Microsoft Access是一个基于文件的数据库因此它在性能和可伸缩性方面都存在固有的局限例如虽然最新版本的Access理论上允许最多个并发用户但在实践中超过多个用户就会减慢Access的性能 Access仅支持SQL标准的一个子集它提供了许多仅在Access环境中有效的功能

Access提供的功能之一就是从远程数据库链接表的能力该功能使Access可以作为应用程序

的前端访问任何与ODBC/OLEDB兼容的数据库

PostgreSQL

PostgreSQL是从美国加州伯克利大学的Michael Stonebraker所领导的一个项目演变而来的 Michael Stonebraker是关系型数据库理论的先驱在最初的Ingres项目以及其继任者PostgreSQL中采用的那些原则也以各种方式被其他RDBMS产品采用例如Sybase Informix EnterpriseDB和Greenplum

PostgreSQL的第一个版本发布于年之后第二年以版本的名义发布并保留了一个由一组专门的开发人员维护的开源项目 PostgreSQL具有很多个商业版本最著名的是EnterpriseDB 一个私人公司为该产品提供企业支持（以及大量专有的管理工具）在一些苛刻的企业级应用环境中很多高端客户（例如Sony和Vonage）都采用了开源的RDBMS 这充分证明了EnterpriseDB的性能

在对SQL标准的支持方面 PostgreSQL可以说是最接近SQL标准的另外它还提供了很多在其他数据库中所没有的功能与它的开源伙伴（例如MySQL）不同 PostgreSQL从一开始就提供了参照完整性和事务支持 PostgreSQL内置了对PL/pgSQL过程化扩展语言的支持另外实际上还具有适配其他任何语言来实现过程化扩展的功能

MySQL

MySQL最先是由Michael Widenius和David Axmark于年开发的并于年发布了第一个版本 MySQL最初定位为一个轻量级的快速数据库用于作为数据驱动型网站的后台数据库尽管MySQL缺乏更加成熟的RDBMS产品所具有的许多功能但在提供信息服务的速度上非常快对于很多场合来说都已经足够好（为了达到真正的快速 MySQL避开了参照完整性约束和事务支持更多内容请参见第章和第章）另外 MySQL有着无法抗拒的价格它是免费的因此在中小规模的用户群中 MySQL成为最流行的关系型数据库在数据库产品的市场上很多其他的免费产品在功能上都有所缺乏或者带有近乎商业炒作的宣传数据库产品的巨人 Oracle IBM Microsoft和Sybase在那时也都没有提供各自RDBMS产品的免费速成版在年 Sun Microsystems公司收购了MySQL 随后Sun公司又被Oracle收购

目前 Oracle提供了一个带有商业支持的MySQL版本和一个Community Edition版本伴随着这一收购出现了大量分支版本例如MariaDB和 Percona Server 它们在通用公共许可证（General PublicLicense GPL）下继续保持免费状态 GPL是一种限制最小的开源许可证

MySQL的最新版本是 MySQL 也已经指日可待它是多平台的（Linux/UNIX/Windows）并且支持SQL: 的绝大多数功能其中一些功能依赖于选定的配置选项（例如存储引擎）

存储引擎选项是MySQL独一无二的特性它允许采用不同的方式处理不同的表类型每一种引擎都有独特的功能和一定的限制（例如事务支持聚集索引存储限制等）可以采用不同的存储引擎选项来创建MySQL数据库中的表默认使用的是MyISAM引擎

HSQLDB和OpenOffice BASE

超结构化查询语言数据库（Hyper Structured Query Language Database HSQLDB）是一个用Java程序设计语言实现的关系型数据库管理系统它是伯克利软件发行（BSD）许可证（这个许可证相当宽松）下的一个开源数据库

HSQLDB是OpenOffice BASE自带的默认RDBMS引擎 OpenOffice BASE是一个桌面型数据库被定位于和Microsoft Access进行市场竞争 OpenOffice BASE也是一个关系型数据库它健壮功能丰富且相当快速支持多种平台包括Linux 各种版本的UNIX和Microsoft Windows OpenOffice BASE声称几乎完全遵循SQL: 标准该标准包含了本书所讨论的绝大多数SQL子集

改写过的HSQLDB可以作为OpenOffice 套件组件BADE的一个嵌入的后端并从版本开始成为OpenOffice 套件中的一部分与Microsoft Access类似假如有适当的驱动程序的话 OpenOffice BASE可以连接到多种不同的RDBMS 在OpenOffice BASE产品中已经包含了大量可用的Java Database Connectivity（JDBC）和ODBC（Open Database Connectivity）驱动程序

随着Oracle收购了OpenOffice 而其在Oracle的资助下作为开源项目的状态并不明确 OpenOffice 社区决定启动一个名为LibreOffice的新项目意图在原来的BSD许可证的授权下将LibreOffice作为一个免费软件实现OpenOffice的所有功能

关系型数据库并不是数据库领域中唯一的主角一些似乎已经被关系型数据库理论打败的旧技术在更快和更便宜的硬件以及软件创新的帮助下卷土重来对更高性能和更容易创建应用程序的需求催生了对列式数据库（columnar database）和面向对象数据库使将所有数据放在一个桶中方法可行的框架特定领域扩展（例如测地数据管理或多媒体）以及各种数据访问机制的研究第章将讨论这些话题

返回目录 SQL实战新手入门

编辑推荐

Oracle索引技术

高性能MySQL

lishixinzhi/Article/program/SQL/201311/16492

楼上说的《数据库系统概论》确实不错我们大学时的教材

个人再推荐一本《oracle从入门到精通》是上班后师傅给我看的也不错

很多人都推荐《oracle9i/10g/11g编程艺术》这本书有点贵不过口碑不错

我还没怎么看看了一眼觉得这本书需要有点基础以后再看

相信很多数据库入门的新手们在学习数据库方面都存在困惑，本文列出了一个非常完整的数据库学习路线，并对数据库学习过程中的细节进行详细指导。希望能够成为大家学习数据库过程中一份纲领性的教程。

本回答来自：数据库怎么学？数据库学习零基础入门指导_树懒学堂

数据库知识要点学习

新手学习数据库务必把握的知识要点：

数据库的安装下载：了解数据库的环境变量，文件目录构造。

数据库网络服务器的启动，登陆与登出。

数据库常用命令及语法标准。

数据库基本数据类型与数据表的实际 *** 作。比如，数据表的增删、单表查寻、多表查询等。

数据库运算符和函数，比如，日期函数，时间函数，信息函数，聚合函数，数据加密涵数，自定义函数等。

数据库存储过程，存储过程的调度。

数据库每个存储引擎的特性。

数据库事务管理的定义和应用等。

数据库管理权限和用户管理等。

数据库学习材料推荐：

1《MySQL必知必会》

这书讲的十分全，从基本要素，到查寻到插入新建表，用户的管理方法，都是有实际的事例，特别适合没有基础的同学们来学习Mysql，总而言之这本书学习的方式便是：

掌握数据库的基本概念

按照示例进行练习

2《SQL必知必会》

纯新手必读，这也是Amazon上最热销的SQL书籍的汉化版，写的很轻快，定义十分清晰。这本书用于学习关系型数据库也非常好，基本概念比大部头的教材内容说得清晰得多。

网站推荐：

树懒学堂_一站式数据知识学习平台

david=# select extract(year from now());

date_part

-----------

2013

(1 row)

david=# 32 取月份

david=# select extract(month from now());

date_part

-----------

(1 row)

david=#

david=# select extract(day from timestamp '2013-04-13');

date_part

-----------

(1 row)

david=#

david=# SELECT EXTRACT(DAY FROM INTERVAL '40 days 1 minute');

date_part

-----------

(1 row)

david=# 33 查看今天是一年中的第几天

david=# select extract(doy from now());

date_part

-----------

102

(1 row)

david=# 34

查看现在距1970-01-01 00:00:00 UTC 的秒数

david=# select extract(epoch from now());

date_part

------------------

136575590794474

(1 row)

david=# 35 把epoch 值转换回时间戳

david=# SELECT TIMESTAMP WITH TIME ZONE 'epoch' + 1369755555 INTERVAL '1 second';

column

------------------------

2013-05-28 23:39:15+08

(1 row)

david=#

--取day

skytf=> select extract(day from now());

date_part

-----------

(1 row)

skytf=> select extract(day from timestamp '2011-06-03');

date_part

-----------

(1 row)

skytf=> select timestamp '2011-06-03';

timestamp

---------------------

2011-06-03 00:00:00

(1 row)

--取小时

skytf=> select extract (hour from now());

date_part

-----------

(1 row)

--取分钟

skytf=> select extract (minute from now());

date_part

历代FM足球经理都有这样的群星数据库，FM2019也不例外，外网玩家“davidczv”为大家带来了这款传奇球星数据库的第4版。和别人不同的是，他的数据库球星非常多，而且还有很多细节是其他玩家望尘莫及的。比如元老球员数量多达4000人，不仅大俱乐部有，小国家或者小俱乐部也会有。因为在足球漫长的历史长河中，不仅是五大联赛或者荷兰、俄罗斯这些地方出巨星，像奥地利、罗马尼亚、保加利亚、前南斯拉夫也有非常多的球星和当时威震欧洲的球队，把他们都加进来，游戏的难度系数大大增加。

传奇球星通常赋予他们的年龄是接近他们巅峰状态的年龄，很多人担心和现实球星冲突的问题，其实作者早就安排好了。像梅西、C罗、姆巴佩这些的顶级球星依旧存在，只不过他们回到了自己年轻的时候，并被安排到了自己出道时的母队，也就是说，你可以想办法签下他们并且让他们在传奇球星身边成长，成为新一代的巨星，是不是非常有成就感。

传奇球星这是一个主观性的东西，所以大家不用特别介意。比如有人问为什么把齐达内放在皇马，而不是尤文甚至是戛纳。作者解释其实对他来说这的确很困难，但他在皇马似乎更加成功，而在尤文输掉过两次决赛，所以选择放在皇马。另外尤文同位置上有普拉蒂尼和博尼佩尔蒂，而皇马同位置只有迪斯蒂法诺，这样齐达内可以踢更多比赛。同样的情况发生在罗纳尔多身上，因为皇马和巴萨的攻击线上传奇巨星更多，所以选择放在了国际米兰。

更新内容

1新增400名传奇球星，涉及球队非常多，比如佩鲁贾、巴塞尔、切沃、欧塞尔、莫斯科火车头、马里博尔、帕尔梅拉斯、格雷米奥等等；

2球员的身价和工资修正到更合理的水平；

3欧冠欧联第一赛季参赛球队进行更新，很多历史显赫的球队被加了进来，比如汉堡、安德莱赫特等等，当然有不少来自东欧的球队；

4国家积分和俱乐部系数，以及国家队排名也根据历史实际情况进行修正

它将冗余数据选择到一个游标中并根据（LastName FirstName）来分组（在我们这个方案中）然后打开游标然后循环地取出每一行然后用与先前的取出的键值进行比较如果这是第一次取出这个值或者这个值不是冗余键那么跳过这个记录然后取下一个不然的话这就是这个组中的冗余记录所以删掉它．

让我们运行一下这个存储过程

BEGIN

DeleteDuplicates;

END;

SELECT LastName FirstName COUNT()

FROM Customers

GROUP BY LastName FirstName

HAVING COUNT() > ;

最后一个查询语句没有返回值所以冗余数据没有了从表中取冗余数据的过程完全是由定义在csr_Duplicates 这个游标中的SQL语句来实现的 PL／SQl只是用来实现删除冗余数那么能不能完全用SQL语句来实现呢？

二．SQL解决方案使用RANK（）删除冗余数据Oracle i分析函数RANK（）来枚举每一个组中的元素在我们的方案中我们应用这个方案我们使用这个函数动态的把冗余数据连续的排列起来加上编号组由Partintion　by　这个语句来分开然后用Order　by　进行分组SELECT ID LastName FirstName RANK() OVER (PARTITION BY LastName

FirstName ORDER BY ID) SeqNumber

FROM Customers

ORDER BY LastName FirstName;

SQL

Listing Output of single SQL statement that uses RANK()

显示的是根据记录的条数的个数来显示尤其对于冗余数据

ID LASTNAME FIRSTNAME SEQNUMBER

Blake Becky

Blue Don

Bradley Tom

Chang Jim

Griffith David

Hill Larry

King Chuck

Krieger Jeff

Loney Julie

Lord Don

Mason Paul

Monroe John

Simon Michael

Stone Tony

我们可以看一到 SeqNumber这一列中的数值冗余数据是根据ID号由小到大进行的排序所有的冗余数据的SqlNumber都大于一所有的非冗余数据都等于一所以我们取自己所需删除那么没用的SELECT ID LastName FirstName

FROM

(SELECT ID LastName FirstName RANK() OVER (PARTITION BY LastName

FirstName ORDER BY ID) AS SeqNumber

FROM Customers)

WHERE SeqNumber > ;

SQL

Listing 冗余键的键值

有七行必须被删除

ID LASTNAME FIRSTNAME

Krieger Jeff

Simon Michael

Stone Tony

rows selected 这显示有七行需要删除还是用上一个表我测试了一下这个代码它用了77秒种就删除了所有的数据准备好了用Sql语句来删除冗余数据版本一它执行了秒

DELETE

FROM CUSTOMERS

WHERE ID IN

(SELECT ID

FROM

(SELECT ID LastName FirstName RANK() OVER (PARTITION BY LastName

FirstName ORDER BY ID) AS SeqNumber

FROM Customers)

WHERE SeqNumber > );

我们可以看到最后的两行语句对表中的数据进行了排序这不是有效的所以我们来优化一下最后一个查询语句把Rank（）函数应用到只含有冗余数据的组而不是所有的列下面这个语句是比较有效率的虽然它不像上一个查询那样精简SELECT ID LastName FirstName

FROM

(SELECT ID LastName FirstName RANK() OVER (PARTITION BY LastName

FirstName ORDER BY ID) AS SeqNumber

FROM

(SELECT ID LastName FirstName

FROM Customers

WHERE (LastName FirstName) IN (SELECT LastName FirstName

FROM Customers

GROUP BY LastName FirstName

HAVING COUNT() > )))

WHERE SeqNumber > ;

选择冗余数据只用了26秒钟这样就提高了％的性能这样就提高了将这个作为子查询的删除查询的效率

DELETE

FROM Customers

WHERE ID IN

(SELECT ID

FROM

(SELECT ID LastName FirstName RANK() OVER (PARTITION BY LastName

FirstName ORDER BY ID) AS SeqNumber

FROM

(SELECT ID LastName FirstName

FROM Customers

WHERE (LastName FirstName) IN (SELECT LastName FirstName

FROM Customers

GROUP BY LastName FirstName

HAVING COUNT() > )))

WHERE SeqNumber > );

现在只用了秒钟的就完成的上面的任务比起上一个秒这是一个很大的进步相比之下存储过程用了秒这样存储过程有些慢了使用PL／SQL语句我们和我们以上的代码会得到更好的更精确的代码和提高你代码的执行效率虽然对于从数据库中枚举数据PL／SQL对于Sql两者没有什么差别但是对于数据的比较上 PL／SQL就比SQL要快很多但是如果冗余数据量比较小的话我们尽量使用SQL而不使用PL／SQL如果你的数据表没有主键的话那么你可以参考其它技术

Rank（）其它的方法

使用Rank（）函数你可以对选择你所保留的数据（或者是小ID的或者是大ID　的就由RECDate这个列来决定这种情况下你可以把REcdate加入到（Orderby　）子句中倒序或者正序

这是一种保留最大Id的一种解决方案

DELETE

FROM Customers

WHERE ID IN

(SELECT ID

FROM

(SELECT ID LastName FirstName RANK() OVER (PARTITION BY LastName FirstName ORDER BY RecDate DESC ID) AS SeqNumber

FROM

(SELECT ID LastName FirstName RecDate

FROM Customers

WHERE (LastName FirstName) IN (SELECT LastName FirstName

FROM Customers

GROUP BY LastName FirstName

HAVING COUNT() > )))

WHERE SeqNumber > );

这种技术保证了你可以控制每一个表中的保留的组假设你有一个数据库有一个促销或者有一个折扣信息比如一个团体可以使用这种促销5次或者个人可以使用这个折扣三次为了指出要保留的组的个数你可以在where 和having子句中进行设置那么你将删除所有大于你

设置有数的冗余组

DELETE

FROM Customers

WHERE ID IN

(SELECT ID

FROM

(SELECT ID LastName FirstName RANK() OVER (PARTITION BY LastName

FirstName ORDER BY ID) AS SeqNumber

FROM

(SELECT ID LastName FirstName

FROM Customers

WHERE (LastName FirstName) IN (SELECT LastName FirstName

FROM Customers

GROUP BY LastName FirstName

HAVING COUNT() > )))

WHERE SeqNumber > );

As you can see using the RANK() function allows you to eliminate duplicates in a

single SQL statement and gives you more capabilities by extending the power of

your

queries

lishixinzhi/Article/program/Oracle/201311/18979

以上就是关于SQL实战新手入门：关系型数据库管理系统全部的内容，包括:SQL实战新手入门：关系型数据库管理系统、大家能推荐一本比较好的学习数据库的书吗国外国内的都行！编写要独得啊！、数据库该怎么学习，纯小白等相关内容解答，如果想了解更多相关内容，可以关注我们，你们的支持是我们更新的动力！

欢迎分享，转载请注明来源：内存溢出

原文地址:https://54852.com/sjk/9493123.html

SQL实战新手入门：关系型数据库管理系统

发表评论

评论列表（0条）