1.数据库基本概念
数据(Data):描述事务的符号记录,是指用物理符号记录下来的、可以鉴别的信息。
数据库(DB):指长期储存在计算机中的有组织的、可共享的数据集合。
数据库管理系统(DBMS):专门用于建立和管理数据库的一套软件,介于应用程序和操作系统之间。
数据库系统(DBS):指在计算机中引入数据库技术之后的系统。包括:数据库、数据库管理系统以及相关实用工具、应用程序、数据库管理员和用户。
2.数据库系统阶段的特点
1)数据集成(主要目的)
2)数据共享性高
3)数据冗余小
4)数据一致性
5)数据独立性高
6)实施统一管理与控制
7)减少应用程序开发与维护的工作量
3.数据库对数据统一管理与控制包括哪些方面
1)数据的安全性;
2)数据的完整性;
3)并发控制;
4)故障恢复。 即数据库保护。
4.数据库系统的三级模式结构
(1)外模式(也称子模式或用户模式):是数据库用户能够看见和使用的局部数据的逻辑结构和特征的描述,是与某一应用有关的数据的逻辑表示。是用于满足不同数据库用户需求的数据视图,即用户视图。
(2)模式(也称概念模式或逻辑模式):是数据库中全体数据的逻辑结构和特征的描述,是所有用户的公共数据视图。
(3)内模式(也称存储模式):是对数据库中数据物理结构和存储方式的描述,是数据在数据库内部的表示形式。是内部视图或存储视图。
5.数据库常见的运行与应用结构有:
(1)客户/服务器结构——C/S
客户端(或前台、表示层):命令行客户端、图形化界面管理工具、应用程序等。主要完成与数据库使用者的交互任务。
服务器(或后台、数据层):数据库管理系统。主要负责数据管理。
(2)浏览器/服务器结构——B/S:基于 Web 应用的客户/服务器结构,也称为三层客户/服务器结构(表示层、处理层(中间层)、数据层)。
6.概念模型的表示方法(E-R 模型)
1)实体型,用矩形表示,矩形框内写明实体的名称;客观存在并可相互区别的事物称为实 体。
2)属性,用椭圆形表示,并用无向边将其与相应的实体连接起来;实体所具有的某种特性称为实体的属性。
3)联系,用菱形表示,联系的类型(1:1、1:N 或 M:N)。
7. 关系数据库的基本术语
表:也称为关系,是一个二维的数据结构,它由表名、构成表的各个列及若干行数据组成。
列:也称作字段或属性。表中属性的个数称为关系的元或度。
行:也称作元组或记录。
分量:表中的一行即为一个元组,元组中的一个属性值,称为分量。
码或键:能用来唯一标识该关系的元组的属性(或属性组)。
超码或超键:在关系的一个码中移去某个属性,它仍然是这个关系的码。
候选码或候选键:在关系的一个码或键中,不能从中移去任何一个属性,否则它就不是这个关系的码或键。
全码或全键:一个关系模式的所有属性集合是这个关系的主码或主键。
主码或主键:若干个候选码或候选键中指定一个用来唯一标识关系的元组。
外码或外键:当关系中的某个属性不是这个关系的主码或候选码,而是另一关系的主码时, 称该属性为这个关系的外码或外键。
主属性和非主属性:关系中包含在任何一个候选码中的属性称为主属性或码属性,不包含在任何一个候选码中的属性称为非主属性或非码属性。
域:表示属性的取值范围。
参照关系和被参照关系:以外码作为主码的关系称为被参照关系(也称为主关系),外码所在的关系称为参照关系(也称为从关系),被参照关系与参照关系是通过外码相联系的,这种联系通常是一对多的联系。
8.关系的完整性约束
实体完整性约束、参照完整性约束、用户定义的完整性约束
9.“不好”的关系模式中可能存在的问题
数据冗余:是指同一数据被反复存储的情况。
更新异常:数据冗余将导致存储空间的浪费以及潜在数据不一致性和修改麻烦等问题。
插入异常:不能正常的执行插入操作。
删除异常:不应该删除的数据会出现被删除的情况。
10.数据库设计的方法
(1)直观设计法:最原始的数据库设计方法
(2)规范设计法
1) 新奥尔良设计方法:需求分析、概念结构设计、逻辑结构设计、物理结构设计
2) 基于 E-R 模型的数据库设计方法
3) 基于第三范式的设计方法,是一类结构化设计方法
(3)计算机辅助设计法:辅助软件工程工具(俗称CASE工具)
11.物理设计方法
(1)建立索引:静态建立索引(应用人员预先建立)和动态建立索引(临时建立)。
(2)建立聚集:聚集:将相关数据集中存放的物理存储技术。
12.SQL 的组成
(1)数据定义语言(DDL)
CREATE:创建数据库或数据库对象
ALTER:对数据库或数据库对象进行修改
DROP:删除数据库或数据库对象
(2)数据操纵语言(DML)
SELECT:从表或视图中检索数据
INSERT:将数据插入到表或视图中
UPDATE:修改表或视图中的数据
DELETE:从表或视图中删除数据
(3)数据控制语言(DCL)
GRANT:授予权限
REVOKE:收回权限
13.变量
用户变量:在使用时,用户变量前常添加一个符号“@”用于将其与列名区分开。
系统变量:大多数系统变量应用于其他 SQL 语句中时,必须在系统变量名称前添加两个“@”符号。
14.数据库模式定义
创建数据库:CREATE DATABASE 或 CREATE SCHEMA
选择数据库:USE
修改数据库:ALTER DATABASE 或 ALTER SCHEMA
删除数据库:DROP DATABASE 或 DROP SCHEMA
查看数据库:SHOW DATABASES 或 SHOW SCHEMAS
15.表定义
创建表:CREATE TABLE
更新表:ALTER TABLE
重命名表:RENAME TABLE
删除表:DROP TABLE
查看表:显示表的名称:SHOW TABLES;显示表的结构:SHOW COLUMNS
16.索引
普通索引(INDEX);唯一性索引(UNIQUE);主键(PRIMARY KEY)
(1)创建:CREATE INDEX 专门用于创建索引
CREATE TABLE 在创建表的同时一起创建索引(INDEX|KEY)
ALTER TABLE 修改表的同时,可以向已有的表中添加索引(ADD INDEX)
(2)查看:SHOW INDEX
(3)删除:DROP INDEX 专门用于删除索引
ALTER TABLE 修改表的同时,删除索引(DROP INDEX)
17.数据更新
插入数据:
INSERT…VALUES 语句 插入单行或多行元组数据
INSERT…SET 语句 插入部分列值数据
INSERT…SELECT 语句 插入子查询数据
修改数据:UPDATE
删除数据:DELETE
18.数据查询
SELECT:要返回的列或表达式
FROM:从中检索数据的表。
WHERE:指定数据的过滤条件(行级过滤)。
GROUP BY:分组说明。ASC 升序(默认)、DESC 降序。
HAVING:过滤分组(组级过滤)。
ORDER BY:输出排序顺序。ASC 升序(默认)、DESC 降序。
LIMIT:限制要检索的行数。LIMIT a OFFSET b:从第 b+1 行开始取 a 行。
19.视图
视图是从一个或多个表或者其他视图中通过查询语句导出的虚拟的表。
优点:
1)集中分散数据;
2)简化查询语句;
3)重用 SQL 语句;
4)保护数据安全;
5)共享所需数据;
6)更改数据格式。
创建视图:CREATE VIEW
修改视图:ALTER VIEW
删除视图:DROP VIEW
查看视图定义:SHOW CREATE VIEW
更新视图数据:INSERT、UPDATE、DELETE
20.存储函数和存储过程的区别
存储函数:
1)不能拥有输出参数;
2)可以直接对存储函数进行调用;
3)必须包含一条 RETURN 语句。
存储过程:
1)可以拥有输出参数;
2)需要使用 CALL 语句对存储过程调用;
3)不允许包含RETURN 语句。
21.触发器
创建触发器:CREATE TRIGGER。(共 6 种:INSERT 触发器、DELETE 触发器、UPDATE 触发器的“之前”和“之后”。)删除触发器:DROP TRIGGER
使用触发器:INSERT 触发器、DELETE 触发器、UPDATE 触发器。
当触发器涉及对触发表自身的更新操作时,只能使用 BEFORE UPDATE 触发器,而 AFTER UPDATE 触发器将不被允许。
22.用户账号管理
创建用户账号:CREATE USER
删除用户:DROP USER
修改用户账号:RENAME USER
修改用户口令:SET PASSWORD
23.账户权限管理
查看用户授权表:SHOW GRANTS FOR
授予:GRANT
转移:在 GRANT 中添加子句:WITH GRANT OPTION
撤销:REVOKE
24.使用 GRANT 语句表示权限的级别
(1)列权限
(2)表权限
(3)数据库权限
(4)用户权限(最有效率)
25.封锁
锁:锁实际上就是允许或阻止一个事务对一个数据对象的存取特权。
分类:
排他锁(X 锁): 写操作;
共享锁(S 锁):读操作
活锁与死锁 封锁带来的一个重要问题是可能引起“活锁”与“死锁”
两段封锁法 定理:遵循两段锁协议的事务的任何并发调度都是可串行化的。
26.数据库技术与计算机技术结合衍生的数据库系统
与分布式处理技术相结合——分布式数据库系统
与并行处理技术相结合——并行数据库系统
与人工智能技术相结合——演绎数据库、知识库和主动数据库系统等
与多媒体技术相结合——多媒体数据库系统
与模糊技术相结合——模糊数据库系统
与移动通信技术相结合——移动数据库系统
与 Web 技术相结合——Web 数据库
27.数据库
定义:指长期存储在计算机中的有组织、可共享的数据集合。
特征:永久存储、有组织、可共享。
常用概念
粒度:是最重要的方面。是指数据仓库的数据单位中保存数据的细化或综合程度的级别,细化程度越高,粒度级就越小。
分割:是将数据分散到各自的物理单元中,以便能分别处理,以提高数据处理的效率。数据分割后的单元称为切片。
维:维是人们观察数据的特定角度,是考虑问题时的一类属性。此类属性的集合构成一个维度。
28.NoSQL 系统支持的数据存储模型
(1) 键值存储:NoSQL 数据库采用最多的数据存储方式,适合通过主键进行查询或遍历。
(2) 文档存储:适合存储系统日志等非结构化数据,可以通过复杂的查询条件来获取数据。
(3) 列存储:比较适合对某一列进行随机查询处理,主要应用于需要处理大量数据的情况。
(4) 图存储:图存储数据库是基于图理论构建的,使用结点、属性和边的概念。
评论: