PostgreSQL
源代码开放的数据库管理系统
PostgreSQL是一个功能强大的开源对象关系数据库系统,已有超过 35 年开发历史。 创始于1986 年的伯克利的POSTGRES项目。目前已经成为一款跨平台、免费和开源的数据库软件,PostgreSQL 应用领域广泛,根据 Stack Overflow 2023 开发者调查数据显示,PostgreSQL 超越了 MySQL,成为开发人员首选。
PostgreSQL 功能和特点:帮助开发人员构建应用程序、保护数据完整性和构建容错环境,还具有可扩展性。可以定义自己的数据类型,构建自定义函数,可以用不同的编程语言编写代码,而无需重新编译数据库。
简述
PostgreSQL是一个功能非常强大的、源代码开放的客户/服务器关系型数据库管理系统(RDBMS)。PostgreSQL最初设想于1986年,当时被叫做Berkley Postgres Project。该项目一直到1994年都处于演进和修改中,直到开发人员Andrew Yu和Jolly Chen在Postgres中添加了一个SQL(Structured Query Language,结构化查询语言)翻译程序,该版本叫做Postgres95,在开放源代码社区发放。
1996年,再次对Postgres95做了较大的改动,并将其作为PostgresSQL6.0版发布。该版本的Postgres提高了后端的速度,包括增强型SQL92标准以及重要的后端特性(包括子选择、默认值、约束和触发器)。
PostgreSQL是一个非常健壮的软件包,有很多在大型商业RDBMS中所具有的特性,包括事务、子选择、触发器、视图、外键参照完整性和复杂锁定功能。另一方面,PostgreSQL也缺少商业数据库中某些可用的特性,如用户定义的类型、继承性和规则。从用户的角度来讲,PostgreSQL惟一不具备的主要特性就是外部连接,在今后的版本中会将其加入。
PostgreSQL提供了两种可选模式。一种模式保证如果操作系统或硬件崩溃,则数据将保存到磁盘中,这种模式通常比大多数商业数据库要慢,这是因为它使用了刷新(或同步)方法;另一种模式与第一种不同,它不提供数据保证,但它通常比商业数据库运行得快。遗憾的是,还没有一种折中的模式:既提供一定程度的数据安全性,又有较快的执行速度。今后的版本将会提供这种模式。
主要特点
PostgreSQL 的 主要优点如下:
1)维护者是PostgreSQL Global Development Group,首次发布于1989年6月。
2)操作系统支持WindowsLinuxunix、MAC OS X、BSD。
3)从基本功能上来看,支持ACID、关联完整性、数据库事务、Unicode多国语言。
4)表和视图方面,PostgreSQL支持临时表,而物化视图,可以使用PL/pgSQL、PL/Perl、PL/Python或其他过程语言的存储过程和触发器模拟。
5)索引方面,全面支持R-/R+tree索引、哈希索引、反向索引、部分索引、Expression 索引、GiST、GIN(用来加速全文检索),从8.3版本开始支持位图索引。
6)其他对象上,支持数据域,支持存储过程、触发器、函数、外部调用、游标7)数据表分区方面,支持4种分区,即范围、哈希、混合、列表。
8)从事务的支持度上看,对事务的支持与MySQL相比,经历了更为彻底的测试。
9)My ISAM表处理方式方面,MySQL对于无事务的MyISAM表,采用表锁定,1个长时间运行的查询很可能会阻碍对表的更新,而PostgreSQL不存在这样的问题。
10)从存储过程上看,PostgreSQL支持存储过程,而目前MySQL不支持。因为存储过程的存在也避免了在网络上大量原始的SQL语句的传输,这样的优势是显而易见的。
11)子查询支持方面,MySQL不支持子查询。
12)用户定义函数的扩展方面,PostgreSQL可以更方便地使用UDF(用户定义函数)进行扩展。
PostgreSQL 的 应用劣势如下:
1)最新版本和历史版本不分离存储,导致清理老旧版本时需要做更多的扫描,代价比较大但一般的数据库都有高峰期,如果合理安排VACUUM,这也不是很大的问题,而且在PostgreSQL9.0中VACUUM进一步被加强了。
2)在PostgreSQL中,由于索引完全没有版本信息,不能实现Coverage index scan,即查询只扫描索引,不能直接从索引中返回所需的属性,还需要访问表,而Oracle数据库InnoDB则可以。
存储系统
存储系统是PostgreSQL的最底层模块,它向下通过操作系统接口访问物理数据,向上为上层模块提供存储操作的接口和函数。PostgreSQL对物理数据的访问和操作都是通过其存储系统模块来进行的。
PostgreSQL存储系统是由以下几个子模块所构成的:
1)页面管理子模块:对PostgreSQL缓冲区页面的组织结构进行定义以及提供页面操作的方法。
2)缓冲区管理子模块:管理PostgreSQL的缓冲区,包括本地缓冲区和共享缓冲区。
3)存储设备管理子模块:数据库记录是存储在存储介质上的,存储设备管理子模块将屏蔽不同物理存储设备(块设备,流设备)接口函数的差异,向上层缓冲区管理子模块提供统一的访问接口函数。
4)文件管理子模块:一般的操作系统对一个进程允许打开的文件数是有限制的,而PostgreSQL服务器有些时候需要打开的文件数是很多的,因此PostgreSQL文件管理子模块自身为了突破这个瓶颈,封装了文件的读写操作,在这里建立了一个LRU链表,通过一定的替换算法来对打开的文件进行管理,使得可以打开的文件数目不受操作系统平台的限制。
内存页面
PostgreSQL内存页面的默认大小是8kB。页面的逻辑结构被定义成三个部分:页首部(PageHeader)、元组记录空间(ltem Space)以及特殊空间(Special Space)。
页首部记录了页面的使用信息,这些信息由元组记录空间和特殊空间的偏移量地址、页面分布格式版本号和页面的事物日志记载点等等所组成。
元组记录空间是存储元组信息的地方,在这里面每个元组记录被称为一个ltem,Item由ltemld和元组数据组成,ltemld内部定义了元组在页面中的偏移量、ltem指针的状态以及元组项的比特位数长度。
特殊空间是为了页面操作所需要的。为了其他模块对页面进行操作,PostgreSQL内部定义了一些页面的操作函数。页面的相关操作包括页面初始化、页面添加、修复和删除。供其他子模块进行调用。这里值得关注的是页面修复与页面批量删除的操作函数。为了实现这两个操作函数,PostgreSQL专门定义了一个数据结构itemldSortData,它为方便在这两个函数中对元组项Item实现降序排序而定义。
目录
概述
简述
主要特点
存储系统
内存页面
参考资料