首页 >> 大全

pg事务篇(一)—— 事务与多版本并发控制MVCC

2023-07-21 大全 26 作者:考证青年

一、 MVCC常用实现方法

一般MVCC有2种实现方法:

1. 的MVCC实现方式优缺点

优点

缺点

2. 中MVCC的实现思路

为了实现MVCC机制,必须要:

下面我们分别来看,首先了解一些基本概念。

二、 基本概念 1. 事务标识

当事务开始(执行begin第一条命令时),事务管理器会为该事务分配一个txid( id)作为唯一标识符。txid是一个32位无符号整数,取值空间大小约42亿(2^32-1)。

txid可通过()函数获取

testdb=# BEGIN;
BEGIN
testdb=# SELECT txid_current();txid_current 
--------------100
(1 row)

三个特殊的txid

事务间的可见性

txid间可以相互比较大小,任何事务只可见txid<其自身txid的事务修改结果。但txid并不是无限的,当42亿数据用尽之后又应该如何判断可见性?这个问题我们下篇再讨论。

Fig. 5.1. Transaction ids in PostgreSQL.

2. 元组结构

pg中元组由三部分组成——元组头结点、空值位图、用户数据。

什么叫事务的并发执行__事务的并发控制

官方文档中解释如下: : 9.6: Page

4 bytes

XID stamp

4 bytes

XID stamp

t_cid

4 bytes

什么叫事务的并发执行_事务的并发控制_

and/or CID stamp ( with )

4 bytes

XID for a row

6 bytes

TID of this or newer row

2 bytes

of , plus flag bits

2 bytes

flag bits

uint8

1 byte

to user data

其中与MVCC相关的重要信息为:

当更新该元组时,会指向新版本元组。若元组被更新多次,则该元组会存在多个版本,各版本通过t_cid串联,形成一个版本链。通过这个版本链,可以找到最新的版本。是一个二元组(页号,页内偏移量),其中页号从0开始,页内偏移量从1开始。

pg提供了插件,可查看指定表对应的page 内容

testdb=# CREATE EXTENSION pageinspect;
CREATE EXTENSION
testdb=# CREATE TABLE tbl (data text);
CREATE TABLE
testdb=# INSERT INTO tbl VALUES('A');
INSERT 0 1
testdb=# SELECT lp as tuple, t_xmin, t_xmax, t_field3 as t_cid, t_ctid FROM heap_page_items(get_raw_page('tbl', 0));tuple | t_xmin | t_xmax | t_cid | t_ctid 
-------+--------+--------+-------+--------1 |     99 |      0 |     0 | (0,1)
(1 row)

三、 元组的增、删、改 1. 插入

插入操作最简单,直接将新元组插入目标表中页面即可

Fig. 5.4. Tuple insertion.

插入操作的过程和结果分析:

2. 删除

pg的删除只是将目标元组在逻辑上标为删除(将设为执行命令的事务txid),实际该元组依然存在于数据库的存储页面,直至该元组被清理进程清理掉。

Fig. 5.5. Tuple deletion.

_事务的并发控制_什么叫事务的并发执行

删除操作的过程和结果分析:

当txid=111的事务提交时,就不再需要了,称为dead tuple。但是这个tuple依然残留在页面上, 随着数据库的运行,这种死元组越来越多,它们会在时最终被清理掉。

3. 更新

pg不会直接修改数据,而是将目标元组标记为删除,并插入一条新元组,同时修改执行新版本元组。

Fig. 5.6. Update the row twice.

更新操作的过程和结果分析

首先看第一条:

再看第二条:

四、 提交日志

pg在提交日志( log,CLOG)中保存事务的状态。

1. 事务状态

pg定义了四种事务状态——, , 和,其中状态用于子事务,此处不讨论。

#define TRANSACTION_STATUS_IN_PROGRESS		0x00
#define TRANSACTION_STATUS_COMMITTED		0x01
#define TRANSACTION_STATUS_ABORTED		0x02
#define TRANSACTION_STATUS_SUB_COMMITTED	0x03

四种事务状态仅需两个bit即可记录。以一个块8KB为例,可以存储8KB*8/2 = 32K个事务的状态。内存中缓存CLOG的 大小为Min(128,Max(4,/512))。

2. 工作原理

CLOG在逻辑上是一个数组,由共享内存中一系列8K页面组成。数组下标对应事务txid,数组内容则为事务状态:

Fig. 5.7. How the clog operates.

当需要获取事务状态时,pg调用内部函数读取CLOG返回所请求事务状态,详情参考下篇——提示位。

3. CLOG的维护

当 pg或运行时,CLOG数据会由内存写入(pg 10后叫)目录中的文件。这些文件被命名为0000,0001,最大256KB。当pg启动时,会加载这些文件用于初始化CLOG。

CLOG数据会不断增长,但并非所有数据都是必要的,清理过程也会定期清理掉不再需要的CLOG页面和文件。

参考

《实战》

The of : 5

PgSQL· 引擎特性 · 多版本并发控制介绍及实例分析

PgSQL · 特性分析 · MVCC机制浅析

PgSQL · 引擎特性 · Hint Bits 简介

: : 10: 67.6. Page

关于我们

最火推荐

小编推荐

联系我们


版权声明:本站内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 88@qq.com 举报,一经查实,本站将立刻删除。备案号:桂ICP备2021009421号
Powered By Z-BlogPHP.
复制成功
微信号:
我知道了