MVCC(多版本并发控制)

2023-12-29 06:22:09

1、 MVCC在MySQL中的实现

MVCC(多版本并发控制)在MySQL中的实现主要依赖于InnoDB存储引擎。以下是MVCC在MySQL中的实现细节:

1. 数据版本管理:


? ?- InnoDB通过为每一行数据添加一个隐藏列`_row_id`来管理多个数据版本。`_row_id`包含两个部分:事务ID和递增的序列号。
? ?- 当对数据进行修改时,InnoDB不会立即覆盖原有的数据,而是创建一个新的数据版本,同时保留旧版本的数据。
? ?- 每个数据版本都有一个唯一的事务ID和时间戳,用于标识数据版本的创建时间和所属事务。

形象的解释:

InnoDB使用隐藏列_row_id来管理多个数据版本,就像给每行数据都添加了一个版本号一样。_row_id由两个部分组成:事务ID和递增的序列号。

当对数据进行修改时,InnoDB不会立即覆盖原有的数据,而是创建一个新的数据版本,就像创建一个新的版本号一样。同时,旧版本的数据也会被保留下来,就像保留旧的版本号一样。

每个数据版本都有一个唯一的事务ID和时间戳,就像每个版本号都有一个唯一的标识符和创建时间一样。事务ID用于标识数据版本的所属事务,时间戳用于标识数据版本的创建时间。

示例:

假设我们有一张名为`users`的表,其中包含两列:`id`和`name`。

CREATE TABLE users (
? id INT NOT NULL AUTO_INCREMENT,
? name VARCHAR(255) NOT NULL,
? PRIMARY KEY (id)
);

现在,我们向表中插入一条数据:

INSERT INTO users (name) VALUES ('John Doe');

此时,InnoDB会为这行数据创建一个新的版本,并将其_row_id设置为`1-1`,其中`1`是事务ID,`1`是递增的序列号。

现在,我们修改这行数据:

UPDATE users SET name = 'Jane Doe' WHERE id = 1;

此时,InnoDB会为这行数据创建一个新的版本,并将其_row_id设置为`2-1`,其中`2`是事务ID,`1`是递增的序列号。

现在,我们查询这行数据:

SELECT * FROM users WHERE id = 1;

此时,InnoDB会返回这行数据的最新版本,即_row_id为`2-1`的数据。

我们可以使用以下查询来查看所有数据版本:

SELECT * FROM users ORDER BY _row_id;

这将返回所有数据版本,按_row_id升序排列。

我们可以使用以下查询来查看特定数据版本:

SELECT * FROM users WHERE _row_id = '2-1';

这将返回_row_id为`2-1`的数据版本。

2. Read View:


? ?- 为了确定事务可见的数据版本,InnoDB引入了Read View的概念。Read View包含了事务的启动时间戳,用于确定事务开始时已经存在的数据版本。
? ?- 当事务执行读操作时,会使用Read View来确定可见的数据版本,从而实现事务的隔离性。

形象的解释:

Read View可以想象成一个时间点,它代表了事务开始时的数据库状态。事务只能看到在这个时间点之前已经存在的数据版本。

当事务执行读操作时,InnoDB会使用Read View来确定哪些数据版本对事务可见。如果数据版本在Read View之前创建,那么它对事务是可见的。否则,它对事务是不可见的。

示例:

假设我们有两个事务,T1和T2。T1在时间戳100开始,T2在时间戳200开始。

现在,我们向表中插入一条数据:

INSERT INTO users (name) VALUES ('John Doe');

此时,InnoDB会为这行数据创建一个新的版本,并将其_row_id设置为`1-1`,其中`1`是事务ID,`1`是递增的序列号。

现在,T1执行以下查询:

SELECT * FROM users WHERE id = 1;

此时,T1会看到这行数据的最新版本,即_row_id为`1-1`的数据。

现在,T2执行以下查询:

SELECT * FROM users WHERE id = 1;

此时,T2也会看到这行数据的最新版本,即_row_id为`1-1`的数据。

现在,T1修改这行数据:

UPDATE users SET name = 'Jane Doe' WHERE id = 1;

此时,InnoDB会为这行数据创建一个新的版本,并将其_row_id设置为`2-1`,其中`2`是事务ID,`1`是递增的序列号。

现在,T1再次执行以下查询:

SELECT * FROM users WHERE id = 1;

此时,T1会看到这行数据的最新版本,即_row_id为`2-1`的数据。

但是,T2再次执行以下查询时:

SELECT * FROM users WHERE id = 1;

此时,T2仍然会看到这行数据的旧版本,即_row_id为`1-1`的数据。这是因为T2的Read View是在时间戳200创建的,而这行数据的旧版本是在时间戳100创建的。因此,这行数据的旧版本对T2是可见的。

这说明,T1和T2对同一行数据看到了不同的版本,这是因为它们的Read View不同。T1的Read View是在时间戳100创建的,而T2的Read View是在时间戳200创建的。因此,T1可以看到这行数据的最新版本,而T2只能看到这行数据的旧版本。

3. 并发访问和事务隔离级别:


? ?- MVCC允许读操作和写操作同时进行而不会相互阻塞,从而提高了数据库的并发性能。
? ?- 同时,MVCC实现了不同的事务隔离级别,包括提交读(Read Committed)和可重复读(Repeatable Read)。提交读会在每次查询时创建一个新的Read View,而可重复读则会在事务开始时创建一个固定的Read View。

提交读(Read Committed)是一种事务隔离级别,它会在每次查询时创建一个新的Read View。这意味着,当一个事务读取数据时,它只能看到在该事务开始之前已经提交的数据。

可重复读(Repeatable Read)是一种事务隔离级别,它会在事务开始时创建一个固定的Read View。这意味着,当一个事务读取数据时,它可以看到在该事务开始之前已经提交的数据,以及在该事务执行期间提交的数据。

形象的比喻:

提交读就像在一个图书馆里看书。当你从书架上取下一本书时,你只能看到这本书在被你取下之前的内容。如果你想看到这本书的最新内容,你需要重新取下这本书。
可重复读就像在一个图书馆里借阅一本书。当你从书架上取下一本书时,你可以看到这本书的所有内容,包括在被你借阅之后添加的内容。

示例:

提交读:在一个银行系统中,当一个客户查询自己的账户余额时,他只能看到在他查询之前已经提交的交易。这意味着,如果另一个客户在他查询之后向他的账户转账,他将看不到这笔转账。
可重复读:在一个在线商店中,当一个客户在一个购物车中添加商品时,他可以看到购物车中的所有商品,包括在他添加商品之后其他客户添加到购物车中的商品。这意味着,他可以在结账之前看到购物车中的所有商品,并确保他没有忘记任何商品。

4. Undo日志:


? ?- InnoDB通过undo日志来实现数据版本的管理,当对数据进行修改时,旧版本的数据会被标记为过期状态,并且相关的undo日志记录会被保留。
? ?- 通过定期清理过期的数据版本和相关的undo日志记录,InnoDB可以保持数据版本的管理效率。

形象的比喻:

Undo日志:就像是一个历史记录簿,它记录了数据库中所有数据的历史变化。当对数据进行修改时,旧版本的数据会被标记为过期状态,并且相关的undo日志记录会被保留。就像是在历史记录簿中添加了一条新的记录,记录了数据的旧版本。

定期清理过期的数据版本和相关的undo日志记录:就像是对历史记录簿进行整理。过期的历史记录会被删除,以节省空间。就像是从历史记录簿中删除了旧的记录,只保留了最新的记录。

示例:

在一个银行系统中,当一个客户向另一个客户转账时,数据库会记录下这次转账的详细信息,包括转账金额、转账时间、转账前后的账户余额等。这些信息都会被记录在undo日志中。

如果客户对这次转账有异议,他可以要求银行撤销这次转账。银行可以通过读取undo日志,找到这次转账的旧版本数据,然后将账户余额恢复到转账前的状态。

为了保持undo日志的效率,数据库会定期清理过期的数据版本和相关的undo日志记录。例如,数据库可能会设置一个规则,只保留最近一个月的undo日志记录。这样,就可以删除过期的undo日志记录,节省存储空间。

总结:

Undo日志就像是一个历史记录簿,它记录了数据库中所有数据的历史变化。通过定期清理过期的数据版本和相关的undo日志记录,数据库可以保持undo日志的效率。

5. 示例:


? ?- 假设有两个事务T1和T2,T1在时间戳100时读取数据,T2在时间戳200时修改了数据。
? ?- 当T1再次读取数据时,它将看到时间戳为100的数据版本,而T2将看到时间戳为200的数据版本。
? ?- 这确保了T1和T2不会看到彼此修改的数据,从而实现了事务的隔离性。

通过以上详细讲解,你可以更好地理解MVCC在MySQL中的实现方式,以及它是如何提高数据库的并发性能和实现不同的事务隔离级别的。MVCC作为InnoDB存储引擎的重要特性,对于理解MySQL数据库的并发控制机制非常重要。

2、介绍MVCC的概念

  • MVCC是什么?

  • MVCC(Multi-Version Concurrency Control)是一种并发控制机制,它允许多个事务同时读取和修改相同的数据,而不会产生脏读、幻读和不可重复读等问题。

    MVCC的基本思想是为每个事务创建一个独立的版本的数据。当一个事务读取数据时,它读取的是该事务开始时的数据版本。当一个事务修改数据时,它会创建一个新的数据版本,而不会覆盖旧的数据版本。其他事务仍然可以看到旧的数据版本。

    MVCC通过使用以下两种机制来实现:

    * **多版本读:**每个事务都有自己的快照,它可以看到事务开始时的数据库状态。当事务读取数据时,它读取的是事务快照中的数据版本。
    * **多版本写:**当一个事务修改数据时,它会创建一个新的数据版本,而不会覆盖旧的数据版本。其他事务仍然可以看到旧的数据版本。

    MVCC的优点包括:

    * **提高并发性:**MVCC允许多个事务同时读取和修改相同的数据,而不会产生脏读、幻读和不可重复读等问题。
    * **减少锁的使用:**MVCC不需要使用锁来保护数据,这可以提高数据库的性能。
    * **提高可扩展性:**MVCC可以很好地扩展到大型数据库系统。

    MVCC的缺点包括:

    * **空间开销:**MVCC需要为每个事务维护一个快照,这会增加数据库的空间开销。
    * **时间开销:**MVCC需要在每个事务开始时创建快照,这会增加数据库的时间开销。

    MVCC是数据库系统中常用的并发控制机制。它可以提高并发性、减少锁的使用和提高可扩展性。

    示例:

    在一个银行系统中,有两个事务同时对同一个账户进行转账操作。

    * 事务A读取账户余额为1000元。
    * 事务B读取账户余额为1000元。
    * 事务A将账户余额转账500元给另一个账户。
    * 事务B将账户余额转账500元给另一个账户。

    在MVCC下,事务A和事务B都可以成功地完成转账操作。这是因为:

    * 事务A读取账户余额时,它读取的是事务开始时的账户余额,即1000元。
    * 事务B读取账户余额时,它读取的是事务开始时的账户余额,即1000元。
    * 事务A将账户余额转账500元给另一个账户后,它创建了一个新的数据版本,其中账户余额为500元。
    * 事务B将账户余额转账500元给另一个账户后,它创建了一个新的数据版本,其中账户余额为500元。

    事务A和事务B可以看到不同的数据版本,因此它们不会产生脏读、幻读和不可重复读等问题。

  • 为什么MVCC对数据库性能和事务隔离级别很重要?

  • MVCC(Multi-Version Concurrency Control)对数据库性能和事务隔离级别很重要,原因如下:

    1. 提高并发性

    MVCC允许多个事务同时读取和修改相同的数据,而不会产生脏读、幻读和不可重复读等问题。这大大提高了数据库的并发性,允许更多的用户同时访问数据库。

    2. 减少锁的使用

    MVCC不需要使用锁来保护数据,这可以提高数据库的性能。在传统的事务处理系统中,当一个事务修改数据时,它需要对数据加锁,以防止其他事务同时修改相同的数据。这可能会导致锁争用和死锁,从而降低数据库的性能。MVCC通过使用多版本数据来避免锁争用和死锁,从而提高了数据库的性能。

    3. 提高可扩展性

    MVCC可以很好地扩展到大型数据库系统。在传统的事务处理系统中,随着数据库规模的增长,锁争用和死锁的可能性也会增加,从而降低数据库的性能。MVCC通过使用多版本数据来避免锁争用和死锁,从而提高了数据库的可扩展性。

    4. 支持不同的事务隔离级别

    MVCC可以支持不同的事务隔离级别,包括读未提交、读已提交、可重复读和串行化。不同的事务隔离级别对数据一致性和并发性有不同的要求。MVCC可以通过使用不同的并发控制机制来支持不同的事务隔离级别。

    例如,在读未提交隔离级别下,MVCC允许事务读取其他事务未提交的数据。这可能会导致脏读问题。在读已提交隔离级别下,MVCC只允许事务读取其他事务已提交的数据。这可以避免脏读问题。在可重复读隔离级别下,MVCC保证一个事务在整个执行过程中看到的数据都是一致的。这可以避免幻读和不可重复读问题。在串行化隔离级别下,MVCC保证所有的事务都是串行执行的。这可以避免所有的事务隔离问题。

    总之,MVCC对数据库性能和事务隔离级别很重要。它可以提高并发性、减少锁的使用、提高可扩展性和支持不同的事务隔离级别。

3、MVCC在InnoDB中的实现

  • 数据版本的管理

  • InnoDB使用MVCC来实现事务隔离和并发控制。InnoDB中的数据版本管理主要包括以下几个方面:

    1. 数据行版本

    InnoDB中的每个数据行都有一个版本号,称为行版本号(row version number)。行版本号是一个6字节的整数,它表示该数据行的版本。当数据行被修改时,其行版本号就会增加。

    2. 回滚段

    InnoDB使用回滚段(rollback segment)来存储旧版本的数据行。回滚段是一个特殊的表空间,它由多个回滚段组成。每个回滚段又由多个回滚段区(rollback segment area)组成。回滚段区是回滚段的最小分配单位。

    3. 插入缓冲池

    InnoDB使用插入缓冲池(insert buffer)来缓存新插入的数据行。插入缓冲池是一个内存缓冲区,它可以提高数据插入的性能。当数据行被插入到数据库中时,它首先会被写入到插入缓冲池中。然后,插入缓冲池会定期将数据行刷新到磁盘上的回滚段中。

    4. 读视图

    InnoDB使用读视图(read view)来隔离不同的事务。读视图是一个数据结构,它包含了在某个时间点上数据库中所有活动事务的信息。当一个事务开始执行时,它会创建一个读视图。该读视图包含了在事务开始执行时所有活动事务的信息。事务在执行过程中只能看到读视图中包含的数据。

    5. 快照读

    InnoDB使用快照读(snapshot read)来实现MVCC。快照读是一种特殊的读操作,它可以读取数据行的旧版本。当一个事务执行快照读时,它会使用其读视图来确定要读取的数据行的版本。

    例如,假设有两个事务T1和T2,T1在T2之前开始执行。T1修改了一行数据,并将该数据的行版本号增加到2。然后,T2开始执行,并执行了一个快照读操作。T2的快照读操作会读取该数据行的版本1,而不是版本2。这是因为T2的读视图是在T1修改数据之前创建的。

    总之,InnoDB使用数据行版本、回滚段、插入缓冲池、读视图和快照读来实现MVCC。MVCC可以提高数据库的并发性和可扩展性,并支持不同的事务隔离级别。

  • Read View的作用

  • Read View在InnoDB中的作用是隔离不同的事务,并确保每个事务看到一个一致的数据库状态。Read View是一个数据结构,它包含了在某个时间点上数据库中所有活动事务的信息。当一个事务开始执行时,它会创建一个Read View。该Read View包含了在事务开始执行时所有活动事务的信息。事务在执行过程中只能看到Read View中包含的数据。

    Read View可以防止事务看到其他事务未提交的数据。例如,假设有两个事务T1和T2,T1在T2之前开始执行。T1修改了一行数据,但尚未提交。然后,T2开始执行,并读取了T1修改的数据。如果T2没有使用Read View,它就会看到T1修改后的数据,即使T1尚未提交。这可能会导致数据不一致。

    Read View可以确保T2只能看到T1提交的数据。这是因为T2的Read View是在T1修改数据之前创建的。因此,T2只能看到T1提交的数据。

    Read View还用于实现MVCC。MVCC允许事务读取数据行的旧版本。当一个事务执行快照读时,它会使用其Read View来确定要读取的数据行的版本。

    例如,假设T1在T2之前修改了一行数据。T2执行了一个快照读操作。T2的快照读操作会读取T1修改数据之前的版本。这是因为T2的Read View是在T1修改数据之前创建的。

    总之,Read View在InnoDB中的作用是隔离不同的事务,并确保每个事务看到一个一致的数据库状态。Read View还可以用于实现MVCC。

    以下是一些Read View的具体作用:

    * 确保每个事务看到一个一致的数据库状态。
    * 防止事务看到其他事务未提交的数据。
    * 实现MVCC,允许事务读取数据行的旧版本。
    * 支持不同的事务隔离级别。

    Read View是InnoDB MVCC实现的一个重要组成部分。它有助于提高数据库的并发性和可扩展性,并支持不同的事务隔离级别。

文章来源:https://blog.csdn.net/samsung_samsung/article/details/135237712
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。