如何在Spring Boot中使用@Scheduled写定时任务判断数据量是否过大,过大则进行分表操作,多张表使用临时视图查询

2024-01-08 16:40:21

当数据量过大,在定时任务中执行分表操作

1、复制表结构及数据

在xml中编写复制表结构及数据(newTableName为新表名、originalTableName为原始表名)

只复制表结构:

CREATE TABLE ${newTableName} AS SELECT * FROM ${originalTableName} WHERE 1=0;

复制表结构以及数据:

CREATE TABLE ${newTableName} AS SELECT * FROM ${originalTableName};

在使用 CREATE TABLE … AS SELECT * FROM … 语句时,添加 WHERE 1=0 和不添加的区别在于是否复制原表的数据。

  • 不加 WHERE 1=0:这会将原表中的数据一同复制到新表中。新表将包含原表中所有的行数据。
  • 加上 WHERE 1=0:这样做不会复制任何原表中的数据,只会复制原表的结构(列定义)到新表中,但新表不会包含任何行数据。

因此,如果只复制表的结构而不需要复制数据,可以在 CREATE TABLE … AS SELECT * FROM … 语句后面加上 WHERE 1=0。如果需要同时复制表的结构和数据,就不需要添加这个条件。

2、清空原始表中的数据

清空原表:使用 DELETETRUNCATE 语句清空原表中的数据。例如:

  • 使用 DELETE 语句逐行删除原表中的数据:
DELETE FROM original_table;
  • 使用 TRUNCATE 语句一次性清空原表中的所有数据:
TRUNCATE TABLE original_table;

注意:TRUNCATE 语句会更快地清空表中的数据,但无法回滚操作。

在执行清空原始表中的数据操作之前,请务必备份好原表中的数据,以防止数据丢失或意外删除。

3、示例代码

定时任务类:

package com.yutu.garden.task;

import com.yutu.garden.mapper.gardens.SanitationJobStatisticsMapper;
import org.springframework.boot.autoconfigure.condition.ConditionalOnProperty;
import org.springframework.scheduling.annotation.EnableScheduling;
import org.springframework.scheduling.annotation.Scheduled;
import org.springframework.stereotype.Component;

import javax.annotation.Resource;
import java.text.SimpleDateFormat;
import java.util.Date;

/**
 * 定时分区、分表
 */
@Component
@EnableScheduling
//@ConditionalOnProperty(name = "scheduled.tasks.enabled", havingValue = "true") //application.yml控制所有task任务启动或不启动
public class SplitTrajectoryTableTask {

	@Resource
	private SanitationJobStatisticsMapper sanitationJobStatisticsMapper;

//	@Scheduled(cron = "0 0 * * * ?") //每小时的整点执行一次任务
	@Scheduled(cron = "0 0/1 * * * ?") //一分钟执行一次
	public void checkDataSizeAndSplitTable() {
	
		int trajectorySize = sanitationJobStatisticsMapper.getTrajectorySize(); // 获取数据量
		
		if (trajectorySize >= 200000) { // 判断数据量是否过大
			splitTable(); // 执行分表操作
		}
		
	}
	private void splitTable() {
		// 获取需要分表的原始表名和新表名前缀(根据实际情况设置)
		String originalTableName = "card_device_trajectory_info"; //原始表名
		
		String newTableNamePrefix = "card_device_trajectory_info_"; //新表 (拼接日期)
		
		// 获取当前日期作为分表后缀(或者使用其他规则)
		SimpleDateFormat sdf = new SimpleDateFormat("yyyyMMdd");
		
		String tableSuffix = sdf.format(new Date());
		
		// 生成新表名
		String newTableName = newTableNamePrefix + tableSuffix;
		
		// 创建新的分表 并 将原始表中符合条件的数据迁移到新表(根据实际情况设置条件)
		sanitationJobStatisticsMapper.copyTable(originalTableName,newTableName);
		
		// 更新原始表 (将原始表中的数据清空)注意:测试前先备份好原始数据,以防丢失
		sanitationJobStatisticsMapper.truncateTable(originalTableName);
	}
}

Mapper方法:

	int getTrajectorySize();

	boolean copyTable(@Param("originalTableName") String originalTableName,@Param("newTableName") String newTableName);

	boolean truncateTable(@Param("originalTableName") String originalTableName);

Sql语句:

    <select id="getTrajectorySize" resultType="int">
        select count(*) from card_device_trajectory_info
    </select>

    
    <update id="copyTable">
        <![CDATA[
        CREATE TABLE ${newTableName} AS SELECT * FROM ${originalTableName};
        ]]>
    </update>

    <delete id="truncateTable">
        TRUNCATE TABLE ${originalTableName};
    </delete>

在 Mybatis 的 XML 中,使用 <![CDATA[ ]]> 包裹 SQL 语句是为了防止 XML 解析器将其中的特殊字符(如 <, >)解析成 XML 标签,从而导致语法错误。因此,加上<![CDATA[ ]]> 是一种良好的实践,可以确保 SQL 语句被正确解析。

但是,在某些情况下,如果 SQL 语句中不包含需要转义的特殊字符,也可以省略 <![CDATA[ ]]>。例如,如果 SQL 语句只包含简单的 SELECT 语句,没有特殊字符,那么可以直接写在 <update> 标签内,而无需使用 <![CDATA[ ]]> 包裹。
以下是不使用 <![CDATA[ ]]> 包裹 SQL 语句的示例:

<update id="copyTable">
  CREATE TABLE ${newTableName} AS SELECT * FROM ${originalTableName};
</update>

如果 SQL 语句中包含特殊字符或需要转义的内容,建议仍然使用 <![CDATA[ ]]> 对 SQL 进行包裹

4、多表创建临时视图查询

创建临时视图 card_device_trajectory_info_view

CREATE TEMPORARY VIEW card_device_trajectory_info_view AS
SELECT *
FROM card_device_trajectory_info  --表1
UNION ALL
SELECT * FROM card_device_trajectory_info_bf; --表2

执行业务查询

 select * from card_device_trajectory_info_view where imei = '15127423721' and DATE(gps_time) = CURRENT_DATE order by gps_time asc

手动删除视图资源 (如果不手动删除也会自动删除,所以这一步可以省略)

 DROP VIEW card_device_trajectory_info_view;

临时视图普通视图(永久视图)之间有以下区别:

  • 生命周期:临时视图只在当前会话有效,会话结束后会自动删除。而普通视图是永久性的,会一直存在数据库中,除非显式删除。
  • 可见性:临时视图只对创建它的会话可见,其他会话无法访问。而普通视图对所有会话都可见,可以被多个会话共享和使用。
  • 存储方式:临时视图的数据可以存储在内存或者临时表中,查询速度较快。而普通视图的数据存储在磁盘上,查询速度可能相对较慢。
  • 持久性:临时视图是临时创建的,不会被数据库系统持久化存储。而普通视图是一个已经定义好的查询,可以被保存并在需要时重新使用。
  • 数据更新:临时视图一般用于查询数据,不能进行数据更新操作。而普通视图可以根据定义的规则进行数据更新,例如使用触发器或者规定的权限。
  • 使用场景:临时视图通常用于会话级别的临时计算或者中间结果的存储。普通视图用于复杂查询、数据重用和提供简化的数据模型。
CREATE TEMPORARY VIEW table_view --创建临时视图(会话结束会自动删除)
CREATE VIEW table_view --创建普通视图(会话结束不会自动删除,需要手动 DROP VIEW table_view 进行删除)

总的来说,临时视图适用于需要在会话中临时存储和处理数据的场景,而普通视图适用于长期的数据查询和数据模型定义。选择使用哪种类型取决于业务需求和数据处理的特点。

文章来源:https://blog.csdn.net/weixin_44912902/article/details/135380918
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。