系统:Win10
JDK:1.8.0_351
IDEA:2022.3.3

1.需求描述

在一次项目中实施过程中,后台需要将地区数据插入到数据库,数据大概三千条左右,本来直接使用循环遍历插入的方式,结果居然需要十几秒的时间,感觉速度太慢了,所以便想办法提高插入数据的速度,经过多番资料查询和验证,结果选定了一款实现方式,特此记录下来。

2.实现方案

数据:3208 条
需求:将数据插入到 Oracle 数据库

2.1 循环 insert 插入

最基础的就是使用 for 循环遍历 list 数据,一个个进行插入

java 代码

...
 //循环插入
 StopWatch started = new StopWatch();
 started.start();//开始计时
 for (Region region : regions) {
     regionMapper.insert(region);
 }
 started.stop();//停止计时
 System.out.println("插入" + list.size() + "条数据耗时: " + started.getTime());
...

mapper 接口

int insert(Region region);

xml 语句

<insert id="insert">
    insert into DATA_REGION(id, name, pid)
    values (#{id}, #{name}, #{pid})
</insert>

这里测试执行了 3 次,平均耗时:15160 ms
在这里插入图片描述

2.2 insert all 插入

这里主要使用的 Oracle 的 INSERT ALL 语法

INSERT ALL
    INTO table_name(col1,col2,col3) VALUES(val1,val2, val3)
    INTO table_name(col1,col2,col3) VALUES(val4,val5, val6)
    INTO table_name(col1,col2,col3) VALUES(val7,val8, val9)
Subquery;

该方法用来批量向数据库中插入数据所用的

java 代码

...
//insert all 插入
StopWatch started = new StopWatch();
started.start();//开始计时
regionMapper.insertAll(regions);
started.stop();//停止计时
System.out.println("插入" + list.size() + "条数据耗时: " + started.getTime());
...

mapper 接口

int insertAll(List<Region> list);

xml 语句

<insert id="insertAll">
    insert all
    <foreach collection="list" item="item" index="index">
        into DATA_REGION(id, name, pid) VALUES (#{item.id},#{item.name},#{item.pid})
    </foreach>
    select 1 from dual
</insert>

这里测试执行了 3 次,平均耗时:8171 ms
在这里插入图片描述

2.3 insert union all 插入

这里是使用 union all 先将各个对象的值查询到一起再批量插入到表中

java 代码

...
//batchInsert
StopWatch started = new StopWatch();
started.start();//开始计时
regionMapper.batchInsert(regions);
started.stop();//停止计时
System.out.println("插入" + list.size() + "条数据耗时: " + started.getTime());
...

mapper 接口

int batchInsert(List<Region> list);

xml 语句

<insert id="batchInsert">
    insert into DATA_REGION(id, name, pid)
    <foreach collection="list" item="item" index="index" separator="union all">
        (
        select #{item.id},#{item.name},#{item.pid} from dual
        )
    </foreach>
</insert>

这里测试执行了 3 次,平均耗时:2619 ms
在这里插入图片描述

3.分析总结

根据上面的三次测试,我们可以得出如下表格

# 循环 insert 插入 insert all 插入 insert union all 插入
平均耗时 15.16s 8.17s 2.62s

所以我最后决定采用第三种方法,不过我这里数据量只有 3000 多条,如果数据量更大,可能要再测试看看。

后续看看还有没有更好的实现方案,如果找到我再添加到文章末尾。

Logo

DAMO开发者矩阵,由阿里巴巴达摩院和中国互联网协会联合发起,致力于探讨最前沿的技术趋势与应用成果,搭建高质量的交流与分享平台,推动技术创新与产业应用链接,围绕“人工智能与新型计算”构建开放共享的开发者生态。

更多推荐