可能涉及各种批处理,我将介绍其中的PostgreSQL JDBC驱动程序(pgjdbc)。
TL;
DR:在使用批处理API的情况下,pgjdbc确实使用较少的网络轮询。
BatchedQuery仅在
reWriteBatchedInserts=true传递给pgjdbc连接设置时使用。
您可能会发现与https://www.slideshare.net/VladimirSitnikv/postgresql-and-jdbc-
striving-for-high-
performance有关(幻灯片44,…)
当涉及到查询执行时,网络延迟通常是经过时间的重要部分。
假设情况是插入10行。
- 没有批处理(例如,仅
PreparedStatement#execute
在循环中)。驱动程序将执行以下 *** 作execute query
sync <– wait for the response from the DB
execute query
sync <– wait for the response from the DB
execute query
sync <– wait for the response from the DB
…
大量时间将花费在“等待数据库”中
- JDBC批处理API。这
PreparedStatement#addBatch()
使驱动程序可以在单个网络往返中发送多个“查询执行”。但是,当前的实现仍将大批拆分成较小的批,以避免TCP死锁。
动作会好得多:
execute query...execute queryexecute queryexecute querysync <-- wait for the response from the DB
- 请注意,即使有了
#addBatch
,“执行查询”命令也有开销。服务器确实需要花费大量时间来单独处理每条消息。
减少查询数量的一种方法是使用多值插入。例如:
insert into tab(a,b,c) values (?,?,?), (?,?,?), ..., (?,?,?)
该PostgreSQL允许一次插入多行。缺点是您没有详细的(每行)错误消息。当前,Hibernate尚未实现多值插入。
但是,自9.4.1209(2016-07-15)起,pgjdbc可以即时将常规批处理插入重写为多值。
为了激活多值重写,您需要添加
reWriteBatchedInserts=true连接属性。该功能最初在https://github.com/pgjdbc/pgjdbc/pull/491中开发
使用2条语句插入10行足够聪明。第一个是8值语句,第二个是2值语句。使用2的幂可以使pgjdbc保持不同的语句的数量合理,并且由于经常使用的语句是服务器准备的,因此提高了性能(请参阅PostgreSQL服务器端准备好的语句的寿命)
BatchedQuery是表示这种多值语句,因此您将看到
reWriteBatchedInserts=true仅在大写情况下使用的类。
该功能的缺点可能包括:较低的细节作为“批处理结果”。例如,常规批处理为您提供“每个语句行计数”,但是在多值情况下,您仅获得“语句完成”状态。最重要的是,即时重写器可能无法解析某些SQL语句(例如https://github.com/pgjdbc/pgjdbc/issues/1045)。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)