手上有个需求,要运行一条SQL统计一下91号订单的数据量;
单表查询耗时25s,一共40套JED, 每套8分片,每个分片32个分表;
顺序跑完一次耗时71个小时;
那么我们可以执行,所有的320个分片同时执行,速度将大大增加;
import time
from joblib import Parallel, delayed
def long_function(ip):
time.sleep(1)
print(ip)
list1 = [
'1.1.1.1',
'2.2.2.2',
'3.3.3.3',
]
REPETITIONS = len(list1)
Parallel(n_jobs=REPETITIONS)(
delayed(long_function)(list1[i]) for i in range(REPETITIONS))
运行后一个小时内就跑完了所有的计算;
long_function(ip) 是具体执行的函数, IP是传入的参数;
list1是列表,列表中包含所有的分片地址信息;
程序按照列表长度决定并发的数量,数量越多并发数越多,确保在单个分片中是顺序执行的;避免单个分片中如果并发执行会对数据库负载有较大影响;
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)