在用yolov5跑训练模型时,首行出现WARNING:优化应该在下一步之前执行:UserWarning: Detected call of lr_scheduler.step()
before optimizer.step()
. In PyTorch 1.1.0 and later, you should call them in the opposite order: optimizer.step()
before lr_scheduler.step()
. Failure to do this will result in PyTorch skipping the first value of the learning rate schedule.
因为这是警告WARNING,不是错误ERROR,所以我一开始没当回事,跑完了train.py,然后结果就出毛病了,根目录下runs/train/results.png这张图里面全是直线,这指定是有毛病啊:
查阅资料知,这是由于之前下载的pytorch和cudnn所支持的cuda版本不匹配的问题,举个例子,我的pytorch支持11.1的CUDA,而我的CUDNN支持11.4的CUDA,那么这样就会出错,这种错误pycharm环境检测不出,所以很坑。
知道错误原因后,解决就很简单了,一句话,重新装CUDA、pytorch和cudnn。
我推荐去下载10.2版本的CUDA,这是最稳定的版本,然后去pytorch官网和cudnn官网下载支持10.2版本的pytorch和cudnn即可。相关教程请读者自行查阅。
当然,大手子可以去找train.py里面对应的位置然后修改代码解决,两个地方分别位于yolov5的6.1版本的train.py第360行和第380行,咱也不懂为啥报警告,因为从逻辑上看优化确实要先于下一步的,大手子可以分析一下
360行optimizer.step():
if ni - last_opt_step >= accumulate:
scaler.step(optimizer) # optimizer.step
scaler.update()
optimizer.zero_grad()
if ema:
ema.update(model)
last_opt_step = ni
380行scheduler.step():
lr = [x['lr'] for x in optimizer.param_groups] # for loggers
scheduler.step()
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)