python练习8 影视视频字幕识别

python练习8 影视视频字幕识别,第1张

python练习8 影视视频字幕识别 1.基本原理

2.安装tesseract-ocr并调试运行环境 ①安装tesseract-ocr

在cmd里运行pip install tesseract

或  下载地址:https://digi.bib.uni-mannheim.de/tesseract/ 

②设置可执行的文件路径

Win+R打开命令行,输入sysdm.cpl,高级-环境变量-打开设置Path的窗口-新建环境变量。

添加后如不能运行,可重启电脑再尝试。

③把语言文件拷贝到此处tessdata目录下

tesseract –v 测试安装  
tesseract –list-langs测试语言包

3. *** 作举例
import pytesseract
import cv2
import numpy as np
from scipy import stats
import os
import matplotlib.pyplot as plt
os.chdir('D:pythonAds2021')

if __name__ == '__main__':
    path = "20210701.mp4"
    cap = cv2.VideoCapture(path)
    frame_count = int(cap.get(cv2.CAP_PROP_frame_COUNT))
    print(frame_count)
    i=1
    while i 

字母都大写的是属性,小写的是方法

psm 7 识别中文的参数

chi_sim 仿宋体

i=i+24*5  每隔五秒钟抽一帧

运行结果:

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zaji/5479705.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-12-12
下一篇 2022-12-12

发表评论

登录后才能评论

评论列表(0条)

保存