软件使用说明 ============= 先启动后端容器实例 ::::::::::::::::::::::::: >>> docker run -d -p 6666:6666 m986883511/extract_subtitles .. figure:: _static/image/1-docker-run.png :alt: 起容器 :align: center 启动程序 ::::::::::::::::: .. figure:: _static/image/2-run-exe.png :alt: 运行界面程序 :align: center 简单介绍页面 ::::::::::::::::: 1. 点击左边按钮连接第一步启动的容器 #. 视频提取字幕的总进度 #. 当前视频帧显示的位置,就是视频进度条 #. 识别出来的文字会在这里显示一下 .. figure:: _static/image/3-view.png :alt: 界面简介 :align: center 点击选择视频确认字幕位置 ::::::::::::::::::::::::::: 1. 点击选择视频按钮,这时你可以拖动进度条到有字幕的位置 #. 然后点击选择字幕区域;在视频中画一个矩形 .. figure:: _static/image/4-rect.png :alt: 选字幕区域 :align: center 点击测试连接API ::::::::::::::::::: 后端没问题的话,会显示已连通;此时所有步骤准备就绪 .. figure:: _static/image/5-connect.png :alt: 连接后端 :align: center 开始识别 ::::::::::::::::::: 点击 **请先完成前几步** 按钮,当进度条从0走到100,temp目录将生成和视频同名的srt字幕文件。 各个阶段的进度如下: - 0%-10%:本机,通过界面程序自带的ffmpeg工具提取视频原声 - 10%-30%:容器内,利用spleeter提取视频原声中的人声 - 30%-40%:容器内,利用pydub根据人声的停顿切分音频,返回识别区间 - 40%-99%:容器内,利用深度学习识别字幕 - 100%:本机,在temp目生成srt字幕文件