2. 软件使用说明

2.1. 先启动后端容器实例

>>> docker run -d -p 6666:6666 m986883511/extract_subtitles
起容器

2.2. 启动程序

运行界面程序

2.3. 简单介绍页面

  1. 点击左边按钮连接第一步启动的容器

  2. 视频提取字幕的总进度

  3. 当前视频帧显示的位置,就是视频进度条

  4. 识别出来的文字会在这里显示一下

界面简介

2.4. 点击选择视频确认字幕位置

  1. 点击选择视频按钮,这时你可以拖动进度条到有字幕的位置

  2. 然后点击选择字幕区域;在视频中画一个矩形

选字幕区域

2.5. 点击测试连接API

后端没问题的话,会显示已连通;此时所有步骤准备就绪

连接后端

2.6. 开始识别

点击 请先完成前几步 按钮,当进度条从0走到100,temp目录将生成和视频同名的srt字幕文件。

各个阶段的进度如下:

  • 0%-10%:本机,通过界面程序自带的ffmpeg工具提取视频原声

  • 10%-30%:容器内,利用spleeter提取视频原声中的人声

  • 30%-40%:容器内,利用pydub根据人声的停顿切分音频,返回识别区间

  • 40%-99%:容器内,利用深度学习识别字幕

  • 100%:本机,在temp目生成srt字幕文件