把视频或音频拖进来,自动转成 SRT 字幕、TXT 文稿、Word 文档。 完全本地离线处理,不上传、不要显卡,中英文识别效果最佳。
专为「把视频里的话变成文字」这一件事打磨
视频、音频文件或整个文件夹拖进去,点一下「开始识别」,全部一次转成字幕和文稿。
载入视频边看边标记片段,只导出选中部分,或全文转写并高亮你挑出来的句子。
SRT 字幕、TXT 文本、JSON、Word 文档随你选,时间戳、分段、字幕长度都能调。
识别全程在你自己电脑上跑,视频不上传任何服务器,隐私无忧,断网也能用。
任何 Windows 电脑都能跑,不挑显卡。识别速度约为视频时长的几倍速。
免费送给朋友用,没有水印、没有时长限制、没有账号、没有内购。
下载解压,双击就能用
下载压缩包后整个文件夹解压出来,双击 VideoASR.exe 打开(首次启动要加载模型,稍等几秒)。
「批量识别」拖入文件或文件夹;「精选识别」载入一个视频,边看边用快捷键标记片段。
选好输出格式点「开始识别」,自动生成字幕 / 文稿。在「⚙ 精度设置」里还能微调效果。
免费 · 解压即用 · 适用于 Windows 10 / 11(64 位)
⬇ 下载 VideoASR(约 750 MB)把整个压缩包解压出来(不要只解压出 exe),进文件夹双击 VideoASR.exe。程序、识别模型、播放器都在这个文件夹里,要一起保留。
这是 PyInstaller 打包程序常见的误报,软件本身无毒、纯本地运行。在杀毒软件或 Windows Defender 里把它加入信任 / 允许即可。
不需要显卡,纯 CPU 运行,任何 Windows 电脑都能跑。识别速度约为视频时长的几倍速,长视频请耐心等待。识别中英文效果最好。
不会。识别全程在你本地电脑完成,不上传任何文件,下载安装后断网也能正常使用。
空格 / K 播放暂停 · ← → 前后 5 秒 · J / L 前后 10 秒 · ↑↓ 音量 · [ ] 倍速 · I 设入点、O 设出点,再点「添加片段」。