Translate the video from one language to another and add dubbing. 将视频从一种语言翻译为另一种语言,同时支持语音识别转录、语音合成、字幕翻译。
pyvideotrans版本: v3.78
🔗更新日志

预打包版仅适用于Windows10/11,MacOS和Linux请源码部署 源码部署升级:重新拉取源码覆盖,然后执行 pip3 install --upgrade torch openai google-genai whisper elevenlabs gradio_client faster-whisper

Change

  • Fix: 修复几处bug 根据bbs反馈
  • Refacor: 统一报错弹窗
  • Fix: Google翻译渠道

v3.75以下版本必须下载完整包覆盖,不可仅下载补丁包,因底层torch升级不兼容

v3.79 完整包/Full package(2.5G)

如果未安装过旧版本,请在此下载完整版,如需cuda加速,需有英伟达显卡并且安装cuda12.x及cudnn9

百度网盘下载地址: https://pan.baidu.com/s/1kRY00vq_SnunQvsVjyLVQQ?pwd=4qwf

huggingface.co: https://huggingface.co/mortimerme/repocollect/resolve/main/win-videotrans-v3.79.7z?download=true

v3.79 补丁包/PatchUpdate(360MB)

不可单独使用,仅用于覆盖旧包,与完整包区别是不含有torch模块 因torch从 2.5 升级到 2.7,补丁包不含有torch,直接下载覆盖补丁包可能导致无法cuda加速,建议下载完整包覆盖

百度网盘下载地址: https://pan.baidu.com/s/1AokGeQjMTCH_bu62pQc0oA?pwd=vt2j

huggingface.co: https://huggingface.co/mortimerme/repocollect/resolve/main/win-PatchUpdate-3.79.7z?download=true

解压注意事项:

  • 解压7z压缩包,解压后,找到 sp.exe 文件,双击即可启动软件。
  • 不要将软件解压到桌面或 C 盘的 Program Files 等需要管理员权限的文件夹下。
  • 避免路径错误: 解压路径中不要包含中文、空格或特殊符号。
  • 如果使用7zip软件解压提示错误,可尝试使用360压缩解压(https://yasuo.360.cn) / 注意避免全家桶
pyvideotrans版本: v3.77
🔗更新日志

预打包版仅适用于Windows10/11,MacOS和Linux请源码部署 源码部署升级:重新拉取源码覆盖,然后执行 pip3 install --upgrade torch openai google-genai whisper elevenlabs gradio_client faster-whisper

Change

  • Refacor: 优化冷启动速度
  • Fix: 视频慢速裁切时忽略掉小于1024B的无效片段
  • Fix: #878 #877

v3.75以下版本必须下载完整包覆盖,不可仅下载补丁包,因底层torch更新

v3.77-0811 完整包下载(2.5G)

如果未安装过旧版本,请在此下载完整版,如需cuda加速,需有英伟达显卡并且安装cuda12.x及cudnn9

百度网盘下载地址: https://pan.baidu.com/s/1JzxfaJt-wyEPl7-xKFMZyA?pwd=9ncy

huggingface.co地址(墙外): https://huggingface.co/mortimerme/repocollect/resolve/main/win-videotrans-v3.77-0811.7z?download=true

v3.77-0811 补丁包(380MB)

不可单独使用,仅用于覆盖旧包,与完整包区别是不含有torch模块 因torch从 2.5 升级到 2.7,补丁包不含有torch,直接下载覆盖补丁包可能导致无法cuda加速,建议下载完整包覆盖

百度网盘下载地址: https://pan.baidu.com/s/1bIMnuUExSBb-8D-bbMjUbg?pwd=8fgu

GitHub地址: https://github.com/jianchang512/pyvideotrans/releases/download/v3.77/win-PatchUpdate-3.77-0811.7z

解压注意事项:

  • 解压7z压缩包,解压后,找到 sp.exe 文件,双击即可启动软件。
  • 不要将软件解压到桌面或 C 盘的 Program Files 等需要管理员权限的文件夹下。
  • 避免路径错误: 解压路径中不要包含中文、空格或特殊符号。
  • 如果使用7zip软件解压提示错误,请尝试使用360压缩软件解压(https://yasuo.360.cn)
pyvideotrans版本: v3.76
🔗更新日志

预打包版仅适用于Windows10/11,MacOS和Linux请源码部署 MacOS/Linux升级:重新拉取源码覆盖,然后执行 pip3 install --upgrade whisper elevenlabs gradio_client faster-whisper

Change

  • Fix: torch 升级到 2.7,兼容 50xx 显卡加速
  • Fix: #846
  • Fix: 不再禁止选择非支持语言,即某些渠道不支持的语言也可选择,仅做文字提示 #861
  • Feat: 302AI配音渠道增加 豆包、azure、minimaxi、dubbingx、openai等角色 https://pvt9.com/302ai

v3.76 完整包下载(2.5G)

如果未安装过旧版本,请在此下载完整版,如需cuda加速,需有英伟达显卡并且安装cuda12.x及cudnn9

百度网盘下载地址: https://pan.baidu.com/s/1ybei88HkCwWzDUkt5aQv8w?pwd=ghar

huggingface.co地址(墙外): https://huggingface.co/mortimerme/pyvideotrans/resolve/main/win-videotrans-v3.76.7z?download=true

v3.76 补丁包(380MB)

不可单独使用,仅用于覆盖旧包,与完整包区别是不含有torch模块 因torch从 2.5 升级到 2.7,补丁包不含有torch,直接下载覆盖补丁包可能导致无法cuda加速,建议下载完整包覆盖

百度网盘下载地址: https://pan.baidu.com/s/12HkYyrr7GEkTkBELBnoNMA?pwd=4jhn

GitHub地址: https://github.com/jianchang512/pyvideotrans/releases/download/v3.76/win-PatchUpdate-3.76.7z

解压注意事项:

  • 解压7z压缩包,解压后,找到 sp.exe 文件,双击即可启动软件。
  • 不要将软件解压到桌面或 C 盘的 Program Files 等需要管理员权限的文件夹下。
  • 避免路径错误: 解压路径中不要包含中文、空格或特殊符号。
  • 如果使用7zip软件解压提示错误,请尝试使用360压缩软件解压(https://yasuo.360.cn)
pyvideotrans版本: v3.75
🔗更新日志

预打包版仅适用于Windows10/11,MacOS和Linux请源码部署 MacOS/Linux升级:重新拉取源码覆盖,然后执行 pip3 install --upgrade whisper elevenlabs gradio_client faster-whisper

Change

v3.75完整包下载(1.9G)

如果未安装过旧版本,请在此下载完整版,如需cuda加速,需有英伟达显卡并且安装cuda12.x及cudnn9

百度网盘下载地址: https://pan.baidu.com/s/1uz1jV1MSwjPymDrP3tDJ5Q?pwd=v5b7

GitHub地址: https://github.com/jianchang512/pyvideotrans/releases/download/v3.75/win-videotrans-v3.75.7z

v3.75-0728 补丁包(380MB)

如果已安装过3.x版本,可下载补丁包后解压在sp.exe所在目录,覆盖已有sp.exe和文件夹 不可单独使用,仅用于覆盖旧包,与完整包区别是不含有torch模块

百度网盘下载地址: https://pan.baidu.com/s/1aCeh2ni_MJl6oEIBlIDGuw?pwd=xrmk

GitHub地址: https://github.com/jianchang512/pyvideotrans/releases/download/v3.75/win-PatchUpdate-3.75-0728.7z

解压注意事项:

  • 解压7z压缩包,解压后,找到 sp.exe 文件,双击即可启动软件。
  • 不要将软件解压到桌面或 C 盘的 Program Files 等需要管理员权限的文件夹下。
  • 避免路径错误: 解压路径中不要包含中文、空格或特殊符号。
  • 如果使用7zip软件解压提示错误,请尝试使用360压缩软件解压(https://yasuo.360.cn)
pyvideotrans版本: v3.74
🔗更新日志

预打包版仅适用于Windows10/11,MacOS和Linux请源码部署 MacOS/Linux升级:重新拉取源码覆盖,然后执行 pip3 install --upgrade whisper elevenlabs gradio_client faster-whisper

Change

  • Feat: 配音渠道增加 Qwen-TTS 详述https://pvt9.com/qwen-tts
  • Fix: #849
  • Fix: 音频加速视频慢速同步滞后
  • Fix: siliconflow save models error
  • Feat: 阿里FunASR/Deepgram.com/Gemini大模型识别 支持说话人识别
  • Feat: 新增 智谱AI/DeepSeek/Siliconflow/OpenRouter.ai 翻译渠道
  • Feat: 新增字幕多角色配音功能,可导入srt字幕,单独为每条字幕设定发音角色
  • Optim: LLM重新断句可选AI引擎为OpenAI渠道或DeepSeek, 在高级选项-通用设置里选择

v3.74 完整包下载(1.9G)

如果未安装过旧版本,请在此下载完整版,如需cuda加速,需有英伟达显卡并且安装cuda12.x及cudnn9

百度网盘下载地址: https://pan.baidu.com/s/1A6unNnt9BLZIBhdIi3pPnA?pwd=q8qr

GitHub地址: https://github.com/jianchang512/pyvideotrans/releases/download/v3.74/win-videotrans-v3.74-0720.7z

v3.74-0720 补丁包(380MB)

如果已安装过3.x版本,可下载补丁包后解压在sp.exe所在目录,覆盖已有sp.exe和文件夹 不可单独使用,仅用于覆盖旧包,与完整包区别是不含有torch模块

百度网盘下载地址: https://pan.baidu.com/s/1OIqnIIhnxYMRiPeJCg0v1w?pwd=rxnr

GitHub地址: https://github.com/jianchang512/pyvideotrans/releases/download/v3.74/win-PatchUpdate-3.74-0720.7z

解压注意事项:

  • 解压7z压缩包,解压后,找到 sp.exe 文件,双击即可启动软件。
  • 不要将软件解压到桌面或 C 盘的 Program Files 等需要管理员权限的文件夹下。
  • 避免路径错误: 解压路径中不要包含中文、空格或特殊符号。
  • 如果使用7zip软件解压提示错误,请尝试使用360压缩软件解压(https://yasuo.360.cn)

简体中文 | English | 捐助 | 微信公众号:pyvideotrans

视频翻译配音工具

这是一个视频翻译配音工具,可将一种语言的视频翻译为指定语言的视频,自动生成和添加该语言的字幕和配音。并支持API调用(v3.0以下版本,以上久未更新)

语音识别支持 faster-whisper/openai-whisper/OpenAI API/Deepgram.com/Gemini/Parakeet/GoogleSpeech/阿里Funasr/字节火山等,并支持自定义语音识别api.

文字翻译支持 微软翻译|Google翻译|百度翻译|腾讯翻译|ChatGPT|AzureAI|Gemini|DeepSeek|claude|DeepL|DeepLX|字节火山|离线翻译OTT|自定义API等

文字合成语音支持 Edge tts Google tts Azure AI TTS Openai TTS Elevenlabs TTS 自定义TTS服务器api GPT-SoVITS F5-TTS Index-tts ChatterBox Gemini-tts clone-voice ChatTTS-ui Fish TTS CosyVoice

允许保留背景伴奏音乐等(基于uvr5)

支持的语言:中文简繁、英语、韩语、日语、俄语、法语、德语、意大利语、西班牙语、葡萄牙语、越南语、泰国语、阿拉伯语、土耳其语、匈牙利语、印度语、乌克兰语、哈萨克语、印尼语、马来语、捷克语、波兰语、荷兰语、瑞典语、芬兰语、菲律宾语、孟加拉语、乌尔都语、希伯来语、粤语等,其他语言可选自动检测

主要用途和功能

【自动翻译视频并配音】将视频中的声音翻译为另一种语言的配音,并嵌入该语言字幕

【语音识别/将音频视频转为字幕】可批量将音频、视频文件中的人类说话声,识别为文字并导出为srt字幕文件

【语音合成/字幕配音】根据本地已有的srt字幕文件创建配音,支持单个或批量字幕

【字幕多角色配音】导入本地已有的srt字幕,为每条字幕指定一个配音角色,创建多角色配音文件

【翻译字幕文件】将一个或多个srt字幕文件翻译为其他语言的字幕文件

【合并视频和音频】批量将视频文件和音频文件一一对应合并

【合并视频和srt字幕】批量将视频文件srt字幕文件一一对应合并

【为视频添加图片水印】批量将视频文件中嵌入图片水印

【从视频中提取音频】从视频中分离为音频文件和无声视频

【音频视频格式转换】批量将音频视频进行格式转换

【字幕编辑并导出多格式】支持导入srt、vtt、ass格式字幕,编辑后可设置字体样式、色彩等导出对应格式字幕

【字幕格式转换】批量将字幕文件进行 srt/ass/vtt 格式互转

【人声背景乐分离】

【API调用<v3.0】支持 语音合成、语言识别、字幕翻译、视频翻译接口调用


pyvideotrans-home

Open In Colab

预打包版本(仅win10/win11可用,MacOS/Linux系统使用源码部署)

使用pyinstaller打包,未做免杀和签名,杀软可能报毒,请加入信任名单或使用源码部署

  1. [点击去下载预打包版,解压到无空格的英文目录后,双击 sp.exe (https://github.com/jianchang512/pyvideotrans/releases)

  2. 解压到英文路径下,并且路径中不含有空格。解压后双击 sp.exe (若遇到权限问题可右键使用管理员权限打开)

  3. 注意:必须解压后使用,不可直接压缩包内双击使用,也不可解压后移动sp.exe文件到其他位置

MacOS源码部署

  1. 打开终端窗口,分别执行如下命令

    执行前确保已安装 Homebrew,如果你没有安装 Homebrew,那么需要先安装

    执行命令安装 Homebrew: /bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)"

    安装完成后,执行: eval $(brew --config)

    brew install libsndfile
    
    brew install ffmpeg
    
    brew install git
    
    brew install python@3.10
    
    

    继续执行

    export PATH="/usr/local/opt/python@3.10/bin:$PATH"
    
    source ~/.bash_profile 
    
    source ~/.zshrc
    
    
  2. 创建不含空格和中文的文件夹,在终端中进入该文件夹。

  3. 终端中执行命令 git clone https://github.com/jianchang512/pyvideotrans

  4. 执行命令 cd pyvideotrans

  5. 继续执行 python -m venv venv

  6. 继续执行命令 source ./venv/bin/activate,执行完毕查看确认终端命令提示符已变成已(venv)开头,以下命令必须确定终端提示符是以(venv)开头

  7. 执行 pip install -r requirements.txt ,如果提示失败,执行如下2条命令切换pip镜像到阿里镜像

    pip config set global.index-url https://mirrors.aliyun.com/pypi/simple/
    pip config set install.trusted-host mirrors.aliyun.com
    

    然后重新执行 如果已切换到阿里镜像源,仍提示失败,请尝试执行 pip install -r requirements.txt

  8. python sp.py 打开软件界面

Linux 源码部署

  1. CentOS/RHEL系依次执行如下命令安装 python3.10

sudo yum update

sudo yum groupinstall "Development Tools"

sudo yum install openssl-devel bzip2-devel libffi-devel

cd /tmp

wget https://www.python.org/ftp/python/3.10.4/Python-3.10.4.tgz

tar xzf Python-3.10.4.tgz

cd Python-3.10.4

./configure — enable-optimizations

sudo make && sudo make install

sudo alternatives — install /usr/bin/python3 python3 /usr/local/bin/python3.10 1

sudo yum install -y ffmpeg

  1. Ubuntu/Debian系执行如下命令安装python3.10

apt update && apt upgrade -y

apt install software-properties-common -y

add-apt-repository ppa:deadsnakes/ppa

apt update

sudo apt-get install libxcb-cursor0

apt install python3.10

curl -sS https://bootstrap.pypa.io/get-pip.py | python3.10

sudo update-alternatives --install /usr/bin/python python /usr/local/bin/python3.10  1

sudo update-alternatives --config python

apt-get install ffmpeg

打开任意一个终端,执行 python3 -V,如果显示 “3.10.4”,说明安装成功,否则失败

  1. 创建个不含空格和中文的文件夹, 从终端打开该文件夹。

  2. 终端中执行命令 git clone https://github.com/jianchang512/pyvideotrans

  3. 继续执行命令 cd pyvideotrans

  4. 继续执行 python -m venv venv

  5. 继续执行命令 source .\venv\scripts\activate,执行完毕查看确认终端命令提示符已变成已(venv)开头,以下命令必须确定终端提示符是以(venv)开头

  6. 执行 pip install -r requirements.txt,如果提示失败,执行如下2条命令切换pip镜像到阿里镜像

    
    pip config set global.index-url https://mirrors.aliyun.com/pypi/simple/
    pip config set install.trusted-host mirrors.aliyun.com
    
    

    然后重新执行,如果已切换到阿里镜像源,仍提示失败,请尝试执行 pip install -r requirements.txt

  7. 如果要使用CUDA加速,分别执行

    pip uninstall -y torch torchaudio

    pip install torch torchaudio --index-url https://download.pytorch.org/whl/cu126

    pip install nvidia-cublas-cu12 nvidia-cudnn-cu12

  8. linux 如果要启用cuda加速,必须有英伟达显卡,并且配置好了CUDA12+环境,请自行搜索 "Linux CUDA 安装"

  9. python sp.py 打开软件界面

Window10/11 源码部署

  1. 打开 https://www.python.org/downloads/ 下载 windows3.10,下载后双击,一路next,注意要选中“Add to PATH”

    打开一个cmd,执行 python -V,如果输出不是 3.10.4,说明安装出错,或没有加入 Add to PATH,请重新安装

  2. 打开 https://github.com/git-for-windows/git/releases/download/v2.45.0.windows.1/Git-2.45.0-64-bit.exe ,下载git,下载后双击一路下一步。

  3. 找个不含空格和中文的文件夹,地址栏中输入 cmd回车,打开终端,以下命令均在该终端中执行

  4. 执行命令 git clone https://github.com/jianchang512/pyvideotrans

  5. 继续执行命令 cd pyvideotrans

  6. 继续执行 python -m venv venv

  7. 继续执行命令 venv\Scripts\activate,执行后请查看确认命令行开头已变成了(venv),否则说明出错

  8. 执行 pip install -r requirements.txt ,如果提示失败,执行如下2条命令切换pip镜像到阿里镜像

    
    pip config set global.index-url https://mirrors.aliyun.com/pypi/simple/
    pip config set install.trusted-host mirrors.aliyun.com
    
    

    然后重新执行,如果已切换到阿里镜像源,仍提示失败,请尝试执行 pip install -r requirements.txt

  9. 如果要使用CUDA加速,分别执行

    pip uninstall -y torch torchaudio

    pip install torch torchaudio --index-url https://download.pytorch.org/whl/cu126

  10. windows 如果要启用cuda加速,必须有英伟达显卡,并且配置好了CUDA12+环境,具体安装见 CUDA加速支持

  11. 解压 ffmpeg.zip 到当前源码目录下,提示覆盖则覆盖,解压后确保源码下的ffmepg文件夹内能看到 ffmpeg.exe ffprobe.exe ytwin32.exe,

  12. python sp.py 打开软件界面

源码部署问题说明

  1. 默认使用 ctranslate2的4.x版本,仅支持CUDA12.x版本,如果你的cuda低于12,并且无法升级cuda到12.x,请执行命令卸载ctranslate2然后重新安装

pip uninstall -y ctranslate2

pip install ctranslate2==3.24.0

  1. 可能会遇到 xx module not found 之类错误,请打开 requirements.txt,搜索该 xx 模块,然后将xx后的 ==及等会后的版本号去掉

使用教程和文档

请查看 https://pyvideotrans.com

语音识别模型:

下载地址: https://pyvideotrans.com/model.html

视频教程(第三方)

Mac下源码部署/b站

用Gemini Api 给视频翻译设置方法/b站

如何下载和安装

软件预览截图

pyvideotrans-home

image

相关联项目

ChatTTS-ui:使用ChatTTS合成声音的UI界面

OTT:本地离线文字翻译工具

声音克隆工具:用任意音色合成语音

语音识别工具:本地离线的语音识别转文字工具

人声背景乐分离:人声和背景音乐分离工具

GPT-SoVITS的api.py改良版

适配 CosyVoice 的 api.py

致谢

本程序主要依赖的部分开源项目

  1. ffmpeg
  2. PySide6
  3. edge-tts
  4. faster-whisper
  5. openai-whisper
  6. pydub

如果觉得该项目对你有价值,并希望该项目能一直稳定持续维护,欢迎捐助