檔案總覽
📌 MediaCraft 音视频工具 — 媒体创作处理软件共 10 樓
主帖Ruclinux
🕐 2025-11-3 10:59:51
MediaCraft 音视频工具 是一款基于 PyQt5 + FFmpeg 开发的一站式音视频处理工具,提供图形化界面操作,让复杂的音视频处理变得简单易用。支持15大核心功能模块,满足从基础编辑到高级AI处理的各类需求。

详细介绍:https://www.myzhenai.com.cn/post/4826.html

这是我自己用python整合ffmpeg和一些ai模型的UI界面工具,欢迎朋友们指点。

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

核心功能详解

1. 工具设置

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

[圖片] https://youke1.picui.cn/s1/2025/11/03/69081275b50bc.png

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

2. 屏幕录制

支持全屏录制或自定义区域录制,支持录制系统声音、录制麦克风声音,支持录制鼠标指针。可设置帧率(FPS)、编码质量(超快/快速/中等/慢速)、视频比特率(5000k-15000k或自定义)。支持暂停/继续/停止操作,默认保存到桌面。需要安装Screen Capturer Recorder用于屏幕捕获,VB-CABLE用于音频捕获。

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

[圖片] https://youke1.picui.cn/s1/2025/11/03/69081275c19a5.png

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

3. 视频水印

支持图片水印和文字水印两种模式。图片水印支持PNG/JPG格式,可设置宽度、高度和透明度(0-100%)。文字水印支持自定义字体(系统字体+程序fonts目录字体)、字号、颜色(HEX格式)、描边颜色、透明度。支持设置水印位置(水平/垂直偏移),支持批量处理多个视频文件,支持拖拽添加文件,支持覆盖已存在输出文件。

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

[圖片] https://youke1.picui.cn/s1/2025/11/03/6908127f4e95a.png

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

4. 视频字幕

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

[圖片] https://youke1.picui.cn/s1/2025/11/03/6908127fde017.png

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

5. 视频合并

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

[圖片] https://youke1.picui.cn/s1/2025/11/03/69081280506d3.png

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

6. 视频转码

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

[圖片] https://youke1.picui.cn/s1/2025/11/03/69081281e39bd.png

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

7. 提取字幕

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

[圖片] https://youke1.picui.cn/s1/2025/11/03/690812827b531.png

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

8. 视频截图

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

[圖片] https://youke1.picui.cn/s1/2025/11/03/6908128a16732.png

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

9. 视频分割

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

[圖片] https://youke1.picui.cn/s1/2025/11/03/69081275e2f50.png

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

10. 图片转视频

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

[圖片] https://youke1.picui.cn/s1/2025/11/03/6908128a866ac.png

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

11. 视频添加音乐

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

[圖片] https://youke1.picui.cn/s1/2025/11/03/6908128a93cd9.png

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

12. 提取视频/音频

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

[圖片] https://youke1.picui.cn/s1/2025/11/03/6908128c7afb5.png

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

13. 媒体元数据修改

支持批量修改视频和音频文件的元数据信息,包括标题、艺术家、专辑、年份、描述等信息。修改后的元数据会显示在文件属性中。

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

[圖片] https://youke1.picui.cn/s1/2025/11/03/6908128d0f429.png

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

14. Whisper 生成字幕

支持使用Whisper AI模型批量从视频中提取文字字幕。支持多种模型选择(tiny/base/small/medium/large),平衡速度和精度。支持多语言识别(中文简体/繁体、英文、日语、韩语、法语、德语、西班牙语等),支持自动检测语言。支持字幕翻译功能,可将识别结果翻译成其他语言。支持多种字幕格式输出(SRT/ASS/VTT),自动命名规则:[原文件名]_[语言代码].格式。程序会自动检测Whisper路径和模型文件(系统安装或Plugin/whisper目录)。

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

[圖片] https://youke1.picui.cn/s1/2025/11/03/69081291ad311.png

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

15. 声音克隆模型

程序内置了RTVC和SoVITS两个声音克隆模型,支持音频训练并生成克隆音频。RTVC支持实时语音转换和文本转语音(目前仅支持英文),需要输入文本和目标参考音频。SoVITS支持高质量音频克隆和多语言支持,需要输入源音频和目标参考音频,自动识别配置文件中的说话人列表。程序会自动检测模型完整性和Python环境。

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

[圖片] https://youke1.picui.cn/s1/2025/11/03/69081291dac06.png

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

[圖片] https://youke1.picui.cn/s1/2025/11/03/69081277636a0.png

[圖片] https://youke1.picui.cn/s1/2025/11/03/69081277e5202.png
#? 樓tomcb
🕐 2025-11-3 11:16:05
支持技术贴。
#? 樓Ruclinux
🕐 2025-11-3 15:36:01
软件是使用PyQT5写的,基于python和FFmpeg,基本上是FFmpeg的UI,大家都知道,FFmpeg是强大的视频和音频的编码和解码处理工具,现在世界上大部份的视频或音频处理工具都是基于FFmpeg开发的。

除了音频和视频的各种操作,我还额外添加了 Whisper、RTVC和SoVITS等3个ai模型。

Whisper:这是强大的,可以从声音中识别出字幕的ai模型,支持所有语言,不需要再进行模型训练,我已经打包了几个语言模型,只需要选择需要识别的语言就可以正常使用了。

RTVC:这是一款语音转换的ai模型,可以根据训练的模块,根据提供的语音模型,根据输入的文本,生成说话人语音,使用前提是需要有精准的音频,并且目前只支持英文,或者你们可以找到已经训练好的国内的语音模型。

SoVITS:同样是一个出色的音频转换ai模型项目,但是这个需要自己训练模型,大家如果想要使用,需要自己制作无噪音、无背景声的音频,然后进行模型训练,最少需要训练到8000步以上,再用训练好的模型去制作音频或音乐。
#? 樓vagrant
🕐 2025-11-3 17:32:42
东西是好东西,但是大佬呀,能不能来个夸克网盘或天翼网盘的链接呀,百度这没会员下载呀。
#? 樓vagrant
🕐 2025-11-3 17:41:21
20.65G??哪个好心人转一下盘分享一下阿,这百度下载没会员得下到啥时候呀?!!
#? 樓Alicloud
🕐 2025-11-3 21:58:40
支持技术帖
#? 樓Ruclinux
🕐 2025-11-4 08:47:46
vagrant 发表于 2025-11-3 17:32

东西是好东西,但是大佬呀,能不能来个夸克网盘或天翼网盘的链接呀,百度这没会员下载呀。 ...
#? 樓Ruclinux
🕐 2025-11-4 09:52:28
vagrant 发表于 2025-11-3 17:32

东西是好东西,但是大佬呀,能不能来个夸克网盘或天翼网盘的链接呀,百度这没会员下载呀。 ...
#? 樓williamc2
🕐 2025-11-4 13:39:54
666
#? 樓vagrant
🕐 2025-11-4 15:14:42
Ruclinux 发表于 2025-11-4 09:52

我用夸克网盘给你分享了「MediaCraft」,点击链接或复制整段内容,打开「夸克APP」即可获取。

/~f90238z8 ...