快速开始
5 分钟从安装到出片,开启你的 AI 字幕之旅
欢迎使用 MioSub!本指南将带你在 5 分钟内完成从安装到生成第一个专业字幕的全流程。
系统要求
- Windows 10/11 (64-bit)
- macOS 12+ (Intel / Apple Silicon)
- Linux (x64 / arm64, AppImage)
- 4GB+ 可用内存
- 网络连接(用于 API 调用)
第一步:下载安装
根据你的系统选择合适的版本:
检测系统中...
- Windows 便携版: 解压到任意位置(如:
D:\Apps\MioSub,请不要解压到C盘根目录),双击MioSub.exe启动。不支持自动更新,需要手动下载新版本。 - Windows 安装版(推荐): 运行安装程序,按提示完成安装。支持自动更新。
- macOS: 打开 DMG,拖拽到 Applications 文件夹
- Linux: 赋予执行权限后运行
chmod +x MioSub-*.AppImage && ./MioSub-*.AppImage
首次启动会自动创建配置文件,等待界面加载完成
第二步:配置 API Key
MioSub 使用 Gemini API 进行智能翻译,你需要配置 API Key 才能开始使用。
点击右上角 ⚙️ 设置 按钮
找到 「服务」→「Gemini API 密钥」 ,填入你的 Gemini API Key
如果使用中转站,则需要填写 Gemini 端点,注意只需要填写域名(如:https://yunwu.zeabur.app 或 https://api3.wlai.vip )
模型要求
请确保你的 API Key 有权限访问以下模型:
- Gemini 2.5/3 Flash(主力翻译)
- Gemini 3 Pro(术语提取)
第三步:生成你的第一个字幕
现在,让我们来生成第一个专业字幕!
方式一:点击「新建项目」,再点击「上传视频/音频」选择本地视频/音频文件
方式二:点击「一键生成熟肉(全自动模式)」,然后粘贴 YouTube/Bilibili 链接,点击解析
- 目标语言:翻译目标语言(如:简体中文)
- 类型:这个视频是什么类型的?程序已经预置了一些常见的类型,如果你希望更具体的向AI说明,可以选择「自定义」,然后在下方文本框中输入更详细的描述
- 术语表提取:可选,在「设置」-「增强」开启。开启后将会自动从视频或音频中提取术语(不需要你手动上传术语表!),提升专业术语翻译准确度
- 说话人识别:可选,在「设置」-「增强」开启。开启后可区分不同说话人,适合访谈/电台类视频(例如声优活动、声优电台等等需要区分两位以上说话人的场景)
点击「开始」按钮,MioSub 将自动执行:
- 🎵 音频提取与降噪
- 🎙️ AI 语音转写
- 📚 术语表智能提取
- 🧠 上下文感知翻译
- ⚡ 时间轴精准对齐
处理完成后,你可以在编辑器中:
- 实时预览字幕效果
- 修改译文内容
- 调整时间轴
- 批量替换术语或其他有问题的内容
- 重新生成不满意的段落
- 让AI润色译文
满意后,点击「导出字幕...」或「压制视频」:
- SRT/ASS:纯字幕文件
- 视频压制:直接压制字幕到视频
🎉 恭喜!
你已经成功生成了第一个专业级 AI 字幕!
接下来探索
- 本地 Whisper 配置 - 离线转写,更快更私密
- 强制对齐配置 - 毫秒级精准时间戳