v3.0.9 已发布 · 全新 GPT-M2 智能生图工作台

让 AI 替你创作
爆款影视解说

上传视频,解说猫 自动分析、生成解说词、配音、加字幕, 一键导出 剪映草稿,让你比同行快 10 倍出片。

12+
解说写作风格
13
支持语言
10×
出片效率提升
为什么选择解说猫

把繁琐的解说视频流程
压缩成一杯咖啡的时间

从场景识别、解说词撰写到 AI 配音、字幕、剪映草稿,全程自动化

真正懂剧情的 AI

基于多模态视觉模型逐帧分析视频内容,理解剧情走向、人物关系、关键情节,写出有血有肉的解说词,而非套模板。

12+ 种解说人格

电影/电视剧/综艺/动漫/短剧/体育/纪录片… 每种风格都有完整的角色设定、开头钩子、叙事结构,告别千篇一律。

13 种语言一键切换

中/英/日/韩/泰/越/西/葡/俄/法/德/印尼/马来全本地化,不只是翻译,而是按目标语言重新创作。出海创作者必备。

专业级 AI 配音

内置 Edge TTS 多音色 + IndexTTS 声音克隆,可用自己的声音合成解说,让粉丝认得出你。

智能穿插原片高光

AI 自动识别视频极燃片段,智能插入到开头和过渡处,让你的解说节奏更紧凑,留人率倍增。

一键导出剪映草稿

视频片段、配音、字幕、转场全部就位的剪映草稿,打开即可微调发布,告别手动拖时间轴的痛苦。

极简工作流

从源视频到爆款解说,
只需 3 步

上手 30 秒,第一支视频成片不到 5 分钟

导入视频 + 选风格

支持单/多视频批量上传,可设置截取范围。从 12+ 种解说风格中选一种,或自定义角色设定与目标字数。

AI 自动生成全流程

场景检测 → 视觉分析 → 解说词撰写 → 字幕匹配 → AI 配音,全自动并发处理,进度实时可见。

一键导出剪映草稿

导出后直接在剪映打开,所有片段、配音、字幕、原片穿插都已对齐,微调即可发布抖音/B 站/西瓜。

完整功能矩阵

解说创作者的瑞士军刀

三种生成模式 + 全套 AI 工具箱,覆盖从素材到发布的每一个环节

🤖

AI 帮我写

仅需视频,自动生成完整解说

📝

我有文案

提供文案,AI 智能匹配视频片段

🎯

文案配视频

精确控制每段对应哪个画面

🎥

多视频合成

多个视频源混剪一支解说

🔇

原声穿插

AI 智能保留关键原片对话

🎙️

声音克隆

用你自己的声音做解说配音

📺

字幕样式

6 套预设 + 阅读模式可选

🩹

字幕遮盖

自动遮盖原视频字幕

📦

视频压缩

一键压缩,节省 80% 空间

🔊

视频音频合并

替换/混音多音轨叠加

🎤

口播助手

自动剪掉口播停顿

🎨

GPT-M2 生图

对话式 AI 生图工作台

📤

剪映草稿

一键导出,打开即用

📜

SRT 导出

导出标准字幕文件

流式生成

实时看到 AI 思考过程

🛡️

断点续跑

意外退出可恢复任务

v3.0.9 全新功能

GPT-M2 智能生图工作台

iOS 风格对话式生图界面,左边管理多轮会话,右边像 ChatGPT 一样直接出图。支持本地图生图、9 种屏幕比例、多轮上下文连贯创作,做封面、做分镜、做素材一体搞定。

  • 对话式生图,像聊天一样调整画面,无需写复杂 prompt
  • 支持本地图片图生图:拖入参考图自动转 base64 多模态提交
  • 9 种比例可选:1:1、16:9、9:16、2.35:1 电影宽幅等
  • 会话自动保存,多轮风格连贯,历史可随时调出
立即体验 GPT-M2 →
出海创作者

13 种语言原生级解说

不是简单翻译,而是按目标语言文化重新创作的本地化解说词

🇨🇳
中文
🇺🇸
English
🇯🇵
日本語
🇰🇷
한국어
🇹🇭
ไทย
🇮🇩
Indonesia
🇻🇳
Tiếng Việt
🇲🇾
Melayu
🇪🇸
Español
🇵🇹
Português
🇷🇺
Русский
🇫🇷
Français
🇩🇪
Deutsch
免费下载 · Windows 10/11

现在开始,做第一支解说视频

免费使用,无需注册。下载即用,几分钟就能完成你的第一支爆款解说。

前往 GitHub Releases → 查看源码与文档

当前最新版本 v3.0.9 · 发布于 2026-04-27 · Windows 10/11 (64-bit)

常见问题

你想问的,这里都有答案

解说猫支持哪些操作系统?

目前支持 Windows 10 / Windows 11(64 位)。macOS 与 Linux 版本规划中,敬请期待。

解说猫是免费的吗?

解说猫主程序永久免费下载与使用。AI 解说词生成需要您自备大模型 API(兼容 OpenAI / Gemini / Claude / 国产模型 等多种服务商)。本地配音 Edge TTS 与场景检测全部免费,无需任何 API Key。

需要什么硬件配置?

最低配置:Windows 10/11 64 位、8GB 内存、20GB 磁盘空间。推荐配置:16GB+ 内存、独立 GPU(NVIDIA 显卡可加速场景检测与字幕识别)。完全 CPU 模式下也能正常工作,仅速度略慢。

支持哪些视频平台发布?

解说猫一键导出 剪映草稿,剪映打开后可直接发布到抖音、B 站、西瓜视频、快手、视频号、小红书等所有主流平台。也可导出 SRT 字幕文件用于其他剪辑软件。

生成的解说视频版权归谁?

解说猫生成的解说词、配音、字幕等内容版权归您所有。但请注意您使用的原视频素材的版权与各平台的二创规则。建议参考目标平台的二创/解说政策。

可以使用自己的声音配音吗?

可以。内置 IndexTTS 声音克隆功能,提供 10-30 秒清晰录音样本即可克隆出您自己的声音用于全程解说,让观众对你的声音产生记忆点。

新版本如何升级?

软件内置自动更新检查。也可在本页面下载增量更新包,拖入软件的更新页面即可一键升级,无需重装。所有项目和设置都会保留。

遇到问题去哪里反馈?

请前往 GitHub Issues 提交问题,开发团队会在 24 小时内响应。也可加入官方交流群获得实时帮助。

免费下载 v3.0.9 看演示