常用网站 影音工具
AI语音合成克隆变声合集

大厂出品
◾️【腾讯】声咖-智能、快捷、高效的音视频创作平台
https://shengka.ai.sogou.com/
◾️【搜狗】智影-在线智能视频创作平台
https://zenvideo.qq.com/home
◾️【讯飞】开放平台-以语音交互为核心的人工智能开放平台
https://www.xfyun.cn/
◾️【阿里云】语音合成TTS_智能客服_文字转语音_AI配音_机器朗读
https://ai.aliyun.com/nls/tts
◾️ 【网易工作台】AI 智能语音识别自动生成字幕
https://jianwai.youdao.com/
◾️【有道同传】
https://tongchuan.youdao.com/
◾️【飞书】
https://www.feishu.cn/
名字换算后价格价格免费额度每月500分钟$1.2美金/小时$0.02美金/分钟IBM谷歌$0.006美金/15秒$1.44美金/小时每月60分钟$1.44美金/小时每月60分钟$0.0004美金/每秒亚马逊$1美金/小时微软AZURE每月300分钟$1美金/1小时每月10小时3.2元/小时腾讯3.2元/小时每天2小时2.5元/小时阿里云2.5元/小时5小时一次性9.9元/小时¥198.00/20小时讯飞
image.png

⚫语音合成
最新VITS2中文语音合成
只需上传一段语音素材,程序自动将语音切片、标注、预处理,一键训练
https://github.com/KevinWang676/VITS2-Chinese
🟣音频to文本
把你的声音转化成文字,实时展示在文本框中
https://github.com/SevaSk/ecoute
简易的 Whisper 客户端,使用 OpenAI API 进行语音转文字
https://www.appinn.com/transcribe-audio-open-ai-whisper-api-web-ui/
本地语音转文字工具,支持 GPU、支持实时语音转换
https://github.com/Const-me/Whisper
开源、可离线的实时语音转文字工具
https://github.com/chidiwilliams/buzz
开源、可离线的实时语音转文字工具
https://github.com/chidiwilliams/buzz
Insanely Fast Whisper 语音转文字
https://github.com/chenxwh/insanely-fast-whisper
把你的声音转化成文字,实时展示在文本框中
https://github.com/SevaSk/ecoute
简易的 Whisper 客户端,使用 OpenAI API 进行语音转文字
https://www.appinn.com/transcribe-audio-open-ai-whisper-api-web-ui/
本地语音转文字工具,支持 GPU、支持实时语音转换
https://github.com/Const-me/Whisper
开源Python语音识别库,AI字幕神器,语音生成字幕工具
https://github.com/m-bain/whisperX
DeepSpeech是一款开源嵌入式(离线、设备上)语音转文本引擎
https://github.com/mozilla/DeepSpeech
Ecoute把你的声音转化成文字,实时展示在文本框中
https://github.com/SevaSk/ecoute
stt一个离线运行的本地语音识别转文字服务,输出json、srt字幕带时间戳、纯文字格式
https://github.com/jianchang512/stt
语音转文本
https://www.gladia.io/
Whisper Web直接在浏览器中进行 ML 驱动的语音识别
https://huggingface.co/spaces/Xenova/whisper-web
Caps Writer一款电脑语音输入工具,运行后,按下大写锁定键超过 0.3 秒,就开始语音识别,松开按键之后,自动输入识别结果
https://gitee.com/haujet/CapsWriter
https://github.com/HaujetZhao/CapsWriter
🤖 字幕组机翻小助手
【功能1:翻译字幕文件】 .srt .ass .vtt 【功能2:语音转文字】
https://github.com/1c7/Translate-Subtitle-File
【MacOS】EngineerDraft语音识别
https://www.engineerdraft.com/bemyears/
基于深度学习的中文语音识别系统
https://asrt.ailemon.net/
https://github.com/nl8590687/ASRT_SpeechRecognition
基于序列到序列的语音处理引擎的开源实现
https://github.com/athena-team/athena
https://athena-team.readthedocs.io/en/latest/
生产优先和生产就绪的端到端语音识别工具包
https://wenet.org.cn/wenet/
https://github.com/wenet-e2e/wenet
pyTranscriber 可用于通过友好的图形用户界面为音频/视频文件生成自动转录/自动字幕
https://github.com/raryelcostasouza/pyTranscriber
Memo-AIYouTube、播客、本地音频视频轻松转文本、字幕并翻译、合成新的语音,还可以由多种 AI 模型提炼内容精华
https://memo.ac/zh/
免费 离线 免安装 多语言AI语音转字幕工具
https://whisper.godlucky.net/
TMSpeech 1.0免费实时语音转字幕软件
https://www.52pojie.cn/thread-1918587-1-1.html
https://pan.baidu.com/s/1GPHvaa-YdzhF-I7dK08E1Q 提取码:3dbm
音视频的文本提取和总结
https://notegpt.io/audio-summary
本地语音转文字 STT Powered by Faster Whisper CPU可用
https://www.52pojie.cn/thread-1954443-1-1.html
https://pan.baidu.com/s/1KJGmUezVOJ9XpmUCe3ljDg 密码:mu4h
CapsWriter 的离线版,一个好用的 PC 端的语音输入工具
两个功能:
1. 按下键盘上的 大写锁定键,录音开始,当松开 大写锁定键 时,就会识别你的录音,并将识别结果立刻输入
2. 将音视频文件拖动到客户端打开,即可转录生成 srt 字幕
https://github.com/HaujetZhao/CapsWriter-Offline
https://www.52pojie.cn/thread-1902715-1-1.html
【工具】音视频转文字字幕小工具V1.2
支持:win10、win11
https://pan.quark.cn/s/1ad3880b42e2
https://pan.baidu.com/s/1UOV0orx6GhgMfoyETcNe0 密码:9p2x
相关知识:
1,Whisperv-large-2和v3模型:
OpenAI Whisper 新一代语音技术(更新至v3)
https://zhuanlan.zhihu.com/p/662906303
2,计算精度:
【基础知识】彻底搞懂float16与float32的计算方式
https://blog.csdn.net/chen1234520nnn/article/details/120846619
int8 int16 int32 int64 float16 float32
https://cloud.tencent.com/developer/article/2115304
3,数据类型概述
https://zhuanlan.zhihu.com/p/378448502
🟢文本to音频
TTS用于文本转语音的深度学习工具包 - https://github.com/coqui-ai/tts
微软语音合成工具 - https://github.com/LokerL/tts-vue
bark - https://github.com/suno-ai/bark
WhisperSpeech - https://github.com/collabora/WhisperSpeech
edge-tts - https://github.com/rany2/edge-tts
EmotiVoice - https://github.com/netease-youdao/EmotiVoice/blob/main/README.zh.md
VALL-E-X - https://github.com/Plachtaa/VALL-E-X
AudioLDM2 - https://github.com/haoheliu/AudioLDM2
ElevenLabs - https://elevenlabs.io/
Gradio - http://genshinvoice.top/
Uberduck - https://app.uberduck.ai/text-to-voice
TextToSpeech - https://www.text-to-speech.cn/
XTTS - https://huggingface.co/coqui/XTTS-v2
VITS - https://huggingface.co/docs/transformers/model_doc/vits
YourTTS - https://github.com/Edresson/YourTTS
FastSpeech2 - https://github.com/DigitalPhonetics/IMS-Toucan
TorToiSe - https://github.com/neonbjb/tortoise-tts
Pheme - https://github.com/PolyAI-LDN/pheme
EmotiVoice - https://github.com/netease-youdao/EmotiVoice
StyleTTS 2 - https://github.com/yl4579/StyleTTS2
pflowtts_pytorch - https://github.com/p0p4k/pflowtts_pytorch
VALL-E - https://github.com/enhuiz/vall-e
OpenVoice - https://github.com/myshell-ai/OpenVoice
Bark - https://github.com/suno-ai/bark
Piper - https://github.com/rhasspy/piper/
Grad-TTS - https://github.com/WelkinYang/GradTTS
Matcha-TTS - https://github.com/shivammehta25/Matcha-TTS
edge-tts - https://github.com/rany2/edge-tts
Bert-VITS2 - https://github.com/fishaudio/Bert-VITS2
naturalspeech2-pytorch - https://github.com/lucidrains/naturalspeech2-pytorch
微软azure - https://github.com/x-dr/tts
M2UGen - https://github.com/shansongliu/M2UGen
AudioGPT - https://github.com/AIGC-Audio/AudioGPT
Bert-VITS2-ext - https://github.com/see2023/Bert-VITS2-ext
TTS-Online - https://www.ttson.cn/
在线免费文字转语音TTSMaker - https://ttsmaker.com/zh-cn
在线文字转语音Text To Speech Free - https://ttsfree.com/
在线文本转语音ttsMP3 - https://ttsmp3.com/
tortoise-tts - https://github.com/neonbjb/tortoise-tts
Neural-HMM - https://github.com/shivammehta25/Neural-HMM
OverFlow - https://github.com/shivammehta25/OverFlow
xVA-Synth - https://github.com/DanRuta/xVA-Synth
HierSpeechpp - https://github.com/sh-lee-prml/HierSpeechpp
silero-models - https://github.com/snakers4/silero-models
Android系统TTS应用 https://github.com/jing332/tts-server-android
琅琅配音 https://www.lang123.top/
微软文字转语音工具edge-tts UI https://github.com/smallnew666/edge-tts
免费文字转语音 https://www.text-to-speech.online/
TTS - 文本转语音 http://www.ttsonline.cn/
在线免费文字转语音 - TTSMaker https://ttsmaker.com/zh-cn
文本转语音工具一键服务端+web客户端
https://www.52pojie.cn/thread-1894816-1-1.html
https://36000.lanzoub.com/iLt3E1pp9ete
将文本和语音转成超级漂亮的视频
https://videosora.app/zh-cn/
可离线的文本转语音工具MultiTTS v1.3.5.2 (听书专用,附海量语音包)
https://www.52pojie.cn/thread-1906366-1-1.html
https://www.123pan.com/s/A2D9-Gu2X.html 密码:r2wo
https://pan.baidu.com/s/1kvDGW0QX3oVq0MejLuU3NA 密码:aium
一点红语音合成2.0版本 -吾爱专版
https://www.52pojie.cn/thread-1908072-1-1.html
https://www.123pan.com/s/9KtDVv-V6o7A.html 提取码:52pj
ChatTTS
https://github.com/2noise/ChatTTS/blob/main/README_CN.md
🟡语音克隆/变声
一款实时变声器/语音转换客户端,支持Windows和Mac
它可以实时变声成其他人或者虚拟角色的音色
https://github.com/w-okada/voice-changer
一个基于VITS的简单易用的变声框架
https://github.com/RVC-Project/Retrieval-based-Voice-Conversion-WebUI
歌声音色转换模型
https://github.com/svc-develop-team/so-vits-svc
开源歌声转换项目,致力于开发可以在个人电脑上普及的自由AI变声器软件
https://github.com/yxlllc/DDSP-SVC/blob/master/cn_README.md
人工智能实时语音转换器
https://github.com/isletennos/MMVC_Trainer
AI声音克隆
https://github.com/Plachtaa/VALL-E-X
OpenVoice:多功能即时语音克隆
https://research.myshell.ai/open-voice
1分钟的语音数据也可以用来训练一个好的TTS模型!
https://github.com/RVC-Boss/GPT-SoVITS
使用AI的实时变声器(Trainer)
https://github.com/isletennos/MMVC_Trainer
开源歌声转换项目,致力于开发可以在个人电脑上普及的自由 AI 变声器软件
https://github.com/yxlllc/DDSP-SVC/blob/master/cn_README.md
一个基于VITS的简单易用的变声框架
https://github.com/RVC-Project/Retrieval-based-Voice-Conversion-WebUI/blob/main/README.md
实时变声器
https://github.com/w-okada/voice-changer
通过 MyShell 进行即时语音克隆
https://research.myshell.ai/open-voice
https://github.com/myshell-ai/OpenVoice
clone-voice一个带web界面的声音克隆工具,使用你的音色或任意声音来录制音频
https://github.com/jianchang512/clone-voice
Voice-Changer一款实时语音转换客户端,支持Windows和Mac,它可以实时变声成其他人或者虚拟角色的音色
https://github.com/w-okada/voice-changer
耗时两个月自主研发的低成本AI音色克隆软件,免费送给大家!【GPT-SoVITS】
视频:https://www.bilibili.com/video/BV12g4y1m7Uw
教程:https://www.yuque.com/baicaigongchang1145haoyuangong/ib3g1e
项目:https://github.com/RVC-Boss/GPT-SoVITS
吾爱:https://www.52pojie.cn/thread-1886747-1-2.html
下载:https://www.123pan.com/s/5tIqVv-GVRcv.html
下载:https://pan.baidu.com/s/1OE5qL0KreO-ASHwm6Zl9gA 提取码:mqpi
VoiceCraft:官宣超过XTTS的语音模型
支持克隆音频,支持通过修改原始音频的文本来编辑音频
https://github.com/jasonppy/VoiceCraft
精准转写:利用 Whisper 处理音视频转文字-不完全指南
https://zj1123581321.com/post/liao-liao-gao-jing-du-yin-shi-pin-zhuan-wen-zi-gong-zuo-liu/

相关导航

暂无评论

暂无评论...