易魔声(EmotiVoice)是由网易有道开发的开源语音合成(TTS)引擎,它支持中英文双语,并且包含了2000多种不同的音色。EmotiVoice的独特之处在于其特色的情感合成功能,可以合成包含快乐、兴奋、悲伤、愤怒等广泛情感的语音,使得合成语音更加自然逼真。
如果您的电脑配备英伟达显卡,可以使用Docker进行快速安装。
首先,确保您已经安装了Docker环境和英伟达容器工具包。
使用以下命令启动EmotiVoice容器:
docker run -dp 127.0.0.1:8501:8501 syq163/emoti-voice:latest
安装完成后,访问http://localhost:8501
即可开始使用EmotiVoice。
完整安装需要您手动安装一些依赖和环境。
安装Anaconda:
访问Anaconda官网下载Anaconda安装程序。
安装Anaconda时,建议选择非C盘的安装位置。
创建Conda环境:
打开Anaconda Prompt或终端,创建名为EmotiVoice的Conda环境:
conda create -n EmotiVoice python=3.11 -y
激活新创建的环境:
conda activate EmotiVoice
安装必要的Python库:
安装torch、torchaudio等库:
pip install torch torchaudio
安装其他依赖库:
pip install numpy numba scipy transformers==4.26.1 soundfile yacs g2p_en jieba pypinyin
安装streamlit用于运行网页界面:
pip install streamlit
下载EmotiVoice项目:
安装git并从GitHub克隆EmotiVoice项目:
git clone https://github.com/netease-youdao/EmotiVoice.git
下载模型:
由于直接从官方下载模型可能会遇到问题,建议使用国内网盘下载模型文件。
启动EmotiVoice:
进入EmotiVoice项目目录,运行以下命令启动网页界面:
streamlit run demo_page.py
如果遇到编码错误,需要更改EmotiVoice/config/joint目录下的config.py文件中的编码格式。
启动EmotiVoice网页界面:
如果您使用的是Docker安装,直接访问http://localhost:8501
。
如果您使用的是完整安装,运行streamlit run demo_page.py
后,访问http://localhost:8501
。
合成语音:
在网页界面中,选择说话人、填写语气和文本,选择语言。
点击“合成”按钮,EmotiVoice将生成符合您要求的语音。
目前EmotiVoice仍处于早期阶段,可能存在一些问题,如音色以外国人为主、中英文混搭可能导致错误等。
官方团队正在积极改进和修正已知问题,建议用户关注更新。