易魔声(EmotiVoice)安装与使用教程

分享   2024-04-19 15:42   88   0  

易魔声(EmotiVoice)安装与使用教程

简介

易魔声(EmotiVoice)是由网易有道开发的开源语音合成(TTS)引擎,它支持中英文双语,并且包含了2000多种不同的音色。EmotiVoice的独特之处在于其特色的情感合成功能,可以合成包含快乐、兴奋、悲伤、愤怒等广泛情感的语音,使得合成语音更加自然逼真。

安装步骤

1. Docker安装(推荐给有英伟达显卡的用户)

如果您的电脑配备英伟达显卡,可以使用Docker进行快速安装。

  • 首先,确保您已经安装了Docker环境和英伟达容器工具包。

  • 使用以下命令启动EmotiVoice容器:

    docker run -dp 127.0.0.1:8501:8501 syq163/emoti-voice:latest
  • 安装完成后,访问http://localhost:8501即可开始使用EmotiVoice。

2. 完整安装(适用于所有用户)

完整安装需要您手动安装一些依赖和环境。

  • 安装Anaconda

    • 访问Anaconda官网下载Anaconda安装程序。

    • 安装Anaconda时,建议选择非C盘的安装位置。

  • 创建Conda环境

    • 打开Anaconda Prompt或终端,创建名为EmotiVoice的Conda环境:

      conda create -n EmotiVoice python=3.11 -y
    • 激活新创建的环境:

      conda activate EmotiVoice
  • 安装必要的Python库

    • 安装torch、torchaudio等库:

      pip install torch torchaudio
    • 安装其他依赖库:

      pip install numpy numba scipy transformers==4.26.1 soundfile yacs g2p_en jieba pypinyin
    • 安装streamlit用于运行网页界面:

      pip install streamlit
  • 下载EmotiVoice项目

    • 安装git并从GitHub克隆EmotiVoice项目:

      git clone https://github.com/netease-youdao/EmotiVoice.git
  • 下载模型

    • 由于直接从官方下载模型可能会遇到问题,建议使用国内网盘下载模型文件。

  • 启动EmotiVoice

    • 进入EmotiVoice项目目录,运行以下命令启动网页界面:

      streamlit run demo_page.py
    • 如果遇到编码错误,需要更改EmotiVoice/config/joint目录下的config.py文件中的编码格式。

使用方法

  1. 启动EmotiVoice网页界面

  • 如果您使用的是Docker安装,直接访问http://localhost:8501

  • 如果您使用的是完整安装,运行streamlit run demo_page.py后,访问http://localhost:8501

合成语音

  • 在网页界面中,选择说话人、填写语气和文本,选择语言。

  • 点击“合成”按钮,EmotiVoice将生成符合您要求的语音。

注意事项

  • 目前EmotiVoice仍处于早期阶段,可能存在一些问题,如音色以外国人为主、中英文混搭可能导致错误等。

  • 官方团队正在积极改进和修正已知问题,建议用户关注更新。


博客评论
还没有人评论,赶紧抢个沙发~
发表评论
说明:请文明发言,共建和谐网络,您的个人信息不会被公开显示。