EmotiVoice 是网易有道 AI 团队开源的一个强大的 [[TTS]] 引擎,支持中英文双语,包含 2000 多种不同的音色,以及特色的情感合成功能,支持合成包含快乐、兴奋、悲伤、愤怒等广泛情感的语音。上线一周时间便获得了 4000 多星的成绩,并且荣登了 GitHub Trending 榜首。

首先我们来解释一下什么是 TTS,TTS 是 Text-to-Speech 的缩写,就是「文本到语音」的技术,是一种将文本内容转换成语音输出的技术。

功能

  • 中英文双语
  • 2000 多种不同音色
  • 情感合成,语音更有表现力
  • 网页界面,提供了简洁直观的网页界面
  • 批量生成接口,API

pQ5b6MsYk-

EmotiVoice 支持几十种声音选择,支持调节语速,音量,Pitch(音高),还能直接导出 mp3 或者 wav 格式。

音高指的是人耳感知到的声音的高低,人耳对声音频率高低的主观感知。它是声音的三大基本属性之一,与音量(loudness)和音色(timbre)并列。

Pitch 主要由声音的基频决定,基频越高,音高越高。

安装

可以通过官方的站点下载 macOS 的安装包

注意当前仅仅支持 Apple Silicon 芯片 M 系列设备。

如果安装之后打开报错:

“emotivoice” is damaged and can’t be opened. You should move it to the Trash.

那么需要执行如下的命令1

sudo xattr -r -d com.apple.quarantine /Applications/emotivoice.app

然后就可以正常打开 EmotiVoice。