COEIRONKのエンジンをUbuntuで動かす
IPFactory Advent Calender 2022 19日目の記事です。
COEIROINKとは
COEIROINKはシロワニさんが開発しており、VOICEVOX派生のテキスト読み上げソフトです。
公式での対応環境はWindows(CPU,GPU)とMac(CPU)です。
きっかけ
我正在开发一个用于Discord的朗读机器人(0kqBee),并且希望能够适用于COEIROINK。然而,正如上述所示,官方只适配了Windows和Mac,而专门为COEIROINK准备Windows环境太麻烦了。
使用した環境
OS: Ubuntu 20.04 LTS
GPU: RTX3060 12GB
Python 3.8.10
手順
今回はGPU版を動かします。
CUDA 11.3以上に対応したGPUが必要です。
CPUのみの場合も基本的には同じ手順で動きます。
VOICEVOXと構造が似ているのでVOICEVOXをソースから動かしたことがある人であればおそらく簡単です。
1. 克隆存储库
COEIROINKのソースはGitHubで公開されています。
https://github.com/shirowanisan/voicevox_engine
$ git clone https://github.com/shirowanisan/voicevox_engine.git
ブランチをc-1.6.0+v-0.12.3+gpuに切り替え
$ cd voicevox_engine
$ git checkout c-1.6.0+v-0.12.3+gpu
2. 必要なパッケージのインストール
requirements.txtだけではespnetが不足していると怒られるためインストール
$ pip install -r requirements.txt
$ pip install typing-extensions>=4.1.0
$ pip install espnet
3. 添加音频库
如果继续启动,将会因为没有speaker_info而产生错误。
请从这里下载并安装您喜欢的语音库。
这次我们使用的是TsuKuYoMi-Chan。
$ mkdir speaker_info
$ wget -O tsukuyomi_chan.zip https://www.dropbox.com/s/lvxit2svbi1dvdf/3c37646f-3881-5374-2a83-149267990abc.zip?dl=1
$ unzip tsukuyomi_chan.zip -d speaker_info
4. 起動
–host 0.0.0.0でlocalhost以外からのアクセスを許可
–use_gpuでGPU処理を指定
$ python run.py --host 0.0.0.0 --use_gpu
感想
VOICEVOXと構造が似ているせいか普通に動きます。
試したらGoogle Colabでも動きました。
そしてVOICEVOXよりもVRAM消費が少ないのがGood
読み上げBOTでも問題なく使えてます。
課題
MYCOE対応による弊害なのか、前回のリクエストと違うspeaker_idのリクエストが飛んでくると数秒ほど処理が遅れます。(おそらくモデルの読み込みが入る)
18日目の記事
futabatoさん
20日目の記事
n01e0さん
https://feneshi.co/chromoly/