ailia_voice  1.1.0.0
機能

ailia AI Voiceの機能

本ページでは、CとC#で共通に使用できる機能を解説します。

音声合成

音声合成モデル

ailia AI Voiceでは、音声合成のアルゴリズムにTacotron2とGPT-SoVITSを使用することができます。

日本語の音声合成

日本語を音声合成するには、日本語のテキストを音素に変換する必要があり、音素への変換にはOpenJtalkを使用しています。OpenJtalkはailia AI Voiceのライブラリに内蔵しています。

任意の声色での音声合成

GPT-SoVITSを使用した場合、10秒程度の音声ファイルを与えることで、任意の声色で音声合成を行うことが可能です。

GPUの使用

WindowsとLinux環境ではcuDNNを使用したGPU推論が可能です。 cuDNNを使用するには、NVIDIAのサイトから、CUDA ToolkitとcuDNNをインストールする必要があります。

CUDA Toolkitはインストーラに沿ってインストールしてください。cuDNNはダウンロード後に、環境変数のPATHに通してください。cuDNNのダウンロードにはNVIDIAのデベロッパー登録が必要です。