ailia_tokenizer
1.4.0.0
|
ailia TokenizerはUnityやC++から使用できるNLP向けトークナイザです。トークナイザは、テキストをAIが扱えるトークンに変換したり、トークンをテキストに戻したりすることができます。
Whisper、CLIP、XLMRoberta、Marian、BERT Japanese WordPiece、BERT Japanese Character、T5、Roberta、BERT、GPT2、LLAMAに対応しています。
Mecabを使用する日本語のトークナイズに対応しています。
UKFC形式に自動的に正規化します。
C APIに加えて、C# API とUnity Pluginを提供しているため、Unityを使用したアプリケーションに簡単に音声認識を実装可能です。
ailia TokenizerはWindows、macOS、Linux、iOS、Androidで動作します。