ailia_speech
1.4.0.0
|
クラス | |
struct | AILIASpeechApiCallback |
class | AILIASpeechText |
公開メンバ関数 | |
delegate int | ailiaCallbackAudioGetFrameLen (ref Int32 a, int b, int c, int d, int e) |
delegate int | ailiaCallbackAudioGetMelSpectrogram (IntPtr a, IntPtr b, int c, int d, int e, int f, int g, int h, int i, int j, float k, int l, float m, float n, int o, int p, int q) |
delegate int | ailiaCallbackAudioResample (IntPtr a, IntPtr b, int c, int d, int e, int f) |
delegate int | ailiaCallbackAudioGetResampleLen (IntPtr a, int b, int c, int d) |
delegate int | ailiaCallbackTokenizerCreate (IntPtr a, int b, int c) |
delegate int | ailiaCallbackTokenizerOpenModelFileA (IntPtr a, IntPtr b) |
delegate int | ailiaCallbackTokenizerOpenModelFileW (IntPtr a, IntPtr b) |
delegate int | ailiaCallbackTokenizerEncode (IntPtr a, IntPtr b) |
delegate int | ailiaCallbackTokenizerGetTokenCount (IntPtr a, IntPtr b) |
delegate int | ailiaCallbackTokenizerGetTokens (IntPtr a, IntPtr b, uint c) |
delegate int | ailiaCallbackTokenizerDecode (IntPtr a, IntPtr b, uint c) |
delegate int | ailiaCallbackTokenizerGetTextLength (IntPtr a, IntPtr b) |
delegate int | ailiaCallbackTokenizerGetText (IntPtr a, IntPtr b, uint c) |
delegate void | ailiaCallbackTokenizerDestroy (IntPtr a) |
delegate int | ailiaCallbackTokenizerUtf8ToUtf32 (IntPtr a, IntPtr b, IntPtr c, uint d) |
delegate int | ailiaCallbackTokenizerUtf32ToUtf8 (IntPtr a, IntPtr b, uint c) |
delegate int | ailiaCallbackCreate (IntPtr a, int b, int c) |
delegate int | ailiaCallbackOpenWeightFileA (IntPtr a, IntPtr b) |
delegate int | ailiaCallbackOpenWeightFileW (IntPtr a, IntPtr b) |
delegate int | ailiaCallbackOpenWeightMem (IntPtr a, IntPtr b, UInt32 c) |
delegate int | ailiaCallbackSetMemoryMode (IntPtr a, UInt32 b) |
delegate void | ailiaCallbackDestroy (IntPtr a) |
delegate int | ailiaCallbackUpdate (IntPtr a) |
delegate int | ailiaCallbackGetBlobIndexByInputIndex (IntPtr a, IntPtr b, uint c) |
delegate int | ailiaCallbackGetBlobIndexByOutputIndex (IntPtr a, IntPtr b, uint c) |
delegate int | ailiaCallbackGetBlobData (IntPtr a, IntPtr b, uint c, uint d) |
delegate int | ailiaCallbackSetInputBlobData (IntPtr a, IntPtr b, uint c, uint d) |
delegate int | ailiaCallbackSetInputBlobShape (IntPtr a, Ailia.AILIAShape b, uint c, uint d) |
delegate int | ailiaCallbackGetBlobShape (IntPtr a, IntPtr b, uint c, uint d) |
delegate IntPtr | ailiaCallbackGetErrorDetail (IntPtr a) |
delegate int | ailiaCallbackCopyBlobData (IntPtr a, uint b, IntPtr c, uint d) |
delegate int | ailiaCallbackGetEnvironment (IntPtr a, uint b, uint d) |
delegate int | ailiaIntermediateCallback (IntPtr handle, IntPtr text) |
static int | ailiaCreate (IntPtr net, int env_id, int num_thread) |
static int | ailiaOpenWeightFileW (IntPtr net, IntPtr path) |
static int | ailiaOpenWeightFileA (IntPtr net, IntPtr path) |
static int | ailiaOpenWeightMem (IntPtr net, IntPtr buf, uint buf_size) |
static int | ailiaAudioGetMelSpectrogram (IntPtr dst, IntPtr src, int sample_n, int sample_rate, int fft_n, int hop_n, int win_n, int win_type, int max_frame_n, int center, float power, int fft_norm_type, float f_min, float f_max, int mel_n, int mel_norm_type, int mel_formula) |
static int | ailiaGetBlobIndexByInputIndex (IntPtr net, IntPtr blob_idx, UInt32 input_blob_idx) |
static int | ailiaGetBlobIndexByOutputIndex (IntPtr net, IntPtr blob_idx, UInt32 output_blob_idx) |
static int | ailiaGetBlobShape (IntPtr net, IntPtr shape, UInt32 blob_idx, UInt32 version) |
static int | ailiaGetEnvironment (IntPtr net, UInt32 env_idx, UInt32 version) |
static int | ailiaTokenizerCreate (IntPtr net, int type, int flags) |
static int | ailiaTokenizerOpenModelFileA (IntPtr net, IntPtr utf8) |
static int | ailiaTokenizerOpenModelFileW (IntPtr net, IntPtr utf16) |
static int | ailiaTokenizerEncode (IntPtr net, IntPtr utf8) |
static int | ailiaTokenizerGetTokenCount (IntPtr net, IntPtr count) |
static int | ailiaTokenizerGetTextLength (IntPtr net, IntPtr len) |
static int | ailiaTokenizerUtf8ToUtf32 (IntPtr a, IntPtr b, IntPtr c, uint d) |
static int | ailiaTokenizerUtf32ToUtf8 (IntPtr a, IntPtr b, uint c) |
static int | ailiaAudioResample (IntPtr a, IntPtr b, int c, int d, int e, int f) |
static int | ailiaAudioGetResampleLen (IntPtr a, int b, int c, int d) |
static int | ailiaSpeechCreate (ref IntPtr net, int env_id, int num_thread, int memory_mode, int task, int flag, AILIASpeechApiCallback callback, int version) |
ネットワークオブジェクトを作成します。 [詳解] | |
static int | ailiaSpeechOpenModelFile (IntPtr net, string encoder_path, string decoder_path, int model_type) |
モデルを指定します。 [詳解] | |
static int | ailiaSpeechOpenVadFile (IntPtr net, string vad_path, int vad_type) |
無音検知に適用するVADモデルを指定します。 [詳解] | |
static int | ailiaSpeechOpenDictionaryFile (IntPtr net, string dictionary_path, int dictionary_type) |
誤り訂正辞書を指定します。 [詳解] | |
static int | ailiaSpeechOpenPostProcessFile (IntPtr net, string encoder_path, string decoder_path, string source_path, string target_path, IntPtr prefix, int post_process_type) |
後処理に適用するAIモデルを指定します。 [詳解] | |
static int | ailiaSpeechOpenDiarizationFile (IntPtr net, string segmentation_path, string embedding_path, int type) |
話者分離に適用するAIモデルを指定します。 [詳解] | |
static int | ailiaSpeechPushInputData (IntPtr net, float[] src, uint channels, uint samples, uint sampling_rate) |
音声をキューに投入します。 [詳解] | |
static int | ailiaSpeechFinalizeInputData (IntPtr net) |
音声のキューへの投入を終了します。 [詳解] | |
static int | ailiaSpeechBuffered (IntPtr net, ref uint buffered) |
音声認識を行うためのデータが存在するかどうかを判定します。 [詳解] | |
static int | ailiaSpeechComplete (IntPtr net, ref uint complete) |
全てのデータを処理したかどうかを判定します。 [詳解] | |
static int | ailiaSpeechSetPrompt (IntPtr net, IntPtr prompt) |
プロンプトの設定を行います。 [詳解] | |
static int | ailiaSpeechSetConstraint (IntPtr net, IntPtr constraint, int type) |
制約の設定を行います。 [詳解] | |
static int | ailiaSpeechSetLanguage (IntPtr net, string language) |
言語設定を行います。 [詳解] | |
static int | ailiaSpeechSetIntermediateCallback (IntPtr net, ailiaIntermediateCallback callback, IntPtr handle) |
認識の途中結果を取得するコールバックを設定します。 [詳解] | |
static int | ailiaSpeechTranscribe (IntPtr net) |
音声認識を行います。 [詳解] | |
static int | ailiaSpeechPostProcess (IntPtr net) |
後処理を行います。 [詳解] | |
static int | ailiaSpeechGetTextCount (IntPtr net, ref uint count) |
認識したテキストの数を取得します。 [詳解] | |
static int | ailiaSpeechGetText (IntPtr net, [In, Out] AILIASpeechText text, uint version, uint idx) |
認識したテキストを取得します。 [詳解] | |
static int | ailiaSpeechSetText (IntPtr net, [In] AILIASpeechText text, uint version, uint idx) |
ポストプロセス対象のテキストを設定します。 [詳解] | |
static void | ailiaSpeechDestroy (IntPtr net) |
ネットワークオブジェクトを破棄します。 [詳解] | |
static IntPtr | ailiaSpeechGetErrorDetail (IntPtr net) |
エラーの詳細を返します [詳解] | |
static int | ailiaSpeechSetSilentThreshold (IntPtr net, float silent_threshold, float speech_sec, float no_speech_sec) |
無音判定の閾値を設定します。 [詳解] | |
static int | ailiaSpeechResetTranscribeState (IntPtr net) |
ネットワークオブジェクトの内部状態を初期化します。 [詳解] | |
静的公開メンバ関数 | |
static int | ailiaCallbackAudioGetFrameLenBridge (ref Int32 a, int b, int c, int d, int e) |
static int | ailiaCallbackAudioGetMelSpectrogramBridge (IntPtr a, IntPtr b, int c, int d, int e, int f, int g, int h, int i, int j, float k, int l, float m, float n, int o, int p, int q) |
static int | ailiaCallbackAudioResampleBridge (IntPtr a, IntPtr b, int c, int d, int e, int f) |
static int | ailiaCallbackAudioGetResampleLenBridge (IntPtr a, int b, int c, int d) |
static int | ailiaCallbackTokenizerCreateBridge (IntPtr a, int b, int c) |
static int | ailiaCallbackTokenizerOpenModelFileABridge (IntPtr a, IntPtr b) |
static int | ailiaCallbackTokenizerOpenModelFileWBridge (IntPtr a, IntPtr b) |
static int | ailiaCallbackTokenizerEncodeBridge (IntPtr a, IntPtr b) |
static int | ailiaCallbackTokenizerGetTokenCountBridge (IntPtr a, IntPtr b) |
static int | ailiaCallbackTokenizerGetTokensBridge (IntPtr a, IntPtr b, uint c) |
static int | ailiaCallbackTokenizerDecodeBridge (IntPtr a, IntPtr b, uint c) |
static int | ailiaCallbackTokenizerGetTextLengthBridge (IntPtr a, IntPtr b) |
static int | ailiaCallbackTokenizerGetTextBridge (IntPtr a, IntPtr b, uint c) |
static void | ailiaCallbackTokenizerDestroyBridge (IntPtr a) |
static int | ailiaCallbackTokenizerUtf8ToUtf32Bridge (IntPtr a, IntPtr b, IntPtr c, uint d) |
static int | ailiaCallbackTokenizerUtf32ToUtf8Bridge (IntPtr a, IntPtr b, uint c) |
static int | ailiaCallbackCreateBridge (IntPtr a, int b, int c) |
static int | ailiaCallbackOpenWeightFileABridge (IntPtr a, IntPtr b) |
static int | ailiaCallbackOpenWeightFileWBridge (IntPtr a, IntPtr b) |
static int | ailiaCallbackOpenWeightMemBridge (IntPtr a, IntPtr b, uint c) |
static int | ailiaCallbackSetMemoryModeBridge (IntPtr a, uint b) |
static void | ailiaCallbackDestroyBridge (IntPtr a) |
static int | ailiaCallbackUpdateBridge (IntPtr a) |
static int | ailiaCallbackGetBlobIndexByInputIndexBridge (IntPtr a, IntPtr b, uint c) |
static int | ailiaCallbackGetBlobIndexByOutputIndexBridge (IntPtr a, IntPtr b, uint c) |
static int | ailiaCallbackGetBlobDataBridge (IntPtr a, IntPtr b, uint c, uint d) |
static int | ailiaCallbackSetInputBlobDataBridge (IntPtr a, IntPtr b, uint c, uint d) |
static int | ailiaCallbackSetInputBlobShapeBridge (IntPtr a, Ailia.AILIAShape b, uint c, uint d) |
static int | ailiaCallbackGetBlobShapeBridge (IntPtr a, IntPtr b, uint c, uint d) |
static IntPtr | ailiaCallbackGetErrorDetailBridge (IntPtr a) |
static int | ailiaCallbackCopyBlobDataBridge (IntPtr a, uint b, IntPtr c, uint d) |
static int | ailiaCallbackGetEnvironmentBridge (IntPtr a, uint b, uint c) |
static AiliaSpeech.AILIASpeechApiCallback | GetCallback () |
static int ailiaSpeech.AiliaSpeech.ailiaAudioGetMelSpectrogram | ( | IntPtr | dst, |
IntPtr | src, | ||
int | sample_n, | ||
int | sample_rate, | ||
int | fft_n, | ||
int | hop_n, | ||
int | win_n, | ||
int | win_type, | ||
int | max_frame_n, | ||
int | center, | ||
float | power, | ||
int | fft_norm_type, | ||
float | f_min, | ||
float | f_max, | ||
int | mel_n, | ||
int | mel_norm_type, | ||
int | mel_formula | ||
) |
static int ailiaSpeech.AiliaSpeech.ailiaAudioGetResampleLen | ( | IntPtr | a, |
int | b, | ||
int | c, | ||
int | d | ||
) |
static int ailiaSpeech.AiliaSpeech.ailiaAudioResample | ( | IntPtr | a, |
IntPtr | b, | ||
int | c, | ||
int | d, | ||
int | e, | ||
int | f | ||
) |
delegate int ailiaSpeech.AiliaSpeech.ailiaCallbackAudioGetFrameLen | ( | ref Int32 | a, |
int | b, | ||
int | c, | ||
int | d, | ||
int | e | ||
) |
|
inlinestatic |
delegate int ailiaSpeech.AiliaSpeech.ailiaCallbackAudioGetMelSpectrogram | ( | IntPtr | a, |
IntPtr | b, | ||
int | c, | ||
int | d, | ||
int | e, | ||
int | f, | ||
int | g, | ||
int | h, | ||
int | i, | ||
int | j, | ||
float | k, | ||
int | l, | ||
float | m, | ||
float | n, | ||
int | o, | ||
int | p, | ||
int | q | ||
) |
|
inlinestatic |
delegate int ailiaSpeech.AiliaSpeech.ailiaCallbackAudioGetResampleLen | ( | IntPtr | a, |
int | b, | ||
int | c, | ||
int | d | ||
) |
|
inlinestatic |
delegate int ailiaSpeech.AiliaSpeech.ailiaCallbackAudioResample | ( | IntPtr | a, |
IntPtr | b, | ||
int | c, | ||
int | d, | ||
int | e, | ||
int | f | ||
) |
|
inlinestatic |
delegate int ailiaSpeech.AiliaSpeech.ailiaCallbackCopyBlobData | ( | IntPtr | a, |
uint | b, | ||
IntPtr | c, | ||
uint | d | ||
) |
|
inlinestatic |
delegate int ailiaSpeech.AiliaSpeech.ailiaCallbackCreate | ( | IntPtr | a, |
int | b, | ||
int | c | ||
) |
|
inlinestatic |
delegate void ailiaSpeech.AiliaSpeech.ailiaCallbackDestroy | ( | IntPtr | a | ) |
|
inlinestatic |
delegate int ailiaSpeech.AiliaSpeech.ailiaCallbackGetBlobData | ( | IntPtr | a, |
IntPtr | b, | ||
uint | c, | ||
uint | d | ||
) |
|
inlinestatic |
delegate int ailiaSpeech.AiliaSpeech.ailiaCallbackGetBlobIndexByInputIndex | ( | IntPtr | a, |
IntPtr | b, | ||
uint | c | ||
) |
|
inlinestatic |
delegate int ailiaSpeech.AiliaSpeech.ailiaCallbackGetBlobIndexByOutputIndex | ( | IntPtr | a, |
IntPtr | b, | ||
uint | c | ||
) |
|
inlinestatic |
delegate int ailiaSpeech.AiliaSpeech.ailiaCallbackGetBlobShape | ( | IntPtr | a, |
IntPtr | b, | ||
uint | c, | ||
uint | d | ||
) |
|
inlinestatic |
delegate int ailiaSpeech.AiliaSpeech.ailiaCallbackGetEnvironment | ( | IntPtr | a, |
uint | b, | ||
uint | d | ||
) |
|
inlinestatic |
delegate IntPtr ailiaSpeech.AiliaSpeech.ailiaCallbackGetErrorDetail | ( | IntPtr | a | ) |
|
inlinestatic |
delegate int ailiaSpeech.AiliaSpeech.ailiaCallbackOpenWeightFileA | ( | IntPtr | a, |
IntPtr | b | ||
) |
|
inlinestatic |
delegate int ailiaSpeech.AiliaSpeech.ailiaCallbackOpenWeightFileW | ( | IntPtr | a, |
IntPtr | b | ||
) |
|
inlinestatic |
delegate int ailiaSpeech.AiliaSpeech.ailiaCallbackOpenWeightMem | ( | IntPtr | a, |
IntPtr | b, | ||
UInt32 | c | ||
) |
|
inlinestatic |
delegate int ailiaSpeech.AiliaSpeech.ailiaCallbackSetInputBlobData | ( | IntPtr | a, |
IntPtr | b, | ||
uint | c, | ||
uint | d | ||
) |
|
inlinestatic |
delegate int ailiaSpeech.AiliaSpeech.ailiaCallbackSetInputBlobShape | ( | IntPtr | a, |
Ailia.AILIAShape | b, | ||
uint | c, | ||
uint | d | ||
) |
|
inlinestatic |
delegate int ailiaSpeech.AiliaSpeech.ailiaCallbackSetMemoryMode | ( | IntPtr | a, |
UInt32 | b | ||
) |
|
inlinestatic |
delegate int ailiaSpeech.AiliaSpeech.ailiaCallbackTokenizerCreate | ( | IntPtr | a, |
int | b, | ||
int | c | ||
) |
|
inlinestatic |
delegate int ailiaSpeech.AiliaSpeech.ailiaCallbackTokenizerDecode | ( | IntPtr | a, |
IntPtr | b, | ||
uint | c | ||
) |
|
inlinestatic |
delegate void ailiaSpeech.AiliaSpeech.ailiaCallbackTokenizerDestroy | ( | IntPtr | a | ) |
|
inlinestatic |
delegate int ailiaSpeech.AiliaSpeech.ailiaCallbackTokenizerEncode | ( | IntPtr | a, |
IntPtr | b | ||
) |
|
inlinestatic |
delegate int ailiaSpeech.AiliaSpeech.ailiaCallbackTokenizerGetText | ( | IntPtr | a, |
IntPtr | b, | ||
uint | c | ||
) |
|
inlinestatic |
delegate int ailiaSpeech.AiliaSpeech.ailiaCallbackTokenizerGetTextLength | ( | IntPtr | a, |
IntPtr | b | ||
) |
|
inlinestatic |
delegate int ailiaSpeech.AiliaSpeech.ailiaCallbackTokenizerGetTokenCount | ( | IntPtr | a, |
IntPtr | b | ||
) |
|
inlinestatic |
delegate int ailiaSpeech.AiliaSpeech.ailiaCallbackTokenizerGetTokens | ( | IntPtr | a, |
IntPtr | b, | ||
uint | c | ||
) |
|
inlinestatic |
delegate int ailiaSpeech.AiliaSpeech.ailiaCallbackTokenizerOpenModelFileA | ( | IntPtr | a, |
IntPtr | b | ||
) |
|
inlinestatic |
delegate int ailiaSpeech.AiliaSpeech.ailiaCallbackTokenizerOpenModelFileW | ( | IntPtr | a, |
IntPtr | b | ||
) |
|
inlinestatic |
delegate int ailiaSpeech.AiliaSpeech.ailiaCallbackTokenizerUtf32ToUtf8 | ( | IntPtr | a, |
IntPtr | b, | ||
uint | c | ||
) |
|
inlinestatic |
delegate int ailiaSpeech.AiliaSpeech.ailiaCallbackTokenizerUtf8ToUtf32 | ( | IntPtr | a, |
IntPtr | b, | ||
IntPtr | c, | ||
uint | d | ||
) |
|
inlinestatic |
delegate int ailiaSpeech.AiliaSpeech.ailiaCallbackUpdate | ( | IntPtr | a | ) |
|
inlinestatic |
static int ailiaSpeech.AiliaSpeech.ailiaCreate | ( | IntPtr | net, |
int | env_id, | ||
int | num_thread | ||
) |
static int ailiaSpeech.AiliaSpeech.ailiaGetBlobIndexByInputIndex | ( | IntPtr | net, |
IntPtr | blob_idx, | ||
UInt32 | input_blob_idx | ||
) |
static int ailiaSpeech.AiliaSpeech.ailiaGetBlobIndexByOutputIndex | ( | IntPtr | net, |
IntPtr | blob_idx, | ||
UInt32 | output_blob_idx | ||
) |
static int ailiaSpeech.AiliaSpeech.ailiaGetBlobShape | ( | IntPtr | net, |
IntPtr | shape, | ||
UInt32 | blob_idx, | ||
UInt32 | version | ||
) |
static int ailiaSpeech.AiliaSpeech.ailiaGetEnvironment | ( | IntPtr | net, |
UInt32 | env_idx, | ||
UInt32 | version | ||
) |
delegate int ailiaSpeech.AiliaSpeech.ailiaIntermediateCallback | ( | IntPtr | handle, |
IntPtr | text | ||
) |
static int ailiaSpeech.AiliaSpeech.ailiaOpenWeightFileA | ( | IntPtr | net, |
IntPtr | path | ||
) |
static int ailiaSpeech.AiliaSpeech.ailiaOpenWeightFileW | ( | IntPtr | net, |
IntPtr | path | ||
) |
static int ailiaSpeech.AiliaSpeech.ailiaOpenWeightMem | ( | IntPtr | net, |
IntPtr | buf, | ||
uint | buf_size | ||
) |
static int ailiaSpeech.AiliaSpeech.ailiaSpeechBuffered | ( | IntPtr | net, |
ref uint | buffered | ||
) |
音声認識を行うためのデータが存在するかどうかを判定します。
net | ネットワークオブジェクトポインタ |
buffered | 存在フラグ |
static int ailiaSpeech.AiliaSpeech.ailiaSpeechComplete | ( | IntPtr | net, |
ref uint | complete | ||
) |
全てのデータを処理したかどうかを判定します。
net | ネットワークオブジェクトポインタ |
complete | 完了フラグ |
static int ailiaSpeech.AiliaSpeech.ailiaSpeechCreate | ( | ref IntPtr | net, |
int | env_id, | ||
int | num_thread, | ||
int | memory_mode, | ||
int | task, | ||
int | flag, | ||
AILIASpeechApiCallback | callback, | ||
int | version | ||
) |
ネットワークオブジェクトを作成します。
net | ネットワークオブジェクトポインタへのポインタ |
env_id | 計算に利用する推論実行環境のID( ailiaGetEnvironment() で取得) AILIA_ENVIRONMENT_ID_AUTO にした場合は自動で選択する |
num_thread | スレッド数の上限( AILIA_MULTITHREAD_AUTO にした場合は自動で設定) |
memory_mode | メモリモード(AILIA_MEMORY_MODE_*) |
task | AILIA_SPEECH_TASK_* |
flag | AILIA_SPEECH_FLAG_*の論理和 |
api_callback | ailiaのAPIへのコールバック |
version | AILIA_SPEECH_API_CALLBACK_VERSION |
ネットワークオブジェクトを作成します。
static void ailiaSpeech.AiliaSpeech.ailiaSpeechDestroy | ( | IntPtr | net | ) |
ネットワークオブジェクトを破棄します。
net | ネットワークオブジェクトポインタ |
static int ailiaSpeech.AiliaSpeech.ailiaSpeechFinalizeInputData | ( | IntPtr | net | ) |
音声のキューへの投入を終了します。
net | ネットワークオブジェクトポインタ |
音声ファイルの末尾であることを通知することで、30秒分のデータが存在しなくてもailiaSpeechBufferedが1を返すようになります。 ailiaSpeechFinalizeInputDataを実行後、ailiaSpeechPushInputDataの実行前に、ailiaSpeechResetTranscribeStateを呼び出す必要があります。
static IntPtr ailiaSpeech.AiliaSpeech.ailiaSpeechGetErrorDetail | ( | IntPtr | net | ) |
エラーの詳細を返します
net | ネットワークオブジェクトポインタ |
返値は解放する必要はありません。 文字列の有効期間は次にailiaSpeechのAPIを呼ぶまでです。 モデルが暗号化されている場合は空文字を返します。 取得したポイントから以下のように文字列に変換して下さい。
static int ailiaSpeech.AiliaSpeech.ailiaSpeechGetText | ( | IntPtr | net, |
[In, Out] AILIASpeechText | text, | ||
uint | version, | ||
uint | idx | ||
) |
認識したテキストを取得します。
net | ネットワークオブジェクトポインタ |
text | テキスト |
version | AILIA_SPEECH_TEXT_VERSION |
idx | テキストのインデックス |
static int ailiaSpeech.AiliaSpeech.ailiaSpeechGetTextCount | ( | IntPtr | net, |
ref uint | count | ||
) |
認識したテキストの数を取得します。
net | ネットワークオブジェクトポインタ |
count | テキストの数 |
static int ailiaSpeech.AiliaSpeech.ailiaSpeechOpenDiarizationFile | ( | IntPtr | net, |
string | segmentation_path, | ||
string | embedding_path, | ||
int | type | ||
) |
話者分離に適用するAIモデルを指定します。
net | ネットワークオブジェクトポインタ |
segmentation_path | onnxファイルのパス名 |
embedding_path | onnxファイルのパス名 |
type | AILIA_SPEECH_DIARIZATION_TYPE_PYANNOTE_AUDIO |
static int ailiaSpeech.AiliaSpeech.ailiaSpeechOpenDictionaryFile | ( | IntPtr | net, |
string | dictionary_path, | ||
int | dictionary_type | ||
) |
誤り訂正辞書を指定します。
net | ネットワークオブジェクトポインタ |
dictionary_path | 辞書ファイルのパス名 |
dictionary_type | AILIA_SPEECH_DICTIONARY_TYPE_* |
static int ailiaSpeech.AiliaSpeech.ailiaSpeechOpenModelFile | ( | IntPtr | net, |
string | encoder_path, | ||
string | decoder_path, | ||
int | model_type | ||
) |
モデルを指定します。
net | ネットワークオブジェクトポインタ |
encoder_path | onnxファイルのパス名 |
decoder_path | onnxファイルのパス名 |
model_type | AILIA_SPEECH_MODEL_TYPE_* |
static int ailiaSpeech.AiliaSpeech.ailiaSpeechOpenPostProcessFile | ( | IntPtr | net, |
string | encoder_path, | ||
string | decoder_path, | ||
string | source_path, | ||
string | target_path, | ||
IntPtr | prefix, | ||
int | post_process_type | ||
) |
後処理に適用するAIモデルを指定します。
net | ネットワークオブジェクトポインタ |
encoder_path | onnxファイルのパス名 |
decoder_path | onnxファイルのパス名 |
source_path | Tokenizerのmodelファイルのパス名 |
target_path | Tokenizerのmodelファイルのパス名 |
prefix | T5のprefix (UTF8)、FuguMTの場合はNULL |
post_process_type | AILIA_SPEECH_POST_PROCESS_TYPE_* |
static int ailiaSpeech.AiliaSpeech.ailiaSpeechOpenVadFile | ( | IntPtr | net, |
string | vad_path, | ||
int | vad_type | ||
) |
無音検知に適用するVADモデルを指定します。
net | ネットワークオブジェクトポインタ |
vad_path | onnxファイルのパス名 |
vad_type | AILIA_SPEECH_VAD_TYPE_* |
static int ailiaSpeech.AiliaSpeech.ailiaSpeechPostProcess | ( | IntPtr | net | ) |
後処理を行います。
net | ネットワークオブジェクトポインタ |
認識した結果はailiaSpeechGetText APIで取得します。
static int ailiaSpeech.AiliaSpeech.ailiaSpeechPushInputData | ( | IntPtr | net, |
float[] | src, | ||
uint | channels, | ||
uint | samples, | ||
uint | sampling_rate | ||
) |
音声をキューに投入します。
net | ネットワークオブジェクトポインタ |
src | PCMデータ(チャンネルインタリーブ、LRLR、-1.0 to 1.0) |
channels | チャンネル数 |
samples | チャンネルあたりのサンプル数 |
sampling_rate | サンプリングレート(Hz) |
static int ailiaSpeech.AiliaSpeech.ailiaSpeechResetTranscribeState | ( | IntPtr | net | ) |
ネットワークオブジェクトの内部状態を初期化します。
net | ネットワークオブジェクトポインタ |
このAPIを呼び出すことで、前回のデコード結果などの内部状態を初期化します。 このAPIを呼び出した後、モデルを再び開く必要はありません。 ailiaSpeechOpenModelFile、ailiaSpeechSetIntermediateCallback、ailiaSpeechSetLanguage、ailiaSpeechSetSilentThreshold、ailiaSpeechSetPromptのステートは保持されます。
static int ailiaSpeech.AiliaSpeech.ailiaSpeechSetConstraint | ( | IntPtr | net, |
IntPtr | constraint, | ||
int | type | ||
) |
制約の設定を行います。
net | ネットワークオブジェクトポインタ |
constraint | 制約となるテキスト(UTF8) |
type | 制約モード (AILIA_SPEECH_CONSTRAINT_*) |
static int ailiaSpeech.AiliaSpeech.ailiaSpeechSetIntermediateCallback | ( | IntPtr | net, |
ailiaIntermediateCallback | callback, | ||
IntPtr | handle | ||
) |
認識の途中結果を取得するコールバックを設定します。
net | ネットワークオブジェクトポインタ |
callback | コールバック |
handle | コールバックに提供されるハンドル |
static int ailiaSpeech.AiliaSpeech.ailiaSpeechSetLanguage | ( | IntPtr | net, |
string | language | ||
) |
言語設定を行います。
net | ネットワークオブジェクトポインタ |
language | 言語コード(en, jaなど) |
static int ailiaSpeech.AiliaSpeech.ailiaSpeechSetPrompt | ( | IntPtr | net, |
IntPtr | prompt | ||
) |
プロンプトの設定を行います。
net | ネットワークオブジェクトポインタ |
prompt | promptとなるテキスト(UTF8) |
static int ailiaSpeech.AiliaSpeech.ailiaSpeechSetSilentThreshold | ( | IntPtr | net, |
float | silent_threshold, | ||
float | speech_sec, | ||
float | no_speech_sec | ||
) |
無音判定の閾値を設定します。
net | ネットワークオブジェクトポインタ |
silent_threshold | 有音判定のしきい値 |
speech_sec | 有音区間の時間 |
no_speech_sec | 無音区間の時間 |
static int ailiaSpeech.AiliaSpeech.ailiaSpeechSetText | ( | IntPtr | net, |
[In] AILIASpeechText | text, | ||
uint | version, | ||
uint | idx | ||
) |
ポストプロセス対象のテキストを設定します。
net | ネットワークオブジェクトポインタ |
text | テキスト |
version | AILIA_SPEECH_TEXT_VERSION |
idx | テキストのインデックス |
音声認識を使用せず、ポストプロセスのみを使用する場合に使用します。 文字列は内部バッファにコピーされるため、呼び出し後に解放することができます。 idxがailiaSpeechGetTextCountよりも大きい場合、自動的に内部バッファが拡張されます。
static int ailiaSpeech.AiliaSpeech.ailiaSpeechTranscribe | ( | IntPtr | net | ) |
音声認識を行います。
net | ネットワークオブジェクトポインタ |
static int ailiaSpeech.AiliaSpeech.ailiaTokenizerCreate | ( | IntPtr | net, |
int | type, | ||
int | flags | ||
) |
static int ailiaSpeech.AiliaSpeech.ailiaTokenizerEncode | ( | IntPtr | net, |
IntPtr | utf8 | ||
) |
static int ailiaSpeech.AiliaSpeech.ailiaTokenizerGetTextLength | ( | IntPtr | net, |
IntPtr | len | ||
) |
static int ailiaSpeech.AiliaSpeech.ailiaTokenizerGetTokenCount | ( | IntPtr | net, |
IntPtr | count | ||
) |
static int ailiaSpeech.AiliaSpeech.ailiaTokenizerOpenModelFileA | ( | IntPtr | net, |
IntPtr | utf8 | ||
) |
static int ailiaSpeech.AiliaSpeech.ailiaTokenizerOpenModelFileW | ( | IntPtr | net, |
IntPtr | utf16 | ||
) |
static int ailiaSpeech.AiliaSpeech.ailiaTokenizerUtf32ToUtf8 | ( | IntPtr | a, |
IntPtr | b, | ||
uint | c | ||
) |
static int ailiaSpeech.AiliaSpeech.ailiaTokenizerUtf8ToUtf32 | ( | IntPtr | a, |
IntPtr | b, | ||
IntPtr | c, | ||
uint | d | ||
) |
|
inlinestatic |
|
static |
|
static |
|
static |
|
static |
|
static |
|
static |
|
static |
|
static |
|
static |
|
static |
|
static |
|
static |
|
static |
|
static |
|
static |
|
static |
|
static |
|
static |
|
static |
|
static |
|
static |
|
static |