ailiaTokenizerGetCharStarts method

int ailiaTokenizerGetCharStarts(
  1. Pointer<AILIATokenizer> net,
  2. Pointer<Int> char_starts,
  3. int count
)

~japanese @brief 開始文字位置を取得します。 @param net トークナイザオブジェクトポインタ @param char_starts 開始文字位置 @param count 格納先トークン数 @param @return 成功した場合は \ref AILIA_STATUS_SUCCESS 、そうでなければエラーコードを返す。 @details ailiaTokenizerEncode() を一度も実行していない場合は \ref AILIA_STATUS_INVALID_STATE が返ります。 AILIA_TOKENIZER_TYPE_ROBERTAとAILIA_TOKENIZER_TYPE_BERTの場合のみ有効です。 各トークンに対応するUTF32単位での開始文字位置が返ります。

~english @brief Gets the Char start positions. @param net A tokenizer instance pointer @param char_starts Character start position @param count Token count @return If this function is successful, it returns \ref AILIA_STATUS_SUCCESS , or an error code otherwise. @details If ailiaTokenizerEncode() is not run at all, the function returns \ref AILIA_STATUS_INVALID_STATE . This is valid only for AILIA_TOKENIZER_TYPE_ROBERTA and AILIA_TOKENIZER_TYPE_BERT. The character start positions in UTF-32 units corresponding to each token are returned.

Implementation

int ailiaTokenizerGetCharStarts(
  ffi.Pointer<AILIATokenizer> net,
  ffi.Pointer<ffi.Int> char_starts,
  int count,
) {
  return _ailiaTokenizerGetCharStarts(
    net,
    char_starts,
    count,
  );
}