2019-04-10から1日間の記事一覧

sentencepiece APIの詳細を調べる (bert-japanese関連)

bert-japaneseのモデルを使っているとsentencepieceへの入力と出力が異なる場合がしばしばあって、文字数のずれが気になったのでsentencepieceについてもう少し調べた。 sentencepieceのNormalizerは何をしてる sentencepieceのテキストのノーマライズ処理は…