Skip to content

Commit

Permalink
🔥 不要だったお正規化処理を削除いたしましたわ 🔥
Browse files Browse the repository at this point in the history
  • Loading branch information
jiro4989 committed Jun 23, 2022
1 parent 84f3679 commit f5f41eb
Show file tree
Hide file tree
Showing 2 changed files with 7 additions and 12 deletions.
12 changes: 0 additions & 12 deletions ojosama.go
Original file line number Diff line number Diff line change
Expand Up @@ -45,18 +45,6 @@ func init() {
// opt は挙動を微調整するためのオプショナルなパラメータ。不要であれば nil を渡せ
// ば良い。
func Convert(src string, opt *ConvertOption) (string, error) {
// 正規化
// !?だと「!」と「?」に分割されるが
// !?!?❗❓とかだと、1つのサ変接続として解釈されてしまう。
// この辺の文字のばらつきで処理がばらつくのが面倒なので
// 形態素解析するまえに表記ゆれを統一してしまう。
src = strings.ReplaceAll(src, "!", "!")
src = strings.ReplaceAll(src, "?", "?")
src = strings.ReplaceAll(src, "❗", "!")
src = strings.ReplaceAll(src, "❓", "?")
src = strings.ReplaceAll(src, "‼", "!!")
src = strings.ReplaceAll(src, "⁉", "!?")

t, err := tokenizer.New(ipa.Dict(), tokenizer.OmitBosEos())
if err != nil {
return "", err
Expand Down
7 changes: 7 additions & 0 deletions ojosama_test.go
Original file line number Diff line number Diff line change
Expand Up @@ -515,6 +515,13 @@ func TestConvert(t *testing.T) {
},
wantErr: false,
},
{
desc: "正常系: 意味のない文章のテストですわ",
src: "あ!い❓❗う",
want: "あ!い❓❗う",
opt: nil,
wantErr: false,
},
}

for _, tt := range tests {
Expand Down

0 comments on commit f5f41eb

Please sign in to comment.