Badword Filter 🚫🤬

Badword Filter adalah library Node.js sederhana untuk mendeteksi kata kasar atau tidak pantas menggunakan pendekatan normalisasi teks dan perhitungan similarity (Levenshtein Distance).
Dirancang ringan, fleksibel, dan cocok untuk bot chat, REST API, maupun aplikasi teks lainnya.

✨ Fitur

Case insensitive (tidak sensitif huruf besar/kecil)
Normalisasi karakter non-alfanumerik
Deteksi kata hasil modifikasi (typo, plesetan, variasi penulisan)
Threshold similarity dapat dikonfigurasi
3 mode utama:
- flag(text) → boolean deteksi
- censor(text) → sensor otomatis
- analyze(text) → analisis detail
Mudah diintegrasikan

📦 Instalasi

Clone repository

git clone <repository-url>
cd badword-filter

Atau salin manual file:

index.js
words.json
whitelist.json

📁 Struktur Proyek

.
├── index.js
├── words.json
└── whitelist.json

🚀 Penggunaan

Import

const badwords = require('./index');

`flag(text)`

badwords.flag('anjir tolol banget');
// true

badwords.flag('assassin creed');
// false (whitelist)

`censor(text)`

badwords.censor('anjir tolol banget');
// "*** *** banget"

`analyze(text)`

badwords.analyze('anjir tolol banget');

Output:

{
  text: 'anjir tolol banget',
  words: 3,
  badwords: ['anjir', 'tolol'],
  count: 2,
  censored: '*** *** banget',
  locations: [0, 1]
}

🧠 Cara Kerja Singkat

Normalisasi teks (lowercase, hapus simbol, kompres karakter)
Cek whitelist (jika ada → aman)
Hilangkan vokal untuk pencocokan konsonan
Hitung Levenshtein similarity
Kata dianggap terlarang jika melewati threshold bawaan

Contoh normalisasi:

anjiiir → anjir
ngentttod → ngentod

⚙️ Konfigurasi Sensitivitas

Atur threshold di index.js:

if (consonantMatch && sim >= 0.70) return true;
if (sim >= 0.75) return true;

Lebih ketat:

if (consonantMatch && sim >= 0.80) return true;
if (sim >= 0.85) return true;

🗂️ Manajemen Kamus

words.json

Berisi daftar kata kasar, contoh:

[
  "anjing",
  "bangsat",
  "kontol",
  "memek",
  "tolol"
]

whitelist.json

Berisi kata aman:

[
  "anjing laut",
  "konyol"
]

🤝 Kontribusi

Kontribusi sangat terbuka dan dihargai 🙌

Fork repository ini
Buat branch baru
Lakukan perubahan
Ajukan Pull Request

Atau:

Laporkan bug
Ajukan ide / saran

melalui Issues GitHub.

⚠️ Catatan

Library ini berbasis heuristik, bukan NLP
Tidak semua kata mirip ejaan bermakna negatif
Sesuaikan threshold dengan konteks aplikasi
Gunakan whitelist untuk menghindari false-positive

📄 Lisensi

MIT License

Name		Name	Last commit message	Last commit date
Latest commit History 2 Commits
LICENSE		LICENSE
README.md		README.md
index.js		index.js
package.json		package.json
whitelist.json		whitelist.json
words.json		words.json

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Badword Filter 🚫🤬

✨ Fitur

📦 Instalasi

Clone repository

📁 Struktur Proyek

🚀 Penggunaan

Import

`flag(text)`

`censor(text)`

`analyze(text)`

🧠 Cara Kerja Singkat

⚙️ Konfigurasi Sensitivitas

🗂️ Manajemen Kamus

words.json

whitelist.json

🤝 Kontribusi

⚠️ Catatan

📄 Lisensi

About

Uh oh!

Releases

Packages

Languages

License

kavionn/badwords

Folders and files

Latest commit

History

Repository files navigation

Badword Filter 🚫🤬

✨ Fitur

📦 Instalasi

Clone repository

📁 Struktur Proyek

🚀 Penggunaan

Import

flag(text)

censor(text)

analyze(text)

🧠 Cara Kerja Singkat

⚙️ Konfigurasi Sensitivitas

🗂️ Manajemen Kamus

words.json

whitelist.json

🤝 Kontribusi

⚠️ Catatan

📄 Lisensi

About

Topics

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

`flag(text)`

`censor(text)`

`analyze(text)`

Packages