From 66f76bacc189a069aa7d3c65fdf4dccc5f24aaea Mon Sep 17 00:00:00 2001 From: Unknown Date: Sun, 26 Apr 2020 16:09:22 -0400 Subject: [PATCH] Stopwords files for several languages Languages included: arabic, bulgarian, catalan, czech, danish, dutch, finnish, german, hebrew, hindi, hungarian, indonesian, malaysian, italian, norwegian, polish, portuguese, romanian, russian, slovak, spanish, swedish, turkish, ukrainian and vietnamese --- stopwords/ar.json | 164 ++++ stopwords/bg.json | 261 ++++++ stopwords/ca.json | 129 +++ stopwords/cz.json | 258 ++++++ stopwords/da.json | 96 +++ stopwords/de.json | 234 ++++++ stopwords/es.json | 310 ++++++++ stopwords/fi.json | 237 ++++++ stopwords/he.json | 223 ++++++ stopwords/hi.json | 171 ++++ stopwords/hu.json | 201 +++++ stopwords/id.json | 359 +++++++++ stopwords/it.json | 310 ++++++++ stopwords/ms.json | 321 ++++++++ stopwords/nb.json | 174 ++++ stopwords/nl.json | 103 +++ stopwords/pl.json | 337 ++++++++ stopwords/pt.json | 205 +++++ stopwords/ro.json | 280 +++++++ stopwords/ru.json | 423 ++++++++++ stopwords/sk.json | 175 ++++ stopwords/sv.json | 116 +++ stopwords/tr.json | 116 +++ stopwords/uk.json | 387 +++++++++ stopwords/vi.json | 1945 +++++++++++++++++++++++++++++++++++++++++++++ 25 files changed, 7535 insertions(+) create mode 100644 stopwords/ar.json create mode 100644 stopwords/bg.json create mode 100644 stopwords/ca.json create mode 100644 stopwords/cz.json create mode 100644 stopwords/da.json create mode 100644 stopwords/de.json create mode 100644 stopwords/es.json create mode 100644 stopwords/fi.json create mode 100644 stopwords/he.json create mode 100644 stopwords/hi.json create mode 100644 stopwords/hu.json create mode 100644 stopwords/id.json create mode 100644 stopwords/it.json create mode 100644 stopwords/ms.json create mode 100644 stopwords/nb.json create mode 100644 stopwords/nl.json create mode 100644 stopwords/pl.json create mode 100644 stopwords/pt.json create mode 100644 stopwords/ro.json create mode 100644 stopwords/ru.json create mode 100644 stopwords/sk.json create mode 100644 stopwords/sv.json create mode 100644 stopwords/tr.json create mode 100644 stopwords/uk.json create mode 100644 stopwords/vi.json diff --git a/stopwords/ar.json b/stopwords/ar.json new file mode 100644 index 0000000..e93401a --- /dev/null +++ b/stopwords/ar.json @@ -0,0 +1,164 @@ +[ + "فى", + "في", + "كل", + "لم", + "لن", + "له", + "من", + "هو", + "هي", + "قوة", + "كما", + "لها", + "منذ", + "وقد", + "ولا", + "نفسه", + "لقاء", + "مقابل", + "هناك", + "وقال", + "وكان", + "نهاية", + "وقالت", + "وكانت", + "للامم", + "فيه", + "كلم", + "لكن", + "وفي", + "وقف", + "ولم", + "ومن", + "وهو", + "وهي", + "يوم", + "فيها", + "منها", + "مليار", + "لوكالة", + "يكون", + "يمكن", + "مليون", + "حيث", + "اكد", + "الا", + "اما", + "امس", + "السابق", + "التى", + "التي", + "اكثر", + "ايار", + "ايضا", + "ثلاثة", + "الذاتي", + "الاخيرة", + "الثاني", + "الثانية", + "الذى", + "الذي", + "الان", + "امام", + "ايام", + "خلال", + "حوالى", + "الذين", + "الاول", + "الاولى", + "بين", + "ذلك", + "دون", + "حول", + "حين", + "الف", + "الى", + "انه", + "اول", + "ضمن", + "انها", + "جميع", + "الماضي", + "الوقت", + "المقبل", + "اليوم", + "ـ", + "ف", + "و", + "و6", + "قد", + "لا", + "ما", + "مع", + "مساء", + "هذا", + "واحد", + "واضاف", + "واضافت", + "فان", + "قبل", + "قال", + "كان", + "لدى", + "نحو", + "هذه", + "وان", + "واكد", + "كانت", + "واوضح", + "مايو", + "ب", + "ا", + "أ", + "،", + "عشر", + "عدد", + "عدة", + "عشرة", + "عدم", + "عام", + "عاما", + "عن", + "عند", + "عندما", + "على", + "عليه", + "عليها", + "زيارة", + "سنة", + "سنوات", + "تم", + "ضد", + "بعد", + "بعض", + "اعادة", + "اعلنت", + "بسبب", + "حتى", + "اذا", + "احد", + "اثر", + "برس", + "باسم", + "غدا", + "شخصا", + "صباح", + "اطار", + "اربعة", + "اخرى", + "بان", + "اجل", + "غير", + "بشكل", + "حاليا", + "بن", + "به", + "ثم", + "اف", + "ان", + "او", + "اي", + "بها", + "صفر" +] \ No newline at end of file diff --git a/stopwords/bg.json b/stopwords/bg.json new file mode 100644 index 0000000..267904e --- /dev/null +++ b/stopwords/bg.json @@ -0,0 +1,261 @@ +[ + "а", + "автентичен", + "аз", + "ако", + "ала", + "бе", + "без", + "беше", + "би", + "бивш", + "бивша", + "бившо", + "бил", + "била", + "били", + "било", + "благодаря", + "близо", + "бъдат", + "бъде", + "бяха", + "в", + "вас", + "ваш", + "ваша", + "вероятно", + "вече", + "взема", + "ви", + "вие", + "винаги", + "внимава", + "време", + "все", + "всеки", + "всички", + "всичко", + "всяка", + "във", + "въпреки", + "върху", + "г", + "ги", + "главен", + "главна", + "главно", + "глас", + "го", + "година", + "години", + "годишен", + "д", + "да", + "дали", + "два", + "двама", + "двамата", + "две", + "двете", + "ден", + "днес", + "дни", + "до", + "добра", + "добре", + "добро", + "добър", + "докато", + "докога", + "дори", + "досега", + "доста", + "друг", + "друга", + "други", + "е", + "евтин", + "едва", + "един", + "една", + "еднаква", + "еднакви", + "еднакъв", + "едно", + "екип", + "ето", + "живот", + "за", + "забавям", + "зад", + "заедно", + "заради", + "засега", + "заспал", + "затова", + "защо", + "защото", + "и", + "из", + "или", + "им", + "има", + "имат", + "иска", + "й", + "каза", + "как", + "каква", + "какво", + "както", + "какъв", + "като", + "кога", + "когато", + "което", + "които", + "кой", + "който", + "колко", + "която", + "къде", + "където", + "към", + "лесен", + "лесно", + "ли", + "лош", + "м", + "май", + "малко", + "ме", + "между", + "мек", + "мен", + "месец", + "ми", + "много", + "мнозина", + "мога", + "могат", + "може", + "мокър", + "моля", + "момента", + "му", + "н", + "на", + "над", + "назад", + "най", + "направи", + "напред", + "например", + "нас", + "не", + "него", + "нещо", + "нея", + "ни", + "ние", + "никой", + "нито", + "нищо", + "но", + "нов", + "нова", + "нови", + "новина", + "някои", + "някой", + "няколко", + "няма", + "обаче", + "около", + "освен", + "особено", + "от", + "отгоре", + "отново", + "още", + "пак", + "по", + "повече", + "повечето", + "под", + "поне", + "поради", + "после", + "почти", + "прави", + "пред", + "преди", + "през", + "при", + "пък", + "първата", + "първи", + "първо", + "пъти", + "равен", + "равна", + "с", + "са", + "сам", + "само", + "се", + "сега", + "си", + "син", + "скоро", + "след", + "следващ", + "сме", + "смях", + "според", + "сред", + "срещу", + "сте", + "съм", + "със", + "също", + "т", + "тази", + "така", + "такива", + "такъв", + "там", + "твой", + "те", + "тези", + "ти", + "т.н.", + "то", + "това", + "тогава", + "този", + "той", + "толкова", + "точно", + "три", + "трябва", + "тук", + "тъй", + "тя", + "тях", + "у", + "утре", + "харесва", + "хиляди", + "ч", + "часа", + "че", + "често", + "чрез", + "ще", + "щом", + "юмрук", + "я", + "як" +] \ No newline at end of file diff --git a/stopwords/ca.json b/stopwords/ca.json new file mode 100644 index 0000000..6d316df --- /dev/null +++ b/stopwords/ca.json @@ -0,0 +1,129 @@ +[ + "a", + "abans", + "algun", + "alguna", + "algunes", + "alguns", + "altre", + "amb", + "ambdós", + "anar", + "ans", + "aquell", + "aquelles", + "aquells", + "aquí", + "bastant", + "bé", + "cada", + "com", + "consegueixo", + "conseguim", + "conseguir", + "consigueix", + "consigueixen", + "consigueixes", + "dalt", + "de", + "des de", + "dins", + "el", + "elles", + "ells", + "els", + "en", + "ens", + "entre", + "era", + "erem", + "eren", + "eres", + "es", + "és", + "éssent", + "està", + "estan", + "estat", + "estava", + "estem", + "esteu", + "estic", + "ets", + "fa", + "faig", + "fan", + "fas", + "fem", + "fer", + "feu", + "fi", + "haver", + "i", + "inclòs", + "jo", + "la", + "les", + "llarg", + "llavors", + "mentre", + "meu", + "mode", + "molt", + "molts", + "nosaltres", + "o", + "on", + "per", + "per", + "per que", + "però", + "perquè", + "podem", + "poden", + "poder", + "podeu", + "potser", + "primer", + "puc", + "quan", + "quant", + "qui", + "sabem", + "saben", + "saber", + "sabeu", + "sap", + "saps", + "sense", + "ser", + "seu", + "seus", + "si", + "soc", + "solament", + "sols", + "som", + "sota", + "també", + "te", + "tene", + "tenim", + "tenir", + "teniu", + "teu", + "tinc", + "tot", + "últim", + "un", + "un", + "una", + "unes", + "uns", + "ús", + "va", + "vaig", + "van", + "vosaltres", + "" +] \ No newline at end of file diff --git a/stopwords/cz.json b/stopwords/cz.json new file mode 100644 index 0000000..fb593c6 --- /dev/null +++ b/stopwords/cz.json @@ -0,0 +1,258 @@ +[ + "ačkoli", + "ahoj", + "ale", + "anebo", + "ano", + "asi", + "aspoň", + "během", + "bez", + "beze", + "blízko", + "bohužel", + "brzo", + "bude", + "budeme", + "budeš", + "budete", + "budou", + "budu", + "byl", + "byla", + "byli", + "bylo", + "byly", + "bys", + "čau", + "chce", + "chceme", + "chceš", + "chcete", + "chci", + "chtějí", + "chtít", + "chut'", + "chuti", + "co", + "čtrnáct", + "čtyři", + "dál", + "dále", + "daleko", + "děkovat", + "děkujeme", + "děkuji", + "den", + "deset", + "devatenáct", + "devět", + "do", + "dobrý", + "docela", + "dva", + "dvacet", + "dvanáct", + "dvě", + "hodně", + "já", + "jak", + "jde", + "je", + "jeden", + "jedenáct", + "jedna", + "jedno", + "jednou", + "jedou", + "jeho", + "její", + "jejich", + "jemu", + "jen", + "jenom", + "ještě", + "jestli", + "jestliže", + "jí", + "jich", + "jím", + "jimi", + "jinak", + "jsem", + "jsi", + "jsme", + "jsou", + "jste", + "kam", + "kde", + "kdo", + "kdy", + "když", + "ke", + "kolik", + "kromě", + "která", + "které", + "kteří", + "který", + "kvůli", + "má", + "mají", + "málo", + "mám", + "máme", + "máš", + "máte", + "mé", + "mě", + "mezi", + "mí", + "mít", + "mně", + "mnou", + "moc", + "mohl", + "mohou", + "moje", + "moji", + "možná", + "můj", + "musí", + "může", + "my", + "na", + "nad", + "nade", + "nám", + "námi", + "naproti", + "nás", + "náš", + "naše", + "naši", + "ne", + "ně", + "nebo", + "nebyl", + "nebyla", + "nebyli", + "nebyly", + "něco", + "nedělá", + "nedělají", + "nedělám", + "neděláme", + "neděláš", + "neděláte", + "nějak", + "nejsi", + "někde", + "někdo", + "nemají", + "nemáme", + "nemáte", + "neměl", + "němu", + "není", + "nestačí", + "nevadí", + "než", + "nic", + "nich", + "ním", + "nimi", + "nula", + "od", + "ode", + "on", + "ona", + "oni", + "ono", + "ony", + "osm", + "osmnáct", + "pak", + "patnáct", + "pět", + "po", + "pořád", + "potom", + "pozdě", + "před", + "přes", + "přese", + "pro", + "proč", + "prosím", + "prostě", + "proti", + "protože", + "rovně", + "se", + "sedm", + "sedmnáct", + "šest", + "šestnáct", + "skoro", + "smějí", + "smí", + "snad", + "spolu", + "sta", + "sté", + "sto", + "ta", + "tady", + "tak", + "takhle", + "taky", + "tam", + "tamhle", + "tamhleto", + "tamto", + "tě", + "tebe", + "tebou", + "ted'", + "tedy", + "ten", + "ti", + "tisíc", + "tisíce", + "to", + "tobě", + "tohle", + "toto", + "třeba", + "tři", + "třináct", + "trošku", + "tvá", + "tvé", + "tvoje", + "tvůj", + "ty", + "určitě", + "už", + "vám", + "vámi", + "vás", + "váš", + "vaše", + "vaši", + "ve", + "večer", + "vedle", + "vlastně", + "všechno", + "všichni", + "vůbec", + "vy", + "vždy", + "za", + "zač", + "zatímco", + "ze", + "že" +] \ No newline at end of file diff --git a/stopwords/da.json b/stopwords/da.json new file mode 100644 index 0000000..a3d256e --- /dev/null +++ b/stopwords/da.json @@ -0,0 +1,96 @@ +[ + "ad", + "af", + "alle", + "alt", + "anden", + "at", + "blev", + "blive", + "bliver", + "da", + "de", + "dem", + "den", + "denne", + "der", + "deres", + "det", + "dette", + "dig", + "din", + "disse", + "dog", + "du", + "efter", + "eller", + "en", + "end", + "er", + "et", + "for", + "fra", + "ham", + "han", + "hans", + "har", + "havde", + "have", + "hende", + "hendes", + "her", + "hos", + "hun", + "hvad", + "hvis", + "hvor", + "i", + "ikke", + "ind", + "jeg", + "jer", + "jo", + "kunne", + "man", + "mange", + "med", + "meget", + "men", + "mig", + "min", + "mine", + "mit", + "mod", + "ned", + "noget", + "nogle", + "nu", + "når", + "og", + "også", + "om", + "op", + "os", + "over", + "på", + "selv", + "sig", + "sin", + "sine", + "sit", + "skal", + "skulle", + "som", + "sådan", + "thi", + "til", + "ud", + "under", + "var", + "vi", + "vil", + "ville", + "vor", + "være", + "været" +] \ No newline at end of file diff --git a/stopwords/de.json b/stopwords/de.json new file mode 100644 index 0000000..d6b502b --- /dev/null +++ b/stopwords/de.json @@ -0,0 +1,234 @@ +[ + "aber", + "alle", + "allem", + "allen", + "aller", + "alles", + "als", + "also", + "am", + "an", + "ander", + "andere", + "anderem", + "anderen", + "anderer", + "anderes", + "anderm", + "andern", + "anders", + "auch", + "auf", + "aus", + "bei", + "bin", + "bis", + "bist", + "da", + "damit", + "dann", + "das", + "dass", + "dasselbe", + "dazu", + "daß", + "dein", + "deine", + "deinem", + "deinen", + "deiner", + "deines", + "dem", + "demselben", + "den", + "denn", + "denselben", + "der", + "derer", + "derselbe", + "derselben", + "des", + "desselben", + "dessen", + "dich", + "die", + "dies", + "diese", + "dieselbe", + "dieselben", + "diesem", + "diesen", + "dieser", + "dieses", + "dir", + "doch", + "dort", + "du", + "durch", + "ein", + "eine", + "einem", + "einen", + "einer", + "eines", + "einig", + "einige", + "einigem", + "einigen", + "einiger", + "einiges", + "einmal", + "er", + "es", + "etwas", + "euch", + "euer", + "eure", + "eurem", + "euren", + "eurer", + "eures", + "für", + "gegen", + "gewesen", + "hab", + "habe", + "haben", + "hat", + "hatte", + "hatten", + "hier", + "hin", + "hinter", + "ich", + "ihm", + "ihn", + "ihnen", + "ihr", + "ihre", + "ihrem", + "ihren", + "ihrer", + "ihres", + "im", + "in", + "indem", + "ins", + "ist", + "jede", + "jedem", + "jeden", + "jeder", + "jedes", + "jene", + "jenem", + "jenen", + "jener", + "jenes", + "jetzt", + "kann", + "kein", + "keine", + "keinem", + "keinen", + "keiner", + "keines", + "können", + "könnte", + "machen", + "man", + "manche", + "manchem", + "manchen", + "mancher", + "manches", + "mein", + "meine", + "meinem", + "meinen", + "meiner", + "meines", + "mich", + "mir", + "mit", + "muss", + "musste", + "nach", + "nicht", + "nichts", + "noch", + "nun", + "nur", + "ob", + "oder", + "ohne", + "sehr", + "sein", + "seine", + "seinem", + "seinen", + "seiner", + "seines", + "selbst", + "sich", + "sie", + "sind", + "so", + "solche", + "solchem", + "solchen", + "solcher", + "solches", + "soll", + "sollte", + "sondern", + "sonst", + "um", + "und", + "uns", + "unser", + "unsere", + "unserem", + "unseren", + "unserer", + "unseres", + "unter", + "viel", + "vom", + "von", + "vor", + "war", + "waren", + "warst", + "was", + "weg", + "weil", + "weiter", + "welche", + "welchem", + "welchen", + "welcher", + "welches", + "wenn", + "werde", + "werden", + "wie", + "wieder", + "will", + "wir", + "wird", + "wirst", + "wo", + "wollen", + "wollte", + "während", + "würde", + "würden", + "zu", + "zum", + "zur", + "zwar", + "zwischen", + "über" +] \ No newline at end of file diff --git a/stopwords/es.json b/stopwords/es.json new file mode 100644 index 0000000..6fe8cac --- /dev/null +++ b/stopwords/es.json @@ -0,0 +1,310 @@ +[ + "a", + "al", + "algo", + "algunas", + "algunos", + "ante", + "antes", + "como", + "con", + "contra", + "cual", + "cuando", + "de", + "del", + "desde", + "donde", + "durante", + "e", + "el", + "ella", + "ellas", + "ellos", + "en", + "entre", + "era", + "erais", + "eran", + "eras", + "eres", + "es", + "esa", + "esas", + "ese", + "eso", + "esos", + "esta", + "estaba", + "estabais", + "estaban", + "estabas", + "estad", + "estada", + "estadas", + "estado", + "estados", + "estamos", + "estando", + "estar", + "estaremos", + "estará", + "estarán", + "estarás", + "estaré", + "estaréis", + "estaría", + "estaríais", + "estaríamos", + "estarían", + "estarías", + "estas", + "este", + "estemos", + "esto", + "estos", + "estoy", + "estuve", + "estuviera", + "estuvierais", + "estuvieran", + "estuvieras", + "estuvieron", + "estuviese", + "estuvieseis", + "estuviesen", + "estuvieses", + "estuvimos", + "estuviste", + "estuvisteis", + "estuviéramos", + "estuviésemos", + "estuvo", + "está", + "estábamos", + "estáis", + "están", + "estás", + "esté", + "estéis", + "estén", + "estés", + "fue", + "fuera", + "fuerais", + "fueran", + "fueras", + "fueron", + "fuese", + "fueseis", + "fuesen", + "fueses", + "fui", + "fuimos", + "fuiste", + "fuisteis", + "fuéramos", + "fuésemos", + "ha", + "habida", + "habidas", + "habido", + "habidos", + "habiendo", + "habremos", + "habrá", + "habrán", + "habrás", + "habré", + "habréis", + "habría", + "habríais", + "habríamos", + "habrían", + "habrías", + "habéis", + "había", + "habíais", + "habíamos", + "habían", + "habías", + "han", + "has", + "hasta", + "hay", + "haya", + "hayamos", + "hayan", + "hayas", + "hayáis", + "he", + "hemos", + "hube", + "hubiera", + "hubierais", + "hubieran", + "hubieras", + "hubieron", + "hubiese", + "hubieseis", + "hubiesen", + "hubieses", + "hubimos", + "hubiste", + "hubisteis", + "hubiéramos", + "hubiésemos", + "hubo", + "la", + "las", + "le", + "les", + "lo", + "los", + "me", + "mi", + "mis", + "mucho", + "muchos", + "muy", + "más", + "mí", + "mía", + "mías", + "mío", + "míos", + "nada", + "ni", + "no", + "nos", + "nosotras", + "nosotros", + "nuestra", + "nuestras", + "nuestro", + "nuestros", + "o", + "os", + "otra", + "otras", + "otro", + "otros", + "para", + "pero", + "poco", + "por", + "porque", + "que", + "quien", + "quienes", + "qué", + "se", + "sea", + "seamos", + "sean", + "seas", + "seremos", + "será", + "serán", + "serás", + "seré", + "seréis", + "sería", + "seríais", + "seríamos", + "serían", + "serías", + "seáis", + "sido", + "siendo", + "sin", + "sobre", + "sois", + "somos", + "son", + "soy", + "su", + "sus", + "suya", + "suyas", + "suyo", + "suyos", + "sí", + "también", + "tanto", + "te", + "tendremos", + "tendrá", + "tendrán", + "tendrás", + "tendré", + "tendréis", + "tendría", + "tendríais", + "tendríamos", + "tendrían", + "tendrías", + "tened", + "tenemos", + "tenga", + "tengamos", + "tengan", + "tengas", + "tengo", + "tengáis", + "tenida", + "tenidas", + "tenido", + "tenidos", + "teniendo", + "tenéis", + "tenía", + "teníais", + "teníamos", + "tenían", + "tenías", + "ti", + "tiene", + "tienen", + "tienes", + "todo", + "todos", + "tu", + "tus", + "tuve", + "tuviera", + "tuvierais", + "tuvieran", + "tuvieras", + "tuvieron", + "tuviese", + "tuvieseis", + "tuviesen", + "tuvieses", + "tuvimos", + "tuviste", + "tuvisteis", + "tuviéramos", + "tuviésemos", + "tuvo", + "tuya", + "tuyas", + "tuyo", + "tuyos", + "tú", + "un", + "una", + "uno", + "unos", + "vosotras", + "vosotros", + "vuestra", + "vuestras", + "vuestro", + "vuestros", + "y", + "ya", + "yo", + "él", + "éramos" +] \ No newline at end of file diff --git a/stopwords/fi.json b/stopwords/fi.json new file mode 100644 index 0000000..33c50b0 --- /dev/null +++ b/stopwords/fi.json @@ -0,0 +1,237 @@ +[ + "ei", + "eivät", + "emme", + "en", + "et", + "ette", + "että", + "he", + "heidän", + "heidät", + "heihin", + "heille", + "heillä", + "heiltä", + "heissä", + "heistä", + "heitä", + "hän", + "häneen", + "hänelle", + "hänellä", + "häneltä", + "hänen", + "hänessä", + "hänestä", + "hänet", + "häntä", + "itse", + "ja", + "johon", + "joiden", + "joihin", + "joiksi", + "joilla", + "joille", + "joilta", + "joina", + "joissa", + "joista", + "joita", + "joka", + "joksi", + "jolla", + "jolle", + "jolta", + "jona", + "jonka", + "jos", + "jossa", + "josta", + "jota", + "jotka", + "kanssa", + "keiden", + "keihin", + "keiksi", + "keille", + "keillä", + "keiltä", + "keinä", + "keissä", + "keistä", + "keitä", + "keneen", + "keneksi", + "kenelle", + "kenellä", + "keneltä", + "kenen", + "kenenä", + "kenessä", + "kenestä", + "kenet", + "ketkä", + "ketkä", + "ketä", + "koska", + "kuin", + "kuka", + "kun", + "me", + "meidän", + "meidät", + "meihin", + "meille", + "meillä", + "meiltä", + "meissä", + "meistä", + "meitä", + "mihin", + "miksi", + "mikä", + "mille", + "millä", + "miltä", + "minkä", + "minkä", + "minua", + "minulla", + "minulle", + "minulta", + "minun", + "minussa", + "minusta", + "minut", + "minuun", + "minä", + "minä", + "missä", + "mistä", + "mitkä", + "mitä", + "mukaan", + "mutta", + "ne", + "niiden", + "niihin", + "niiksi", + "niille", + "niillä", + "niiltä", + "niin", + "niin", + "niinä", + "niissä", + "niistä", + "niitä", + "noiden", + "noihin", + "noiksi", + "noilla", + "noille", + "noilta", + "noin", + "noina", + "noissa", + "noista", + "noita", + "nuo", + "nyt", + "näiden", + "näihin", + "näiksi", + "näille", + "näillä", + "näiltä", + "näinä", + "näissä", + "näistä", + "näitä", + "nämä", + "ole", + "olemme", + "olen", + "olet", + "olette", + "oli", + "olimme", + "olin", + "olisi", + "olisimme", + "olisin", + "olisit", + "olisitte", + "olisivat", + "olit", + "olitte", + "olivat", + "olla", + "olleet", + "ollut", + "on", + "ovat", + "poikki", + "se", + "sekä", + "sen", + "siihen", + "siinä", + "siitä", + "siksi", + "sille", + "sillä", + "sillä", + "siltä", + "sinua", + "sinulla", + "sinulle", + "sinulta", + "sinun", + "sinussa", + "sinusta", + "sinut", + "sinuun", + "sinä", + "sinä", + "sitä", + "tai", + "te", + "teidän", + "teidät", + "teihin", + "teille", + "teillä", + "teiltä", + "teissä", + "teistä", + "teitä", + "tuo", + "tuohon", + "tuoksi", + "tuolla", + "tuolle", + "tuolta", + "tuon", + "tuona", + "tuossa", + "tuosta", + "tuota", + "tähän", + "täksi", + "tälle", + "tällä", + "tältä", + "tämä", + "tämän", + "tänä", + "tässä", + "tästä", + "tätä", + "vaan", + "vai", + "vaikka", + "yli" +] \ No newline at end of file diff --git a/stopwords/he.json b/stopwords/he.json new file mode 100644 index 0000000..907f6ac --- /dev/null +++ b/stopwords/he.json @@ -0,0 +1,223 @@ +[ + ""אני",", + ""את",", + ""אתה",", + ""אנחנו",", + ""אתן",", + ""אתם",", + ""הם",", + ""הן",", + ""היא",", + ""הוא",", + ""שלי",", + ""שלו",", + ""שלך",", + ""שלה",", + ""שלנו",", + ""שלכם",", + ""שלכן",", + ""שלהם",", + ""שלהן",", + ""לי",", + ""לו",", + ""לה",", + ""לנו",", + ""לכם",", + ""לכן",", + ""להם",", + ""להן",", + ""אותה",", + ""אותו",", + ""זה",", + ""זאת",", + ""אלה",", + ""אלו",", + ""תחת",", + ""מתחת",", + ""מעל",", + ""בין",", + ""עם",", + ""עד",", + ""נגר",", + ""על",", + ""אל",", + ""מול",", + ""של",", + ""אצל",", + ""כמו",", + ""אחר",", + ""אותו",", + ""בלי",", + ""לפני",", + ""אחרי",", + ""מאחורי",", + ""עלי",", + ""עליו",", + ""עליה",", + ""עליך",", + ""עלינו",", + ""עליכם",", + ""לעיכן",", + ""עליהם",", + ""עליהן",", + ""כל",", + ""כולם",", + ""כולן",", + ""כך",", + ""ככה",", + ""כזה",", + ""זה",", + ""זות",", + ""אותי",", + ""אותה",", + ""אותם",", + ""אותך",", + ""אותו",", + ""אותן",", + ""אותנו",", + ""ואת",", + ""את",", + ""אתכם",", + ""אתכן",", + ""איתי",", + ""איתו",", + ""איתך",", + ""איתה",", + ""איתם",", + ""איתן",", + ""איתנו",", + ""איתכם",", + ""איתכן",", + ""יהיה",", + ""תהיה",", + ""היתי",", + ""היתה",", + ""היה",", + ""להיות",", + ""עצמי",", + ""עצמו",", + ""עצמה",", + ""עצמם",", + ""עצמן",", + ""עצמנו",", + ""עצמהם",", + ""עצמהן",", + ""מי",", + ""מה",", + ""איפה",", + ""היכן",", + ""במקום שבו",", + ""אם",", + ""לאן",", + ""למקום שבו",", + ""מקום בו",", + ""איזה",", + ""מהיכן",", + ""איך",", + ""כיצד",", + ""באיזו מידה",", + ""מתי",", + ""בשעה ש",", + ""כאשר",", + ""כש",", + ""למרות",", + ""לפני",", + ""אחרי",", + ""מאיזו סיבה",", + ""הסיבה שבגללה",", + ""למה",", + ""מדוע",", + ""לאיזו תכלית",", + ""כי",", + ""יש",", + ""אין",", + ""אך",", + ""מנין",", + ""מאין",", + ""מאיפה",", + ""יכל",", + ""יכלה",", + ""יכלו",", + ""יכול",", + ""יכולה",", + ""יכולים",", + ""יכולות",", + ""יוכלו",", + ""יוכל",", + ""מסוגל",", + ""לא",", + ""רק",", + ""אולי",", + ""אין",", + ""לאו",", + ""אי",", + ""כלל",", + ""נגד",", + ""אם",", + ""עם",", + ""אל",", + ""אלה",", + ""אלו",", + ""אף",", + ""על",", + ""מעל",", + ""מתחת",", + ""מצד",", + ""בשביל",", + ""לבין",", + ""באמצע",", + ""בתוך",", + ""דרך",", + ""מבעד",", + ""באמצעות",", + ""למעלה",", + ""למטה",", + ""מחוץ",", + ""מן",", + ""לעבר",", + ""מכאן",", + ""כאן",", + ""הנה",", + ""הרי",", + ""פה",", + ""שם",", + ""אך",", + ""ברם",", + ""שוב",", + ""אבל",", + ""מבלי",", + ""בלי",", + ""מלבד",", + ""רק",", + ""בגלל",", + ""מכיוון",", + ""עד",", + ""אשר",", + ""ואילו",", + ""למרות",", + ""אס",", + ""כמו",", + ""כפי",", + ""אז",", + ""אחרי",", + ""כן",", + ""לכן",", + ""לפיכך",", + ""מאד",", + ""עז",", + ""מעט",", + ""מעטים",", + ""במידה",", + ""שוב",", + ""יותר",", + ""מדי",", + ""גם",", + ""כן",", + ""נו",", + ""אחר",", + ""אחרת",", + ""אחרים",", + ""אחרות",", + ""אשר",", + ""או"" +] \ No newline at end of file diff --git a/stopwords/hi.json b/stopwords/hi.json new file mode 100644 index 0000000..274066b --- /dev/null +++ b/stopwords/hi.json @@ -0,0 +1,171 @@ +[ + "अत", + "अपना", + "अपनी", + "अपने", + "अभी", + "अंदर", + "आदि", + "आप", + "इत्यादि", + "इन", + "इनका", + "इन्हीं", + "इन्हें", + "इन्हों", + "इस", + "इसका", + "इसकी", + "इसके", + "इसमें", + "इसी", + "इसे", + "उन", + "उनका", + "उनकी", + "उनके", + "उनको", + "उन्हीं", + "उन्हें", + "उन्हों", + "उस", + "उसके", + "उसी", + "उसे", + "एक", + "एवं", + "एस", + "ऐसे", + "और", + "कई", + "कर", + "करता", + "करते", + "करना", + "करने", + "करें", + "कहते", + "कहा", + "का", + "काफ़ी", + "कि", + "कितना", + "किन्हें", + "किन्हों", + "किया", + "किर", + "किस", + "किसी", + "किसे", + "की", + "कुछ", + "कुल", + "के", + "को", + "कोई", + "कौन", + "कौनसा", + "गया", + "घर", + "जब", + "जहाँ", + "जा", + "जितना", + "जिन", + "जिन्हें", + "जिन्हों", + "जिस", + "जिसे", + "जीधर", + "जैसा", + "जैसे", + "जो", + "तक", + "तब", + "तरह", + "तिन", + "तिन्हें", + "तिन्हों", + "तिस", + "तिसे", + "तो", + "था", + "थी", + "थे", + "दबारा", + "दिया", + "दुसरा", + "दूसरे", + "दो", + "द्वारा", + "न", + "नके", + "नहीं", + "ना", + "निहायत", + "नीचे", + "ने", + "पर", + "पहले", + "पूरा", + "पे", + "फिर", + "बनी", + "बही", + "बहुत", + "बाद", + "बाला", + "बिलकुल", + "भी", + "भीतर", + "मगर", + "मानो", + "मे", + "में", + "यदि", + "यह", + "यहाँ", + "यही", + "या", + "यिह", + "ये", + "रखें", + "रहा", + "रहे", + "ऱ्वासा", + "लिए", + "लिये", + "लेकिन", + "व", + "वग़ैरह", + "वर्ग", + "वह", + "वहाँ", + "वहीं", + "वाले", + "वुह", + "वे", + "सकता", + "सकते", + "सबसे", + "सभी", + "साथ", + "साबुत", + "साभ", + "सारा", + "से", + "सो", + "संग", + "ही", + "हुआ", + "हुई", + "हुए", + "है", + "हैं", + "हो", + "होता", + "होती", + "होते", + "होना", + "होने" +] \ No newline at end of file diff --git a/stopwords/hu.json b/stopwords/hu.json new file mode 100644 index 0000000..5af1de2 --- /dev/null +++ b/stopwords/hu.json @@ -0,0 +1,201 @@ +[ + "a", + "abban", + "ahhoz", + "ahogy", + "ahol", + "aki", + "akik", + "akkor", + "alatt", + "amely", + "amelyek", + "amelyekben", + "amelyeket", + "amelyet", + "amelynek", + "ami", + "amikor", + "amit", + "amolyan", + "amíg", + "annak", + "arra", + "arról", + "az", + "azok", + "azon", + "azonban", + "azt", + "aztán", + "azután", + "azzal", + "azért", + "be", + "belül", + "benne", + "bár", + "cikk", + "cikkek", + "cikkeket", + "csak", + "de", + "e", + "ebben", + "eddig", + "egy", + "egyes", + "egyetlen", + "egyik", + "egyre", + "egyéb", + "egész", + "ehhez", + "ekkor", + "el", + "ellen", + "elsõ", + "elég", + "elõ", + "elõször", + "elõtt", + "emilyen", + "ennek", + "erre", + "ez", + "ezek", + "ezen", + "ezt", + "ezzel", + "ezért", + "fel", + "felé", + "hanem", + "hiszen", + "hogy", + "hogyan", + "igen", + "ill", + "ill.", + "illetve", + "ilyen", + "ilyenkor", + "ismét", + "ison", + "itt", + "jobban", + "jó", + "jól", + "kell", + "kellett", + "keressünk", + "keresztül", + "ki", + "kívül", + "között", + "közül", + "legalább", + "legyen", + "lehet", + "lehetett", + "lenne", + "lenni", + "lesz", + "lett", + "maga", + "magát", + "majd", + "majd", + "meg", + "mellett", + "mely", + "melyek", + "mert", + "mi", + "mikor", + "milyen", + "minden", + "mindenki", + "mindent", + "mindig", + "mint", + "mintha", + "mit", + "mivel", + "miért", + "most", + "már", + "más", + "másik", + "még", + "míg", + "nagy", + "nagyobb", + "nagyon", + "ne", + "nekem", + "neki", + "nem", + "nincs", + "néha", + "néhány", + "nélkül", + "olyan", + "ott", + "pedig", + "persze", + "rá", + "s", + "saját", + "sem", + "semmi", + "sok", + "sokat", + "sokkal", + "szemben", + "szerint", + "szinte", + "számára", + "talán", + "tehát", + "teljes", + "tovább", + "továbbá", + "több", + "ugyanis", + "utolsó", + "után", + "utána", + "vagy", + "vagyis", + "vagyok", + "valaki", + "valami", + "valamint", + "való", + "van", + "vannak", + "vele", + "vissza", + "viszont", + "volna", + "volt", + "voltak", + "voltam", + "voltunk", + "által", + "általában", + "át", + "én", + "éppen", + "és", + "így", + "õ", + "õk", + "õket", + "össze", + "úgy", + "új", + "újabb", + "újra" +] \ No newline at end of file diff --git a/stopwords/id.json b/stopwords/id.json new file mode 100644 index 0000000..85f84e2 --- /dev/null +++ b/stopwords/id.json @@ -0,0 +1,359 @@ +[ + "ada", + "adanya", + "adalah", + "adapun", + "agak", + "agaknya", + "agar", + "akan", + "akankah", + "akhirnya", + "aku", + "akulah", + "amat", + "amatlah", + "anda", + "andalah", + "antar", + "diantaranya", + "antara", + "antaranya", + "diantara", + "apa", + "apaan", + "mengapa", + "apabila", + "apakah", + "apalagi", + "apatah", + "atau", + "ataukah", + "ataupun", + "bagai", + "bagaikan", + "sebagai", + "sebagainya", + "bagaimana", + "bagaimanapun", + "sebagaimana", + "bagaimanakah", + "bagi", + "bahkan", + "bahwa", + "bahwasanya", + "sebaliknya", + "banyak", + "sebanyak", + "beberapa", + "seberapa", + "begini", + "beginian", + "beginikah", + "beginilah", + "sebegini", + "begitu", + "begitukah", + "begitulah", + "begitupun", + "sebegitu", + "belum", + "belumlah", + "sebelum", + "sebelumnya", + "sebenarnya", + "berapa", + "berapakah", + "berapalah", + "berapapun", + "betulkah", + "sebetulnya", + "biasa", + "biasanya", + "bila", + "bilakah", + "bisa", + "bisakah", + "sebisanya", + "boleh", + "bolehkah", + "bolehlah", + "buat", + "bukan", + "bukankah", + "bukanlah", + "bukannya", + "cuma", + "percuma", + "dahulu", + "dalam", + "dan", + "dapat", + "dari", + "daripada", + "dekat", + "demi", + "demikian", + "demikianlah", + "sedemikian", + "dengan", + "depan", + "di", + "dia", + "dialah", + "dini", + "diri", + "dirinya", + "terdiri", + "dong", + "dulu", + "enggak", + "enggaknya", + "entah", + "entahlah", + "terhadap", + "terhadapnya", + "hal", + "hampir", + "hanya", + "hanyalah", + "harus", + "haruslah", + "harusnya", + "seharusnya", + "hendak", + "hendaklah", + "hendaknya", + "hingga", + "sehingga", + "ia", + "ialah", + "ibarat", + "ingin", + "inginkah", + "inginkan", + "ini", + "inikah", + "inilah", + "itu", + "itukah", + "itulah", + "jangan", + "jangankan", + "janganlah", + "jika", + "jikalau", + "juga", + "justru", + "kala", + "kalau", + "kalaulah", + "kalaupun", + "kalian", + "kami", + "kamilah", + "kamu", + "kamulah", + "kan", + "kapan", + "kapankah", + "kapanpun", + "dikarenakan", + "karena", + "karenanya", + "ke", + "kecil", + "kemudian", + "kenapa", + "kepada", + "kepadanya", + "ketika", + "seketika", + "khususnya", + "kini", + "kinilah", + "kiranya", + "sekiranya", + "kita", + "kitalah", + "kok", + "lagi", + "lagian", + "selagi", + "lah", + "lain", + "lainnya", + "melainkan", + "selaku", + "lalu", + "melalui", + "terlalu", + "lama", + "lamanya", + "selama", + "selama", + "selamanya", + "lebih", + "terlebih", + "bermacam", + "macam", + "semacam", + "maka", + "makanya", + "makin", + "malah", + "malahan", + "mampu", + "mampukah", + "mana", + "manakala", + "manalagi", + "masih", + "masihkah", + "semasih", + "masing", + "mau", + "maupun", + "semaunya", + "memang", + "mereka", + "merekalah", + "meski", + "meskipun", + "semula", + "mungkin", + "mungkinkah", + "nah", + "namun", + "nanti", + "nantinya", + "nyaris", + "oleh", + "olehnya", + "seorang", + "seseorang", + "pada", + "padanya", + "padahal", + "paling", + "sepanjang", + "pantas", + "sepantasnya", + "sepantasnyalah", + "para", + "pasti", + "pastilah", + "per", + "pernah", + "pula", + "pun", + "merupakan", + "rupanya", + "serupa", + "saat", + "saatnya", + "sesaat", + "saja", + "sajalah", + "saling", + "bersama", + "sama", + "sesama", + "sambil", + "sampai", + "sana", + "sangat", + "sangatlah", + "saya", + "sayalah", + "se", + "sebab", + "sebabnya", + "sebuah", + "tersebut", + "tersebutlah", + "sedang", + "sedangkan", + "sedikit", + "sedikitnya", + "segala", + "segalanya", + "segera", + "sesegera", + "sejak", + "sejenak", + "sekali", + "sekalian", + "sekalipun", + "sesekali", + "sekaligus", + "sekarang", + "sekarang", + "sekitar", + "sekitarnya", + "sela", + "selain", + "selalu", + "seluruh", + "seluruhnya", + "semakin", + "sementara", + "sempat", + "semua", + "semuanya", + "sendiri", + "sendirinya", + "seolah", + "seperti", + "sepertinya", + "sering", + "seringnya", + "serta", + "siapa", + "siapakah", + "siapapun", + "disini", + "disinilah", + "sini", + "sinilah", + "sesuatu", + "sesuatunya", + "suatu", + "sesudah", + "sesudahnya", + "sudah", + "sudahkah", + "sudahlah", + "supaya", + "tadi", + "tadinya", + "tak", + "tanpa", + "setelah", + "telah", + "tentang", + "tentu", + "tentulah", + "tentunya", + "tertentu", + "seterusnya", + "tapi", + "tetapi", + "setiap", + "tiap", + "setidaknya", + "tidak", + "tidakkah", + "tidaklah", + "toh", + "waduh", + "wah", + "wahai", + "sewaktu", + "walau", + "walaupun", + "wong", + "yaitu", + "yakni", + "yang" +] \ No newline at end of file diff --git a/stopwords/it.json b/stopwords/it.json new file mode 100644 index 0000000..2a5277f --- /dev/null +++ b/stopwords/it.json @@ -0,0 +1,310 @@ +[ + "a", + "abbia", + "abbiamo", + "abbiano", + "abbiate", + "ad", + "adesso", + "agl", + "agli", + "ai", + "al", + "all", + "alla", + "alle", + "allo", + "allora", + "altre", + "altri", + "altro", + "anche", + "ancora", + "avemmo", + "avendo", + "avere", + "avesse", + "avessero", + "avessi", + "avessimo", + "aveste", + "avesti", + "avete", + "aveva", + "avevamo", + "avevano", + "avevate", + "avevi", + "avevo", + "avrai", + "avranno", + "avrebbe", + "avrebbero", + "avrei", + "avremmo", + "avremo", + "avreste", + "avresti", + "avrete", + "avrà", + "avrò", + "avuta", + "avute", + "avuti", + "avuto", + "c", + "che", + "chi", + "ci", + "coi", + "col", + "come", + "con", + "contro", + "cui", + "da", + "dagl", + "dagli", + "dai", + "dal", + "dall", + "dalla", + "dalle", + "dallo", + "degl", + "degli", + "dei", + "del", + "dell", + "della", + "delle", + "dello", + "dentro", + "di", + "dov", + "dove", + "e", + "ebbe", + "ebbero", + "ebbi", + "ecco", + "ed", + "era", + "erano", + "eravamo", + "eravate", + "eri", + "ero", + "essendo", + "faccia", + "facciamo", + "facciano", + "facciate", + "faccio", + "facemmo", + "facendo", + "facesse", + "facessero", + "facessi", + "facessimo", + "faceste", + "facesti", + "faceva", + "facevamo", + "facevano", + "facevate", + "facevi", + "facevo", + "fai", + "fanno", + "farai", + "faranno", + "fare", + "farebbe", + "farebbero", + "farei", + "faremmo", + "faremo", + "fareste", + "faresti", + "farete", + "farà", + "farò", + "fece", + "fecero", + "feci", + "fino", + "fosse", + "fossero", + "fossi", + "fossimo", + "foste", + "fosti", + "fra", + "fu", + "fui", + "fummo", + "furono", + "giù", + "gli", + "ha", + "hai", + "hanno", + "ho", + "i", + "il", + "in", + "io", + "l", + "la", + "le", + "lei", + "li", + "lo", + "loro", + "lui", + "ma", + "me", + "mi", + "mia", + "mie", + "miei", + "mio", + "ne", + "negl", + "negli", + "nei", + "nel", + "nell", + "nella", + "nelle", + "nello", + "no", + "noi", + "non", + "nostra", + "nostre", + "nostri", + "nostro", + "o", + "per", + "perché", + "però", + "più", + "pochi", + "poco", + "qua", + "quale", + "quanta", + "quante", + "quanti", + "quanto", + "quasi", + "quella", + "quelle", + "quelli", + "quello", + "questa", + "queste", + "questi", + "questo", + "qui", + "quindi", + "sarai", + "saranno", + "sarebbe", + "sarebbero", + "sarei", + "saremmo", + "saremo", + "sareste", + "saresti", + "sarete", + "sarà", + "sarò", + "se", + "sei", + "senza", + "si", + "sia", + "siamo", + "siano", + "siate", + "siete", + "sono", + "sopra", + "sotto", + "sta", + "stai", + "stando", + "stanno", + "starai", + "staranno", + "stare", + "starebbe", + "starebbero", + "starei", + "staremmo", + "staremo", + "stareste", + "staresti", + "starete", + "starà", + "starò", + "stava", + "stavamo", + "stavano", + "stavate", + "stavi", + "stavo", + "stemmo", + "stesse", + "stessero", + "stessi", + "stessimo", + "stesso", + "steste", + "stesti", + "stette", + "stettero", + "stetti", + "stia", + "stiamo", + "stiano", + "stiate", + "sto", + "su", + "sua", + "sue", + "sugl", + "sugli", + "sui", + "sul", + "sull", + "sulla", + "sulle", + "sullo", + "suo", + "suoi", + "te", + "ti", + "tra", + "tu", + "tua", + "tue", + "tuo", + "tuoi", + "tutti", + "tutto", + "un", + "una", + "uno", + "vai", + "vi", + "voi", + "vostra", + "vostre", + "vostri", + "vostro", + "è" +] \ No newline at end of file diff --git a/stopwords/ms.json b/stopwords/ms.json new file mode 100644 index 0000000..125e435 --- /dev/null +++ b/stopwords/ms.json @@ -0,0 +1,321 @@ +[ + "ada", + "adakah", + "adakan", + "adalah", + "adanya", + "adapun", + "agak", + "agar", + "akan", + "aku", + "akulah", + "akupun", + "al", + "alangkah", + "allah", + "amat", + "antara", + "antaramu", + "antaranya", + "apa", + "apa-apa", + "apabila", + "apakah", + "apapun", + "atas", + "atasmu", + "atasnya", + "atau", + "ataukah", + "ataupun", + "bagaimana", + "bagaimanakah", + "bagi", + "bagimu", + "baginya", + "bahawa", + "bahawasanya", + "bahkan", + "bahwa", + "banyak", + "banyaknya", + "barangsiapa", + "bawah", + "beberapa", + "begitu", + "begitupun", + "belaka", + "belum", + "belumkah", + "berada", + "berapa", + "berikan", + "beriman", + "berkenaan", + "berupa", + "beserta", + "biarpun", + "bila", + "bilakah", + "bilamana", + "bisa", + "boleh", + "bukan", + "bukankah", + "bukanlah", + "dahulu", + "dalam", + "dalamnya", + "dan", + "dapat", + "dapati", + "dapatkah", + "dapatlah", + "dari", + "daripada", + "daripadaku", + "daripadamu", + "daripadanya", + "demi", + "demikian", + "demikianlah", + "dengan", + "dengannya", + "di", + "dia", + "dialah", + "didapat", + "didapati", + "dimanakah", + "engkau", + "engkaukah", + "engkaulah", + "engkaupun", + "hai", + "hampir", + "hampir-hampir", + "hanya", + "hanyalah", + "hendak", + "hendaklah", + "hingga", + "ia", + "iaitu", + "ialah", + "ianya", + "inginkah", + "ini", + "inikah", + "inilah", + "itu", + "itukah", + "itulah", + "jadi", + "jangan", + "janganlah", + "jika", + "jikalau", + "jua", + "juapun", + "juga", + "kalau", + "kami", + "kamikah", + "kamipun", + "kamu", + "kamukah", + "kamupun", + "katakan", + "ke", + "kecuali", + "kelak", + "kembali", + "kemudian", + "kepada", + "kepadaku", + "kepadakulah", + "kepadamu", + "kepadanya", + "kepadanyalah", + "kerana", + "kerananya", + "kesan", + "ketika", + "kini", + "kita", + "ku", + "kurang", + "lagi", + "lain", + "lalu", + "lamanya", + "langsung", + "lebih", + "maha", + "mahu", + "mahukah", + "mahupun", + "maka", + "malah", + "mana", + "manakah", + "manapun", + "masih", + "masing", + "masing-masing", + "melainkan", + "memang", + "mempunyai", + "mendapat", + "mendapati", + "mendapatkan", + "mengadakan", + "mengapa", + "mengapakah", + "mengenai", + "menjadi", + "menyebabkan", + "menyebabkannya", + "mereka", + "merekalah", + "merekapun", + "meskipun", + "mu", + "nescaya", + "niscaya", + "nya", + "olah", + "oleh", + "orang", + "pada", + "padahal", + "padamu", + "padanya", + "paling", + "para", + "pasti", + "patut", + "patutkah", + "per", + "pergilah", + "perkara", + "perkaranya", + "perlu", + "pernah", + "pertama", + "pula", + "pun", + "sahaja", + "saja", + "saling", + "sama", + "sama-sama", + "samakah", + "sambil", + "sampai", + "sana", + "sangat", + "sangatlah", + "saya", + "se", + "seandainya", + "sebab", + "sebagai", + "sebagaimana", + "sebanyak", + "sebelum", + "sebelummu", + "sebelumnya", + "sebenarnya", + "secara", + "sedang", + "sedangkan", + "sedikit", + "sedikitpun", + "segala", + "sehingga", + "sejak", + "sekalian", + "sekalipun", + "sekarang", + "sekitar", + "selain", + "selalu", + "selama", + "selama-lamanya", + "seluruh", + "seluruhnya", + "sementara", + "semua", + "semuanya", + "semula", + "senantiasa", + "sendiri", + "sentiasa", + "seolah", + "seolah-olah", + "seorangpun", + "separuh", + "sepatutnya", + "seperti", + "seraya", + "sering", + "serta", + "seseorang", + "sesiapa", + "sesuatu", + "sesudah", + "sesudahnya", + "sesungguhnya", + "sesungguhnyakah", + "setelah", + "setiap", + "siapa", + "siapakah", + "sini", + "situ", + "situlah", + "suatu", + "sudah", + "sudahkah", + "sungguh", + "sungguhpun", + "supaya", + "tadinya", + "tahukah", + "tak", + "tanpa", + "tanya", + "tanyakanlah", + "tapi", + "telah", + "tentang", + "tentu", + "terdapat", + "terhadap", + "terhadapmu", + "termasuk", + "terpaksa", + "tertentu", + "tetapi", + "tiada", + "tiadakah", + "tiadalah", + "tiap", + "tiap-tiap", + "tidak", + "tidakkah", + "tidaklah", + "turut", + "untuk", + "untukmu", + "wahai", + "walau", + "walaupun", + "ya", + "yaini", + "yaitu", + "yakni", + "yang" +] \ No newline at end of file diff --git a/stopwords/nb.json b/stopwords/nb.json new file mode 100644 index 0000000..e7a9434 --- /dev/null +++ b/stopwords/nb.json @@ -0,0 +1,174 @@ +[ + "alle", + "at", + "av", + "bare", + "begge", + "ble", + "blei", + "bli", + "blir", + "blitt", + "både", + "båe", + "da", + "de", + "deg", + "dei", + "deim", + "deira", + "deires", + "dem", + "den", + "denne", + "der", + "dere", + "deres", + "det", + "dette", + "di", + "din", + "disse", + "ditt", + "du", + "dykk", + "dykkar", + "då", + "eg", + "ein", + "eit", + "eitt", + "eller", + "elles", + "en", + "enn", + "er", + "et", + "ett", + "etter", + "for", + "fordi", + "fra", + "før", + "ha", + "hadde", + "han", + "hans", + "har", + "hennar", + "henne", + "hennes", + "her", + "hjå", + "ho", + "hoe", + "honom", + "hoss", + "hossen", + "hun", + "hva", + "hvem", + "hver", + "hvilke", + "hvilken", + "hvis", + "hvor", + "hvordan", + "hvorfor", + "i", + "ikke", + "ikkje", + "ingen", + "ingi", + "inkje", + "inn", + "inni", + "ja", + "jeg", + "kan", + "kom", + "korleis", + "korso", + "kun", + "kunne", + "kva", + "kvar", + "kvarhelst", + "kven", + "kvi", + "kvifor", + "man", + "mange", + "me", + "med", + "medan", + "meg", + "meget", + "mellom", + "men", + "mi", + "min", + "mine", + "mitt", + "mot", + "mykje", + "ned", + "no", + "noe", + "noen", + "noka", + "noko", + "nokon", + "nokor", + "nokre", + "nå", + "når", + "og", + "også", + "om", + "opp", + "oss", + "over", + "på", + "samme", + "seg", + "selv", + "si", + "sia", + "sidan", + "siden", + "sin", + "sine", + "sitt", + "sjøl", + "skal", + "skulle", + "slik", + "so", + "som", + "somme", + "somt", + "så", + "sånn", + "til", + "um", + "upp", + "ut", + "uten", + "var", + "vart", + "varte", + "ved", + "vere", + "verte", + "vi", + "vil", + "ville", + "vore", + "vors", + "vort", + "være", + "vært", + "vår", + "å" +] \ No newline at end of file diff --git a/stopwords/nl.json b/stopwords/nl.json new file mode 100644 index 0000000..66e6ee1 --- /dev/null +++ b/stopwords/nl.json @@ -0,0 +1,103 @@ +[ + "aan", + "al", + "alles", + "als", + "altijd", + "andere", + "ben", + "bij", + "daar", + "dan", + "dat", + "de", + "der", + "deze", + "die", + "dit", + "doch", + "doen", + "door", + "dus", + "een", + "eens", + "en", + "er", + "ge", + "geen", + "geweest", + "haar", + "had", + "heb", + "hebben", + "heeft", + "hem", + "het", + "hier", + "hij", + "hoe", + "hun", + "iemand", + "iets", + "ik", + "in", + "is", + "ja", + "je", + "kan", + "kon", + "kunnen", + "maar", + "me", + "meer", + "men", + "met", + "mij", + "mijn", + "moet", + "na", + "naar", + "niet", + "niets", + "nog", + "nu", + "of", + "om", + "omdat", + "onder", + "ons", + "ook", + "op", + "over", + "reeds", + "te", + "tegen", + "toch", + "toen", + "tot", + "u", + "uit", + "uw", + "van", + "veel", + "voor", + "want", + "waren", + "was", + "wat", + "werd", + "wezen", + "wie", + "wil", + "worden", + "wordt", + "zal", + "ze", + "zelf", + "zich", + "zij", + "zijn", + "zo", + "zonder", + "zou" +] \ No newline at end of file diff --git a/stopwords/pl.json b/stopwords/pl.json new file mode 100644 index 0000000..1b90a77 --- /dev/null +++ b/stopwords/pl.json @@ -0,0 +1,337 @@ +[ + "a", + "aby", + "ach", + "acz", + "aczkolwiek", + "aj", + "albo", + "ale", + "ależ", + "ani", + "aż", + "bardziej", + "bardzo", + "bez", + "bo", + "bowiem", + "by", + "byli", + "bym", + "bynajmniej", + "być", + "był", + "była", + "było", + "były", + "będzie", + "będą", + "cali", + "cała", + "cały", + "chce", + "choć", + "ci", + "ciebie", + "cię", + "co", + "cokolwiek", + "coraz", + "coś", + "czasami", + "czasem", + "czemu", + "czy", + "czyli", + "często", + "daleko", + "dla", + "dlaczego", + "dlatego", + "do", + "dobrze", + "dokąd", + "dość", + "dr", + "duå¼o", + "dużo", + "dwa", + "dwaj", + "dwie", + "dwoje", + "dzisiaj", + "dziś", + "gdy", + "gdyby", + "gdyż", + "gdzie", + "gdziekolwiek", + "gdzieś", + "go", + "godz", + "hab", + "i", + "ich", + "ii", + "iii", + "ile", + "im", + "inna", + "inne", + "inny", + "innych", + "inż", + "iv", + "ix", + "iż", + "ja", + "jak", + "jakaś", + "jakby", + "jaki", + "jakichś", + "jakie", + "jakiś", + "jakiż", + "jakkolwiek", + "jako", + "jakoś", + "je", + "jeden", + "jedna", + "jednak", + "jednakże", + "jedno", + "jednym", + "jedynie", + "jego", + "jej", + "jemu", + "jest", + "jestem", + "jeszcze", + "jeå¼eli", + "jeå›li", + "jeśli", + "jeżeli", + "juå¼", + "już", + "jä…", + "ją", + "kaå¼dy", + "każdy", + "kiedy", + "kierunku", + "kilka", + "kilku", + "kimś", + "kto", + "ktokolwiek", + "ktoś", + "która", + "które", + "którego", + "której", + "który", + "których", + "którym", + "którzy", + "ku", + "lat", + "lecz", + "lub", + "ma", + "mają", + "mam", + "mamy", + "mało", + "mgr", + "mi", + "miał", + "mimo", + "między", + "mnie", + "mną", + "mogą", + "moi", + "moim", + "moja", + "moje", + "może", + "możliwe", + "można", + "mu", + "musi", + "my", + "mój", + "na", + "nad", + "nam", + "nami", + "nas", + "nasi", + "nasz", + "nasza", + "nasze", + "naszego", + "naszych", + "natomiast", + "natychmiast", + "nawet", + "nic", + "nich", + "nie", + "niech", + "niego", + "niej", + "niemu", + "nigdy", + "nim", + "nimi", + "nią", + "niż", + "no", + "nowe", + "np", + "nr", + "o", + "o.o.", + "obok", + "od", + "ok", + "około", + "on", + "ona", + "one", + "oni", + "ono", + "oraz", + "oto", + "owszem", + "pan", + "pana", + "pani", + "pl", + "po", + "pod", + "podczas", + "pomimo", + "ponad", + "ponieważ", + "powinien", + "powinna", + "powinni", + "powinno", + "poza", + "prawie", + "prof", + "przecież", + "przed", + "przede", + "przedtem", + "przez", + "przy", + "raz", + "razie", + "roku", + "również", + "sam", + "sama", + "się", + "skąd", + "sobie", + "sobą", + "sposób", + "swoje", + "są", + "ta", + "tak", + "taka", + "taki", + "takich", + "takie", + "także", + "tam", + "te", + "tego", + "tej", + "tel", + "temu", + "ten", + "teraz", + "też", + "to", + "tobie", + "tobą", + "toteż", + "totobą", + "trzeba", + "tu", + "tutaj", + "twoi", + "twoim", + "twoja", + "twoje", + "twym", + "twój", + "ty", + "tych", + "tylko", + "tym", + "tys", + "tzw", + "tę", + "u", + "ul", + "vi", + "vii", + "viii", + "vol", + "w", + "wam", + "wami", + "was", + "wasi", + "wasz", + "wasza", + "wasze", + "we", + "według", + "wie", + "wiele", + "wielu", + "więc", + "więcej", + "wszyscy", + "wszystkich", + "wszystkie", + "wszystkim", + "wszystko", + "wtedy", + "www", + "wy", + "właśnie", + "wśród", + "xi", + "xii", + "xiii", + "xiv", + "xv", + "z", + "za", + "zapewne", + "zawsze", + "zaś", + "ze", + "zeznowu", + "znowu", + "znów", + "został", + "zł", + "żaden", + "żadna", + "żadne", + "żadnych", + "że", + "żeby" +] \ No newline at end of file diff --git a/stopwords/pt.json b/stopwords/pt.json new file mode 100644 index 0000000..b8925a8 --- /dev/null +++ b/stopwords/pt.json @@ -0,0 +1,205 @@ +[ + "a", + "ao", + "aos", + "aquela", + "aquelas", + "aquele", + "aqueles", + "aquilo", + "as", + "até", + "com", + "como", + "da", + "das", + "de", + "dela", + "delas", + "dele", + "deles", + "depois", + "do", + "dos", + "e", + "ela", + "elas", + "ele", + "eles", + "em", + "entre", + "era", + "eram", + "essa", + "essas", + "esse", + "esses", + "esta", + "estamos", + "estas", + "estava", + "estavam", + "este", + "esteja", + "estejam", + "estejamos", + "estes", + "esteve", + "estive", + "estivemos", + "estiver", + "estivera", + "estiveram", + "estiverem", + "estivermos", + "estivesse", + "estivessem", + "estivéramos", + "estivéssemos", + "estou", + "está", + "estávamos", + "estão", + "eu", + "foi", + "fomos", + "for", + "fora", + "foram", + "forem", + "formos", + "fosse", + "fossem", + "fui", + "fôramos", + "fôssemos", + "haja", + "hajam", + "hajamos", + "havemos", + "hei", + "houve", + "houvemos", + "houver", + "houvera", + "houveram", + "houverei", + "houverem", + "houveremos", + "houveria", + "houveriam", + "houvermos", + "houverá", + "houverão", + "houveríamos", + "houvesse", + "houvessem", + "houvéramos", + "houvéssemos", + "há", + "hão", + "isso", + "isto", + "já", + "lhe", + "lhes", + "mais", + "mas", + "me", + "mesmo", + "meu", + "meus", + "minha", + "minhas", + "muito", + "na", + "nas", + "nem", + "no", + "nos", + "nossa", + "nossas", + "nosso", + "nossos", + "num", + "numa", + "não", + "nós", + "o", + "os", + "ou", + "para", + "pela", + "pelas", + "pelo", + "pelos", + "por", + "qual", + "quando", + "que", + "quem", + "se", + "seja", + "sejam", + "sejamos", + "sem", + "serei", + "seremos", + "seria", + "seriam", + "será", + "serão", + "seríamos", + "seu", + "seus", + "somos", + "sou", + "sua", + "suas", + "são", + "só", + "também", + "te", + "tem", + "temos", + "tenha", + "tenham", + "tenhamos", + "tenho", + "terei", + "teremos", + "teria", + "teriam", + "terá", + "terão", + "teríamos", + "teu", + "teus", + "teve", + "tinha", + "tinham", + "tive", + "tivemos", + "tiver", + "tivera", + "tiveram", + "tiverem", + "tivermos", + "tivesse", + "tivessem", + "tivéramos", + "tivéssemos", + "tu", + "tua", + "tuas", + "tém", + "tínhamos", + "um", + "uma", + "você", + "vocês", + "vos", + "à", + "às", + "éramos" +] \ No newline at end of file diff --git a/stopwords/ro.json b/stopwords/ro.json new file mode 100644 index 0000000..bc1f8e8 --- /dev/null +++ b/stopwords/ro.json @@ -0,0 +1,280 @@ +[ + "vreo", + "acelea", + "cata", + "cita", + "degraba", + "lor", + "alta", + "tot", + "ai", + "dat", + "despre", + "peste", + "bine", + "dar", + "foarte", + "avea", + "multi", + "cit", + "cat", + "alt", + "mai", + "sa", + "fie", + "tu", + "intrucat", + "multe", + "orice", + "dintr", + "dintre", + "dintr-o", + "dintr-un", + "se", + "intr", + "intr-o", + "intr-un", + "niste", + "multa", + "insa", + "il", + "fost", + "a", + "abia", + "nimic", + "sub", + "acel", + "in", + "altceva", + "si", + "avem", + "altfel", + "c", + "ea", + "acest", + "li", + "parca", + "fi", + "dintre", + "unele", + "m", + "acestei", + "mare", + "cel", + "este", + "pe", + "atitia", + "atatia", + "uneori", + "acela", + "iti", + "astazi", + "acestui", + "o", + "imi", + "ele", + "ceilalti", + "pai", + "fata", + "noua", + "sa-ti", + "altul", + "au", + "i", + "prin", + "conform", + "aceste", + "anume", + "azi", + "k", + "unul", + "ala", + "unei", + "fara", + "ei", + "la", + "aceeasi", + "u", + "inapoi", + "acestea", + "acesta", + "aceasta", + "catre", + "sale", + "asupra", + "as", + "aceea", + "ba", + "ale", + "da", + "le", + "apoi", + "aia", + "suntem", + "cum", + "isi", + "inainte", + "s", + "de", + "cind", + "cand", + "cumva", + "chiar", + "acestia", + "daca", + "sunt", + "care", + "al", + "numai", + "cui", + "sus", + "tocmai", + "prea", + "cu", + "mi", + "eu", + "doar", + "niciodata", + "nicidecum", + "exact", + "putini", + "aiurea", + "tuturor", + "celor", + "astfel", + "atunci", + "citeva", + "cateva", + "cat", + "ca", + "sau", + "fel", + "intre", + "acolo", + "nostri", + "ma", + "mult", + "una", + "ceea", + "iar", + "iara", + "sintem", + "suntem", + "ati", + "din", + "geaba", + "sai", + "caruia", + "adica", + "inca", + "are", + "aici", + "ca", + "ia", + "nici", + "d", + "oricum", + "asta", + "carora", + "face", + "citiva", + "cativa", + "voi", + "unor", + "f", + "atat", + "toata", + "alaturi", + "cea", + "nu", + "totusi", + "ce", + "altii", + "acum", + "sint", + "sunt", + "capat", + "mod", + "deasupra", + "cam", + "vom", + "b", + "toate", + "careia", + "aceasta", + "atit", + "atat", + "nimeni", + "ii", + "ci", + "unde", + "ul", + "plus", + "era", + "sa-mi", + "l", + "spre", + "dupa", + "nou", + "cele", + "acea", + "un", + "incit", + "incat", + "n", + "cei", + "or", + "va", + "deci", + "acelasi", + "atatea", + "h", + "vor", + "decit", + "decat", + "noi", + "cineva", + "desi", + "ceva", + "j", + "ului", + "atitea", + "atatea", + "avut", + "ar", + "pina", + "pana", + "t", + "atata", + "unui", + "el", + "citi", + "asa", + "totul", + "pentru", + "atita", + "v", + "alti", + "asemenea", + "atatia", + "te", + "ne", + "deja", + "unii", + "p", + "atare", + "cite", + "cate", + "cine", + "cand", + "toti", + "vreun", + "ori", + "r", + "alte", + "lui", + "ti", + "ni", + "aceia", + "am" +] \ No newline at end of file diff --git a/stopwords/ru.json b/stopwords/ru.json new file mode 100644 index 0000000..992d4d6 --- /dev/null +++ b/stopwords/ru.json @@ -0,0 +1,423 @@ +[ + "а", + "в", + "г", + "е", + "ж", + "и", + "к", + "м", + "о", + "с", + "т", + "у", + "я", + "бы", + "во", + "вы", + "да", + "до", + "ее", + "ей", + "ею", + "её", + "же", + "за", + "из", + "им", + "их", + "ли", + "мы", + "на", + "не", + "ни", + "но", + "ну", + "нх", + "об", + "он", + "от", + "по", + "со", + "та", + "те", + "то", + "ту", + "ты", + "уж", + "без", + "был", + "вам", + "вас", + "ваш", + "вон", + "вот", + "все", + "всю", + "вся", + "всё", + "где", + "год", + "два", + "две", + "дел", + "для", + "его", + "ему", + "еще", + "ещё", + "или", + "ими", + "имя", + "как", + "кем", + "ком", + "кто", + "лет", + "мне", + "мог", + "мож", + "мои", + "мой", + "мор", + "моя", + "моё", + "над", + "нам", + "нас", + "наш", + "нее", + "ней", + "нем", + "нет", + "нею", + "неё", + "них", + "оба", + "она", + "они", + "оно", + "под", + "пор", + "при", + "про", + "раз", + "сам", + "сих", + "так", + "там", + "тем", + "тех", + "том", + "тот", + "тою", + "три", + "тут", + "уже", + "чем", + "что", + "эта", + "эти", + "это", + "эту", + "алло", + "буду", + "будь", + "бывь", + "была", + "были", + "было", + "быть", + "вами", + "ваша", + "ваше", + "ваши", + "ведь", + "весь", + "вниз", + "всем", + "всех", + "всею", + "года", + "году", + "даже", + "двух", + "день", + "если", + "есть", + "зато", + "кого", + "кому", + "куда", + "лишь", + "люди", + "мало", + "меля", + "меня", + "мимо", + "мира", + "мной", + "мною", + "мочь", + "надо", + "нами", + "наша", + "наше", + "наши", + "него", + "нему", + "ниже", + "ними", + "один", + "пока", + "пора", + "пять", + "рано", + "сама", + "сами", + "само", + "саму", + "свое", + "свои", + "свою", + "себе", + "себя", + "семь", + "стал", + "суть", + "твой", + "твоя", + "твоё", + "тебе", + "тебя", + "теми", + "того", + "тоже", + "тому", + "туда", + "хоть", + "хотя", + "чаще", + "чего", + "чему", + "чтоб", + "чуть", + "этим", + "этих", + "этой", + "этом", + "этот", + "более", + "будем", + "будет", + "будто", + "будут", + "вверх", + "вдали", + "вдруг", + "везде", + "внизу", + "время", + "всего", + "всеми", + "всему", + "всюду", + "давно", + "даром", + "долго", + "друго", + "жизнь", + "занят", + "затем", + "зачем", + "здесь", + "иметь", + "какая", + "какой", + "когда", + "кроме", + "лучше", + "между", + "менее", + "много", + "могут", + "может", + "можно", + "можхо", + "назад", + "низко", + "нужно", + "одной", + "около", + "опять", + "очень", + "перед", + "позже", + "после", + "потом", + "почти", + "пятый", + "разве", + "рядом", + "самим", + "самих", + "самой", + "самом", + "своей", + "своих", + "сеаой", + "снова", + "собой", + "собою", + "такая", + "также", + "такие", + "такое", + "такой", + "тобой", + "тобою", + "тогда", + "тысяч", + "уметь", + "часто", + "через", + "чтобы", + "шесть", + "этими", + "этого", + "этому", + "близко", + "больше", + "будете", + "будешь", + "бывает", + "важная", + "важное", + "важные", + "важный", + "вокруг", + "восемь", + "всегда", + "второй", + "далеко", + "дальше", + "девять", + "десять", + "должно", + "другая", + "другие", + "других", + "другое", + "другой", + "занята", + "занято", + "заняты", + "значит", + "именно", + "иногда", + "каждая", + "каждое", + "каждые", + "каждый", + "кругом", + "меньше", + "начала", + "нельзя", + "нибудь", + "никуда", + "ничего", + "обычно", + "однако", + "одного", + "отсюда", + "первый", + "потому", + "почему", + "просто", + "против", + "раньше", + "самими", + "самого", + "самому", + "своего", + "сейчас", + "сказал", + "совсем", + "теперь", + "только", + "третий", + "хорошо", + "хотеть", + "хочешь", + "четыре", + "шестой", + "восьмой", + "впрочем", + "времени", + "говорил", + "говорит", + "девятый", + "десятый", + "кажется", + "конечно", + "которая", + "которой", + "которые", + "который", + "которых", + "наверху", + "наконец", + "недавно", + "немного", + "нередко", + "никогда", + "однажды", + "посреди", + "сегодня", + "седьмой", + "сказала", + "сказать", + "сколько", + "слишком", + "сначала", + "спасибо", + "человек", + "двадцать", + "довольно", + "которого", + "наиболее", + "недалеко", + "особенно", + "отовсюду", + "двадцатый", + "миллионов", + "несколько", + "прекрасно", + "процентов", + "четвертый", + "двенадцать", + "непрерывно", + "пожалуйста", + "пятнадцать", + "семнадцать", + "тринадцать", + "двенадцатый", + "одиннадцать", + "пятнадцатый", + "семнадцатый", + "тринадцатый", + "шестнадцать", + "восемнадцать", + "девятнадцать", + "одиннадцатый", + "четырнадцать", + "шестнадцатый", + "восемнадцатый", + "девятнадцатый", + "действительно", + "четырнадцатый", + "многочисленная", + "многочисленное", + "многочисленные", + "многочисленный" +] \ No newline at end of file diff --git a/stopwords/sk.json b/stopwords/sk.json new file mode 100644 index 0000000..bf66236 --- /dev/null +++ b/stopwords/sk.json @@ -0,0 +1,175 @@ +[ + "a", + "aby", + "aj", + "ak", + "ako", + "ale", + "alebo", + "and", + "ani", + "áno", + "asi", + "až", + "bez", + "bude", + "budem", + "budeš", + "budeme", + "budete", + "budú", + "by", + "bol", + "bola", + "boli", + "bolo", + "byť", + "cez", + "čo", + "či", + "ďalší", + "ďalšia", + "ďalšie", + "dnes", + "do", + "ho", + "ešte", + "for", + "i", + "ja", + "je", + "jeho", + "jej", + "ich", + "iba", + "iné", + "iný", + "som", + "si", + "sme", + "sú", + "k", + "kam", + "každý", + "každá", + "každé", + "každí", + "kde", + "keď", + "kto", + "ktorá", + "ktoré", + "ktorou", + "ktorý", + "ktorí", + "ku", + "lebo", + "len", + "ma", + "mať", + "má", + "máte", + "medzi", + "mi", + "mna", + "mne", + "mnou", + "musieť", + "môcť", + "môj", + "môže", + "my", + "na", + "nad", + "nám", + "náš", + "naši", + "nie", + "nech", + "než", + "nič", + "niektorý", + "nové", + "nový", + "nová", + "nové", + "noví", + "o", + "od", + "odo", + "of", + "on", + "ona", + "ono", + "oni", + "ony", + "po", + "pod", + "podľa", + "pokiaľ", + "potom", + "práve", + "pre", + "prečo", + "preto", + "pretože", + "prvý", + "prvá", + "prvé", + "prví", + "pred", + "predo", + "pri", + "pýta", + "s", + "sa", + "so", + "si", + "svoje", + "svoj", + "svojich", + "svojím", + "svojími", + "ta", + "tak", + "takže", + "táto", + "teda", + "te", + "tě", + "ten", + "tento", + "the", + "tieto", + "tým", + "týmto", + "tiež", + "to", + "toto", + "toho", + "tohoto", + "tom", + "tomto", + "tomuto", + "toto", + "tu", + "tú", + "túto", + "tvoj", + "ty", + "tvojími", + "už", + "v", + "vám", + "váš", + "vaše", + "vo", + "viac", + "však", + "všetok", + "vy", + "z", + "za", + "zo", + "že" +] \ No newline at end of file diff --git a/stopwords/sv.json b/stopwords/sv.json new file mode 100644 index 0000000..b037244 --- /dev/null +++ b/stopwords/sv.json @@ -0,0 +1,116 @@ +[ + "alla", + "allt", + "att", + "av", + "blev", + "bli", + "blir", + "blivit", + "de", + "dem", + "den", + "denna", + "deras", + "dess", + "dessa", + "det", + "detta", + "dig", + "din", + "dina", + "ditt", + "du", + "där", + "då", + "efter", + "ej", + "eller", + "en", + "er", + "era", + "ert", + "ett", + "från", + "för", + "ha", + "hade", + "han", + "hans", + "har", + "henne", + "hennes", + "hon", + "honom", + "hur", + "här", + "i", + "icke", + "ingen", + "inom", + "inte", + "jag", + "ju", + "kan", + "kunde", + "man", + "med", + "mellan", + "men", + "mig", + "min", + "mina", + "mitt", + "mot", + "mycket", + "ni", + "nu", + "när", + "någon", + "något", + "några", + "och", + "om", + "oss", + "på", + "samma", + "sedan", + "sig", + "sin", + "sina", + "sitta", + "själv", + "skulle", + "som", + "så", + "sådan", + "sådana", + "sådant", + "till", + "under", + "upp", + "ut", + "utan", + "vad", + "var", + "vara", + "varför", + "varit", + "varje", + "vars", + "vart", + "vem", + "vi", + "vid", + "vilka", + "vilkas", + "vilken", + "vilket", + "vår", + "våra", + "vårt", + "än", + "är", + "åt", + "över" +] \ No newline at end of file diff --git a/stopwords/tr.json b/stopwords/tr.json new file mode 100644 index 0000000..21165db --- /dev/null +++ b/stopwords/tr.json @@ -0,0 +1,116 @@ +[ + "mu", + "onlar", + "seksen", + "ama", + "trilyon", + "buna", + "bizim", + "þeyden", + "yirmi", + "altý", + "iki", + "seni", + "doksan", + "dört", + "bunun", + "ki", + "nereye", + "altmýþ", + "hem", + "milyon", + "kez", + "otuz", + "beþ", + "elli", + "bizi", + "da", + "sekiz", + "ve", + "çok", + "bu", + "veya", + "ya", + "kýrk", + "onlarýn", + "ona", + "bana", + "yetmiþ", + "milyar", + "þunu", + "senden", + "birþeyi", + "dokuz", + "yani", + "kimi", + "þeyler", + "kim", + "neden", + "senin", + "yedi", + "niye", + "üç", + "þey", + "mý", + "tüm", + "onlari", + "bunda", + "ise", + "þundan", + "hep", + "þuna", + "bin", + "ben", + "ondan", + "kimden", + "bazý", + "belki", + "ne", + "bundan", + "gibi", + "de", + "onlardan", + "sizi", + "sizin", + "daha", + "niçin", + "þunda", + "INSERmi", + "bunu", + "beni", + "ile", + "þu", + "þeyi", + "sizden", + "defa", + "biz", + "için", + "dahi", + "siz", + "nerde", + "kime", + "birþey", + "birkez", + "her", + "biri", + "on", + "mü", + "diye", + "acaba", + "sen", + "en", + "hepsi", + "bir", + "bizden", + "sanki", + "benim", + "nerede", + "onu", + "benden", + "yüz", + "birkaç", + "çünkü", + "nasýl", + "hiç", + "katrilyon" +] \ No newline at end of file diff --git a/stopwords/uk.json b/stopwords/uk.json new file mode 100644 index 0000000..1d6feed --- /dev/null +++ b/stopwords/uk.json @@ -0,0 +1,387 @@ +[ + "a", + "б", + "в", + "г", + "е", + "ж", + "з", + "м", + "т", + "у", + "я", + "є", + "і", + "аж", + "ви", + "де", + "до", + "за", + "зі", + "ми", + "на", + "не", + "ну", + "нх", + "ні", + "по", + "та", + "ти", + "то", + "ту", + "ті", + "це", + "цю", + "ця", + "ці", + "чи", + "ще", + "що", + "як", + "їй", + "їм", + "їх", + "її", + "або", + "але", + "ало", + "без", + "був", + "вам", + "вас", + "ваш", + "вже", + "все", + "всю", + "вся", + "від", + "він", + "два", + "дві", + "для", + "ким", + "мож", + "моя", + "моє", + "мої", + "міг", + "між", + "мій", + "над", + "нам", + "нас", + "наш", + "нею", + "неї", + "них", + "ніж", + "ній", + "ось", + "при", + "про", + "під", + "пір", + "раз", + "рік", + "сам", + "сих", + "сім", + "так", + "там", + "теж", + "тим", + "тих", + "той", + "тою", + "три", + "тут", + "хоч", + "хто", + "цей", + "цим", + "цих", + "час", + "щоб", + "яка", + "які", + "адже", + "буде", + "буду", + "будь", + "була", + "були", + "було", + "бути", + "вами", + "ваша", + "ваше", + "ваші", + "весь", + "вниз", + "вона", + "вони", + "воно", + "всею", + "всім", + "всіх", + "втім", + "геть", + "далі", + "двох", + "день", + "дуже", + "зате", + "його", + "йому", + "каже", + "кого", + "коли", + "кому", + "крім", + "куди", + "лише", + "люди", + "мало", + "мати", + "мене", + "мені", + "миру", + "мною", + "може", + "нами", + "наша", + "наше", + "наші", + "ними", + "ніби", + "один", + "поки", + "пора", + "рано", + "року", + "році", + "сама", + "саме", + "саму", + "самі", + "свою", + "своє", + "свої", + "себе", + "собі", + "став", + "суть", + "така", + "таке", + "такі", + "твоя", + "твоє", + "твій", + "тебе", + "тими", + "тобі", + "того", + "тоді", + "тому", + "туди", + "хоча", + "хіба", + "цими", + "цієї", + "часу", + "чого", + "чому", + "який", + "яких", + "якої", + "якщо", + "ім'я", + "інша", + "інше", + "інші", + "буває", + "будеш", + "більш", + "вгору", + "вміти", + "внизу", + "вісім", + "давно", + "даром", + "добре", + "довго", + "друго", + "дякую", + "життя", + "зараз", + "знову", + "какая", + "кожен", + "кожна", + "кожне", + "кожні", + "краще", + "ледве", + "майже", + "менше", + "могти", + "можна", + "назад", + "немає", + "нижче", + "нього", + "однак", + "п'ять", + "перед", + "поруч", + "потім", + "проти", + "після", + "років", + "самим", + "самих", + "самій", + "свого", + "своєї", + "своїх", + "собою", + "справ", + "такий", + "також", + "тепер", + "тисяч", + "тобою", + "треба", + "трохи", + "усюди", + "усіма", + "хочеш", + "цього", + "цьому", + "часто", + "через", + "шість", + "якого", + "іноді", + "інший", + "інших", + "багато", + "будемо", + "будете", + "будуть", + "більше", + "всього", + "всьому", + "далеко", + "десять", + "досить", + "другий", + "дійсно", + "завжди", + "звідси", + "зовсім", + "кругом", + "кілька", + "людина", + "можуть", + "навіть", + "навіщо", + "нагорі", + "небудь", + "низько", + "ніколи", + "нікуди", + "нічого", + "обидва", + "одного", + "однієї", + "п'ятий", + "перший", + "просто", + "раніше", + "раптом", + "самими", + "самого", + "самому", + "сказав", + "скрізь", + "сьомий", + "третій", + "тільки", + "хотіти", + "чотири", + "чудово", + "шостий", + "близько", + "важлива", + "важливе", + "важливі", + "вдалині", + "восьмий", + "говорив", + "дев'ять", + "десятий", + "зайнята", + "зайнято", + "зайняті", + "занадто", + "значить", + "навколо", + "нарешті", + "нерідко", + "повинно", + "посеред", + "початку", + "пізніше", + "сказала", + "сказати", + "скільки", + "спасибі", + "частіше", + "важливий", + "двадцять", + "дев'ятий", + "зазвичай", + "зайнятий", + "звичайно", + "здається", + "найбільш", + "не можна", + "недалеко", + "особливо", + "потрібно", + "спочатку", + "сьогодні", + "численна", + "численне", + "численні", + "відсотків", + "двадцятий", + "звідусіль", + "мільйонів", + "нещодавно", + "прекрасно", + "четвертий", + "численний", + "будь ласка", + "дванадцять", + "одинадцять", + "сімнадцять", + "тринадцять", + "безперервно", + "дванадцятий", + "одинадцятий", + "одного разу", + "п'ятнадцять", + "сімнадцятий", + "тринадцятий", + "шістнадцять", + "вісімнадцять", + "п'ятнадцятий", + "чотирнадцять", + "шістнадцятий", + "вісімнадцятий", + "дев'ятнадцять", + "чотирнадцятий", + "дев'ятнадцятий" +] \ No newline at end of file diff --git a/stopwords/vi.json b/stopwords/vi.json new file mode 100644 index 0000000..070bbb0 --- /dev/null +++ b/stopwords/vi.json @@ -0,0 +1,1945 @@ +[ + "a lô", + "a ha", + "ai", + "ai ai", + "ai nấy", + "ai đó", + "alô", + "amen", + "anh", + "anh ấy", + "ba", + "ba ba", + "ba bản", + "ba cùng", + "ba họ", + "ba ngày", + "ba ngôi", + "ba tăng", + "bao giờ", + "bao lâu", + "bao nhiêu", + "bao nả", + "bay biến", + "biết", + "biết bao", + "biết bao nhiêu", + "biết chắc", + "biết chừng nào", + "biết mình", + "biết mấy", + "biết thế", + "biết trước", + "biết việc", + "biết đâu", + "biết đâu chừng", + "biết đâu đấy", + "biết được", + "buổi", + "buổi làm", + "buổi mới", + "buổi ngày", + "buổi sớm", + "bà", + "bà ấy", + "bài", + "bài bác", + "bài bỏ", + "bài cái", + "bác", + "bán", + "bán cấp", + "bán dạ", + "bán thế", + "bây bẩy", + "bây chừ", + "bây giờ", + "bây nhiêu", + "bèn", + "béng", + "bên", + "bên bị", + "bên có", + "bên cạnh", + "bông", + "bước", + "bước khỏi", + "bước tới", + "bước đi", + "bạn", + "bản", + "bản bộ", + "bản riêng", + "bản thân", + "bản ý", + "bất chợt", + "bất cứ", + "bất giác", + "bất kì", + "bất kể", + "bất kỳ", + "bất luận", + "bất ngờ", + "bất nhược", + "bất quá", + "bất quá chỉ", + "bất thình lình", + "bất tử", + "bất đồ", + "bấy", + "bấy chầy", + "bấy chừ", + "bấy giờ", + "bấy lâu", + "bấy lâu nay", + "bấy nay", + "bấy nhiêu", + "bập bà bập bõm", + "bập bõm", + "bắt đầu", + "bắt đầu từ", + "bằng", + "bằng cứ", + "bằng không", + "bằng người", + "bằng nhau", + "bằng như", + "bằng nào", + "bằng nấy", + "bằng vào", + "bằng được", + "bằng ấy", + "bển", + "bệt", + "bị", + "bị chú", + "bị vì", + "bỏ", + "bỏ bà", + "bỏ cha", + "bỏ cuộc", + "bỏ không", + "bỏ lại", + "bỏ mình", + "bỏ mất", + "bỏ mẹ", + "bỏ nhỏ", + "bỏ quá", + "bỏ ra", + "bỏ riêng", + "bỏ việc", + "bỏ xa", + "bỗng", + "bỗng chốc", + "bỗng dưng", + "bỗng không", + "bỗng nhiên", + "bỗng nhưng", + "bỗng thấy", + "bỗng đâu", + "bộ", + "bộ thuộc", + "bộ điều", + "bội phần", + "bớ", + "bởi", + "bởi ai", + "bởi chưng", + "bởi nhưng", + "bởi sao", + "bởi thế", + "bởi thế cho nên", + "bởi tại", + "bởi vì", + "bởi vậy", + "bởi đâu", + "bức", + "cao", + "cao lâu", + "cao ráo", + "cao răng", + "cao sang", + "cao số", + "cao thấp", + "cao thế", + "cao xa", + "cha", + "cha chả", + "chao ôi", + "chia sẻ", + "chiếc", + "cho", + "cho biết", + "cho chắc", + "cho hay", + "cho nhau", + "cho nên", + "cho rằng", + "cho rồi", + "cho thấy", + "cho tin", + "cho tới", + "cho tới khi", + "cho về", + "cho ăn", + "cho đang", + "cho được", + "cho đến", + "cho đến khi", + "cho đến nỗi", + "choa", + "chu cha", + "chui cha", + "chung", + "chung cho", + "chung chung", + "chung cuộc", + "chung cục", + "chung nhau", + "chung qui", + "chung quy", + "chung quy lại", + "chung ái", + "chuyển", + "chuyển tự", + "chuyển đạt", + "chuyện", + "chuẩn bị", + "chành chạnh", + "chí chết", + "chính", + "chính bản", + "chính giữa", + "chính là", + "chính thị", + "chính điểm", + "chùn chùn", + "chùn chũn", + "chú", + "chú dẫn", + "chú khách", + "chú mày", + "chú mình", + "chúng", + "chúng mình", + "chúng ta", + "chúng tôi", + "chúng ông", + "chăn chắn", + "chăng", + "chăng chắc", + "chăng nữa", + "chơi", + "chơi họ", + "chưa", + "chưa bao giờ", + "chưa chắc", + "chưa có", + "chưa cần", + "chưa dùng", + "chưa dễ", + "chưa kể", + "chưa tính", + "chưa từng", + "chầm chập", + "chậc", + "chắc", + "chắc chắn", + "chắc dạ", + "chắc hẳn", + "chắc lòng", + "chắc người", + "chắc vào", + "chắc ăn", + "chẳng lẽ", + "chẳng những", + "chẳng nữa", + "chẳng phải", + "chết nỗi", + "chết thật", + "chết tiệt", + "chỉ", + "chỉ chính", + "chỉ có", + "chỉ là", + "chỉ tên", + "chỉn", + "chị", + "chị bộ", + "chị ấy", + "chịu", + "chịu chưa", + "chịu lời", + "chịu tốt", + "chịu ăn", + "chọn", + "chọn bên", + "chọn ra", + "chốc chốc", + "chớ", + "chớ chi", + "chớ gì", + "chớ không", + "chớ kể", + "chớ như", + "chợt", + "chợt nghe", + "chợt nhìn", + "chủn", + "chứ", + "chứ ai", + "chứ còn", + "chứ gì", + "chứ không", + "chứ không phải", + "chứ lại", + "chứ lị", + "chứ như", + "chứ sao", + "coi bộ", + "coi mòi", + "con", + "con con", + "con dạ", + "con nhà", + "con tính", + "cu cậu", + "cuối", + "cuối cùng", + "cuối điểm", + "cuốn", + "cuộc", + "càng", + "càng càng", + "càng hay", + "cá nhân", + "các", + "các cậu", + "cách", + "cách bức", + "cách không", + "cách nhau", + "cách đều", + "cái", + "cái gì", + "cái họ", + "cái đã", + "cái đó", + "cái ấy", + "câu hỏi", + "cây", + "cây nước", + "còn", + "còn như", + "còn nữa", + "còn thời gian", + "còn về", + "còn có", + "có", + "có ai", + "có chuyện", + "có chăng", + "có chăng là", + "có chứ", + "có cơ", + "có dễ", + "có họ", + "có khi", + "có ngày", + "có người", + "có nhiều", + "có nhà", + "có phải", + "có số", + "có tháng", + "có thế", + "có thể", + "có vẻ", + "có ý", + "có ăn", + "có điều", + "có điều kiện", + "có đáng", + "có đâu", + "có được", + "cóc khô", + "cô", + "cô mình", + "cô quả", + "cô tăng", + "cô ấy", + "công nhiên", + "cùng", + "cùng chung", + "cùng cực", + "cùng nhau", + "cùng tuổi", + "cùng tột", + "cùng với", + "cùng ăn", + "căn", + "căn cái", + "căn cắt", + "căn tính", + "cũng", + "cũng như", + "cũng nên", + "cũng thế", + "cũng vậy", + "cũng vậy thôi", + "cũng được", + "cơ", + "cơ chỉ", + "cơ chừng", + "cơ cùng", + "cơ dẫn", + "cơ hồ", + "cơ hội", + "cơ mà", + "cơn", + "cả", + "cả nghe", + "cả nghĩ", + "cả ngày", + "cả người", + "cả nhà", + "cả năm", + "cả thảy", + "cả thể", + "cả tin", + "cả ăn", + "cả đến", + "cảm thấy", + "cảm ơn", + "cấp", + "cấp số", + "cấp trực tiếp", + "cần", + "cần cấp", + "cần gì", + "cần số", + "cật lực", + "cật sức", + "cậu", + "cổ lai", + "cụ thể", + "cụ thể là", + "cụ thể như", + "của", + "của ngọt", + "của tin", + "cứ", + "cứ như", + "cứ việc", + "cứ điểm", + "cực lực", + "do", + "do vì", + "do vậy", + "do đó", + "duy", + "duy chỉ", + "duy có", + "dài", + "dài lời", + "dài ra", + "dành", + "dành dành", + "dào", + "dì", + "dù", + "dù cho", + "dù dì", + "dù gì", + "dù rằng", + "dù sao", + "dùng", + "dùng cho", + "dùng hết", + "dùng làm", + "dùng đến", + "dưới", + "dưới nước", + "dạ", + "dạ bán", + "dạ con", + "dạ dài", + "dạ dạ", + "dạ khách", + "dần dà", + "dần dần", + "dầu sao", + "dẫn", + "dẫu", + "dẫu mà", + "dẫu rằng", + "dẫu sao", + "dễ", + "dễ dùng", + "dễ gì", + "dễ khiến", + "dễ nghe", + "dễ ngươi", + "dễ như chơi", + "dễ sợ", + "dễ sử dụng", + "dễ thường", + "dễ thấy", + "dễ ăn", + "dễ đâu", + "dở chừng", + "dữ", + "dữ cách", + "em", + "em em", + "giá trị", + "giá trị thực tế", + "giảm", + "giảm chính", + "giảm thấp", + "giảm thế", + "giống", + "giống người", + "giống nhau", + "giống như", + "giờ", + "giờ lâu", + "giờ này", + "giờ đi", + "giờ đây", + "giờ đến", + "giữ", + "giữ lấy", + "giữ ý", + "giữa", + "giữa lúc", + "gây", + "gây cho", + "gây giống", + "gây ra", + "gây thêm", + "gì", + "gì gì", + "gì đó", + "gần", + "gần bên", + "gần hết", + "gần ngày", + "gần như", + "gần xa", + "gần đây", + "gần đến", + "gặp", + "gặp khó khăn", + "gặp phải", + "gồm", + "hay", + "hay biết", + "hay hay", + "hay không", + "hay là", + "hay làm", + "hay nhỉ", + "hay nói", + "hay sao", + "hay tin", + "hay đâu", + "hiểu", + "hiện nay", + "hiện tại", + "hoàn toàn", + "hoặc", + "hoặc là", + "hãy", + "hãy còn", + "hơn", + "hơn cả", + "hơn hết", + "hơn là", + "hơn nữa", + "hơn trước", + "hầu hết", + "hết", + "hết chuyện", + "hết cả", + "hết của", + "hết nói", + "hết ráo", + "hết rồi", + "hết ý", + "họ", + "họ gần", + "họ xa", + "hỏi", + "hỏi lại", + "hỏi xem", + "hỏi xin", + "hỗ trợ", + "khi", + "khi khác", + "khi không", + "khi nào", + "khi nên", + "khi trước", + "khiến", + "khoảng", + "khoảng cách", + "khoảng không", + "khá", + "khá tốt", + "khác", + "khác gì", + "khác khác", + "khác nhau", + "khác nào", + "khác thường", + "khác xa", + "khách", + "khó", + "khó biết", + "khó chơi", + "khó khăn", + "khó làm", + "khó mở", + "khó nghe", + "khó nghĩ", + "khó nói", + "khó thấy", + "khó tránh", + "không", + "không ai", + "không bao giờ", + "không bao lâu", + "không biết", + "không bán", + "không chỉ", + "không còn", + "không có", + "không có gì", + "không cùng", + "không cần", + "không cứ", + "không dùng", + "không gì", + "không hay", + "không khỏi", + "không kể", + "không ngoài", + "không nhận", + "không những", + "không phải", + "không phải không", + "không thể", + "không tính", + "không điều kiện", + "không được", + "không đầy", + "không để", + "khẳng định", + "khỏi", + "khỏi nói", + "kể", + "kể cả", + "kể như", + "kể tới", + "kể từ", + "liên quan", + "loại", + "loại từ", + "luôn", + "luôn cả", + "luôn luôn", + "luôn tay", + "là", + "là cùng", + "là là", + "là nhiều", + "là phải", + "là thế nào", + "là vì", + "là ít", + "làm", + "làm bằng", + "làm cho", + "làm dần dần", + "làm gì", + "làm lòng", + "làm lại", + "làm lấy", + "làm mất", + "làm ngay", + "làm như", + "làm nên", + "làm ra", + "làm riêng", + "làm sao", + "làm theo", + "làm thế nào", + "làm tin", + "làm tôi", + "làm tăng", + "làm tại", + "làm tắp lự", + "làm vì", + "làm đúng", + "làm được", + "lâu", + "lâu các", + "lâu lâu", + "lâu nay", + "lâu ngày", + "lên", + "lên cao", + "lên cơn", + "lên mạnh", + "lên ngôi", + "lên nước", + "lên số", + "lên xuống", + "lên đến", + "lòng", + "lòng không", + "lúc", + "lúc khác", + "lúc lâu", + "lúc nào", + "lúc này", + "lúc sáng", + "lúc trước", + "lúc đi", + "lúc đó", + "lúc đến", + "lúc ấy", + "lý do", + "lượng", + "lượng cả", + "lượng số", + "lượng từ", + "lại", + "lại bộ", + "lại cái", + "lại còn", + "lại giống", + "lại làm", + "lại người", + "lại nói", + "lại nữa", + "lại quả", + "lại thôi", + "lại ăn", + "lại đây", + "lấy", + "lấy có", + "lấy cả", + "lấy giống", + "lấy làm", + "lấy lý do", + "lấy lại", + "lấy ra", + "lấy ráo", + "lấy sau", + "lấy số", + "lấy thêm", + "lấy thế", + "lấy vào", + "lấy xuống", + "lấy được", + "lấy để", + "lần", + "lần khác", + "lần lần", + "lần nào", + "lần này", + "lần sang", + "lần sau", + "lần theo", + "lần trước", + "lần tìm", + "lớn", + "lớn lên", + "lớn nhỏ", + "lời", + "lời chú", + "lời nói", + "mang", + "mang lại", + "mang mang", + "mang nặng", + "mang về", + "muốn", + "mà", + "mà cả", + "mà không", + "mà lại", + "mà thôi", + "mà vẫn", + "mình", + "mạnh", + "mất", + "mất còn", + "mọi", + "mọi giờ", + "mọi khi", + "mọi lúc", + "mọi người", + "mọi nơi", + "mọi sự", + "mọi thứ", + "mọi việc", + "mối", + "mỗi", + "mỗi lúc", + "mỗi lần", + "mỗi một", + "mỗi ngày", + "mỗi người", + "một", + "một cách", + "một cơn", + "một khi", + "một lúc", + "một số", + "một vài", + "một ít", + "mới", + "mới hay", + "mới rồi", + "mới đây", + "mở", + "mở mang", + "mở nước", + "mở ra", + "mợ", + "mức", + "nay", + "ngay", + "ngay bây giờ", + "ngay cả", + "ngay khi", + "ngay khi đến", + "ngay lúc", + "ngay lúc này", + "ngay lập tức", + "ngay thật", + "ngay tức khắc", + "ngay tức thì", + "ngay từ", + "nghe", + "nghe chừng", + "nghe hiểu", + "nghe không", + "nghe lại", + "nghe nhìn", + "nghe như", + "nghe nói", + "nghe ra", + "nghe rõ", + "nghe thấy", + "nghe tin", + "nghe trực tiếp", + "nghe đâu", + "nghe đâu như", + "nghe được", + "nghen", + "nghiễm nhiên", + "nghĩ", + "nghĩ lại", + "nghĩ ra", + "nghĩ tới", + "nghĩ xa", + "nghĩ đến", + "nghỉm", + "ngoài", + "ngoài này", + "ngoài ra", + "ngoài xa", + "ngoải", + "nguồn", + "ngày", + "ngày càng", + "ngày cấp", + "ngày giờ", + "ngày ngày", + "ngày nào", + "ngày này", + "ngày nọ", + "ngày qua", + "ngày rày", + "ngày tháng", + "ngày xưa", + "ngày xửa", + "ngày đến", + "ngày ấy", + "ngôi", + "ngôi nhà", + "ngôi thứ", + "ngõ hầu", + "ngăn ngắt", + "ngươi", + "người", + "người hỏi", + "người khác", + "người khách", + "người mình", + "người nghe", + "người người", + "người nhận", + "ngọn", + "ngọn nguồn", + "ngọt", + "ngồi", + "ngồi bệt", + "ngồi không", + "ngồi sau", + "ngồi trệt", + "ngộ nhỡ", + "nhanh", + "nhanh lên", + "nhanh tay", + "nhau", + "nhiên hậu", + "nhiều", + "nhiều ít", + "nhiệt liệt", + "nhung nhăng", + "nhà", + "nhà chung", + "nhà khó", + "nhà làm", + "nhà ngoài", + "nhà ngươi", + "nhà tôi", + "nhà việc", + "nhân dịp", + "nhân tiện", + "nhé", + "nhìn", + "nhìn chung", + "nhìn lại", + "nhìn nhận", + "nhìn theo", + "nhìn thấy", + "nhìn xuống", + "nhóm", + "nhón nhén", + "như", + "như ai", + "như chơi", + "như không", + "như là", + "như nhau", + "như quả", + "như sau", + "như thường", + "như thế", + "như thế nào", + "như thể", + "như trên", + "như trước", + "như tuồng", + "như vậy", + "như ý", + "nhưng", + "nhưng mà", + "nhược bằng", + "nhất", + "nhất loạt", + "nhất luật", + "nhất là", + "nhất mực", + "nhất nhất", + "nhất quyết", + "nhất sinh", + "nhất thiết", + "nhất thì", + "nhất tâm", + "nhất tề", + "nhất đán", + "nhất định", + "nhận", + "nhận biết", + "nhận họ", + "nhận làm", + "nhận nhau", + "nhận ra", + "nhận thấy", + "nhận việc", + "nhận được", + "nhằm", + "nhằm khi", + "nhằm lúc", + "nhằm vào", + "nhằm để", + "nhỉ", + "nhỏ", + "nhỏ người", + "nhớ", + "nhớ bập bõm", + "nhớ lại", + "nhớ lấy", + "nhớ ra", + "nhờ", + "nhờ chuyển", + "nhờ có", + "nhờ nhờ", + "nhờ đó", + "nhỡ ra", + "những", + "những ai", + "những khi", + "những là", + "những lúc", + "những muốn", + "những như", + "nào", + "nào cũng", + "nào hay", + "nào là", + "nào phải", + "nào đâu", + "nào đó", + "này", + "này nọ", + "nên", + "nên chi", + "nên chăng", + "nên làm", + "nên người", + "nên tránh", + "nó", + "nóc", + "nói", + "nói bông", + "nói chung", + "nói khó", + "nói là", + "nói lên", + "nói lại", + "nói nhỏ", + "nói phải", + "nói qua", + "nói ra", + "nói riêng", + "nói rõ", + "nói thêm", + "nói thật", + "nói toẹt", + "nói trước", + "nói tốt", + "nói với", + "nói xa", + "nói ý", + "nói đến", + "nói đủ", + "năm", + "năm tháng", + "nơi", + "nơi nơi", + "nước", + "nước bài", + "nước cùng", + "nước lên", + "nước nặng", + "nước quả", + "nước xuống", + "nước ăn", + "nước đến", + "nấy", + "nặng", + "nặng căn", + "nặng mình", + "nặng về", + "nếu", + "nếu có", + "nếu cần", + "nếu không", + "nếu mà", + "nếu như", + "nếu thế", + "nếu vậy", + "nếu được", + "nền", + "nọ", + "nớ", + "nức nở", + "nữa", + "nữa khi", + "nữa là", + "nữa rồi", + "oai oái", + "oái", + "pho", + "phè", + "phè phè", + "phía", + "phía bên", + "phía bạn", + "phía dưới", + "phía sau", + "phía trong", + "phía trên", + "phía trước", + "phóc", + "phót", + "phù hợp", + "phăn phắt", + "phương chi", + "phải", + "phải biết", + "phải chi", + "phải chăng", + "phải cách", + "phải cái", + "phải giờ", + "phải khi", + "phải không", + "phải lại", + "phải lời", + "phải người", + "phải như", + "phải rồi", + "phải tay", + "phần", + "phần lớn", + "phần nhiều", + "phần nào", + "phần sau", + "phần việc", + "phắt", + "phỉ phui", + "phỏng", + "phỏng như", + "phỏng nước", + "phỏng theo", + "phỏng tính", + "phốc", + "phụt", + "phứt", + "qua", + "qua chuyện", + "qua khỏi", + "qua lại", + "qua lần", + "qua ngày", + "qua tay", + "qua thì", + "qua đi", + "quan trọng", + "quan trọng vấn đề", + "quan tâm", + "quay", + "quay bước", + "quay lại", + "quay số", + "quay đi", + "quá", + "quá bán", + "quá bộ", + "quá giờ", + "quá lời", + "quá mức", + "quá nhiều", + "quá tay", + "quá thì", + "quá tin", + "quá trình", + "quá tuổi", + "quá đáng", + "quá ư", + "quả", + "quả là", + "quả thật", + "quả thế", + "quả vậy", + "quận", + "ra", + "ra bài", + "ra bộ", + "ra chơi", + "ra gì", + "ra lại", + "ra lời", + "ra ngôi", + "ra người", + "ra sao", + "ra tay", + "ra vào", + "ra ý", + "ra điều", + "ra đây", + "ren rén", + "riu ríu", + "riêng", + "riêng từng", + "riệt", + "rày", + "ráo", + "ráo cả", + "ráo nước", + "ráo trọi", + "rén", + "rén bước", + "rích", + "rón rén", + "rõ", + "rõ là", + "rõ thật", + "rút cục", + "răng", + "răng răng", + "rất", + "rất lâu", + "rằng", + "rằng là", + "rốt cuộc", + "rốt cục", + "rồi", + "rồi nữa", + "rồi ra", + "rồi sao", + "rồi sau", + "rồi tay", + "rồi thì", + "rồi xem", + "rồi đây", + "rứa", + "sa sả", + "sang", + "sang năm", + "sang sáng", + "sang tay", + "sao", + "sao bản", + "sao bằng", + "sao cho", + "sao vậy", + "sao đang", + "sau", + "sau chót", + "sau cuối", + "sau cùng", + "sau hết", + "sau này", + "sau nữa", + "sau sau", + "sau đây", + "sau đó", + "so", + "so với", + "song le", + "suýt", + "suýt nữa", + "sáng", + "sáng ngày", + "sáng rõ", + "sáng thế", + "sáng ý", + "sì", + "sì sì", + "sất", + "sắp", + "sắp đặt", + "sẽ", + "sẽ biết", + "sẽ hay", + "số", + "số cho biết", + "số cụ thể", + "số loại", + "số là", + "số người", + "số phần", + "số thiếu", + "sốt sột", + "sớm", + "sớm ngày", + "sở dĩ", + "sử dụng", + "sự", + "sự thế", + "sự việc", + "tanh", + "tanh tanh", + "tay", + "tay quay", + "tha hồ", + "tha hồ chơi", + "tha hồ ăn", + "than ôi", + "thanh", + "thanh ba", + "thanh chuyển", + "thanh không", + "thanh thanh", + "thanh tính", + "thanh điều kiện", + "thanh điểm", + "thay đổi", + "thay đổi tình trạng", + "theo", + "theo bước", + "theo như", + "theo tin", + "thi thoảng", + "thiếu", + "thiếu gì", + "thiếu điểm", + "thoạt", + "thoạt nghe", + "thoạt nhiên", + "thoắt", + "thuần", + "thuần ái", + "thuộc", + "thuộc bài", + "thuộc cách", + "thuộc lại", + "thuộc từ", + "thà", + "thà là", + "thà rằng", + "thành ra", + "thành thử", + "thái quá", + "tháng", + "tháng ngày", + "tháng năm", + "tháng tháng", + "thêm", + "thêm chuyện", + "thêm giờ", + "thêm vào", + "thì", + "thì giờ", + "thì là", + "thì phải", + "thì ra", + "thì thôi", + "thình lình", + "thích", + "thích cứ", + "thích thuộc", + "thích tự", + "thích ý", + "thím", + "thôi", + "thôi việc", + "thúng thắng", + "thương ôi", + "thường", + "thường bị", + "thường hay", + "thường khi", + "thường số", + "thường sự", + "thường thôi", + "thường thường", + "thường tính", + "thường tại", + "thường xuất hiện", + "thường đến", + "thảo hèn", + "thảo nào", + "thấp", + "thấp cơ", + "thấp thỏm", + "thấp xuống", + "thấy", + "thấy tháng", + "thẩy", + "thậm", + "thậm chí", + "thậm cấp", + "thậm từ", + "thật", + "thật chắc", + "thật là", + "thật lực", + "thật quả", + "thật ra", + "thật sự", + "thật thà", + "thật tốt", + "thật vậy", + "thế", + "thế chuẩn bị", + "thế là", + "thế lại", + "thế mà", + "thế nào", + "thế nên", + "thế ra", + "thế sự", + "thế thì", + "thế thôi", + "thế thường", + "thế thế", + "thế à", + "thế đó", + "thếch", + "thỉnh thoảng", + "thỏm", + "thốc", + "thốc tháo", + "thốt", + "thốt nhiên", + "thốt nói", + "thốt thôi", + "thộc", + "thời gian", + "thời gian sử dụng", + "thời gian tính", + "thời điểm", + "thục mạng", + "thứ", + "thứ bản", + "thứ đến", + "thửa", + "thực hiện", + "thực hiện đúng", + "thực ra", + "thực sự", + "thực tế", + "thực vậy", + "tin", + "tin thêm", + "tin vào", + "tiếp theo", + "tiếp tục", + "tiếp đó", + "tiện thể", + "toà", + "toé khói", + "toẹt", + "trong", + "trong khi", + "trong lúc", + "trong mình", + "trong ngoài", + "trong này", + "trong số", + "trong vùng", + "trong đó", + "trong ấy", + "tránh", + "tránh khỏi", + "tránh ra", + "tránh tình trạng", + "tránh xa", + "trên", + "trên bộ", + "trên dưới", + "trước", + "trước hết", + "trước khi", + "trước kia", + "trước nay", + "trước ngày", + "trước nhất", + "trước sau", + "trước tiên", + "trước tuổi", + "trước đây", + "trước đó", + "trả", + "trả của", + "trả lại", + "trả ngay", + "trả trước", + "trếu tráo", + "trển", + "trệt", + "trệu trạo", + "trỏng", + "trời đất ơi", + "trở thành", + "trừ phi", + "trực tiếp", + "trực tiếp làm", + "tuy", + "tuy có", + "tuy là", + "tuy nhiên", + "tuy rằng", + "tuy thế", + "tuy vậy", + "tuy đã", + "tuyệt nhiên", + "tuần tự", + "tuốt luốt", + "tuốt tuồn tuột", + "tuốt tuột", + "tuổi", + "tuổi cả", + "tuổi tôi", + "tà tà", + "tên", + "tên chính", + "tên cái", + "tên họ", + "tên tự", + "tênh", + "tênh tênh", + "tìm", + "tìm bạn", + "tìm cách", + "tìm hiểu", + "tìm ra", + "tìm việc", + "tình trạng", + "tính", + "tính cách", + "tính căn", + "tính người", + "tính phỏng", + "tính từ", + "tít mù", + "tò te", + "tôi", + "tôi con", + "tông tốc", + "tù tì", + "tăm tắp", + "tăng", + "tăng chúng", + "tăng cấp", + "tăng giảm", + "tăng thêm", + "tăng thế", + "tại", + "tại lòng", + "tại nơi", + "tại sao", + "tại tôi", + "tại vì", + "tại đâu", + "tại đây", + "tại đó", + "tạo", + "tạo cơ hội", + "tạo nên", + "tạo ra", + "tạo ý", + "tạo điều kiện", + "tấm", + "tấm bản", + "tấm các", + "tấn", + "tấn tới", + "tất cả", + "tất cả bao nhiêu", + "tất thảy", + "tất tần tật", + "tất tật", + "tập trung", + "tắp", + "tắp lự", + "tắp tắp", + "tọt", + "tỏ ra", + "tỏ vẻ", + "tốc tả", + "tối ư", + "tốt", + "tốt bạn", + "tốt bộ", + "tốt hơn", + "tốt mối", + "tốt ngày", + "tột", + "tột cùng", + "tớ", + "tới", + "tới gần", + "tới mức", + "tới nơi", + "tới thì", + "tức thì", + "tức tốc", + "từ", + "từ căn", + "từ giờ", + "từ khi", + "từ loại", + "từ nay", + "từ thế", + "từ tính", + "từ tại", + "từ từ", + "từ ái", + "từ điều", + "từ đó", + "từ ấy", + "từng", + "từng cái", + "từng giờ", + "từng nhà", + "từng phần", + "từng thời gian", + "từng đơn vị", + "từng ấy", + "tự", + "tự cao", + "tự khi", + "tự lượng", + "tự tính", + "tự tạo", + "tự vì", + "tự ý", + "tự ăn", + "tựu trung", + "veo", + "veo veo", + "việc", + "việc gì", + "vung thiên địa", + "vung tàn tán", + "vung tán tàn", + "và", + "vài", + "vài ba", + "vài người", + "vài nhà", + "vài nơi", + "vài tên", + "vài điều", + "vào", + "vào gặp", + "vào khoảng", + "vào lúc", + "vào vùng", + "vào đến", + "vâng", + "vâng chịu", + "vâng dạ", + "vâng vâng", + "vâng ý", + "vèo", + "vèo vèo", + "vì", + "vì chưng", + "vì rằng", + "vì sao", + "vì thế", + "vì vậy", + "ví bằng", + "ví dù", + "ví phỏng", + "ví thử", + "vô hình trung", + "vô kể", + "vô luận", + "vô vàn", + "vùng", + "vùng lên", + "vùng nước", + "văng tê", + "vượt", + "vượt khỏi", + "vượt quá", + "vạn nhất", + "vả chăng", + "vả lại", + "vấn đề", + "vấn đề quan trọng", + "vẫn", + "vẫn thế", + "vậy", + "vậy là", + "vậy mà", + "vậy nên", + "vậy ra", + "vậy thì", + "vậy ư", + "về", + "về không", + "về nước", + "về phần", + "về sau", + "về tay", + "vị trí", + "vị tất", + "vốn dĩ", + "với", + "với lại", + "với nhau", + "vở", + "vụt", + "vừa", + "vừa khi", + "vừa lúc", + "vừa mới", + "vừa qua", + "vừa rồi", + "vừa vừa", + "xa", + "xa cách", + "xa gần", + "xa nhà", + "xa tanh", + "xa tắp", + "xa xa", + "xa xả", + "xem", + "xem lại", + "xem ra", + "xem số", + "xin", + "xin gặp", + "xin vâng", + "xiết bao", + "xon xón", + "xoành xoạch", + "xoét", + "xoẳn", + "xoẹt", + "xuất hiện", + "xuất kì bất ý", + "xuất kỳ bất ý", + "xuể", + "xuống", + "xăm xúi", + "xăm xăm", + "xăm xắm", + "xảy ra", + "xềnh xệch", + "xệp", + "xử lý", + "yêu cầu", + "à", + "à này", + "à ơi", + "ào", + "ào vào", + "ào ào", + "á", + "á à", + "ái", + "ái chà", + "ái dà", + "áng", + "áng như", + "âu là", + "ít", + "ít biết", + "ít có", + "ít hơn", + "ít khi", + "ít lâu", + "ít nhiều", + "ít nhất", + "ít nữa", + "ít quá", + "ít ra", + "ít thôi", + "ít thấy", + "ô hay", + "ô hô", + "ô kê", + "ô kìa", + "ôi chao", + "ôi thôi", + "ông", + "ông nhỏ", + "ông tạo", + "ông từ", + "ông ấy", + "ông ổng", + "úi", + "úi chà", + "úi dào", + "ý", + "ý chừng", + "ý da", + "ý hoặc", + "ăn", + "ăn chung", + "ăn chắc", + "ăn chịu", + "ăn cuộc", + "ăn hết", + "ăn hỏi", + "ăn làm", + "ăn người", + "ăn ngồi", + "ăn quá", + "ăn riêng", + "ăn sáng", + "ăn tay", + "ăn trên", + "ăn về", + "đang", + "đang tay", + "đang thì", + "điều", + "điều gì", + "điều kiện", + "điểm", + "điểm chính", + "điểm gặp", + "điểm đầu tiên", + "đành đạch", + "đáng", + "đáng kể", + "đáng lí", + "đáng lý", + "đáng lẽ", + "đáng số", + "đánh giá", + "đánh đùng", + "đáo để", + "đâu", + "đâu có", + "đâu cũng", + "đâu như", + "đâu nào", + "đâu phải", + "đâu đâu", + "đâu đây", + "đâu đó", + "đây", + "đây này", + "đây rồi", + "đây đó", + "đã", + "đã hay", + "đã không", + "đã là", + "đã lâu", + "đã thế", + "đã vậy", + "đã đủ", + "đó", + "đó đây", + "đúng", + "đúng ngày", + "đúng ra", + "đúng tuổi", + "đúng với", + "đơn vị", + "đưa", + "đưa cho", + "đưa chuyện", + "đưa em", + "đưa ra", + "đưa tay", + "đưa tin", + "đưa tới", + "đưa vào", + "đưa về", + "đưa xuống", + "đưa đến", + "được", + "được cái", + "được lời", + "được nước", + "được tin", + "đại loại", + "đại nhân", + "đại phàm", + "đại để", + "đạt", + "đảm bảo", + "đầu tiên", + "đầy", + "đầy năm", + "đầy phè", + "đầy tuổi", + "đặc biệt", + "đặt", + "đặt làm", + "đặt mình", + "đặt mức", + "đặt ra", + "đặt trước", + "đặt để", + "đến", + "đến bao giờ", + "đến cùng", + "đến cùng cực", + "đến cả", + "đến giờ", + "đến gần", + "đến hay", + "đến khi", + "đến lúc", + "đến lời", + "đến nay", + "đến ngày", + "đến nơi", + "đến nỗi", + "đến thì", + "đến thế", + "đến tuổi", + "đến xem", + "đến điều", + "đến đâu", + "đều", + "đều bước", + "đều nhau", + "đều đều", + "để", + "để cho", + "để giống", + "để không", + "để lòng", + "để lại", + "để mà", + "để phần", + "để được", + "để đến nỗi", + "đối với", + "đồng thời", + "đủ", + "đủ dùng", + "đủ nơi", + "đủ số", + "đủ điều", + "đủ điểm", + "ơ", + "ơ hay", + "ơ kìa", + "ơi", + "ơi là", + "ư", + "ạ", + "ạ ơi", + "ấy", + "ấy là", + "ầu ơ", + "ắt", + "ắt hẳn", + "ắt là", + "ắt phải", + "ắt thật", + "ối dào", + "ối giời", + "ối giời ơi", + "ồ", + "ồ ồ", + "ổng", + "ớ", + "ớ này", + "ờ", + "ờ ờ", + "ở", + "ở lại", + "ở như", + "ở nhờ", + "ở năm", + "ở trên", + "ở vào", + "ở đây", + "ở đó", + "ở được", + "ủa", + "ứ hự", + "ứ ừ", + "ừ", + "ừ nhé", + "ừ thì", + "ừ ào", + "ừ ừ", + "ử" +] \ No newline at end of file