#

multilinguality

Here are 14 public repositories matching this topic...

Babelscape / ner4id

Data and code for the paper "NER4ID at SemEval-2022 Task 2: Named Entity Recognition for Idiomaticity Detection".

nlp machine-learning pytorch multiword-expressions multilinguality idiomatic-expressions

Updated Feb 1, 2023
Jupyter Notebook

siebeniris / MultiVec2Text

Multilingual Vec2Text + Ad-hoc Translation + Masking Defense Mechanism

multilinguality textembeddingsinversion llmsec

Updated Sep 17, 2024
Python

cisnlp / TransMI

TransMI: A Framework to Create Strong Baselines from Multilingual Pretrained Language Models for Transliterated Data

transliteration multilinguality crosslingual-transfer tokenizer-modification

Updated May 30, 2024
Python

cisnlp / TransliCo

TransliCo: A Contrastive Learning Framework to Address the Script Barrier in Multilingual Pretrained Language Models

transliteration multilinguality crosslingual-transfer script-barrier

Updated May 23, 2024
Python

Babelscape / CroCoAlign

A Cross-Lingual, Context-Aware and Fully-Neural Sentence Alignment System for Long Texts.

nlp machine-translation sentence-embeddings sentence-alignment bilingual-corpora multilinguality embeddings-similarity

Updated Sep 11, 2024
Python

khuangaf / CONCRETE

Official implementation of "CONCRETE: Improving Cross-lingual Fact Checking with Cross-lingual Retrieval" (COLING'22)

retrieval fact-checking low-resource-languages multilinguality cross-lingual-transfer

Updated Oct 13, 2022
Python

yifan-h / Multilingual_Space

Source Code for "Adapters for Enhanced Modeling of Multilingual Knowledge and Text"

multilinguality knowledge-enhancement language-model-adapter

Updated Oct 28, 2022
Python

dair-iitd / DSRE

Resources for the paper "PARE: A Simple and Strong Baseline for Monolingual and Multilingual Distantly Supervised Relation Extraction"

relation-extraction distant-supervision multilinguality

Updated Jul 26, 2022
Python

Babelscape / ID10M

Data and code for the paper "ID10M: Idiom Identification in 10 Languages" (NAACL 2022).

nlp machine-learning pytorch dataset multiword-expressions figurative-language multilinguality idiomatic-expressions token-classification

Updated Feb 1, 2023
Python

SapienzaNLP / mwsd-datasets

Semeval-2013 and -2015 multilingual WSD datasets for BabelNet 4.0

wsd semeval babelnet multilinguality

Updated Dec 9, 2020
Shell

kbatsuren / CogNet

CogNet: a large-scale, high-quality cognate database for 338 languages, 1.07M words, and 8.1 million cognates

wordnet corpus-linguistics language-resources cognate bilingual-lexicon-extraction low-resource-languages cross-lingual-simialrity multilinguality cross-lingual-transfer bilingual-lexicon-induction

Updated Jun 15, 2023

AIRI-Institute / Probing_framework

Framework for probing tasks

natural-language-processing transformers universal-dependencies probing multilinguality

Updated Mar 24, 2024
Python

Babelscape / wikineural

Data and evaluation code for the paper WikiNEuRal: Combined Neural and Knowledge-based Silver Data Creation for Multilingual NER (EMNLP 2021).

natural-language-processing dataset named-entity-recognition multilinguality

Updated Jan 27, 2023
Python

csebuetnlp / xl-sum

This repository contains the code, data, and models of the paper titled "XL-Sum: Large-Scale Multilingual Abstractive Summarization for 44 Languages" published in Findings of the Association for Computational Linguistics: ACL-IJCNLP 2021.

multilingual machine-learning deep-learning dataset text-summarization abstractive-text-summarization abstractive-summarization text-summarisation low-resource-languages multilinguality summarization-corpora summarization-dataset multilingual-text-summarization text-summarization-dataset text-summarization-model low-resource-summarization low-resource-text-summarizarion multilingual-summarization

Updated Mar 26, 2024
Python

Improve this page

Add a description, image, and links to the multilinguality topic page so that developers can more easily learn about it.

Curate this topic

Add this topic to your repo

To associate your repository with the multilinguality topic, visit your repo's landing page and select "manage topics."