NMT-Koean-To-English

작성중...

한영 기계 번역(Korean-English Machine Translation) 모델 개발 스터디
PyTorch, koNLPY, NLPY, Gensim package 활용

Requirements

Python 3.6 (may work with other versions, but I used 3.6)
PyTorch 1.1.0
Gensim 3.8.0
konlpy 0.5.1
nltk 3.4.4

Datasets

https://github.com/jungyeul/korean-parallel-corpora 데이터셋 사용

git clone https://github.com/dlcjfgmlnasa/NMT-Koean-To-English.git --recursive

pip install -r requirement.txt

import argparse
parser = argparse.ArgumentParser()
parser.add_argument('--rnn_sequence_size', default=30, type=int)
parser.add_argument('--min_count', default=3, type=int)
parser.add_argument('--max_count', default=10000, type=int)
parser.add_argument('--embedding_size', default=200, type=int)
parser.add_argument('--rnn_dim', default=200, type=int)
parser.add_argument('--rnn_layer', default=3, type=int)
parser.add_argument('--batch_size', default=128, type=int)

loss

translation

2. Seq2Seq with Attention

Parameter List

import argparse
parser = argparse.ArgumentParser()
parser.add_argument('--rnn_sequence_size', default=30, type=int)
parser.add_argument('--min_count', default=3, type=int)
parser.add_argument('--max_count', default=100000, type=int)
parser.add_argument('--embedding_size', default=200, type=int)
parser.add_argument('--rnn_dim', default=123, type=int)
parser.add_argument('--rnn_layer', default=3, type=int)
parser.add_argument('--rnn_dropout_rate', default=0.5, type=float)
parser.add_argument('--use_residual', default=True, type=bool)
parser.add_argument('--attention_method', default='general', choices=['dot', 'general', 'concat'], type=str)
parser.add_argument('--batch_size', default=128, type=int)

Name		Name	Last commit message	Last commit date
Latest commit History 54 Commits
01_Seq2Seq		01_Seq2Seq
02_Seq2SeqAttention		02_Seq2SeqAttention
03_ConvSeq2Seq		03_ConvSeq2Seq
04_ByteNet		04_ByteNet
05_SliceNet		05_SliceNet
06_Transformer		06_Transformer
Dataset		Dataset
Dictionary		Dictionary
Word2Vec		Word2Vec
img		img
.gitignore		.gitignore
README.md		README.md
data_helper.py		data_helper.py
eval.py		eval.py
requirement.txt		requirement.txt
utils.py		utils.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

NMT-Koean-To-English

Requirements

Datasets

목차

1. Seq2Seq

2. Seq2Seq with Attention

3. Convolution Seq2Seq

4. ByteNet

5. SliceNet

6. Transformer

Reference

About

Uh oh!

Releases

Packages

Languages

dlcjfgmlnasa/NMT-Korean-To-English

Folders and files

Latest commit

History

Repository files navigation

NMT-Koean-To-English

Requirements

Datasets

목차

1. Seq2Seq

2. Seq2Seq with Attention

3. Convolution Seq2Seq

4. ByteNet

5. SliceNet

6. Transformer

Reference

About

Topics

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages