README.Rmd

---
output: github_document
title: "Repositori data dan kode pemrograman untuk Penelitian Unggulan Program Studi (PUPS) dengan judul *MODEL KAJIAN TERJEMAHAN BERBASIS BANK DATA TERJEMAHAN DIGITAL INGGRIS-INDONESIA DAN IMPLIKASI PEDAGOGISNYA*"
author: '[Gede Primahadi Wijaya Rajeg](https://udayananetworking.unud.ac.id/lecturer/880-gede-primahadi-wijaya-rajeg) <a itemprop="sameAs" content="https://orcid.org/0000-0002-2047-8621" href="https://orcid.org/0000-0002-2047-8621" target="orcid.widget" rel="noopener noreferrer" style="vertical-align:top;"><img src="https://orcid.org/sites/default/files/images/orcid_16x16.png" style="width:1em;margin-right:.5em;" alt="ORCID iD icon"></a>(Ketua Tim Peneliti), [I Made Rajeg](https://udayananetworking.unud.ac.id/lecturer/1817-i-made-rajeg) <a itemprop="sameAs" content="https://orcid.org/0000-0001-8989-0203" href="https://orcid.org/0000-0001-8989-0203" target="orcid.widget" rel="noopener noreferrer" style="vertical-align:top;"><img src="https://orcid.org/sites/default/files/images/orcid_16x16.png" style="width:1em;margin-right:.5em;" alt="ORCID iD icon"></a>(Anggota), I Gede Semara Dharma Putra (Anggota Mahasiswa), Putu Dea Indah Kartini (Anggota Mahasiswa)'
bibliography: "references.bib"
link-citations: yes
csl: "linguistics.csl"
---

<!-- README.md is generated from README.Rmd. Please edit that file -->

```{r, include = FALSE}
knitr::opts_chunk$set(
  collapse = TRUE,
  comment = "#>"
)
```

Universitas Udayana, Bali, Indonesia

<a rel="license" href="http://creativecommons.org/licenses/by-nc-sa/4.0/"><img alt="Creative Commons License" style="border-width:0" src="https://i.creativecommons.org/l/by-nc-sa/4.0/88x31.png" /></a> [![](https://img.shields.io/badge/doi-10.17605/OSF.IO/Y6ESA-lightblue.svg)](https://doi.org/10.17605/OSF.IO/Y6ESA)<br />Semua berkas di dalam repositori ini berlisensi <a rel="license" href="http://creativecommons.org/licenses/by-nc-sa/4.0/">Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License</a>. 

Kunjungi [laman utama](https://udayananetworking.unud.ac.id/lecturer/research/880-gede-primahadi-wijaya-rajeg/a-model-for-translation-study-based-on-english-indonesian-translation-database-and-its-pedagogical-implication-1179) penelitian ini.

Jika berkas-berkas dalam repositori ini [@rajeg_material_2021] digunakan untuk tujuan penelitian dan pengajaran, harap menyitir/mengutip repositori ini sebagai berikut:

> Rajeg, Gede Primahadi Wijaya, I Made Rajeg, Putu Dea Indah Kartini & I Gede Semara Dharma Putra. 2021. Material pendukung untuk *MODEL KAJIAN TERJEMAHAN BERBASIS BANK DATA TERJEMAHAN DIGITAL INGGRIS-INDONESIA DAN IMPLIKASI PEDAGOGISNYA*. Open Science Framework. https://doi.org/10.17605/OSF.IO/Y6ESA. https://osf.io/y6esa/.

Luaran utama dari penelitian ini, yaitu artikel jurnal, saat ini sedang dalam proses peninjauan sejawat (*peer review*), dan repositori pendukung artikel tersebut dapat diakses melalui [tautan berikut](https://github.com/gederajeg/constructional-equivalence) [@Rajeg_Constructional_equivalence_in_2021].

# Material

- Direktori [SENASTEK](https://github.com/gederajeg/rob-steal-parallel-corpora/tree/main/SENASTEK) berisi berkas pendukung untuk makalah yang disajikan pada [*Seminar Nasional Sains, Teknologi dan Humaniora*](https://senastek.unud.ac.id) 2021 (SENASTEK 2021). Berkas-berkas tersebut berupa data mentah, [kode pemrograman R](https://github.com/gederajeg/rob-steal-parallel-corpora/blob/main/SENASTEK/SENASTEK-code.R) untuk analisis kuantitatif dan visualisasi, [salindia/slides](https://doi.org/10.6084/m9.figshare.17078369) dan [abstrak](https://github.com/gederajeg/rob-steal-parallel-corpora/blob/main/SENASTEK/SENASTEK-abstrak.pdf) presentasi [@rajeg_pemanfaatan_2021], dan dua grafik statistik yang digunakan dalam presentasi.

- Direktori [LITERATES](https://github.com/gederajeg/rob-steal-parallel-corpora/tree/main/LITERATES) berisi berkas pendukung untuk makalah pada *LINGUISTICS, LITERATURE, CULTURE AND ARTS INTERNATIONAL SEMINAR* ([LITERATES](https://fba.unmas.ac.id/literates/)) yang diselenggarakan pada tanggal 22 Januari 2022 oleh [Fakultas Bahasa Asing](https://fba.unmas.ac.id) (FBA), Universitas Mahasaraswati Denpasar.

- Berkas [`gpwr2021-code-for-pre-processing-the-osub-tmx-file.R`](https://github.com/gederajeg/rob-steal-parallel-corpora/blob/main/gpwr2021-code-for-pre-processing-the-osub-tmx-file.R) mengandung kode pemrograman untuk pengolahan awal korpus paralel Inggris-Indonesia *OpenSubtitles2018* [@lison_opensubtitles2016_2016] berformat `.tmx`. Pengolahan ini adalah untuk memisahkan kalimat bahasa Inggris dan padanan bahasa Indonesianya menjadi dua berkas teks biasa (`.txt`) terpisah, yang kemudian bisa menjadi input untuk konkordansi paralel (lihat info selanjutnya).

- Berkas bernama [`ROB_sample_conc_main.tsv`](https://github.com/gederajeg/rob-steal-parallel-corpora/blob/main/ROB_sample_conc_main.tsv) dan [`STEAL_sample_conc_main.tsv`](https://github.com/gederajeg/rob-steal-parallel-corpora/blob/main/STEAL_sample_conc_main.tsv) adalah data utama penelitian ini. Berkas ini berupa sampel konkordansi lema ROB dan STEAL beserta terjemahan bahasa Indonesianya yang telah dianotasi berdasarkan variabel-variabel kualitatif (leksikal, morfosintaksis, semantik, dan konstruksional) sesuai dengan tujuan dan rumusan masalah penelitian.

- Program untuk menghasilkan konkordansi paralel menggunakan R dikemas dalam fungsi `para_conc()` yang diterbitkan bersama dengan modul pemrograman R bernama [**paracorp**](https://gederajeg.github.io/paracorp/) [@rajeg_paracorp_2021]. Perhatikan salah satu contoh penggunaan `para_conc()` berikut. Info lengkap cara memasang dan mengutip modul **paracorp** dalam publikasi dapat dilihat pada laman [**paracorp**](https://gederajeg.github.io/paracorp/).

```{r contoh-paraconc}
# load the paracorp R package
# more info at https://gederajeg.github.io/paracorp/
library(paracorp)  

# in this example, the English text is used as the source text
my_para_conc <- para_conc(source_text = sci_en,
                          target_text = sci_id,
                          pattern = "\\bshould\\b", # regular expression pattern
                          conc_sample = 20) # retrieve 20 random concordance lines

# peek into the results as tibble/data frame
head(my_para_conc)
```


# Sesi ruang kerja R

```{r sessinfo}
devtools::session_info()
```

# Referensi