Nama : Rafi Aliefian Putra Ramadhani
NRP : 5025211234
Seorang peneliti melakukan penelitian mengenai pengaruh aktivitas 𝐴 terhadap kadar saturasi oksigen pada manusia. Peneliti tersebut mengambil sampel sebanyak 9 responden. Pertama, sebelum melakukan aktivitas 𝐴, peneliti mencatat kadar saturasi oksigen dari 9 responden tersebut. Kemudian, 9 responden tersebut diminta melakukan aktivitas 𝐴. Setelah 15 menit, peneliti tersebut mencatat kembali kadar saturasi oksigen dari 9 responden tersebut. Berikut data dari 9 responden mengenai kadar saturasi oksigen sebelum dan sesudah melakukan aktivitas 𝐴.
Responden | X | Y |
---|---|---|
1 | 78 | 100 |
2 | 75 | 95 |
3 | 67 | 70 |
4 | 77 | 90 |
5 | 70 | 90 |
6 | 72 | 90 |
7 | 78 | 89 |
8 | 74 | 90 |
9 | 77 | 100 |
Berdasarkan data pada tabel diatas, diketahui kadar saturasi oksigen dari responden ke-3 ketika belum melakukan aktivitas 𝐴 sebanyak 67, dan setelah melakukan aktivitas 𝐴 sebanyak 70.
Carilah standar deviasi dari data selisih pasangan pengamatan tabel di atas.
Pertama, masukkan data yang telah ada ke dalam variabel sesuai pengelompokannya.
before <- c(78, 75, 67, 77, 70, 72, 78, 74, 77)
after <- c(100, 95, 70, 90, 90, 90, 89, 90, 100)
Kedua, cari selisih dari antar data dengan index yang sama. Kemudian, dilakukan pencarian rata-rata dari selisih-selisih tersebut untuk digunakan dalam mencari nilai standar deviasinya dengan rumus sebagai berikut.
difference <- after - before
difference
mean(difference)
sd(difference)
Carilah nilai t (p-value).
Solusi dilakukan dengan menggunakan fungsi t.test()
sebagai berikut dengan parameter masukan data yaitu data kelompok yang telah dikelompokkan pada poin sebelumnya.
t.test(after, before, paired = TRUE)
Tentukanlah apakah terdapat pengaruh yang signifikan secara statistika dalam hal kadar saturasi oksigen , sebelum dan sesudah melakukan aktivitas 𝐴 jika diketahui tingkat signifikansi 𝛼 = 5% serta H0 : “tidak ada pengaruh yang signifikan secara statistika dalam hal kadar saturasi oksigen , sebelum dan sesudah melakukan aktivitas 𝐴”
Berdasarkan hasil poin sebelumnya, diketahui bahwa nilai probabilitas dari uji 𝑡 (p-value) adalah 6.003e-05 atau 0.00006003. Karena nilai probabilitas tersebut lebih kecil dibandingkan tingkat signifikansi 𝛼 = 0.05, maka hipotesis nol ditolak dan hipotesis alternatif diterima.
Hal ini artinya sebelum dan sesudah melakukan aktivitas 𝐴 pada tingkat signifikansi 5%, terdapat pengaruh yang signifikan secara statistika dalam hal kadar saturasi oksigen.
(Hipotesa 1 Sampel) Diketahui bahwa mobil dikemudikan rata-rata lebih dari 20.000 kilometer per tahun. Untuk menguji klaim ini, 100 pemilik mobil yang dipilih secara acak diminta untuk mencatat jarak yang mereka tempuh. Jika sampel acak menunjukkan rata-rata 23.500 kilometer dan standar deviasi 3900 kilometer. (Kerjakan menggunakan 2 library seperti referensi pada modul).
Apakah Anda setuju dengan klaim tersebut?
Setuju, karena dengan rata-rata 23.5000 dari sampel acak dengan standar deviasi 3900 kilometer, maka sangatlah mungkin klaim tersebut valid. Hal itu karena grafik dari persebaran data distribusi normal yang dihasilkan akan lebih pekat di daerah lebih dari 20.000 kilometer dengan asumsi nilai tengah grafik tersebut adalah rata-rata dari sampel acak yang didapatkan.
Selanjutnya, digunakan sebuah package library BSDA untuk membuat solusi permasalahannya.
install.packages("BSDA")
library(BSDA)
Jelaskan maksud dari output yang dihasilkan!
Untuk menyelesaikan nya perlu menggunakan fungsi tsum.test()
dengan parameter-parameter yang disebutkan pada poin sebelumnya. Hasilnya adalah sebagai berikut.
tsum.test(mean.x = 23500, s.x = 3900, n.x = 100)
Sehingga dengan interval kepercayaan 95%, rata-rata jarak tempuh mobil per tahun berada di antara 22.726,16 km dan 24.273,84 km. Dengan interval kepercayaan 95% dan dari 100 responden, dapat dibuktikan bahwa rata-rata jarak tempuh mobil per thn lebih dari 20.000 km karena nilai p-value kurang dari tingkat signifikansi 𝛼 = 0.05.
Buatlah kesimpulan berdasarkan P-Value yang dihasilkan!
Dikarenakan nilai probabilitas tersebut lebih kecil dibandingkan tingkat signifikansi 𝛼 = 0.05, maka hipotesis nol ditolak dan hipotesis alternatif diterima. Sehingga, kesimpulan yang didapatkan yaitu bahwa mobil dikemudikan rata-rata lebih dari 20.000 kilometer per tahun.
(Hipotesa 2 Sampel) Diketahui perusahaan memiliki seorang data analyst ingin memecahkan permasalahan pengambilan keputusan dalam perusahaan tersebut. Selanjutnya didapatkanlah data berikut dari perusahaan saham tersebut.
Nama Kota/Atribut | Bandung | Bali |
---|---|---|
Jumlah Saham | 19 | 27 |
Sampel Mean | 3.64 | 2.79 |
Sampel Standar Deviasi | 1.67 | 1.32 |
Dari data diatas berilah keputusan serta kesimpulan yang didapatkan dari hasil diatas. Asumsikan nilai variancenya sama, apakah ada perbedaan pada rata-ratanya (α= 0.05)? Buatlah:
H0 dan H1(3)
Berdasarkan deskripsi dan data yang terlampir, maka dapat disusun hipotesis H0 dan H1 sebagai berikut.
- H0 ← μ1 = μ2 (rata-rata saham di Bandung sama dengan di Bali)
- H1 ← μ1 ≠ μ2 (rata-rata saham di Bandung tidak sama dengan di Bali)
Hitung sampel statistik(3)
Penyelesaian menggunakan fungsi tsum.test()
dengan parameter sesuai dengan data pada tabel terlampir. Fungsi tersebut menghasilkan nilai dari sampel statistik.
tsum.test(mean.x=3.64, s.x = 1.67, n.x = 19,
mean.y =2.79 , s.y = 1.32, n.y = 27,
alternative = "greater", var.equal = TRUE)
Lakukan uji statistik (df =2)(5)
Install Package Mosaic untuk membuat S=solusi permasalahan.
install.packages("mosaic")
library(mosaic)
Langkah selanjutnya yaitu dengan menggunakan fungsi plotDist()
untuk mendapatkan gambaran atau visualisasi dari statistik dengan derajat bebas sebesar 2.
plotDist(dist = 't', df = 2, col = "blue")
Nilai Kritikal(3)
Penyelesaian dengan menggunakan fungsi qchisq()
dengan nilai df
sesuai dengan yang telah terlampir untuk mendapatkan nilai kritikal.
qchisq(p = 0.05, df = 2, lower.tail = FALSE)
Keputusan(3)
Teori keputusan merupakan teori formal pengambilan keputusan di bawah ketidakpastian. Aksinya adalah ({a}\_{a∈A})
dengan kemungkinan konsekuensinya adalah ({c}_{c∈C})
(tergantung pada keadaan dan tindakan). Sehingga, keputusan dapat diperoleh dengan menggunakan fungsi t.test
Kesimpulan(3)
Dapat disimpulkan bahwa perbedaan rata-rata yang terjadi tidak ada jika dilihat dari uji statistik. Namun, akan ada (meski tidak signifikan) jika dipengaruhi oleh nilai kritikal.
(Anova satu arah) Seorang Peneliti sedang meneliti spesies dari kucing di ITS. Dalam penelitiannya ia mengumpulkan data tiga spesies kucing yaitu kucing oren, kucing hitam dan kucing putih dengan panjangnya masing-masing.
Jika diketahui dataset pada https://intip.in/datasetprobstat1 dan H0 adalah tidak ada perbedaan panjang antara ketiga spesies atau rata-rata panjangnya sama, maka kerjakan atau carilah:
Buatlah masing masing jenis spesies menjadi 3 subjek "Grup" (grup 1, grup 2, dan grup 3). Lalu gambarkan plot kuantil normal untuk setiap kelompok dan lihat apakah ada outlier utama dalam homogenitas varians.
Pertama, masukkan data dari dataset yang disediakan.
dataoneway <- read.table("https://rstatisticsandresearch.weebly.com/uploads/1/0/2/6/1026585/onewayanova.txt", h = T)
attach(dataoneway)
names(dataoneway)
Kedua, melakukan grouping sesuai dengan label yang telah ditentukan sekaligus melakukan pengecekan value dalam grup yang dihasilkan.
dataoneway$Group <- as.factor(dataoneway$Group)
dataoneway$Group = factor(dataoneway$Group, labels = c("Kucing Oren", "Kucing Hitam", "Kucing Putih"))
class(dataoneway$Group)
Ketiga, membagi tiap valuer menjadi 3 bagian sesuai dengan label grup yang telah dibuat.
Group1 <- subset(dataoneway, Group == "Kucing Oren")
Group2 <- subset(dataoneway, Group == "Kucing Hitam")
Group3 <- subset(dataoneway, Group == "Kucing Putih")
Keempat, menggambar plot kuantil normal untuk setiap grup untuk melihat distribusi data dan outlier utama dalam homogenitas varians pada masing-masing grup.
qqnorm(Group1$Length)
qqline(Group1$Length)
qqnorm(Group2$Length)
qqline(Group2$Length)
qqnorm(Group3$Length)
qqline(Group3$Length)
Carilah atau periksalah homogeneity of variances-nya. Berapa nilai p yang didapatkan? Apa hipotesis dan kesimpulan yang dapat diambil?
Penyelesaian untuk mendapatkan homogeneity of variances adalah dengan menggunakan sebuah fungsi yaitu fungsi bartlett.test()
dengan parameter dari data yang telah dimasukkan sebelumnya.
bartlett.test(Length ~ Group, data = dataoneway)
Dari hasil uji fungsi bartlett.test()
didapatkan p-value sebesar 0.8054 yang lebih dari nilai 𝛼 = 0.05 sehingga asumsi kesamaan varians terpenuhi.
Untuk uji ANOVA (satu arah), buatlah model linier dengan panjang versus grup dan beri nama model tersebut model 1.
Penyelesaian dari membuat uji anova dan model liniernya yaitu digunakan fungsi lm()
dan anova()
dengan parameter dari data yang telah dimasukkan sebelumnya.
model1 = lm(Length ~ Group, data = dataoneway)
anova(model1)
Dari hasil poin C, berapakah nilai p? Apa yang dapat Anda simpulkan dari H0?
Melihat dari hasil yang didapatkan pada poin sebelumnya, pada taraf uji 5% didapatkan nilai p-value sebesar 0.0013.
Sehingga, terdapat perbedaan panjang kucing yang signifikan berdasarkan grupnya.
Verifikasilah jawaban model 1 dengan Post-hoc test Tukey HSD, dari nilai p yang didapatkan apakah satu jenis kucing lebih panjang dari yang lain? Jelaskan.
Verifikasi jawaban model 1 sebelumnya menggunakan sebuah fungsi yaitu fungsi TukeyHSD()
dengan parameter model 1 dari AOV sebelumnya.
TukeyHSD(aov(model1))
Dari hasil uji Tukey, dapat dilihat kombinasi dari kelompok mana yang secara signifikan berbeda. Jika menggunakan 𝛼 = 5%, perbedaan panjang kucing yang signifikan adalah grup 2 (Kucing Hitam) terhadap grup 1 (Kucing Oren) dan grup 3 (Kucing Putih).
Visualisasikan data dengan ggplot2
Penyelesaian menggunakan sebuah fungsi ggplot()
untuk melakukan visualisasi data.
install.packages("ggplot2")
library("ggplot2")
ggplot(dataoneway, aes(x = Group, y = Length)) + geom_boxplot(fill = "grey80", colour = "black") + scale_x_discrete() + xlab("Treatment Group") + ylab("Length (cm)")
(Anova dua arah) Data yang digunakan merupakan hasil eksperimen yang dilakukan untuk mengetahui pengaruh suhu operasi (100˚C, 125˚C, dan 150˚C) dan tiga jenis kaca pelat muka (A, B dan C) pada keluaran cahaya tabung osiloskop. Percobaan dilakukan sebanyak 27 kali dan didapatkan data hasil eksperimen berikut. Dengan data tersebut:
Buatlah plot sederhana untuk visualisasi data
Pertama, gunakan beberapa library sebagai berikut.
install.packages("multcompView")
library(readr)
library(ggplot2)
library(multcompView)
library(dplyr)
Kedua, masukkan dan baca dataset yang telah disediakan.
GTL <- read_csv("GTL.csv")
head(GTL)
Ketiga, lakukan observasi pada dataset.
str(GTL)
Keempat, lakukan viasualisasi dengan menggunakan simple plot dengan fungsi qplot()
sebagai berikut.
qplot(x = Temp, y = Light, geom = "point", data = GTL) + facet_grid(.~Glass, labeller = label_both)
Lakukan uji ANOVA dua arah untuk 2 faktor
Pertama, buat variabel as factor sebagai ANOVA.
GTL$Glass <- as.factor(GTL$Glass)
GTL$Temp_Factor <- as.factor(GTL$Temp)
str(GTL)
Kedua, lakukan analisis of variance (AoV) dengan fungsi summary(aov())
sebagai berikut.
anova <- aov(Light ~ Glass*Temp_Factor, data = GTL)
summary(anova)
Tampilkan tabel dengan mean dan standar deviasi keluaran cahaya untuk setiap perlakuan (kombinasi kaca pelat muka dan suhu operasi)
Penyelesaian-nya dengan menggunakan sebuah fungsi group_by()
yang selanjutnya digunakan untuk melakukan data summary dengan fungsi summarise()
sesuai mean dan standar deviasi yang berlaku sebagai berikut.
data_summary <- group_by(GTL, Glass, Temp) %>%
summarise(mean = mean(Light), sd = sd(Light)) %>%
arrange(desc(mean))
print(data_summary)
Lakukan uji Tukey
Penyelesaian dengan menggunakan sebuah fungsi TukeyHSD()
sebagai berikut.
tukey <- TukeyHSD(anova)
print(tukey)
Gunakan compact letter display untuk menunjukkan perbedaan signifikan antara uji Anova dan uji Tukey
Pertama, buat compact letter display dengan fungsi multcompLetterS4()
sebagai berikut.
tukey.cld <- multcompLetters4(anova, tukey)
print(tukey.cld)
Kedua, tambahkan compact letter display tersebut ke tabel dengan mean dan standar deviasi yang telah dibuat sebelumnya.
cld <- as.data.frame.list(tukey.cld$`Glass:Temp_Factor`)
data_summary$Tukey <- cld$Letters
print(data_summary)