Selasa, 19 November 2019

Contoh Tugas Mata Kuliah Statistika


Tugas Mata Kuliah Statistika


#Import data from csv dan library
library(dply)
data_DPT_untuk_tugas <-read.csv("D:/data DPT untuk tugas.csv", sep=";", header = TRUE)
  1. #mengetahui variable dalam database DPT colnames(data_DPT_untuk_tugas

  1. #menampilkan kota yang terdapat dari data
data_kota <- as.vector(data_DPT_untuk_tugas$kota)
View(unique(data_kota))
Output :
\\
#menampilkan kecamatan yang terdapat dari data
data_kecamatan <- as.vector(data_DPT_untuk_tugas$kecamatan)
View(unique(data_kecamatan))


#menampilkan desa yang terdapat dari data
data_desa <- as.vector(data_DPT_untuk_tugas$desa)
  View(unique(data_desa))

  1. #menampilkan total tps di setiap kota
aggregate (data_DPT_untuk_tugas$tps ~ data_DPT_untuk_tugas$kota, data_DPT_untuk_tugas, length)
#menampilkan total tps di setiap kecamatan
aggregate (data_DPT_untuk_tugas$tps ~ data_DPT_untuk_tugas$kecamatan, data_DPT_untuk_tugas, length)    

#menampilkan total tps di setiap desa
aggregate (data_DPT_untuk_tugas$tps ~ data_DPT_untuk_tugas$desa, data_DPT_untuk_tugas, length)    
1                     BUARAN                    10724
2              CEMPAKA PUTIH                    16269
3                     CIATER                    14776
4                 CILENGGANG                     6314
5                   CIPAYUNG                    16593
6                    CIPUTAT                    15922
7                  CIREUNDEU                    17320
8                   JELUPANG                    18724
9                    JOMBANG                    25653
10         JURANGMANGU BARAT                    23019
11         JURANGMANGU TIMUR                    19235
12           LENGKONG GUDANG                     7975
13     LENGKONG GUDANG TIMUR                     7282
14            LENGKONG KARYA                     4562
15            LENGKONG WETAN                     6909
16                 PAKU JAYA                    15971
17                  PAKUALAM                     8344
18                 PAKULONAN                     6621
19            PAMULANG BARAT                     3217
20               PARIGI BARU                     7901
21               PARIGI LAMA                    11607
22                  PISANGAN                    23873
23               PONDOK AREN                    19608
24             PONDOK BETUNG                    22881
25             PONDOK JAGUNG                    10937
26       PONDOK JAGUNG TIMUR                    10386
27               PONDOK JAYA                     6371
28       PONDOK KACANG BARAT                    14420
29       PONDOK KACANG TIMUR                    24039
30              PONDOK KARYA                    17104
31             PONDOK PUCUNG                    17317
32              PONDOK RANJI                    17671
33                RAWA BUNTU                    16529
34           RAWA MEKAR JAYA                    10509
35                    REMPOA                    19586
36                    RENGAS                    16088
37                     SAWAH                    19930
38                SAWAH BARU                    17690
39                   SERPONG                    12173
40                     SERUA                    25597
41               SERUA INDAH                    12353

  1. #menampilkan nilai max
max(data_DPT_untuk_tugas$Usia)
[1] 1038
#menampilkan nilai min
min(data_DPT_untuk_tugas$Usia)
[1] -957
#menampilkan nilai mean/rata-rata
mean(data_DPT_untuk_tugas$Usia)
[1] 41.15074
#menampilkan nilai median/nilai tengah
median(data_DPT_untuk_tugas$Usia)
[1] 40
#menampilkan nilai varian/ragam
var(data_DPT_untuk_tugas$Usia)
[1] 230.255

#menampilkan nilai modus
tail(names(sort(table(data_DPT_untuk_tugas$Usia))), 1)
[1] "37"

5.       #menampilkan pie chart dari variabel jenis kelamin di kecamatan Ciputat
sta_jk_ciputat = data_DPT_untuk_tugas %>% group_by(kecamatan, jeniskelamin) %>% count(jeniskelamin) %>% rename(banyakjk = n) %>% filter(kecamatan == "CIPUTAT")
v_jk_ciputat <- as.vector(df_jk_ciputat$jeniskelamin)
v_banyak_jk_ciputat <- as.vector(sta_jk_ciputat$banyakjk)
pie(v_banyak_jk_ciputat, labels=v_jk_ciputat, main="Pemilih di Kecamatan Ciputat")

##menampilkan pie chart dari variabel jenis kelamin di kecamatan Ciputat Timur
sta_jk_ciputat_timur = data_DPT_untuk_tugas %>% group_by(kecamatan, jeniskelamin) %>% count(jeniskelamin) %>% rename(banyakjk = n) %>% filter(kecamatan == "CIPUTAT TIMUR")
v_jk_ciputat_timur <- as.vector(sta_jk_ciputat_timur$jeniskelamin)
v_banyak_jk_ciputat_timur <- as.vector(sta_jk_ciputat_timur$banyakjk)
pie(v_banyak_jk_ciputat_timur, labels=v_jk_ciputat_timur, main="Pemilih di Kecamatan Ciputat Timur")

#menampilkan pie chart dari variabel jenis kelamin di kecamatan Pamulang
sta_jk_pamulang = data_DPT_untuk_tugas %>% group_by(kecamatan, jeniskelamin) %>% count(jeniskelamin) %>% rename(banyakjk = n) %>% filter(kecamatan == "PAMULANG")
v_jk_pamulang <- as.vector(sta_jk_pamulang$jeniskelamin)
v_banyak_jk_pamulang <- as.vector(sta_jk_pamulang$banyakjk)
pie (v_banyak_jk_pamulang, labels=v_jk_pamulang, main="Pemilih di Kecamatan Pamulang")

#menampilkan pie chart dari variabel jenis kelamin di kecamatan Pondok Aren
sta_jk_pondok_aren = data_DPT_untuk_tugas %>% group_by(kecamatan, jeniskelamin) %>% count(jeniskelamin) %>% rename(banyakjk = n) %>% filter(kecamatan == "PONDOK AREN")
v_jk_pondok_aren <- as.vector(sta_jk_pondok_aren$jeniskelamin)
v_banyak_jk_pondok_aren <- as.vector(sta_jk_pondok_aren$banyakjk)
pie (v_banyak_jk_pondok_aren, labels=v_jk_pondok_aren, main="Pemilih di Kecamatan Pondok Aren")

#menampilkan pie chart dari variabel jenis kelamin di kecamatan Serpong
sta_jk_serpong = data_DPT_untuk_tugas %>% group_by(kecamatan, jeniskelamin) %>% count(jeniskelamin) %>% rename(banyakjk = n) %>% filter(kecamatan == "SERPONG")
v_jk_serpong <- as.vector(sta_jk_serpong$jeniskelamin)
v_banyak_jk_serpong <- as.vector(sta_jk_serpong$banyakjk)
pie(v_banyak_jk_serpong, labels=v_jk_serpong, main="Pemilih di Kecamatan Serpong")

#menampilkan pie chart dari variabel jenis kelamin di kecamatan Serpong Utara
sta_jk_serpong_utara = data_DPT_untuk_tugas %>% group_by(kecamatan, jeniskelamin) %>% count(jeniskelamin) %>% rename(banyakjk = n) %>% filter(kecamatan == "SERPONG UTARA")
v_jk_serpong_utara <- as.vector(sta_jk_serpong_utara$jeniskelamin)
v_banyak_jk_serpong_utara <- as.vector(sta_jk_serpong_utara$banyakjk)
pie(v_banyak_jk_serpong_utara, labels=v_jk_serpong_utara, main="Pemilih di Kecamatan Serpong Utara")

#menampilkan barplot chart dari variabel usia di kecamatan Ciputat
sta_usia_ciputat = data_DPT_untuk_tugas %>% group_by(kecamatan, Usia) %>% count(Usia) %>% rename(banyakusia = n) %>% filter(kecamatan == "CIPUTAT")
vector_usia_ciputat = as.vector(sta_usia_ciputat$Usia)
vector_banyak_usia_ciputat = as.vector(sta_usia_ciputat$banyakusia)
barplot (vector_banyak_usia_ciputat, names.arg=vector_usia_ciputat, ylab="Banyak Usia", xlab="Usia", main="Banyaknya pemilih berdasarkan usia di Kecamatan Ciputat")

#menampilkan barplot chart dari variabel usia di kecamatan Ciputat Timur
sta_usia_ciputat_timur = data_DPT_untuk_tugas %>% group_by(kecamatan, Usia) %>% count(Usia) %>% rename(banyakusia = n) %>% filter(kecamatan == "CIPUTAT TIMUR")
vector_usia_ciputat_timur = as.vector(sta_usia_ciputat_timur$Usia)
vector_banyak_usia_ciputat_timur = as.vector(sta_usia_ciputat_timur$banyakusia)
barplot(vector_banyak_usia_ciputat_timur, names.arg=vector_usia_ciputat_timur, ylab="Banyak Usia", xlab="Usia", main="Banyaknya pemilih berdasarkan usia di Kecamatan Ciputat Timur")

#menampilkan barplot chart dari variabel usia di kecamatan Pamulang
sta_usia_pamulang = data_DPT_untuk_tugas %>% group_by(kecamatan, Usia) %>% count(Usia) %>% rename(banyakusia = n) %>% filter(kecamatan == "PAMULANG")
vector_usia_pamulang = as.vector(sta_usia_pamulang$Usia)
vector_banyak_usia_pamulang = as.vector(sta_usia_pamulang$banyakusia)
barplot(vector_banyak_usia_pamulang, names.arg=vector_usia_pamulang, ylab="Banyak Usia", xlab="Usia", main="Banyaknya pemilih berdasarkan usia di Kecamatan Pamulang")

#menampilkan barplot chart dari variabel usia di kecamatan Pondok Aren
sta_usia_pondok_aren = data_DPT_untuk_tugas %>% group_by(kecamatan, Usia) %>% count(Usia) %>% rename(banyakusia = n) %>% filter(kecamatan == "PONDOK AREN")
vector_usia_pondok_aren = as.vector(sta_usia_pondok_aren$Usia)
vector_banyak_usia_pondok_aren = as.vector(sta_usia_pondok_aren$banyakusia)
barplot(vector_banyak_usia_pondok_aren, names.arg=vector_usia_pondok_aren, ylab="Banyak Usia", xlab="Usia", main="Banyaknya pemilih berdasarkan usia di Kecamatan Pondok Aren")

#menampilkan barplot chart dari variabel usia di kecamatan Serpong
sta_usia_serpong = data_DPT_untuk_tugas %>% group_by(kecamatan, Usia) %>% count(Usia) %>% rename(banyakusia = n) %>% filter(kecamatan == "SERPONG")
vector_usia_serpong = as.vector(sta_usia_serpong$Usia)
vector_banyak_usia_serpong = as.vector(sta_usia_serpong$banyakusia)
barplot(vector_banyak_usia_serpong, names.arg=vector_usia_serpong, ylab="Banyak Usia", xlab="Usia", main="Banyaknya pemilih berdasarkan usia di Kecamatan Serpong")

#menampilkan barplot chart dari variabel usia di kecamatan Serpong Utara
sta_usia_serpong_utara = data_DPT_untuk_tugas %>% group_by(kecamatan, Usia) %>% count(Usia) %>% rename(banyakusia = n) %>% filter(kecamatan == "SERPONG UTARA")
vector_usia_serpong_utara = as.vector(sta_usia_serpong_utara$Usia)
vector_banyak_usia_serpong_utara = as.vector(sta_usia_serpong_utara$banyakusia)
barplot(vector_banyak_usia_serpong_utara, names.arg=vector_usia_serpong_utara, ylab="Banyak Usia", xlab="Usia", main="Banyaknya pemilih berdasarkan usia di Kecamatan Serpong Utara")

6.   rata-rata pendapatan masyarakat di kota A dan B sama
 rata-rata pendapatan masyarakat di kota A dan B berbeda

#membuat data frame berdasarkan kota
sta_kota_a = data_DPT_untuk_tugas %>% filter(kota == "A")
sta_kota_b = data_DPT_untuk_tugas %>% filter(kota == "B")

#pendeklarasian variable pendapatan tiap kota
pendapatan_kota_a = sta_kota_a$pendapatan
pendapatan_kota_b = sta_kota_b$pendapatan


#uji kesamaan ragam
var.test(pendapatan_kota_a, pendapatan_kota_b)


Output :
     F test to compare two variances

data:  df_kota_a$pendapatan and df_kota_a$pendapatan
F = 1, num df = 320090, denom df = 320090, p-value = 1
alternative hypothesis: true ratio of variances is not equal to 1
95 percent confidence interval:
 0.9930954 1.0069526
sample estimates:
ratio of variances
                 1

Hasil analisis:
Pada uji keragaman jika p-value lebih kecil dari alpha 0.05 maka ragamnya berbeda  tapi jika sebaliknya maka ragamya sama. Dari hasil ouput menujukkan bahwa p-value = 1 < alpha = 0.05 yang mana bernilai false, sehingga dapat disimpulkan bahwa ragam antara kedua kelompok sama. Hasil ini akan menentukan langkah berikutnya yaitu, sintaks uji t nya (var.equal) harus sama dengan TRUE

#uji t
t.test(pendapatan_kota_a,pendapatan_kota_b, var.equal=TRUE, paired=FALSE)

Output :
     Two Sample t-test

data:  pendapatan_kota_a and pendapatan_kota_b
t = 0, df = 640180, p-value = 1
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 -13440.86  13440.86
sample estimates:
mean of x mean of y
  5251636   5251636

alpha=0.05
db=15+15-2
qt(c(alpha/2, 1-(alpha/2)), df=db)

Output :
[1] -2.048407  2.048407

Hasil analisis :
Dari hasil output diperoleh t hitung = 0 tidak berada pada selang
2.048407 < t < 2.048407 dan p-value = 1 < alpha = 0.05. Uji hipotesis yang digunakan pada kasus ini adalah uji dua sisi. Pada uji dua sisi H0 ditolak jika t hitung tidak berada pada selang (–t tabel < t < t tabel) dan p-value < alpha. Sedangkan pada output, t tidak berada pada selang (–t tabel < t < t tabel) bernilai false dan p-value < alpha bernilai false sehingga H0 dapat diterima karna keduanya bernilai false.

Dengan demikian, dapat disimpulkan bahwa rata-rata pendapatan kota A dan B sama dengan tingkat percayaan 95 %, sehingga cenderung tidak ada perbedaan kondisi ekonomi antara kota A dan B.



EmoticonEmoticon