M.Cholil Abdilla

M.Cholil Abdilla

This user hasn't shared any profile information

Posts by M.Cholil Abdilla

Regresi

0

Regresi merupakan suatu alat ukur yang juga dapat digunakan untuk mengukur ada atau tidaknya korelasi antarvariabel. Jika kita memiliki dua buah variabel atau lebih maka sudah selayaknya apabila kita ingin mempelajari bagaimana variabel-variabel itu berhubungan atau dapat diramalkan.

Analisis regresi lebih akurat dalam melakukan analisis korelasi, karena pada analisis itu kesulitan dalam menunjukkan slop (tingkat perubahan suatu variabel terhadap variabel lainnya dapat ditentukan). Dengan demikian maka melalui analisis regresi, peramalan nilai variabel terikat pada nilai variabel bebas lebih akurat pula.

Model kelayakan  regresi linear didasarkan pada hal-hal sebagai berikut:

 

a.         Model regresi dikatakan layak  jika angka signifikansi pada ANOVA sebesar < 0.05

b.         Predictor yang digunakan sebagai variabel bebas harus layak. Kelayakan ini diketahui jika

angka Standard Error of Estimate < Standard Deviation

c.         Koefesien regresi harus signifikan. Pengujian dilakukan dengan Uji T. Koefesien regresi

signifikan jika T hitung > T table (nilai kritis)

 

d.         Tidak boleh terjadi multikolinieritas, artinya tidak boleh terjadi korelasi yang sangat tinggi

atau sangat rendah antar variabel bebas. Syarat ini hanya berlaku untuk regresi linier

berganda dengan variabel bebas lebih dari satu.

e.         Tidak terjadi otokorelasi. Terjadi otokorelasi jika angka Durbin dan Watson (DB) sebesar 3

f.          Keselerasan model regresi dapat diterangkan dengan menggunakan nilai r2 semakin besar

nilai tersebut maka model semakin baik. Jika nilai mendekati 1 maka model regresi semakin

baik. Nilai r2 mempunyai karakteristik diantaranya: 1) selalu positif, 2) Nilai r2 maksimal

sebesar 1. Jika Nilai r2 sebesar 1 akan mempunyai arti kesesuaian yang sempurna. Maksudnya

seluruh variasi dalam variabel Y dapat diterangkan oleh model regresi. Sebaliknya jika r2sama

dengan 0, maka tidak ada hubungan linier antara X dan Y.

g.         Terdapat hubungan linier antara variabel bebas (X) dan variabel tergantung (Y)

h.         Data harus berdistribusi normal

i.          Data berskala interval atau rasio

j.           Kedua variabel bersifat dependen, artinya satu variabel merupakan variabel bebas (disebut

juga sebagai variabel predictor) sedang variabel lainnya variabel tergantung (disebut juga

sebagai variabel response)

 

 

Persamaan Regresi Linier dari Y terhadap X

Persamaan regresi linier dari Y terhadap X dirumuskan sebagai berikut:

Y = a + b X
Keterangan:

Y = variabel terikat

X = variabel bebas

a = intersep

b = koefisien regresi/slop

Pada persamaan tersebut di atas, nilai a dan b dapat ditentukan dengan cara sebagai berikut:

rumus regresi sederhana

Contoh latihan soal regresi sederhana

Berikut ini adalah data pengalaman kerja dan omzet penjualan dari 8 marketing pada PT MAKMUR

contoh latihan soal regresi sederhana

Pertanyaan:

1.       Tentukan nilai a dan b

2.       Buatkan persamaan garis regresinya

3.       Berapa perkiraan omzet penjualan dari seorang marketing yang memiliki pengalaman kerjanya 3,5 tahun?

Penyelesaian:

tabel penolong regresiregresi linier sederhana

Dijawab:

1. nilai a = 3,25 dan b = 1,25

2. Persamaan regresi liniernya adalah

Y = a + bX

= 3,25 + 1,25X

1. Nilai duga Y , jika X = 3,5

Y = a + bX

= 3,25 + 1,25X

= 3,25 + 1,25 (3,5)

= 7,625

 

Pengujian regresi dilakuan dengan 2 cara, yaitu :

1.       T – test

Uji-t (t-test) merupakan statistik uji yang sering kali ditemui dalam masalah-masalah praktis statistika. Uji-t termasuk dalam golongan statistika parametrik. Statistik uji ini digunakan dalam pengujian hipotesis. Seperti yang telah dibahas dalam tulisan (post) lain di weblog ini, uji-t digunakan ketika informasi mengenai nilai variance (ragam) populasi tidak diketahui.
Uji-t dapat dibagi menjadi 2, yaitu uji-t yang digunakan untuk pengujian hipotesis 1-sampel dan uji-t yang digunakan untuk pengujian hipotesis 2-sampel. Bila dihubungkan dengan kebebasan (independency) sampel yang digunakan (khusus bagi uji-t dengan 2-sampel), maka uji-t dibagi lagi menjadi 2, yaitu uji-t untuk sampel bebas (independent) dan uji-t untuk sampel berpasangan (paired).

Dalam lingkup uji-t untuk pengujian hipotesis 2-sampel bebas, maka ada 1 hal yang perlu mendapat perhatian, yaitu apakah ragam populasi (ingat: ragam populasi, bukan ragam sampel) diasumsikan homogen (sama) atau tidak. Bila ragam populasi diasumsikan sama, maka uji-t yang digunakan adalah uji-t dengan asumsi ragam homogen, sedangkan bila ragam populasi dari 2-sampel tersebut tidak diasumsikan homogen, maka yang lebih tepat adalah menggunakan uji-t dengan asumsi ragam tidak homogen. Uji-t dengan ragam homogen dan tidak homogen memiliki rumus hitung yang berbeda. Oleh karena itulah, apabila uji-t hendak digunakan untuk melakukan pengujian hipotesis terhadap 2-sampel, maka harus dilakukan pengujian mengenai asumsi kehomogenan ragam populasi terlebih dahulu dengan menggunakan uji-F.

2.       Anova

ANOVA merupakan lanjutan dari uji-t independen dimana kita memiliki dua kelompok percobaan atau lebih. ANOVA biasa digunakan untuk membandingkan mean dari dua kelompok sampel independen (bebas). Uji ANOVAOne Way Analysis of Variance. ini juga biasa disebut sebagai

Asumsi yang digunakan adalah subjek diambil secara acak menjadi satu kelompok n. Distribusi mean berdasarkan kelompok normal dengan keragaman yang sama. Ukuran sampel antara masing-masing kelompok sampel tidak harus sama, tetapi perbedaan ukuran kelompok sampel yang besar dapat mempengaruhi hasil uji perbandingan keragaman.

Hipotesis yang digunakan adalah:

H0: µ1 = µ2 … = µk (mean dari semua kelompok sama)

Ha: µi µj (terdapat mean dari dua atau lebih kelompok tidak sama)

 

Regresi dalam statistika adalah salah satu metode untuk menentukan tingkat pengaruh suatuvariabel terhadap variabel yang lain. Variabel yang pertama disebut dengan bermacam-macam istilah:variabel penjelasvariabel eksplanatorikvariabel independen, atau secara bebas, variabel X (karena seringkali digambarkan dalam grafik sebagai absis, atau sumbu X). Variabel yang kedua adalahvariabel yang dipengaruhivariabel dependenvariabel terikat, atau variabel Y. Kedua variabel ini dapat merupakan variabel acak (random), namun variabel yang dipengaruhi harus selalu variabel acak.

Analisis regresi adalah salah satu analisis yang paling populer dan luas pemakaiannya. Hampir semua bidang ilmu yang memerlukan analisis sebab-akibat boleh dipastikan mengenal analisis ini.

Analisis ini pertama kali dipergunakan oleh Karl Pearson, seorang matematikawan dan penyokong ide eugenetika, untuk menganalisis hubungan antara sifat orang tua dan anaknya.

Korelasi dan regresi mempunyai hubungan yang sangat erat. Setiap regresi pasti ada korelasinya, tetapi korelasi belum tentu dilanjutkan dengan regresi. Korelasi yang tidak dilanjutkan dengan regresi adalah korelasi antara dua variabel yang tidak mempunyai hubungan kausal/sebab-akibat atau hubungan fungsional. Untuk menetapkan apakah kedua variabel mempunyai hubungan kausal atau tidak, maka harus dilandaskan pada teori atau konsep tentang dua variabel tersebut (Sugiyono, 2005).
Contoh Persamaan Regresi:

Y = 2 + 10X ……..(1)

Y = variabel respon; X = variabel prediktor/bebas

Angka 2 pada persamaan (1) biasanya disebut sebagai intersep.

Sedangkan angka 10 biasanya disebut sebagai slope. Pada umumnya, intersep diartikan sebagai nilai rata-rata Y bila nilai X sama dengan nol.

Sering ditemui di lapangan, para peneliti yang melakukan analisis data dengan regresi linier, baik sederhana maupun berganda, selalu “memaksa” untuk menginterpretasikan makna nilai intersep dari persamaan regresi yang didapatkan. Padahal, intersep tidak selalu dapat diartikan, apalagi jika tidak ada dukungan secara teori terhadap kasus yang sedang diteliti. Intersep sebenarnya merupakan komponen yang harus muncul agar nilai slope dapat dihitung. Apabila data pengamatan untuk variabel bebas/prediktor (variabel X) tidak mengikutkan nilai 0 (atau mendekati 0), maka peneliti perlu berhati-hati dalam memaknai intersep. Apabila tetap dipaksakan untuk memaknai intersep tanpa didukung oleh latar belakang keilmuan untuk kasus yang diteliti, dikuatirkan akan melanggar aturan dari penggunaan persamaan regresi, yaitu bahwa persamaan regresi tidak dapat digunakan untuk memprediksi nilai variabel respon (variabel Y) secara ekstrapolasi. Hal ini disebabkan karena kita tidak tahu apakah bentuk hubungan antara variabel respon dan prediktor juga masih berbentuk linier apabila nilai pengamatan variabel prediktor diperluas hingga mendekati nilai 0. Dalam hal ini, peneliti dituntut memahami secara lebih mendalam mengenai latar belakang keilmuan dari kasus yang diteliti. Biasanya, secara teoritis, para ahli suatu bidang ilmu telah menjelaskan mengenai peran intersep dalam ilmu tersebut. Misalnya dalam bidang eonomi, untuk penelitian mengenai biaya, intersep biasanya diartikan sebagai fixed cost, sedangkan slope diartikan sebagai variabel cost.

Dalam kehidupan sehari-hari, seringkali dijumpai hubungan antara suatu variabel dengan satu atau lebih variabel lain. Di dalam bidang pertanian sebagai contoh, dosis dan jenis pupuk yang diberikan berhubungan dengan hasil pertanian yang diperoleh, jumlah pakan yang diberikan pada ternak berhubungan dengan berat badannya, dan sebagainya. Secara umum ada dua macam hubungan antara dua atau lebih variabel, yaitu bentuk hubungan dan keeratan hubungan. Bila ingin mengetahuibentuk hubungan dua variabel atau lebih, digunakan analisis regresi. Bila ingin melihat keeratan hubungan, digunakan analisis korelasi.

Analisis regresi adalah teknik statistika yang berguna untuk memeriksa dan memodelkan hubungan diantara variabel-variabel. Penerapannya dapat dijumpai secara luas di banyak bidang seperti teknik, ekonomi, manajemen, ilmu-ilmu biologi, ilmu-ilmu sosial, dan ilmu-ilmu pertanian. Pada saat ini, analisis regresi berguna dalam menelaah hubungan dua variabel atau lebih, dan terutama untuk menelusuri pola hubungan yang modelnya belum diketahui dengan sempurna, sehingga dalam penerapannya lebih bersifat eksploratif.

Analisis regresi dikelompokkan dari mulai yang paling sederhana sampai yang paling rumit, tergantung tujuan yang berlandaskan pengetahuan atau teori sementara, bukan asal ditentukan saja.

a.   Regresi Linier Sederhana

Regresi linier sederhana bertujuan mempelajari hubungan linier antara dua variabel. Dua variabel ini dibedakan menjadi variabel bebas (X) dan variabel tak bebas (Y). Variabel bebas adalah variabel yang bisa dikontrol sedangkan variabel tak bebas adalah variabel yang mencerminkan respon dari variabel bebas.

b.   Regresi Berganda

Regresi berganda seringkali digunakan untuk mengatasi permasalahan analisis regresi yang melibatkan hubungan dari dua atau lebih variabel bebas. Pada awalnya regresi berganda dikembangkan oleh ahli ekonometri untuk membantu meramalkan akibat dari aktivitas-aktivitas ekonomi pada berbagai segmen ekonomi. Misalnya laporan tentang peramalan masa depan perekonomian di jurnal-jurnal ekonomi (Business Week, Wal Street Journal, dll), yang didasarkan pada model-model ekonometrik dengan analisis berganda sebagai alatnya. Salah satu contoh penggunaan regresi berganda dibidang pertanian diantaranya ilmuwan pertanian menggunakan analisis regresi untuk menjajagi antara hasil pertanian (misal: produksi padi per hektar) dengan jenis pupuk yang digunakan, kuantitas pupuk yang diberikan, jumlah hari hujan, suhu, lama penyinaran matahari, dan infeksi serangga.

c.   Regresi Kurvilinier

Regresi kurvilinier seringkali digunakan untuk menelaah atau memodelkan hubungan fungsi variabel terikat (Y) dan variabel bebas (X) yang tidak bersifat linier. Tidak linier bisa diartikan bilamana laju perubahan Y sebagai akibat perubahan X tidak konstan untuk nilai-nilai X tertentu. Kondisi fungsi tidak linier ini (kurvilinier) seringkali dijumpai dalam banyak bidang. Misal pada bidang pertanian, bisa diamati hubungan antara produksi padi dengan taraf pemupukan Phospat. Secara umum produksi padi akan meningkat cepat bila pemberian Phospat ditingkatkan dari taraf rendah ke taraf sedang. Tetapi ketika pemberian dosis Phospat diteruskan hingga taraf tinggi, maka tambahan dosis Phospat tidak lagi diimbangi kenaikan hasil, sebaliknya terjadi penurunan hasil. Untuk kasus-kasus hubungan tidak linier, prosedur regresi sederhana atau berganda tidak dapat digunakan dalam mencari pola hubungan dari variabel-variabel yang terlibat. Dalam hal ini, prosedur analisis regresi kurvilinier merupakan prosedur yang sesuai untuk digunakan.

d.      Regresi Dengan Variabel Dummy (Boneka)

Analisis regresi tidak saja digunakan untuk data-data kuantitatif (misal : dosis pupuk), tetapi juga bisa digunakan untuk data kualitatif (misal : musim panen). Jenis data kualitatif tersebut seringkali menunjukkan keberadaan klasifikasi (kategori) tertentu, sering juga dikatagorikan variabel bebas (X) dengan klasifikasi pengukuran nominal dalam persamaan regresi. Sebagai contoh, bila ingin meregresikan pengaruh kondisi kemasan produk dodol nenas terhadap harga jual. Pada umumnya, cara yang dipakai untuk penyelesaian adalah memberi nilai 1 (satu) kalau kategori yang dimaksud ada dan nilai 0 (nol) kalau kategori yang dimaksud tidak ada (bisa juga sebaliknya, tergantung tujuannya). Dalam kasus kemasan ini, bila kemasannya menarik diberi nilai 1 dan bila tidak menarik diberi nilai 0. Variabel yang mengambil nilai 1 dan 0 disebut variabel dummy dan nilai yang diberikan dapat digunakan seperti variabel kuantitatif lainnya.

 

e.       Regresi Logistik (Logistic Regression)

 Bila regresi dengan variabel bebas (X) berupa variabel dummy,  maka dikatagorikan sebagai regresi dummy. Regresi logistik digunakan jika variabel terikatnya (Y) berupa variabel masuk katagori klasifikasi. Misalnya, variabel Y berupa dua respon yakni gagal (dilambangkan dengan nilai 0) dan berhasil (dilambangkan dengan nilai 1). Kondisi demikian juga sering dikatagorikan sebagai regresi dengan respon biner. Seperti pada analisis regresi berganda, untuk regresi logistik variabel bebas (X) bisa juga terdiri lebih dari satu variabel.

REGRESI LINIER

Regresi linier digunakan untuk memodelkan hubungan sebab akibat antara variabel bebas dengan variabel respon. Dari namanya saja udah kelihatan, bahwa model hubungan yang dimaksud adalah model hubungan linier. Contoh: Ingin dicari model regresi antara “biaya iklan” dengan “penjualan”. Variabel bebas/prediktor adalah biaya iklan dan variabel respon adalah penjualan. Jadi ingin dicari bagaimanakah model hubungan antara 2 variabel tsb, sehingga bisa diketahui berapakah nilai penjualan yang akan diperoleh bila perusahaan mengeluarkan biaya iklan sebesar X rupiah.

Regresi Linier Berganda

Analisis regresi merupakan studi dalam menjelaskan dan mengevaluasi hubungan antara suatu peubah bebas (independent variable) dengan satu peubah tak bebas (dependent variable) dengan tujuan untuk mengestimasi dan atau meramalkan nilai peubah tak bebas didasarkan pada nilai peubah bebas yang diketahui (Widarjono, 2005).

Metode regresi linear berganda dapat digunakan untuk melihat pengaruh beberapa peubah penjelas atau peubah bebas terhadap satu peubah tak bebas. Metode analisis yang digunakan dalam penelitian ini adalah analisis regresi linear berganda. Analisis regresi linier berganda digunakan untuk melihat pengaruh peubah stok karet alam AS, PDB AS, harga karet alam di pasar internasional, dan jumlah kendaraan bermotor di AS terhadap volume ekspor karet alam Indonesia.

Selain itu, analisis regresi linear berganda juga digunakan untuk melihat pengaruh peubah produksi karet alam Indonesia, impor karet sintetis Indonesia, jumlah kendaraan bermotor di Indonesia, serta kebijakan pemerintah dalam Kepres no.1 tahun 1986 terhadap konsumsi karet alam Indonesia.

Untuk menyatakan kuat tidaknya hubungan linier antara peubah penjelas dan peubah bebas dapat diukur dari koefisisen korelasi ( coefficient correlation) atau R, dan untuk melihat besarnya sumbangan (pengaruh) dari peubah bebas terhadap perubahan peubah tak bebas dapat dilihat dari koefisien determinasi (coefficient of determination) atau R2. Variabel boneka (dummy) adalah variabel yang menjelaskan ada atau tidak adanya kualitas dengan membentuk variabel buatan yang mengambil nilai 1 atau 0 (Budiani, 2005).

Regresi Liear Klasik

Setelah didapatkan model regresi, kita tidak bisa langsung melakukan interpretasi terhadap hasil yang diperoleh. Hal ini disebabkan karena model regresi harus diuji terlebih dahulu apakah sudah memenuhi asumsi klasik. Apabila ada satu syarat saja yang tidak terpenuhi, maka hasil analisis regresi tidak dapat dikatakan bersifat BLUE (Best Linear Unbiased Estimator). Asumsi regresi linier klasik tersebut antara lain adalah:

  1. Model regresi dispesifikasikan dengan benar.
  2. Error menyebar normal dengan rataan nol dan memiliki suatu ragam (variance) tertentu.
  3. Tidak terjadi heteroskedastisitas pada ragam error.
  4. Tidak terjadi multikolinieritas antara peubah bebas.
  5. Error tidak mengalami autokorelasi (error tidak berkorelasi dg dirinya sendiri).

Jika Variabel bebas lebih dari satu, diperlukan analisis Regresi Multilinier, yg pers
umumnya adalah sbb :
Y = a + b1x1 + b2x2 + b3x3 + … + bnxn
Beberapa asumsi statistik diperlukan dalam analisis regresi multilinier :
1. Variabel tidak bebas adalah fungsi linier dari variabel bebas, Jika hubungan
tsb tidak linier maka harus ditransformasikan menjadi linier
2. Variabel, terutama variabel bebas adalah tetap atau telah diukur tanpa
kesalahan
3. Sesama variabel bebas tidak boleh ada korelasi dan jika terdapat korelasi
antara 2 buah variabel bebas maka salah satu variabel harus dibuang (yg
dibuang adalah variabel yg pengaruhnya kecil terhadap variabel tidak bebas.
4. Variansi dari variabel tidak bebas tentang garis regresi adalah sama untuk
seluruh nilai variabel bebas
5. Nilai variabel tidak bebas harus berdistribusi normal atau mendekati
Metode Least-Square digunakan dlm proses regresi dimana garis linier didapat sehingga
jml kuadrat terkecil dihasilkan atau (data survey – data model) adalah minimal

 

sumber : 

http://ilerning.com/index.php?option=com_content&view=article&id=248:regresi-sederhana-edit-mar&catid=39:hipotesis&Itemid=70

http://kuliahitukeren.blogspot.com/2011/04/pengertian-regresi.html

http://syafii.staff.uns.ac.id/files/2010/02/bab-4-trip-generation.pdf

Distribusi

0

Pada saat kita dihadapkan pada sekumpulan data yang banyak, seringkali membantu untuk mengatur dan merangkum data tersebut dengan membuat tabel yang berisi daftar nilai data yang mungkin berbeda (baik secara individu atau berdasarkan pengelompokkan) bersama dengan frekuensi yang sesuai, yang mewakili berapa kali nilai-nilai tersebut terjadi. Daftar sebaran nilai data tersebut dinamakan dengan Daftar Frekuensi atau Sebaran Frekuensi (Distribusi Frekuensi).

Dengan demikian, distribusi frekuensi adalah daftar nilai data (bisa nilai individual atau nilai data yang sudah dikelompokkan ke dalam selang interval tertentu) yang disertai dengan nilai frekuensi yang sesuai.

Pengelompokkan data ke dalam beberapa kelas dimaksudkan agar ciri-ciri penting data tersebut dapat segera terlihat. Daftar frekuensi ini akan memberikan gambaran yang khas tentang bagaimana keragaman data. Sifat keragaman data sangat penting untuk diketahui, karena dalam pengujian-pengujian statistik selanjutnya kita harus selalu memperhatikan sifat dari keragaman data. Tanpa memperhatikan sifat keragaman data, penarikan suatu kesimpulan pada umumnya tidaklah sah.

Sebagai contoh, perhatikan contoh data pada Tabel 1. Tabel tersebut adalah daftar nilai ujian Matakuliah Statistik dari 80 Mahasiswa (Sudjana, 19xx).

Tabel 1. Daftar Nilai Ujian Matakuliah Statistik

79 49 48 74 81 98 87 80
80 84 90 70 91 93 82 78
70 71 92 38 56 81 74 73
68 72 85 51 65 93 83 86
90 35 83 73 74 43 86 88
92 93 76 71 90 72 67 75
80 91 61 72 97 91 88 81
70 74 99 95 80 59 71 77
63 60 83 82 60 67 89 63
76 63 88 70 66 88 79 75

Sangatlah sulit untuk menarik suatu kesimpulan dari daftar data tersebut. Secara sepintas, kita belum bisa menentukan berapa nilai ujian terkecil atau terbesar. Demikian pula, kita belum bisa mengetahui dengan tepat, berapa nilai ujian yang paling banyak atau berapa banyak mahasiswa yang mendapatkan nilai tertentu. Dengan demikian, kita harus mengolah data tersebut terlebih dulu agar dapat memberikan gambaran atau keterangan yang lebih baik.

Bandingkan dengan tabel yang sudah disusun dalam bentuk daftar frekuensi (Tabel 2a dan Tabel 2b). Tabel 2amerupakan daftar frekuensi dari data tunggal dan Tabel 2b merupakan daftar frekuensi yang disusun dari data yang sudah di kelompokkan pada kelas yang sesuai dengan selangnya. Kita bisa memperoleh beberapa informasi atau karakteristik dari data nilai ujian mahasiswa.

Tabel 2a.

No Nilai Ujian Frekuensi
xi fi
1 35 1
2 36 0
3 37 0
4 38 1
: : :
16 70 4
17 71 3
: : 1
42 98 1
43 99 1
Total 80

Pada Tabel 2a, kita bisa mengetahui bahwa ada 80 mahasiswa yang mengikuti ujian, nilai ujian terkecil adalah 35 dan tertinggi adalah 99. Nilai 70 merupakan nilai yang paling banyak diperoleh oleh mahasiswa, yaitu ada 4 orang, atau kita juga bisa mengatakan ada 4 mahasiswa yang memperoleh nilai 70, tidak ada satu pun mahasiswa yang mendapatkan nilai 36, atau hanya satu orang mahasiswa yang mendapatkan nilai 35.

Tabel 2b.

Kelas ke- Nilai Ujian Frekuensi fi
1 31 – 40 2
2 41 – 50 3
3 51 – 60 5
4 61 – 70 13
5 71 – 80 24
6 81 – 90 21
7 91 – 100 12
Jumlah 80

Tabel 2b merupakan daftar frekuensi dari data yang sudah dikelompokkan. Daftar ini merupakan daftar frekuensi yang sering digunakan. Kita sering kali mengelompokkan data contoh ke dalam selang-selang tertentu agar memperoleh gambaran yang lebih baik mengenai karakteristik dari data. Dari daftar tersebut, kita bisa mengetahui bahwa mahasiswa yang mengikuti ujian ada 80, selang kelas nilai yang paling banyak diperoleh oleh mahasiswa adalah sekitar 71 sampai 80, yaitu ada 24 orang, dan seterusnya. Hanya saja perlu diingat bahwa dengan cara ini kita bisa kehilangan identitas dari data aslinya. Sebagai contoh, kita bisa mengetahui bahwa ada 2 orang yang mendapatkan nilai antara 31 sampai 40. Meskipun demikian, kita tidak akan tahu dengan persis, berapa nilai sebenarnya dari 2 orang mahasiswa tersebut, apakah 31 apakah 32 atau 36 dst.

Ada beberapa istilah yang harus dipahami terlebih dahulu dalam menyusun daftar frekuensi.

Tabel 3.

Kelas ke- Selang
Nilai Ujian
Batas Kelas Nilai Kelas
(xi)
Frekuensi
(fi)
1 31 – 40 30.5 – 40.5 35.5 2
2 41 – 50 40.5 – 50.5 45.5 3
3 51 – 60 50.5 – 60.5 55.5 5
4 61 – 70 60.5 – 70.5 65.5 13
5 71 – 80 70.5 – 80.5 75.5 24
6 81 – 90 80.5 – 90.5 85.5 21
7 91 – 100 90.5 – 100.5 95.5 12
Jumlah 80

Range : Selisih antara nilai tertinggi dan terendah. Pada contoh ujian di atas, Range = 99 – 35 = 64

Batas bawah kelas: Nilai terkecil yang berada pada setiap kelas. (Contoh: Pada Tabel 3 di atas, batas bawah kelasnya adalah 31, 41, 51, 61, …, 91)

Batas atas kelas: Nilai terbesar yang berada pada setiap kelas. (Contoh: Pada Tabel 3 di atas, batas bawah kelasnya adalah 40, 50, 60, …, 100)

Batas kelas (Class boundary): Nilai yang digunakan untuk memisahkan antar kelas, tapi tanpa adanya jarak antara batas atas kelas dengan batas bawah kelas berikutnya. Contoh: Pada kelas ke-1, batas kelas terkecilnya yaitu 30.5 dan terbesar 40.5. Pada kelas ke-2, batas kelasnya yaitu 40.5 dan 50.5. Nilai pada batas atas kelas ke-1 (40.5) sama dengan dan merupakan nilai batas bawah bagi kelas ke-2 (40.5). Batas kelas selalu dinyatakan dengan jumlah digit satu desimal lebih banyak daripada data pengamatan asalnya. Hal ini dilakukan untuk menjamin tidak ada nilai pengamatan yang jatuh tepat pada batas kelasnya, sehingga menghindarkan keraguan pada kelas mana data tersebut harus ditempatkan. Contoh: bila batas kelas di buat seperti ini:

Kelas ke-1 : 30 – 40

Kelas ke-2 : 40 – 50

:

dst.

Apabila ada nilai ujian dengan angka 40, apakah harus ditempatkan pada kelas-1 ataukah kelas ke-2?

Panjang/lebar kelas (selang kelas): Selisih antara dua nilai batas bawah kelas yang berurutan atau selisih antara dua nilai batas atas kelas yang berurutan atau selisih antara nilai terbesar dan terkecil batas kelas bagi kelas yang bersangkutan. Biasanya lebar kelas tersebut memiliki lebar yang sama. Contoh:

lebar kelas = 41 – 31 = 10 (selisih antara 2 batas bawah kelas yang berurutan) atau

lebar kelas = 50 – 40 = 10 (selisih antara 2 batas atas kelas yang berurutan) atau

lebar kelas = 40.5 – 30.5 = 10. (selisih antara nilai terbesar dan terkecil batas kelas pada kelas ke-1)

Nilai tengah kelas: Nilai kelas merupakan nilai tengah dari kelas yang bersangkutan yang diperoleh dengan formula berikut: ½ (batas atas kelas+batas bawah kelas). Nilai ini yang dijadikan pewakil dari selang kelas tertentu untuk perhitungan analisis statistik selanjutnya. Contoh: Nilai kelas ke-1 adalah ½(31+40) = 35.5

Banyak kelas: Sudah jelas! Pada tabel ada 7 kelas.

Frekuensi kelas: Banyaknya kejadian (nilai) yang muncul pada selang kelas tertentu. Contoh, pada kelas ke-1, frekuensinya = 2. Nilai frekuensi = 2 karena pada selang antara 30.5 – 40.5, hanya ada 2 angka yang muncul, yaitu nilai ujian 31 dan 38.

Teknik pembuatan Tabel Distribusi Frekuensi (TDF)

Distribusi frekuensi dibuat dengan alasan berikut:

  • kumpulan data yang besar dapat diringkas
  • kita dapat memperoleh beberapa gambaran mengenai karakteristik data, dan
  • merupakan dasar dalam pembuatan grafik penting (seperti histogram).

Banyak software (teknologi komputasi ) yang bisa digunakan untuk membuat tabel distribusi frekuensi secara otomatis. Meskipun demikian, di sini tetap akan diuraikan mengenai prosedur dasar dalam membuat tabel distribusi frekuensi.

Langkah-langkah dalam menyusun tabel distribusi frekuensi:

  • Urutkan data, biasanya diurutkan dari nilai yang paling kecil
    • Tujuannya agar range data diketahui dan mempermudah penghitungan frekuensi tiap kelas!
  • Tentukan range (rentang atau jangkauan)
      • Range = nilai maksimum – nilai minimum
    • Tentukan banyak kelas yang diinginkan. Jangan terlalu banyak/sedikit, berkisar antara 5 dan 20, tergantung dari banyak dan sebaran datanya.
      • Aturan Sturges:
      • Banyak kelas = 1 + 3.3 log n, dimana n = banyaknya data
    • Tentukan panjang/lebar kelas interval (p)
      • Panjang kelas (p) = [rentang]/[banyak kelas]
    • Tentukan nilai ujung bawah kelas interval pertama

    Pada saat menyusun TDF, pastikan bahwa kelas tidak tumpang tindih sehingga setiap nilai-nilai pengamatan harus masuk tepat ke dalam satu kelas. Pastikan juga bahwa tidak akan ada data pengamatan yang tertinggal (tidak dapat dimasukkan ke dalam kelas tertentu). Cobalah untuk menggunakan lebar yang sama untuk semua kelas, meskipun kadang-kadang tidak mungkin untuk menghindari interval terbuka, seperti ” ≥ 91 ” (91 atau lebih). Mungkin juga ada kelas tertentu dengan frekuensi nol.

    Contoh:

    Kita gunakan prosedur di atas untuk menyusun tabel distribusi frekuensi nilai ujian mahasiswa (Tabel 1).

    Berikut adalah nilai ujian yang sudah diurutkan:
    
     35  38  43  48  49  51  56  59  60  60
     61  63  63  63  65  66  67  67  68  70
     70  70  70  71  71  71  72  72  72  73
     73  74  74  74  74  75  75  76  76  77
     78  79  79  80  80  80  80  81  81  81
     82  82  83  83  83  84  85  86  86  87
     88  88  88  88  89  90  90  90  91  91
     91  92  92  93  93  93  95  97  98  99
    
     2. Range:
        [nilai tertinggi – nilai terendah] = 99 – 35 = 64
    
     3. Banyak Kelas:
        Tentukan banyak kelas yang diinginkan.
        Apabila kita lihat nilai Range = 64, mungkin banyak kelas
        sekitar 6 atau 7.
        Sebagai latihan, kita gunakan aturan Sturges.
        banyak kelas = 1 + 3.3 x log(n)
                     = 1 + 3.3 x log(80)
                     = 7.28 ≈ 7
    
     4. Panjang Kelas:
        Panjang Kelas = [range]/[banyak kelas]
                      = 64/7
                      = 9.14 ≈ 10
                        (untuk memudahkan dalam penyusunan TDF)
    
     5. Tentukan nilai batas bawah kelas pada kelas pertama.
        Nilai ujian terkecil = 35
        Penentuan nilai batas bawah kelas bebas saja,
        asalkan nilai terkecil masih masuk ke dalam kelas tersebut.
        Misalkan: apabila nilai batas bawah yang kita pilih adalah 26,
        maka interval kelas pertama: 26 – 35, nilai 35 tepat jatuh
        di batas atas kelas ke-1. Namun apabila kita pilih
        nilai batas bawah kelas 20 atau 25, jelas nilai terkecil, 35,
        tidak akan masuk ke dalam kelas tersebut.
        Namun untuk kemudahan dalam penyusunan dan pembacaan TDF,
        tentunya juga untuk keindahan, he2.. lebih baik kita memilih
        batas bawah 30 atau 31.  Ok, saya tertarik dengan angka 31,
        sehingga batas bawahnya adalah 31.
    
     Dari prosedur di atas, kita dapat info sebagai berikut:
     Banyak kelas       : 7
     Panjang kelas      : 10
     Batas bawah kelas  : 31
     Selanjutnya kita susun TDF:
     Form TDF:
     ------------------------------------------------------------
      Kelas ke- | Nilai Ujian | Batas Kelas | Turus | Frekuensi
     ------------------------------------------------------------
          1        31 -
          2        41 -
          3        51 -
          :        :  -
          6        81 -
          7        91 -
     ------------------------------------------------------------
       Jumlah
     ------------------------------------------------------------
     Tabel berikut merupakan tabel yang sudah dilengkapi
    Kelas ke- Nilai Ujian Batas Kelas Frekuensi
    (fi)
    1 31 – 40 30.5 – 40.5 2
    2 41 – 50 40.5 – 50.5 3
    3 51 – 60 50.5 – 60.5 5
    4 61 – 70 60.5 – 70.5 13
    5 71 – 80 70.5 – 80.5 24
    6 81 – 90 80.5 – 90.5 21
    7 91 – 100 90.5 – 100.5 12
    Jumlah 80
    atau dalam bentuk yang lebih ringkas:
    Kelas ke- Nilai Ujian Frekuensi
    (fi)
    1 31 – 40 2
    2 41 – 50 3
    3 51 – 60 5
    4 61 – 70 13
    5 71 – 80 24
    6 81 – 90 21
    7 91 – 100 12
    Jumlah 80

    Distribusi Frekuensi Relatif dan Kumulatif

    Variasi penting dari distribusi frekuensi dasar adalah dengan menggunakan nilai frekuensi relatifnya, yang disusun dengan membagi frekuensi setiap kelas dengan total dari semua frekuensi (banyaknya data). Sebuah distribusi frekuensi relatif mencakup batas-batas kelas yang sama seperti TDF, tetapi frekuensi yang digunakan bukan frekuensi aktual melainkan frekuensi relatif. Frekuensi relatif kadang-kadang dinyatakan sebagai persen.

    Frekuensi relatif = \dfrac{{{f_i}}}{{\sum {f_i}}} \times 100\% = \dfrac{{{f_i}}}{n} \times 100\%

    Contoh: frekuensi relatif kelas ke-1:

    fi = 2; n = 80

    Frekuensi relatif = 2/80 x 100% = 2.5%

    Kelas ke- Nilai Ujian Frekuensi relatif (%)
    1 31 – 40 2.50
    2 41 – 50 3.75
    3 51 – 60 6.25
    4 61 – 70 16.25
    5 71 – 80 30.00
    6 81 – 90 26.25
    7 91 – 100 15.00
    Jumlah 100.00

    Distribusi Frekuensi kumulatif

    Variasi lain dari distribusi frekuensi standar adalah frekuensi kumulatif. Frekuensi kumulatif untuk suatu kelas adalah nilai frekuensi untuk kelas tersebut ditambah dengan jumlah frekuensi semua kelas sebelumnya.

    Perhatikan bahwa kolom frekuensi selain label headernya diganti dengan frekuensi kumulatif kurang dari, batas-batas kelas diganti dengan “kurang dari” ekspresi yang menggambarkan kisaran nilai-nilai baru.

    Nilai Ujian Frekuensi kumulatif kurang dari
    kurang dari 30.5 0
    kurang dari 40.5 2
    kurang dari 50.5 5
    kurang dari 60.5 10
    kurang dari 70.5 23
    kurang dari 80.5 47
    kurang dari 90.5 68
    kurang dari 100.5 80

    atau kadang disusun dalam bentuk seperti ini:

    Nilai Ujian Frekuensi kumulatif kurang dari
    kurang dari 41 2
    kurang dari 51 5
    kurang dari 61 10
    kurang dari 71 23
    kurang dari 81 47
    kurang dari 91 68
    kurang dari 101 80

    Variasi lain adalah Frekuensi kumulatif lebih dari. Prinsipnya hampir sama dengan prosedur di atas.

    Histogram

    Histogram adalah merupakan bagian dari grafik batang di mana skala horisontal mewakili nilai-nilai data kelas dan skala vertikal mewakili nilai frekuensinya. Tinggi batang sesuai dengan nilai frekuensinya, dan batang satu dengan lainnya saling berdempetan, tidak ada jarak/ gap diantara batang. Kita dapat membuat histogram setelah tabel distribusi frekuensi data pengamatan dibuat.

    Poligon Frekuensi:

    Poligon Frekuensi menggunakan segmen garis yang terhubung ke titik yang terletak tepat di atas nilai-nilai titik tengah kelas. Ketinggian dari titik-titik sesuai dengan frekuensi kelas, dan segmen garis diperluas ke kanan dan kiri sehingga grafik dimulai dan berakhir pada sumbu horisontal.

    Ogive

    Ogive adalah grafik garis yang menggambarkan frekuensi kumulatif, seperti daftar distribusi frekuensi kumulatif. Perhatikan bahwa batas-batas kelas dihubungkan oleh segmen garis yang dimulai dari batas bawah kelas pertama dan berakhir pada batas atas dari kelas terakhir. Ogive berguna untuk menentukan jumlah nilai di bawah nilai tertentu. Sebagai contoh, pada gambar berikut menunjukkan bahwa 68 mahasiswa mendapatkan nilai kurang dari 90.5.

     

     

    Distribusi Binomial

    Distribusi Binomial atau distribusi Bernoulli (ditemukan oleh James Bernoulli) adalah suatu distribusi teoritis yang menggunakan variabel random diskrit yang terdiri dari dua kejadian yang berkomplemen, seperti sukses-gagal, ya-tidak, baik-cacat, kepalaekor dll.

    Ciri-ciri distribusi Binomial adalah sbb :

    1. Setiap percobaan hanya memiliki dua peristiwa, seperti ya-tidak, sukses-gagal.

    2. Probabilitas suatu peristiwa adalah tetap, tidak berubah untuk setiap percobaan.

    3. Percobaannya bersifat independen, artinya peristiwa dari suatu percobaan tidak mempengaruhi atau dipengaruhi peristiwa dalam percobaan lainnya.

    4. Jumlah atau banyaknya percobaan yang merupakan komponen percobaan binomial harus tertentu.

     

    Rumus Distribusi Binomial

    a). Rumus binomial suatu peristiwa

    Probabilitas suatu peristiwa dapat dihitung dengan mengalikan kombinasi susunan dengan probabilitas salah satu susunan.

    Berdasarkan hal tersebut, secara umum rumus dari probabilitas binomial suatu peristiwa dituliskan.

    b). Probabilitas binomial kumulatif

    Probabilitas binomial kumulatif adalah probabilitas dari peristiwa binomial lebih dari satu sukses.

    Probabilitas binomial kumulatif dapat dihitung dengan menggunakan rumus :

    Contoh :

    Sebuah dadu dilemparkan keatas sebanyak 4 kali. Tentukan probabilitas dari

    peristiwa berikut :

    a). Mata dadu 5 muncul 1 kali

    b). Mata dadu genap muncul 2 kali

    c). Mata dadu 2 atau 6 muncul sebanyak 4 kali.

     

    a). Karena dadu memiliki 6 sisi, yaitu 1, 2, 3, 4, 5, 6, sehingga setiap sisi memiliki

    probabilitas 1/6. Jadi, probabilitas untuk mata 1 adalah 1/6, sehigga :

    p=1/6; q=5/6; n=4; x=1 (muncul 1 kali )

    P(X=1) = C1

    4.p1.q3

    = 4(1/6)1(5/6)3

    = 0,386

     

    b). Mata dadu genap ada 3, yaitu 2,4, dan 6, sehingga :

    p = 3/6 = 1/2; q = 1/2; n = 4; x = 2

    P(X=2) = C2

    4.p2.q2

    = 6(1/2)2(1/2)2

    = 0,375

     

    c). Muncul mata dadu 2 atau 6 sebanyak 4 kali, sehngga :

    p = 2/6; q = 2/3; n = 4; x = 4

    P(X=4) = C 4

    4.p4.q0 .p .q

    = 1(2/6)4(2/3)0

    = 0,0123

     

    Distribusi Poisson

    Distibusi Poisson merupakan distribusi probabilitas untuk variabel diskrit acak yang mempunyai nilai 0,1, 2, 3 dst. Distribusi Poisson adalah distribusi nilai-nilai bagi suatu variabel random X (X diskrit), yaitu banyaknya hasil percobaan yang terjadi dalam suatu interval waktu tertentu atau disuatu daerah tertentu. fungsi distribusi probabilitas diskrit yang sangat penting dalam beberapa aplikasi praktis.
    Poisson memperhatikan bahwa distribusi binomial sangat bermanfaat dan dapat menjelaskan dengan sangat memuaskan terhadap probabilitas Binomial b(X│n.p) untuk X= 1,2,3 …n. namun demikian, untuk suatu kejadian dimana n sangat besar (lebih besar dari 50) sedangkan probabilitas sukses (p) sangat kecil seperti 0,1 atau kurang, maka nilai binomialnya sangat sulit dicari. Suatu bentuk dari distribusi ini adalah rumus pendekatan peluang Poisson untuk peluang Binomial yang dapat digunakan untuk pendekatan probabilitas Binomial dalam situasi tertentu.

    CIRI-CIRI DISTRIBUSI POISSON

    Percobaan Poisson memiliki ciri-ciri berikut :
    Hasil percobaan pada suatu selang waktu dan tempat tidak tergantung dari hasil percobaan di selang waktu dan tempat yang lain yang terpisah
    Peluang terjadinya suatu hasil percobaan sebanding dengan panjang selang waktu dan luas tempat percobaan terjadi. Hal ini berlaku hanya untuk selang waktu yang singkat dan luas daerah yang sempit
    Peluang bahwa lebih dari satu hasil percobaan akan terjadi pada satu selang waktu dan luasan tempat yang sama diabaikan

     

    PENGGUNAAN DISTRIBUSI POISSON

    Distribusi poisson banyak digunakan dalam hal:
    a). menghitung Probabilitas terjadinya peristiwa menurut satuan waktu, ruang atau isi, luas, panjang tertentu, saeperti menghitung probabilitas dari:
    Kemungkinan kesalahan pemasukan data atau kemungkinan cek ditolak oleh bank
    Jumlah pelanggan yang harus antri pada pelayanan rumah sakit, restaurant cepat saji atau antrian yang panjang bila ke ancol.
    banyaknya bintang dalam suatu area acak di ruangangkasa atau banyaknya bakteri dalam 1 tetes atau 1 liter air.
    jumlah salah cetak dalam suatu halaman ketik
    Banyaknya penggunaan telepon per menit atau banyaknya mobil yang lewat selama 5 menit di suatu ruas jalan.
    distribusi bakteri di permukaan beberapa rumput liar di ladang.
    Semua contoh ini merupakan beberapa hal yang menggambarkan tentang suatu distribusi Poisson.
    b). Menghitung distribusi binomial apabila nilai n besar (n ≥ 30) dan p kecil (p<0,1).

    Jika kita menghitung sejumlah benda acak dalam suatu daerah tertentu T, maka proses penghitungan ini dilakukan sebagai berikut :
    a. jumlah rata-rata benda di daerah S T adalah sebanding terhadap ukuran S, yaitu ECount(S)= λ S. Di sini melambangkan ukuran S, yaitu panjang, luas, volume, dan lain lain. Parameter λ > 0 menggambarkankan intensitas proses.
    b. menghitung di daerah terpisah adalah bebas.
    c. kesempatan untuk mengamati lebih dari satu benda di dalam suatu daerah kecil adalah sangat kecil, yaitu P(Count(S)2) menjadi kecil ketika ukuran menjadi kecil.

    RUMUS DISTRIBUSI POISSON
    Rumus Poisson dapat digunakan untuk menghitung probabilitas dari jumlah kedatangan, misalnya : probabilitas jumlah kedatangan nasabah pada suatu bank pada jam kantor. Distribusi Poisson ini digunakan untuk menghitung probabilitas menurut satuan waktu.

    Rumus Probabilitas Poisson Suatu Peristiwa

    Probabilitas suatu peristiwa yang berdistribusi Poisson dirumuskan:

    P(X) = µ_X . e_µ / x!

    Keterangan: P(x) = Nilai probabilitas distribusi poisson
    µ = Rata-rata hitung dan jumlah nilai sukses, dimana µ = n . p
    e = Bilangan konstan = 2,71828
    X = Jumlah nilai sukses
    P = Probabilitas sukses suatu kejadian
    ! = lambang faktorial

    Soal 1
    Jumlah emiten di BEJ ada 150 perusahaan. Probabilitas perusahaan memberikan deviden pada tahun 2002 hanya 0,1. apabila BEJ meminta laporan dari emiten sebanyak 5 perusahaan, berapa probabilitas 5 perusahaan tersebut adalah perusahaan yang membagikan deviden?
    Jawab:
    n = 150, X = 5, dan p = 0,1 (ini merupakan cirri distribusi Poisson, n > 50 dan p kecil yaitu )
    µ = n . p = 150 x 0,1 = 15

    Jadi probabilitas 5 perusahaan sample membagikan deviden hanya 0,002 atau 0,2%

     

     

    Distribusi Normal

    Distribusi Normal adalah salah satu distribusi teoritis dari variable random kontinu. Distribusi Normal sering disebut distribusi Gauss.

    Distribusi Normal memiliki bentuk fungsi sebagai berikut :

     

    Keterangan :

    X = nilai data

    μ = rata-rata

    π= 3,14

    e = 2,71828

    σ= Simpangan baku


    Karakteristik Distribusi Normal

    Distribusi probabilitas normal dan kurva normal yang menyertainya memiliki beberapa karakteristik sebagai berikut :

    1. Kurva normal berbentuk lonceng

    2. Simetris

    3. Asimtotis

    1. Kurva berbentuk genta (μ= Md= Mo)2. Kurva berbentuk simetris

    2. Kurva berbentuk simetris

    3. Kurva normal berbentuk asimptotis

    4. Kurva mencapai puncak pada saat X= μ

    5. Luas daerah di bawah kurva adalah 1; ½ di sisi kanan nilai

    tengah dan ½ di sisi kiri.

     

     

    Jenis-jenis Distribusi Normal

    Grafik Pendekatan Distribusi Normal dan Binomial

     

    DISTRIBUSI SAMPLING

    (Distribusi Penarikan Sampel)

     

    •  Bidang Inferensia Statistik membahas generalisasi/penarikan kesimpulan dan prediksi/

    peramalan. Generalisasi dan prediksi tersebut melibatkan sampel/contoh, sangat jarang

    menyangkut populasi.

     

    •  Sensus = pendataan setiap  anggota populasi

    •  Sampling = pendataan sebagian anggota populasi = penarikan contoh = pengambilan

    sampel

    •  Pekerjaan yang melibatkan populasi tidak digunakan, karena:

    1.   mahal dari segi biaya dan waktu yang panjang

    2.    populasi akan menjadi rusak atau habis jika disensus

    misal :  dari populasi donat ingin diketahui rasanya, jika

    semua donat dimakan, dan donat tidak tersisa,

    tidak ada yang dijual?

    •  Sampel yang baik     →   Sampel yang representatif

    Besaran/ciri sampel (Statistik  Sampel) memberikan

    gambaran yang tepat mengenai besaran ukuran populasi

    (Parameter Populasi)

     

    Masih ingat beda antara  Statistik Sampel Vs  Parameter Populasi? perhatikan tabel

    berikut:

    Sampel yg baik diperoleh dengan memperhatikan hal-hal berikut :

    1.  keacakannya (randomness)

    2.  ukuran

    3.  teknik penarikan sampel (sampling)  yang sesuai dengan

    kondisi atau sifat populasi

     

    Sampel Acak  = Contoh Random → dipilih dari populasi di mana setiap anggota

    populasi memiliki peluang yang sama terpilih menjadi anggota ruang sampel.

     

    •  BEBERAPA TEKNIK PENARIKAN SAMPEL :

    1.         Penarikan Sampel Acak Sederhana (Simple Randomized Sampling)

    Pengacakan dapat dilakukan dengan :  undian, tabel bilangan acak, program

    komputer.

     

    2.  Penarikan Sampel Sistematik (Systematic Sampling)

    Tetapkan interval lalu  pilih secara acak anggota pertama sampel

     

    Contoh :   Ditetapkan interval = 20

    Secara acak terpilih  :  Anggota populasi ke-7 sebagai anggota  ke-

    1 dalam sampel, maka :

    Anggota populasi ke-27 menjadi anggota ke-2 dalam sampel

    Anggota populasi ke-47 menjadi anggota ke-3

    dalam sampel,  dst.

     

    3.  Penarikan Sampel Acak Berlapis (Stratified Random  Sampling)

     

    Populasi terdiri dari beberapa kelas/kelompok. Dari setiap kelas diambil sampel

    secara acak.

     

    Perhatikan !!!!

    Antar Kelas bersifat (cenderung) berbeda nyata (heterogen). Anggota dalam suatu

    kelas akan (cenderung) sama (homogen).

    DISTRIBUSI PENARIKAN SAMPEL

    ( DISTRIBUSI SAMPLING)

     

    •  Jumlah Sampel Acak yang dapat ditarik dari suatu populasi adalah sangat banyak.

    •  Nilai setiap Statistik Sampel akan bervariasi/beragam antar sampel.

    •  Suatu statistik dapat dianggap sebagai peubah acak yang besarnya sangat tergantung

    dari sampel  yang kita ambil.

    •  Karena statistik sampel adalah peubah acak maka ia mempunyai distribusi yang kita

    sebut sebagai : Distribusi peluang statistik sampel = Distribusi Sampling = Distribusi

    Penarikan Sampel

     

    Statistik sampel yg paling populer dipelajari adalah Rata-Rata ( x )

    Distribusi Sampling / thomas yuni gunarto /  hal 3 dari 11

    II.1. DISTRIBUSI SAMPLING RATA-RATA

     

    Beberapa notasi :

    n     : ukuran sampel    N   :  ukuran populasi

    x    : rata-rata sampel    µ    :  rata-rata populasi

    s    : standar deviasi sampel  σ    :  standar deviasi populasi

    µx   : rata-rata antar semua sampel

    σ x   : standar deviasi antar semua sampel = standard error = galat  baku

     

    II.1.1.Distribusi Sampling Rata Rata Sampel Besar

    Pengertian Pendugaan Parameter

     

    Pengertian Pendugaan dan Penduga
    • Pendugaan adalah proses yang menggunakan sample statistik untuk menduga atau menaksir hubungan parameter populasi yang tidak diketahui. Pendugaan merupakan suatu pernyataan mengenai parameter populasi yang diketahui berdasarkan informasi dari sample , dalam hal ini sample random , yang diambil dari populasi bersangkutan. Jadi dengan pendugaan itu , keadaan parameter populasi dapat diketahui
    • Pendugaan = Penaksiran = Parameter
    • Penduga adalah suatu statistik ( harga sample) yang digunakan untuk menduga suatu parameter. Dengan penduga , dapat diketahui seberapa jauh suatu parameter populasi yang tidak diketahui berada di sekitar sample ( statistik sample )
    • Secara  umum , parameter diberi lambang θ ( baca : theta ) dan penduga diberi lambang xxx

     

    Ciri – ciri Penduga yang Baik

    Banyak ciri atau syarat untuuk menentukan apakah sebuah penduga tergolong baik atau tidak . Suatau penduga dikatakan baik apabila memiliki ciri – ciri berikut :

    1. Tidak Bias ( Unbiased )

    Suatu penduga ( θ ) dikatakan tidak bias bagi parameternya ( θ ) apabila nilai penduga sama dengan nilai yang diduganya ( parameternya ). Jadi , penduga tersebut secara tepat dapat menduga nilai dari parameternya.

    1. Efisien

    Suatu penduga dikatakan efisien bagi parameternya ( θ ) apabila penduga tersebut memiliki varians yang kecil. Apabila terdapat lebih dari satu penduga , penduga yang efisien adalah penduga yuang memiliki varians terkecil. Dua buah penduga dapat dibandingkan efisiensinya dengan menggunakan efisiensi relatif ( relative efficiency ).

    1. Konsisten

    Suatu penduga dikatakan konsisten apabila memenuhi syarat berikut :

    a.       Jika ukuran sample semakin bertambah maka penduga akan mendekati parameternya. Jika besarnya sample menjadi tak terhingga maka penduga konsisten harus dapat memberi suatu pendugaan titik yang sempurna terhadap parameternya.

    b.      Jika ukuran sample bertambah tak terhingga maka distribusi sampling penduga akan mengecil menjadi suatu garis tegak lurus di atas parameter yang sebenarnya dengan probabilitas sama dengan 1.

    Catatan : Suatu penduga konsisten belum tentu merupakan penduga yang baik , karena konsisten hanya merupakan salah satu syarat.

     

    Jenis Pendugaan

    Teori pendugaan dibagi dua, yaitu:

    1.       Pendugaan Tunggal ( point estimate)

    ð  Pendugaan yang hanya mempunyai atau menyebutkan satu nilai

    Contoh : – pendugaan untuk µ merupakan rata – rata dari sample

    -  pendugaan untuk σmerupakan varians dari sample s2

    - pendugaan untuk p merupakan proporsi dari sample p

    2.       Pendugaan interval

    yaitu pendugaan yang mempunyai dua nilai sebagai pembatasan atau daerah pembatasan. Jadi di dalam pendugaan interval , dugaan dinyatakan dalam sebuah interval yang dibatasi oleh 2 nilai. Pada pendugaan interval digunakan tingkat keyakinan ( confidence) terhadap daerah yang nilai sebenarnya atau parameternya akan berbeda. Dengan demikian , pendugaan interval yang disertai keyakinan merupakan interval keyakinan ( confidence interval estimate ) atau interval kepercayaan.

    • Tingkat keyakinan / tingkat kepercayaan / tingkat konfidensi / peluang benar ( 1 – α )

    Adalah luas daerah di bawah kurva distribusi peluang teoritis yang merupakan tempat kedudukan nilai – nilai taksiran parameter suatu populasi berdasarkan pada statistic sampelnya yang masih dapat diyakini kebenarannya

    • Tingkat signifikan / tingkat resiko / taraf nyata ( α )

    Adalah luas daerah di bawah kurva distribusi peluang teoritis yang merupakan tempat kedudukan nilai – nilai taksiran parameter suatu populasi berdasarkan pada statistic samplenya yang tidak dapat diyakini kebenarannya.

     

    http://smartstat.wordpress.com/2010/03/29/distribusi-frekuensi/

    http://tugasfisikakuari.blogspot.com/

    pianhervian.files.wordpress.com/2010/12/distribusi-teoritis.pdf

    http://ilerning.com/index.php?option=com_content&view=article&id=468:pengertian-pendugaan-parameter&catid=38:distribusi-normal&Itemid=7

     

Teori Peluang

0

Teori peluang menyangkut dengan cara menentukan hubungan antara sejumlah kejadian khusus dengan jumlah kejadian sebarang. Misalnya pada kasus pelemparan uang sebanyak seratus kali, berapa kali akan munculnya gambar.

Teori peluang awalnya diinspirasi oleh masalah perjudian. Awalnya dilakukan oleh matematikawan dan fisikawan Itali yang bernama Girolamo Cardano (1501-1576). Cardano lahir pada tanggal 24 September 1501. Cardano merupakan seorang penjudi pada waktu itu. Walaupun judi berpengaruh buruk terhadap keluarganya, namun judi juga memacunya untuk mempelajari peluang. Dalam bukunya yang berjudul Liber de Ludo Aleae (Book on Games of Changes) pada tahun 1565,  Cardano banyak membahas konsep dasar dari peluang yang berisi tentang masalah perjudian. Sayangnya tidak pernah dipublikasikan sampai 1663. Girolamo merupakan salah seorang dari bapak probability. Di bukunya Cardano menulis tentang permasalahan peluan, yaitu:

Jika 3 buah dadu dilempar bersamaan sebanyak 3 kali, berapa peluang untuk mendapatkan mata dadu minimal 1,1 pada setiap lemparan.

Jika 2 buah dadu dilempar bersamaan sebanyak 3 kali, berapa peluang untuk mendapatkan mata dadu 1,1 paling sedikit dua kali.

Pada tahun 1654, seorang penjudi lainnya yang bernama Chevalier de Mere menemukan sistem perjudian. Ketika Chevalier kalah dalam berjudi dia meminta temannya Blaise Pascal (1623-1662) untuk menganalisis sistim perjudiannya. Pascal menemukan bahwa sistem yang dipunyai oleh Chevalier akan mengakibatkan peluang dia kalah 51 %. Pascal kemudian menjadi tertarik dengan peluang, dan mulailah dia mempelajari masalah perjudian. Dia mendiskusikannya dengan matematikawan terkenal yang lain yaituPierre de Fermat (1601-1665). Mereka berdiskusi pada tahun 1654 antara bulan Juni dan Oktober melalui 7 buah surat yang ditulis oleh Blaise Pascal dan Pierre de Fermat yang membentuk asal kejadian dari konsep peluang.

Blaisé Pascal bekerjasama dengan Fermat menyelesaikan soal-soal yang diberikan oleh Chevalier de Mere, diantaranya:

Ø Berapa kali kita harus melemparkan dua buah dadu, sehingga minimal separuh  mata dadu yang muncul keduanya angka 6.

Ø Dalam permainan dadu, dadu dilempar sebanyak 8 kali, permainan berakhir bila seorang gagal mendapat  mata dadu 1 sebanyak tiga kali.

Ø Probleme des partis (Problem of Point)

Dua pemain judi P1 dan P2 sepakat untuk bermain “fair games” sampai salah satu dari mereka menang dengan nilai tertentu dari N kali permainan. Permainannya tiba-tiba dihentikan. P1 menang N1 kali permainan dan P2 menang N2 permainan. Bagaimana seharusnya membagi taruhannya?

Pada awalnya Pascal mempunyai rencana untuk menulis karya tentang problema of point ini atau yang disebut aleae geometría tetapi tidak pernah menulisnya,

Ø Dua orang melempar sebuah mata uang logam secara bergantian, setiap muncul muka orang pertama akan memperoleh 1 point, bila yang muncul adalah belakang maka pemain kedua yang mendapat 1 point. Jika orang pertama sudah mendapat 100 point maka orang tersebut akan mendapat uang $1000.

Bila pemain pertama mempunyai 100-m point,dan pemain kedua mempunyai 100- n point , berapa peluang pemain pertama akan menang

Di awal tahun 1656, Christiaan Huygens menulis naskah Van Rekeningh in Spelen van Geluck Van Rekeningh in Spelen van Geluck adalah risalat singkat terdiri dari 15 halaman, yang kemungkinan didasarkan atas apa yang dilihat Huygen selama dia menetap di paris pada tahun-tahun sebelumnya tentang surat menyurat antara Pascal dan Fermat. Pada bentuk akhirnya, tulisan ini memuat 14 masalah (Voorstellen) dengan solusi atau buktinya dan 5 masalah yang harus diselesaikan oleh pembaca. Lima masalah terakhir adalah sebagian dari masalah Fermat dan Pascal. Masalah terakhir dari kelima masalah tersebut pada akhirnya dikenal sebagai “Gambler’s ruin” dan bagian-bagian dari surat menyurat Pascal dan Fermat yang di terbitkan pada tahun 1656.

Pada tahun 1709 Jaques (Jacob) Bernoulli menulis buku Ars Conjectandi, yang terdiri 5 bagian, yaitu:

1. Menulis lagi Liber de Ludo Aleae (Book on Games of Chance) karya Cardano

2. Permutasi dan Kombinasi

3. Distribusi Binomial dan Multinomial

4. Teori Peluang

5. Law Large Number (Hukum Bilangan Besar)

Jaques (Jacob) Bernoulli adalah orang yang pertama mengenalkan hukum bilangan besar (LLN). Dia mengerjakan dan mengembangkannya selama lebih dari 20 tahun, dan mempublikasikannya pada Ars Conjectandi (The Art of Conjecturing) pada tahun 1713. Dia menamakannya dengan teorema keemasan yang kemudian lebih dikenal dengan teorema Bernoulli. S.D Poisson menamakannya dengan La loi des Grand Nomber (The law Large Number). Setelah Bernoulli dan Poisson mempublikasikan LLN, maka matematikawan lainnya yang mengembangkan LLN adalah Chebysev, Markov, Borel, Cantelli dan Kolmogorov. Mereka menghasilkan apa yang kita kenal dengan Weak law Large Number dan Strong Large Number.

Law Large Number (LLN)

Hukum bilangan besar (LLN) adalah teorema pada peluang yang menggambarkan stabilitas yang lama dari suatu variable random. Jika kita diberikan suatu sample random dari variable random yang identik dan independent (iid) dengan mean dan variannya finite, maka rata-rata sample akan mendekati rata-rata populasi.

Misalnya ketika kita melempar mata uang logam, maka frekuensi munculnya angka atau gambar akan mendekati 50 %, perbedaan frekuensi munculnya angka atau gambar tidak besar, contohnya kita akan mendapat munculnya angka sebanyak 520 kali dalam 1000 lemparan, dan 5096 kali dalam 10000 kali lemparan.

 

Kemudian pada tahun 1711, Abraham de Moivre yang lahir di French Hugesenot pada tanggal 26 Mei 1667, dan wafat di London 27 November 1754 , menerbitkan buku yang berjudul Doctrine of Chances, yang diantaranya memuat Ars Conjectandi. Selain memuat Ars Conjectandi, buku ini juga memuat mengenai teori dari permutasi dan kombinasi yang berpangkal dari probabilitas, contohnya:

Diketahui dari huruf-huruf a,b,c,d,e,f diambil dua huruf, maka peluang terambilnya huruf pertama adalah 1/6, peluang terambilnya huruf kedua adalah 1/5. Jadi peluang terambilnya dua huruf tersebut adalah (1/6)(1/5) = 1/30.

 

Selain itu karya de Moivre adalah teorema limit pusat dan distribusi normal. Abraham de Moivreadalah orang yang pertama memperkenalkan distribusi normal pada tahun 1737, kemudian ditulis ulang pada tahun 1738 dengan judul The Doctrine of Chances, yang membahas pendekatan distribusi binomial untuk n yang besar. Hasil ini diperluas oleh Laplace dalam buku Analytical Theory of Probabiliteis pada tahun 1812, yang sekarang dikenal dengan teorema De Moivre-Laplace. Laplace menggunakan distribusi normal untuk menganalisis percobaannya. Karena grafik probalitasnya mirip lonceng maka Jouffret pada tahun 1872 memberi nama kurva lonceng (bell curve) .Nama distribusi normal diberikan oleh S.Pierce, Francis Galton dan Wilhelm Lexis pada tahun 1875.

Sejarah dari teorema limit pusat adalah sangat menarik, teorema ini dirumuskan pertama kali olehAbraham de Moivre pada tahun 1733. Moivre menggunakan distribusi normal untuk memperkirakan banyaknya muncul muka (head) pada pelantunan mata uang. Penemuan ini hampir terlupakan, sebelum akhirnya matematikawan Perancis yang bernama Pierre Simon Laplace mengenalkannya dalam tulisanTheorie Analytique des Probabilities, yang dipublikasikan pada tahun1812. Laplace memperkirakan distribusi dari orbit komet dengan distribusi binomial. Pada abad ke 19 teorema limit pusat dirumuskan secara umum dan dibuktikan oleh matematikawan Rusia yang bernama Aleksander Lyapunov.

Berbeda dengan sejarah peluang yang berawal dari sebuah perjudian, statistika berawal dari kegiatan pengumpulan data yang dilakukan oleh John Graunt di Eropa pada tahun 1662, hal ini merupakan awal munculnya statistika deskriptif. Penggunaan istilah statistika berakar dari istilah- istilah dalam bahasa latin modern statisticum collegium (dewan negara) dan bahasa Italia statista (negarawan atau politikus). Pada tahun 1749 Gottfried Achenwall menggunakan Statistika dalam bahasa Jerman untuk pertama kalinya sebagai nama bagi kegiatan analisis data kenegaraan, dengan mengartikannya sebagai ilmu tentang Negara (state). Pada awal abad ke-19 telah terjadi pergeseran arti menjadi “ilmu mengenai pengumpulan dan klasifikasi data“. Nama dan pengertian statistik pertama kali diperkenalkan dalam bahasa Inggris oleh Sir John Sinclair . Jadi statistika secara prinsip mula-mula hanya mengurus data yang dipakai lembaga-lembaga administrasif dan pemerintahan. Pengumpulan data terus berlanjut, khususnya melalui sensus yang dilakukan secara teratur untuk memberi informasi kependudukan yang berubah setiap saat.

Pada tahun yang sama juga, tahun 1662 John Graunt mulai menerbitkan karya miliknya yaituObservation on the bills of mortality. John Graunt merupakan orang pertama yang menyingkat data ke dalam tabel. Dia juga membicarakan tentang reliabilitas data. John Graunt pula orang pertama yang mendemonstrasikan secara statistik bahwa jumlah dari pria dan wanita mendekati sama dan perbandingan jenis kelamin pada saat kelahiran stabil. Dia adalah orang pertama yang membentuk tabel hidup, yang membentuk kajian tentang asuransi jiwa secara matematik. Dari data yang terkumpul tersebut juga memicu lahirnya teknik pentabelan yang dilakukan oleh Edmon Halley pada tahun 1693. Seiring dengan perkembangan tori-teori probabilitas antara tahun 1713 – 1812, Galton yang semasa hidupnya menghasilkan 340 lebih tulisan dan buku,  mempelajari fenomena korelasi dan regresi terhadap nilai rata-rata dan nilai tengah dan menggunakan metode statistik untuk mempelajari perbedaan pada sifat manusia dan warisan kecerdasan dengan menggunakan daftar pertanyaan-pertanyaan.

Penemuan-penemuan tersebut memicu lahirnya statistika inferensial yang diawali oleh Pearsonpada tahun 1900 dengan Chi Square Test. Selain Chi Square Test, dengan menggunakan korelasi dan regresi linear, Pearson membuat model 3 dimensi sebagai model pengumpulan data dalam penelitian di Departemen Sains Statistik. Selain itu juga Pearson menggunakan distribusi probabilitas sebagai dasar untuk teori statistic modern.

Seorang kimiawan muda William Gosset atau yang lebih dikenal dengan panggilan “student” menggunakan ketidak cocokan penggunaan kurva normal untuk ukuran sampel kecil. Bersama seorang professor, ia merumuskan penemuannya pada tahun 1908. Ia menyebutnya dengan distribusi “student”. Penemuannya kurang mendapat perhatian terkecuali setelah dimasukkan ke dalam buku ajar statistika modern yang pertama yang ditulis oleh Sir Ronald Fisher 20 tahun kemudian. Pada tahun 1925, Fisher mempublikasikan buku yang berjudul Statistical Methods for Research Workers. Di buku tersebut, Fisher menuliskan mengenai ANAVA.

Sekitar tahun 1943-1946 penemuan-penemuan baru muncul seperti yang diperkenalkan oleh Cramer dan M. G Kendall yang mengkaji metode non parametric dengan menggunakan statistika inferensi. Satatistika non parametric muncul karena kebutuhan berdasarkan syarat yang tidak terpenuhi oleh statistika parametric. Pada tahun 1945 Frank Wilcoxon menemukan satu uji, yang kemudian lebih dikenal dengan uji Wilcoxon.

Pada periode tahun 1950-1980 cakupan mengenai teori peluang dan statistic meningkat dengan munculnya bidang baru seperti teori antrian. William Feller mengembangkan topik-topik statistic tingkat lanjut seperti rantai markov. Pada tahun 1950, Rudolf Carnap menerbitkan risetnya yang berjudul Logical Fondation of Probabity yang berisi derajat informasi (degree of confirmation) dan frekuensi relatif. W.Edward Demingmeneliti tentang kualiti control dan banyak perusahaan mengambil metode ini. Austin Bradford Hillmengembangkan statistik pada bidang kesehatan dan epidemiologi. Bradford mempelopori trial klinik random dan mendemonstrasikan hubungan antara kebiasaan merokok dengan penyakit kangker paru-paru.Quetelet mengaplikasikan teori peluang pada sensus. Semenjak tahun 1970 keuangan menjadi bagian penting dari penerapan teori peluang. Ito mengembangkan kalkulus stokastik pada tahun 1940 dan diterapkan pada model Black-Scholes. Black dan Scholes memenangkan hadiah nobel pada bidang ekonomi.

Periode tahun 1980an ditandai dengan mulainya penggunaan komputer dalam mengolah data statistik, dengan menggunakan komputer kita dapat menghemat waktu dalam mengolah data statistik, dan muncul aktifitas baru yang berkenaan dengan statistic. Tabel statistik menjadi lebih mudah dihasilkan, data yang besar dapat dengan mudah dianalisis secara mendalam dan lengkap. Pada awal abad ke 20 ketika Student(1908) menulis tentang distribusi normal dan Yule (1926) tentang korelasi, mereka menggunakan sampling dan berfaedah dalam menghasilkan tabel, dengan komputer menerapkan percobaan Montecarlo menjadi mungkin. Percobaan montecarlo adalah cara standar untuk menyelidiki tingkah laku yang finit pada prosedur statistik. Semenjak tahun 1980 metode montecarlo sudah digunakan secara luas. Walker menekankan statistic pada spikologi dan pendidikan.

 

 

http://hasanahworld.wordpress.com/2008/06/21/sejarah-peluang-dan-statistika/

Quartile, Quansil, Desil, Persentil

0

Quartile adalah nilai-nilai yang membagi segugus pengamatan menjadi empat bagian sama besar. Nilai-nilai itu, yang dilambangkan dengan Q1, Q2, dan Q3, mempunyai sifat bahwa 25% data jatuh dibawah Q1, 50% data jatuh dibawah Q2, dan 75% data jatuh dibawah Q3.
Contoh : Perhatikan table umur aki mobil dibawah ini, dan cari Quartile ke 1 (Q1).

Jawab : Untuk menghitung Q1 bagi distribusi umur aki, diperlukan nilai yang dibawahnya terdapat (25/100) X 40 = 10 pengamatan. Karena pengamatan yang ke 10 dan ke 11 sama dengan 3.1 tahun, maka rat-ratanya juga 3.1 tahun jadi Q1 = 3.1 tahun.

 

Sedangkan untuk menghitung Quartile dari data yang telah tersusun dalam bentuk distribusi frekuensi (grouped data), digunakan rumus berikut.

Perhatikan table dibawah ini, tentukan Q bagi distribusi bobot 50 koper.

  

Jawab : Diperlukan sebuah nilai yang dibawahnya terdapat (75/100) X 50 = 37.5 pengmatan. Ada 27 pengamatan yang terdapat di bawah 15.5, sehingga masih diperlukan 10.5 diantara 15 pengamatan berikutnya.  Sehingga didapat,

Quansil dari sampel dinyatakan oleh q(f) adalah batas nilai q yang menyatakan sebanyak fraksi f dari data bernilai kurang dari atau sama dengan q.

Jadi:

q(0.25)= Q1

q(0.5) = Q2=median

q(0.75) = Q3 dst

Quantile Plot memplot nilai data di sumbu tegak thd nilai quantile-nya

q0,5 = median = x([n+1]/2)  …………… n ganjil

= {x(n/2) + x([n/2]+1)}/2 … n genap

Contoh :

Jika terdapat 9 data (n=9), nilai median adalah q0,5 = x(5). Quartil bawah adalah q0,25 = x(3), quartil atas adalah q0,75 = x(7)

 

Desil merupakan suatu ukuran-ukuran yang membagi data terurut menjadi sepuluh bagian sama banyak

D_k menotasikan desil ke-k dimana k\epsilon \left \{ 1,2,3,4,5,6,7,8,9 \right \}

Untuk menentukan D_k dapat diperoleh dengan langkah-langkah berikut:

  • Urutkan data dari yang terkecil ke yang terbesar.
  • Tentukan ukuran data (banyak data) dinotasikan n.
  • Dekati dengan persamaan D_k=x_\left (k\frac{\left (n+1 \right )}{10} \right )

Contoh. Tentukan desil keempat dan ketujuh dari data berikut: 3, 5, 17, 5, 7, 6, 11, 8, 13, 9, 17, 12, 15, 14, 17, 4, 1, 16

Penyelesaian:

  • Kita urutkan data diatas dari yang terkecil yaitu 1 menuju yang terbesar yaitu 17 sebagai berikut: 1, 3, 4, 5, 5, 6, 7, 8, 9, 11, 12, 13, 14, 15, 16, 17, 17, 17.
  • Kita tentukan banyaknya data dengan membilang data tersebut dan diperoleh ukuran datanya adalah 18.
  • Menentukan desil keempat dengan rumus D_4=x_\left (4\frac{\left (18+1 \right )}{10} \right )

D_4=x_\left (4\frac{\left (18+1 \right )}{10} \right )

 D_4=x_{7,6}=x_{7} +0,6\left ( x_{8}-x_{7} \right )

D_4=7 +0,6\left ( 8-7 \right )=7,6

Jadi D_4=7,6

  • Menentuka desil ketujuh dengan rumus D_7=x_{7\frac{(18+1)}{10}}

 D_7=x_{7\frac{(18+1)}{10}}=x_{13,3}

 D_7=x_{13}+0,3(x_{14}-x_{13})

 D_7=14+0,3(15-14)=14,3

Jadi D_7=14,3

Catatan:

x_i merupakan data ke-i

 

Persentil (percentile), Persentil adalah nilai-nilai pengamatan yang membagi data menjadi 100 bagian yang sama.

Berdasarkan informasi dari help microsoft excel, cara penulisan rumus percentile seperti di bawah ini:

PERCENTILE

Dimana :
a. Array dapat berupa array atau range data.
b. k adalah nilai percentle yang diinginkan (nilai percentile berada dalam kisaran 0 sampai1, 0 berarti 0%, sedangkan 1 berarti 100%)

Dalam postingan ini akan dibahas tentang cara menentukan/menghitung percentil dengan menggunakan excel.
Untuk pembahasan rumus secara manual bisa dilihat disini percentile

Beberapa hal yang perlu diperhatikan saat menggunakan fungsi percentile di excel:
a. Jika array kosong atau berisi lebih dari 8.191 titik data,  maka PERSENTIL aka menghasilkan NUM #! (nilai kesalahan).
b. Jika k adalah nonnumerik (bukan angka), maka PERSENTIL menghasilkan # VALUE!
c. Jika k adalah <0 atau jika k> 1, PERSENTIL menghasilkan NUM #!
d. Jika k adalah bukan kelipatan dari 1 / (n – 1), PERSENTIL akan melakukan interpolasi untuk menentukan nilai pada persentil ke-k.

Agar lebih mudah menerapkan fungsi percentile silahkan buat tabel seperti di bawah ini :
1.Kolom A akan diisi data, dalam contoh ini data berada dalam range A3:A13
Perlu diperhatikan data harus tersortir dari kecil hingga besar.

2. Selanjutnya lakukan perhitungan percentil
a. Untuk menghitung percentil ke-100 di sel D3 ketik formula
=PERCENTILE(A3:A13,1)

b. Untuk mencari percentil ke-20 di sel D4 type formula
=PERCENTILE(A3:A13,0.2)

c. Untuk menentukan percentil ke-80 di sel D5 type formula
=PERCENTILE(A3:A13,0.8)

 

 

http://materi-statistik.blogspot.com/2011/12/quartile.html

http://www.bamstheguru.com/desil

http://kalongkalong.blogspot.com/2011/10/cara-menghitung-persentil-di-excel.html

 

Tendensis Sentral

0

Tendensis Sentral

Tendensi sentral adalah pengukuran aritmatika yang ditujukan untuk menggambarkan suatu nilai yang mewakili nilai pusat atau nilai sentral dari suatu gugus data (himpunan pengamatan).

Beberapa macam ukuran tendensi central, yaitu rata-rata (mean), median, modus, kuartil, desil dan persentil. Tetapi kuartil  desil dan persentil tidak begitu banyak digunakan dalam analisis data.

  1. Mean (rata-rata)
  2. Median
  3. Modus atau mode
  4. Kuartil
  5. Desil
  6. Persentil

Nilai ukuran pusat yang tepat untuk digunakan tergantung pada sifat data, sifat distribusi frekuensi dan tujuan. Jika data bersifat kualitatif, hanya modus yang dapat digunakan. Jika data bersifat kuantitatif, kita dapat menggunakan salah satu dari ukuran nilai pusat tersebut, mean atau median atau modus.

Jadi, Tendensi sentral adalah pengukuran aritmatika yang digunakan untuk mengetahui kumpulan data mengenai sampel atau populasi dan untuk menggambarkan suatu nilai dalam tabel atau diagram, yang dapat mewakili sampel atau populasi.

 

  1. Mean (rata-rata)

 

Disebut dengan nama rata-rata. mean memberi informasi tentang besaran rata-rata yang ada pada data.

 

a. Menghitung rata-rata dengan data mentah

Bila data yang hendak dihitung masih dalam bentuk data raw input maka penghitungan rata-ratanya adalah jumlah seluruh nilai data dibagi dengan banyaknya kejadian atau frekuensi.

X = dibaca X bar merupakan notasi untuk nilai rata-rata
 = dibaca sigma, yang berarti jumlah
X = nilai data dari X1 … Xn

 

Contoh: Persentase Keuntungan lima belas perusahaan

CV ASRI CV BESRI CV CESRI CV DESRI CV ESRI
     5       6       8       7       9
CV FESRI CV GESRI CV HESRI CV ISRI CV JESRI
     4       3       3       5        6
CV KESRI CV LESRI CV MESRI CV NESRI CV OSRI
     3       4       3       4        5

Mean  = (5 + 6 + 8 + 7 + 9 + 4 + 3 + 3 + 5 + 6 + 3 + 4 + 3 + 4 + 5)/5 = 75/15 = 5

b. Menghitung rata-rata dengan data dari table distribusi frekuensi

Bila data sudah tersaji dalam bentuk data frekuensi maka dipergunakan rumus:

Sebagai contoh tabel berikut:

Nilai Skor Keuntungan 15 Perusahaan
No X f fX
1 3 4 12
2 4 3 12
3 5 3 15
4 6 2 12
5 7 1 7
6 8 1 8
7 9 1 9
Jumlah 15 75

 

Mean = 75/15 = 5

  1. Median

Median suatu rangkaian data adalah nilai tengah dari rangkaian data yang telah disusun secara berurut.

Contoh untuk Data Bercacah Ganjil:

Data:  3 4 5 5 6  Jumlah N = 5
Cara:
a. Susun data secara berurut.
b. Cari letak median dengan rumus
(letak median pada urutan ketiga)
c. Cari nilai median pada urutan ketiga (median = 5)

Contoh untuk Data Bercacah Genap:
Data: 3 4 4 5 6 6    Jumlah N = 6

a. Susun data secara berurut
b. Cari letak median dengan rumus
(letak median pada urutan 3,5)
c. Cari nilai median pada urutan 3,5 [median = (4 + 5)/2 = 4,5

Bila data sudah tersaji dalam bentuk table distribusi frekuensi maka digunakan rumus:


Mdn = Median
Bbn = Batas bawah nyata dari interval yang mengandung mediam
n      = Jumlah subyek
Cfb  = Kumilatif frekuensi dari bawah di bawah interval yang mengandung median
fd     = Frekuensi di dalam interval yang mengandung median
i        = Banyaknya nilai dalam tiap interval

Nilai Skor Keuntungan 15 Perusahaan
No X f Cfb
1 9 1 15
2 8 1 14
3 7 1 13
4 6 2 12
5 5 3 10
6 4 3 7
7 3 4 4
Jumlah 15

Langkah:
1. Tentukan interval yang mengandung median dengan menghitung n/2. dalam hal ini 15/2 = 7,5
2. Beri tanda interval yang mengandung median. dalam hal ini baris ke lima
3. Cari Kumulatif frekuensi dari bawah di bawah interval yang mengandung median, dalam hal ini 7.
4. Cari frekuensi yang ada di dalam interval yang mengandung median, dalam hal ini 3.
5. masukkan semua itu ke dalam rumus sebagai berikut:

  1. Modus atau mode

Modus dari suatu rangkaian data adalah nilai data yang paling sering muncul (frekuensi terbesar) dalam rangkaian data itu.

Contoh:
a. Data: 2 3 4 5 6
Karena data ini masing-masing frekuensi (kemunculan)-nya hanya 1, maka dikatakan tidak memiliki modus.
b. Data: 2 3 4 4 5 6
Frekuensi terbesar adalah 2 (nilai empat muncul dua kali). Jadi modusnya adalah 4. Rangkaian data yang memiliki satu modus disebut Mono-modus.
c. Data: 2 3 4 4 5 6 6 7
Frekuensi terbesar adalah dua (muncul dua kali) yaitu angka 4 dan 6.
Jadi modus rangkaian data ini adalah 4 dan 6. Rangkaian data ini memiliki 2 Modus atau disebut Bi-modus.

  1. Kuartil

Ukuran letak yang membagi suatu distribusi ke dalam 4 bagian yang sama, yaitu 25% data berada di bawah Kuartil 1 dan 75% data berada di atas Kwartil 1.
Kuartil 2 sama dengan Median.

Contoh Perhitungan:
Data penjualan komputer selama 7 bulan terakhir:
Data: 2 4 3 3 6 5 7 (N = 7)

Langkah:
a. Susun data secara berurut, menjadi:
2 3 3 4 5 6 7
1) 2) 3) 4) 5) 6) 7)

b. Cari letak kuartil dengan rumus di atas:
K1 = 1(7 + 1)/4 = 8/4 = 2 ® data urutan kedua, jadi K1 = 3
K2 = 2(7 + 1)/4 = 16/4 = 4 ® data urutan keempat, jadi K2 = 4
K3 = 3(7 + 1) /4 = 24/4 = 6 ® data urutan keenam, jadi K3 = 6

 

  1. Desil

Desil dari suatu rangkaian data adalah ukuran letak yang membagi suatu distribusi menjadi 10 bagian yang sama.
Rumus letak desil dapat dikembangkan dari rumus kuartil di atas. Tinggal kita ubah angka pembagi (100) dan bilangan persentil yang dikehendaki, 1 30, 78 ….)

Contoh Perhitungan:
Data: 2 3 3 4 4 5 6 6 7 8 9 10 (N=12)
Urut 1) 2) 3) 4) 5) 6) 7)  9) 10) 11) 12)

Langkah:
a. Letak D1 = 1(12 +1)/10 = 13/10 = Urutan 1,3 (atau 1 + 0,3)

Letak Desil 1 Bilangan Nilai
1 2 2
0,3 (3-2) 0,3
1,3 2,3

Nilai desil 1 adalah data urutan 1,3, yang bernilai 2,3.

b. D5 = 5(12 + 1)/10 = 65/10 = 6,5 (atau 6 + 0,5)

Letak Desil 5 Bilangan Nilai
6 5 5
0,5 (6-5) 0,5
6,5 5,5

Nilai desil 5 adalah data urutan ke 6,5, yang bernilai 5,5.

c. D9 = 9(12 + 1)/10 = 117/10 = 11,7 (atau 11 + 0,7)

Letak Desil 9 Bilangan Nilai
11 9 9
0,7 (10-9) 0,7
11,7 9,7

Nilai desil 9 adalah data urutan ke-12 (Desil 9 = 10).

 

  1. Persentil

Persentil suatu rangkaian data adalah ukuran letak yang membagi suatu distribusi menjadi 100 bagian yang sama besar.

Rumus persentil juga dapat dikembangkan dari rumus kuartil, tinggal kita ubah angka pembagi (100) dan bilangan persentil yang dikehendaki, 1 30, 78 ….)

Contoh Perhitungan Persentil:
Data: 2 3 3 4 4 5 6 7 10 12 13 ® N = 11
Urut: 1) 2) 3) 4) 5) 6) 7)  9) 10) 11)

Langkah:
a) Tentukan letak data
b) Letak nilai P50 = 50(11 + 1)/100 = 6
Nilai P 50 adalah data nomor urut 6 (P50 = 5)

c) Letak P20 = 20(11+1)/100 = 240/100 = 2,4 (atau 2 + 0,4)

Letak Persentil 20 Bilangan Nilai
2 3 3
0,4 (3-3) 0
2,4 3

Nilai P 20 adalah data pada urutan 2,4 (P20 = 3)

Data: 2 3 3 4 4 5 6 7 10 12 13 ® N = 11
Urut: 1) 2) 3) 4) 5) 6) 7)  9) 10) 11)

d) Letak P60 = 60 (11 + 1)/100 = 720/100 = 7,2 (atau 7 + 0,2)

d. Bila data sudah tersaji dalam bentuk tabel.
Kadang kita menemukan data yang sudah tersaji dalam bentuk tabel maka rumus yang digunakan sama dengan yang telah ada di median hanya kita tingga mengubah pembanginya sesuai dengan jumlah bagian yang dikehendaki serta mengubah bilangannya sesuai dengan posisi titik yang dikehendaki (Kuartil 1, Desil 6 dll). Sebagai contoh di sini disampaikan rumus kuartil:

Ki    =   Kuartil ke i
Bbn =  Batas bawah nyata dari interval yang mengandung kuartil ke i
n      =  Jumlah subyek
Cfb  =  Kumilatif frekuensi dari bawah di bawah interval yang mengandung
kuartil ke i
fd     =   Frekuensi di dalam interval yang mengandung kuartil ke i
i       =  Banyaknya nilai dalam tiap interval

 

Standar Deviasi dan Varians

Standar deviasi atau simpangan baku dalam bahasa Indonesia tidak bisa lepas dari varians. Hal ini karena standar deviasi adalah akar kuadrat dari varians atau sebaliknya, varians adalah kuadrat dari standar deviasi.

Salah satu ukuran variabilitas (measure of dispersion) yang paling sering digunakan jika data yang diukur berskala interval adalah varians. Varians didefinisikan sebagai rata-rata dari skor penyimpangan kuadrat. Untuk mencari varians, dibedakan antara varians populasi yang dilambangkan dengan (σ2) dengan varians sample yang dilambangkan dengan (s2).

Untuk varians populasi, dapat dicari dengan rumus:

Dimana:
µ = rata-rata populasi
N = total jumlah populasi
Adapun varians untuk sample dapat dicari dengan rumus yang sama namun mengurangkan N dengan 1 sebagai berikut:

Dimana :
s = rata-rata sample
n = jumlah sampel yang digunakan
untuk lebih memperjelas, baiklah kita coba dengan menghitung varians untuk populasi jika kita memiliki data pengukuran tentang nilai 5 siswa pada mata pelajaran matematika sebagai berikut:

7 7 9 8 6
Untuk menghitung varians dari data di atas maka kita harus mencari dahulu berapa mean (rata-rata) dari. Dengan rata-rata 6,9 maka kita tinggal memasukkan data di atas sebagai berikut:

Dengan varian sebesar 1,3 maka untuk mencari standar deviasi kita tinggal mengakar kuadratkan 1,3 yang akan menghasilkan 1,14. Karena varian adalah ukuran keberagaman data, maka semakin besar angkat varians maka semakin beragamlah data yang kita miliki dan semakin kecil nilai varians maka semakin homogenlah data yang kita miliki.
Nah, jika seandainya nilai varians yang kita miliki ternyata adalah 0, maka dapat disimpulkan bahwa dalam populasi atau sampel yang kita miliki tidak terdapat variabilitas. Keadaan demikian dapat terjadi jika sekor untuk setiap sampel/populasi adalah sama.

Selain rumus di atas, kita juga dapat menggunakan rumus-rumus lain untuk mencari varians. Pada dasarnya, pemilihan rumus yang digunakan tergantung pengguna yang merasakan rumus manakah yang paling mudah digunakan. Rumus-rumus yang lain tersebut diantaranya adalah:
Untuk varians sampel:

 

 

Sumber :

http://ipahipeh.blog.fisip.uns.ac.id/2011/09/15/tendensi-sentral/

http://thofa.page.tl/Tendensi-Sentral.htm

http://statistikpendidikanii.blogspot.com/2010/07/varian-dan-standar-deviasi.html


Populasi , Sample dan Data

0

1. Data

Untuk membuat keputusan ataupun kebijakan yang tepat, maka diperlukan suatu gambaran umum tentang karakteristik dari hal-hal yang berkait dengan suatu persoalan. Untuk itu perlu dilakukan pengamatan, pencacahan maupun pengukuran. Contoh data yang berkait dengan seseorang, misalnya Bapak Adul:

 

  • Warna rambut : coklat
  • Jumlah isteri : 1
  • Jumlah anak : 3
  • Tinggi badan : 167 cm
  • Berat badan : 75 kg

Himpunan hasil pengamatan, pencacahan ataupun pengukuran sejumlah objek disebut data. Jadi, data adalah segala keterangan, informasi atau fakta tentang sesuatu hal atau persoalan. Sedangkan datum adalah keterangan yang diperoleh dari satu pengamatan. Jadi data adalah bentuk jamak dari datum. Untuk selanjutnya akan digunakan istilah data saja karena dengan hanya pengamatan satu datum saja, sangatlah sulit untuk mengambil kesimpulan. Dari contoh di atas, terlihat bahwa ada data yang berbentuk angka dan ada juga yang berbentuk kategori (atribut). Contoh data berbentuk angka adalah data yang berkait dengan tinggi badan maupun jumlah anak. Data berbentuk angka tersebut biasa disebut dengan data numerik atau data kuantitatif. Sedangkan data warna rambut yang dapat berkategori hitam, putih, coklat maupun pirang disebut data kategorikatau data kualitatifNamun secara teknis, perhitungan dalam statistika hampir selalu kuantitatif (berupa angka). Sebagai misal, dalam suatu formulir kadang-kadang jenis kelamin ditulis sebagai berikut: 1. Laki-laki; 2. Perempuan. Angka 1 dan 2 pada contoh di atas hanya digunakan untuk membedakan objek laki-laki atau perempuan.

Perhatikan data numerik atau data kuantitatif tentang jumlah anak dan berat badan di atas. Jumlah anak bisa 0, 1, 2, 3 … yang didapat dari hasil membilang atau mencacah. Data seperti ini disebut dengan data cacahan. Sedangkan data tinggi badan bisa 75 kg namun bisa juga 75,125 kg jika menggunakan alat ukur yang lebih teliti. Data seperti itu disebut data ukuran. Dengan demikian jelaslah bahwa data numerik atau data kuantitatif yang berbentuk angka terdiri atas dua macam, yaitu:

  1. Data cacahan yang diperoleh dari membilang atau mencacah dan datanya berupa bilangan cacah sehingga disebut juga sebagai data diskrit.
  2. Data ukuran yang diperoleh dari hasil mengukur dan datanya berupa bilangan real sehingga disebut juga sebagai data kontinu. Di kelurahan, di sekolah, di kantor ataupun di tempat lain sering ditemui laporan hasil pengamatan, pencacahan ataupun pengukuran berupa bilangan yang disusun dalam gambar ataupun tabel. Data yang telah tersusun maupun hasil tertentu dari pengolahan data disebut statistik. Dengan demikian, statistik dipakai untuk menyatakan kumpulan data berbentuk bilangan yang disusun dalam diagram atau tabel untuk menjelaskan persoalan.

 

Pada penyajian data kualitatif kategori yang ditampilkan tidak berupa angka. Hal ini berkaitan erat dengan data kualitatif dan skala pengukurannya. Skala pengukuran yang dipergunakan untuk data kualitatif adalah skala nominal dan ordinal. Skala nominal memperlihatkan klasifikasi atau penggolongan data, sedangkan skala ordinal memperlihatkan tingkatan dari data. Jenis diagram yang merupakan bentuk penyajian data kualitatif adalah diagram lingkaran. Diagram batang, diagram garis, dan piktogram.Sedangkan Penyajian data kuantitatif ditandai dengan penggunaan kategori yang berbentuk angka. Oleh karena itu, skala yang digunakannya adalah interval ratio. Data kuantitatif juga dapat disajikan dalam bentuk tabel dan diagram.

Adapun empat macam skala yang mungkin terjadi dalam statistik antara lain :

  • Skala Nominal. Skala ini mempunyai derajat pengukuran terendah. Data yang diperoleh dengan cara kategorisasi atau klasifikasi dengan ciri-ciri: Posisi data serata, Tidak bisa dilakukan operasi matematika, Contoh : Kebangsaan, kesukuan, warna, jenis kelamin, dll., Analisis statistik : Non- parametrik untuk komparasi dan korelasi, Memiliki mean dan modus.
  • Skala Ordinal. Adalah data yang diperoleh dengan cara kategorisasi atau klasifikasi tetapi diantara data terdapat hubungan, dengan ciri- crri : Posisi data tidak setara, Tidak bisa dilakukan operasi matematika, Adanya sistim jenjang urutan ( misalnya urutan usia 2-4 tahun, urutan 7-8 tahun, dll)., Mempunyai ciri- ciri data nominal,  Analisis statistik : parametrik, Memiliki median dan modus.
  • Skala Interval. Adalah data yang diperoleh dengan cara pengukuran dengan jarak dua titik pada skala diketahui dan ciri- cirinya : Tidak ada kategorisasi, Bisa dilakukan operasi matematika, Ada jarak antar dua kelompok satuan, Mempunyai ciri- ciri seperti nominal dan ordinal, Contoh: Suhu tubuh bisa diukur dengan skala derajat celcius atau farenheit dengan masing- masing mempunyai skala sendiri- sendiri, Analisis statistik: Parametrik dan non-parametrik kecuali koefisien variasi.
  • Skala Rasio. Adalah data yang dipeeroleh dengan cara pengukuran dan ciri- cirinya : Memiliki ciri-ciri seperti skala nominal, interval dan ordinal, Memiliki titik 0 yang definitif, Sembarang 2 titik pada skala tidak bergantung pada unitpengukurannya,  Contoh: mengukur berat benda dalam gram dan pounds hasilnya identik, Analisis statistik: Parametrik dan non-parametrik.

 

2. Sampel

Dalam statistik inferensial, kita ingin mengetahui gambaran karakteristik tertentu dari suatu populasi, namun terkadang hal tersebut terkadang tidak mungkin dan tidak praktis untuk mengamati seluruh obyek/individu yang menyusun suatu populasi. Pedagang eceran beras hanya meneliti segenggam beras untuk menentukan kualitas sekarang beras. Pedagang emas hanya meneliti bekas gosokan dari perhiasan tersebut untuk menentukan kualitas emas perhiasan tersebut. Peneliti lingkungan hanya meneliti beberapa milliliter air untuk menentukan kualitas air pada suatu sungai atau danau. Pertanyaannya, mengapa tidak meneliti secara keseluruhan, bukankah hasilnya akan lebih baik dan lebih tepat?

Mengingat seorang peneliti dalam melakukan penelitian penuh dengan keterbatasan baik dari segi biaya, waktu, dan lain sebagainya maka penelitian yang dilakukan untuk mengumpulkan informasi atau data yang diinginkan sesuai dengan permasalah yang diteliti ditempuh dengan mengambil sebagian dari populasi, dengan mempertimbangkan ketebatasan yang ada dari peneliti. Bagian dari populasi tersebut sebagai tempat untuk mengumpulkan informasi dinamakan contoh (sampel).

Dengan demikian, sampel merupakan bagian dari populasi yang dipilih dengan menggunakan aturan-aturan tertentu, yang digunakan untuk mengumpulkan informasi/data yang menggambarkan sifat atau ciri yang dimiliki populasi.

Dari definisi tersebut jelas bahwa sampel yang kita ambil digunakan untuk menggambarkan karakteristik suatu populasi, atau dengan kata lain, sampel digunakan untuk menggeneralisasi suatu populasi.  Dengan demikian, sampel harus betul-betul bersifat representatif sehingga dapat mewakili dan mencerminkan karakteristik populasi dari mana sampel itu diambil.

 

 

Gambaran Sampel Representatif

Seorang peneliti, jarang mengamati keseluruhan populasi karena dua alasan:

  • Biaya terlalu tinggi dan
  • Populasi bersifat dinamis, yaitu unsur-unsur populasi bisa berubah dari waktu ke waktu.

 

Ada tiga keuntungan utama pengambilan sampel:

  • Biaya lebih rendah,
  • Pengumpulan data lebih cepat, dan
  • Hal ini mungkin untuk memastikan keseragaman dan untuk meningkatkan akurasi dan kualitas data karena kumpulan data lebih kecil .

Jenis-Jenis sampel

Dalam proses pemilihan sampel ada dua faktor penentu yang berperan yaitu:

  • Ada atau tidak adanya faktor pengacakan, dan
  • Peran orang yang memilih (mengambil) sampel tersebut.

 

Pada proses pengambilan sampel dengan menggunakan faktor pengacakan didalamnya termasuk unsur-unsur peluang, sedangkan peran dari orang pemilih sampel dapat bersifat obyektif dan dapat pula bersifat subyektif.

Yang dimaksud dengan sikap obyektif dalam memilih sampel adalah suatu cara pemilihan sampel yang menggunakan metode tertentu yang jelas, sehingga penarikan sampel tersebut bila dilakukan oleh orang lain akan diperoleh hasil yang tidak jauh berbeda dari penarikan sampel sebelumnya, dalam menduga sifat atau ciri populasinya. Jadi dengan pengambilan sampel dengan menggunakan metode tertentu dan jelas, akan diperoleh sampel yang konsisten, artinya bila pengambilan sampel dilakukan secar berulang-ulang terhadap populasi yang sama hasilnya tetap terkendali dalam arti tetap menggambarkan sifat atau ciri dari populasinya, walaupun hasilnya tidak persis sama antara yang satu dengan yang lainnya.

Sifat subyektif dalam memilih sampel adalah suatu pemilihan sampel dengan melibatkan pertimbangan pribadi dari pengambil sampel untuk mengambil sampel yang baik menurut versinya sendiri (versi peneliti). Dengan demikian sampel yang diperoleh merupakan sampel yang berbias, apalagi orang yang memilih cotnoh sampel mempunyai latar belakang yang kurang terhadap konsep statistika khususnya konsep tentang teori penarikan sampel.

Pemilihan Jenis Sampel :

1. Sampel Random :

Pengambilan (Simple Random Sampling) sampel acak sederhana adl suatu cara pengambilan sampel dimana tiap unsur yg membentuk populasi diberi kesempatan yg sama utk terpilih menjadi sampel. Cara ini sangat mudah apabila telah terdapat daptar lengkap unsur-unsur populasi.

Prosedur yg cukup akurat utk pengambilan sampel secara acak adl dgn menggunakan tabel angka acak (Table of random numbers) disamping itu dapat pula dilakukan dgn cara mengundi.

Pengambilan sampel acak yg dilakukan sesuai prosedur sama sekali bukan jaminan bahwa suatu sampel akan menjadi representasi sempurna dari populasi krn bisa saja terjadi pengambilan sampel secara random dalam kenyataan menghasilkan suatu sampel yg unik akan tetapi perlu pengambilan sampel secara acak harus dipahami dalam konteks proses kemungkinan apabila sampel acak diambil dari suatu populasi secara berulang-ulang maka secara umum seluruh sampel tersebut akan mampu memberikan estimasi yg lbh akurat terhadap populasi demikian juga variabilitas atau kekeliruan dapat diestimasi dan uji signifikansi statistik juga menunjukan probabilitas hasil dgn mempertimbangkan kekeliruan pengambilan sampel (Sampling Error).

2. Sampel Sistematis :

Systematic Sampling (Pengambilan Sampel secara Sistimatis) merupakan Alternatif lain pengambilan sampel yg sangat bermanfaat utk pengambilan sampel dari populasi yg sangat besar. Pengambilan sampel secara sistematis adl suatu metode dimana hanya unsur pertama dari sampel yg dipilih secara acak sedang unsur-unsur selanjut dipilih secara sistematis menurut suatu pola tertentu.

Sebagai contoh Kepala Dinas Pendidikan ingin mengetahui bagaimana Motivasi Kerja Kepala Sekolah di Kabupaten Kuningan yg berjumlah 1000 orang dan akan mengambil sempel 100 orang Kepala sekolah kemudian Nama-nama Kepala Sekolah disusun secara alpabetis lalu dipilih sampel per sepuluh Kepala Sekolah utk itu disusun nomor dari 1 sampai 10 lalu diundi utk memilih satu angka jika angka lima yg keluar maka sampel adl nomor 5 15 25 35 dan seterus sampai diperoleh jumlah sampel yg dikehendaki.

Dalam pengambilan sampel secara sistematis dikenal dua istilah yaitu interval pengambilan sampel (Sampling intervals) yaitu perbandingan antara populasi dgn sampel yg diinginkan dan proporsi pengambilan sampel (sampling Fraction/Sampling Ratio) yaitu perbandingan antara ukuran sampel dengan populasi.

Dari contoh di atas Sampling interval adl 1000 : 100 = 10 dan sampling ratio adl 100 : 1000 = 01. Contoh tersebut juga dapat disebut sebagai Systematic Sampling with random start dimana awal penentuan sampel dilakukan secara acak baru sesudah itu dilakukan langkah-langkah sistematis sesuai dgn prosedurnya. Cara pengambilan sampel seperti ini menurut Jack R. Fraenkel dan Norman E Wallen bisa dikategorikan sebagai random sampling jika daftar populasi disusun secara random dan sampel diambil dari daftar tersebut.

 3. Sampel Luas

adalah proses pengambilan sampel dilakukan terhadap sampling unit, dimana sampling unitnya terdiri dari satu kelompok (cluster). Tiap item (individu) di dalam kelompok yang terpilih akan diambil sebagai sampel.

Cara ini dipakai bila populasi dapat dibagi dalam kelompok-kelompok dan setiap karakteristik yang dipelajari ada dalam setiap kelompok. Contoh jumlah anggota pada suatu populasi sebesar 20, dan kita menjadikannya 4 buah kelompok. Dan kita memilih secara acak missal kelompok 3. Maka seluruh karakteristik individu dari kelompok 3 tersebut diambil sebagai sampel.

4. Sampel Bertingkat

       adalah proses pengambilan sampel dilakukan bertingkat, baik bertingkat dua maupun lebih. Pengumpulan sampel ini sama halnya dengan pengumpulan sampel dengan metode sampel luas / berkelompok. Namun yang membedakan kuantitas populasinya yang cukup sangat besar. Misal pengumpulan data pada masyarakat.

5. Sampel Kuota

adalah teknik untuk menentukan sampel dari populasi yang mempunyai ciri-ciri tertentu sampai jumlah (kuota) yang diinginkan. Sebagai contoh, akan melakukan penelitian tentang pendapat masyarakat terhadap pelayanan masyarakat dalam urusan Izin Mendirikan Bangunan. Jumlah sampel yang ditentukan 500 orang. Kalau pengumpulan data belum didasarkan pada 500 orang tersebut, maka penelitian dipandang belum selesai, karena belum memenuhi kouta yang ditentukan. Bila pengumpulan data dilakukan secara kelompok yang terdiri atas 5 orang pengumpul data, maka setiap anggota kelompok harus dapat menghubungi 100 orang anggota sampel, atau 5 orang tersebut harus dapat mencari data dari 500 anggota sampel.

 

3.  Populasi

Populasi adalah keseluruhan pengamatan atau obyek yang mempunyai kuantitas dan karakteristik tertentu yang sedang diamati atau diteliti. Populasi mencakup segala hal, termasuk benda-benda alam, dan bukan sekedar jumlah yang ada pada objek. Secara umum populasi diartikan sebagai kumpulan individu yang berada pada suatu tempat dan waktu tertentu pula.

        Tabel dan Grafik

Data yang telah diperoleh disajikan dalam bentuk tabel atau grafik agar mudah untuk menganalisa dan dipahami. Dua cara penyajian data ini saling berkaitan karena pada dasarnya sebelum dibuat grafik data tersebut berupa tabel. Penyajian data berupa grafik lebih komunikatif.

Tabel adalah kumpulan data yang berupa angka-angka disusun secara baris dan kolom berdasarkan karakteristik yang dimilikinya. Dalam ilmu statistika terdapat beberapa jenis tabel, yaitu tabel referensi, tabel ikhtisar, tabel umum, tabel distribusi.

Dapat di bagi menjadi 4 :

Tabel referensi sebenarnya memiliki karakteristik khusus yaitu tabel ini bersifat gudang seluruh data. Hal ini wajar karena tabel referensi memuat semua data-data yang terperinci dan disusun untuk kepentingan referensi. Tabel-tabel yang terdapat dalam sensus umumnya merupakan tabel referensi. Fungsi tabel seperti itu bersifat umum sekali karena data-datanya dapat digunakan sebagai input dari berbagai analisis statistic.

Tabel ikhtisar tabel ini seringkali disebut tabel naskah. Tabel ini biasanya sederhana, singkat, jelas dan mudah dimengerti karena fungsinya adalah memberikan gambaran yang sistematis tentang hasil penelitian atau observasi. Tabel ikhtisar dibuat seringkali berdasarkan tabel referensi dan tabel-tabel ikhtisar lainnya.

Tabel distribusi adalah tabel yang biasanya mengelompokkan data berdasarkan jumlahnya. Misal tabel pada perhitungan pemilihan umum. Ciri khas tabel ini menggunakan turus. Contoh tabel distribusi :

 

Grafik merupakan satu cara penyajian data secara ringkas biasanya menghubungkan antara variabel bebas (X) dengan variabel tidak bebas (Y), sehingga mudah dalm pengamatannya. Macam dari grafik yaitu grafik garis, grafik batang, grafik lingkaran, polygon dan histogram.

Grafik garis adalah sebuah grafik yang menunjukkan karakteristik datanya dengan garis (satu maupun lebih), biasanya berdasarkan pada sebuah skala. Baik berupa waktu, jarak, dll.

Grafik batang pada dasarnya sama seperti grafik garis, hanya saja menggunakan sebuah persegi panjang/balok/batang sebagai penunjuknya.

Garfik lingkaran adalah grafik yang sering digunakan untuk menunjukkan perbandingan karakteristik yang dimiliki oleh data.

Polygon dan histogram adalah adalah gabungan dua grafik yaitu grafik batang dan grafik garis yang menggambarkan distribusi frekuensi. Histogram terdiri dari persegi panjang yang alasnya merupakan panjang kelas interval, sedangkan tingginya sama dengan frekuensi masing-masing kelas interval.

 

Refrensi :

http://cokroaminoto.blogetery.com/2010/02/18/pengertian-data-dan-macamnya/

http://smartstat.wordpress.com/2010/03/14/populasi-dan-sampel/

http://blog.re.or.id/teknik-pengambilan-sampel-stratified-sampling-pengambilan-sampel-berstrata.htm

http://www.denggol.com/2010/01/tabel-referensi-dan-tabel-ikhtisar.html

http://v2.ijenfx.com/teknikal-klasik/59-mengenal-grafik

Statistik dan Probabilitas

0

Statistik dan Statistika

Statistik adalah kumpulan data dalam bentuk angka maupun bukan angka yang disusun dalam bentuk tabel (daftar) dan atau diagram yang menggambarkan atau berkaitan dengan suatu masalah tertentu.

Contoh :

Statistik penduduk adalah kumpulan angka-angka yang berkaitan dengan masalah penduduk.

Statistik ekonomi adalah kumpulan angka-angka yang berkaitan dengan masalah ekonomi.

Statistika adalah pengetahuan yang berkaitan dengan metode, teknik atau cara mengumpulkan, mengolah, menganalisis dan menginterprestasikan data untuk disajikan secara lengkap dalam bentuk yang mudah dipahami penggunanya.

Pengertian Data

Dalam statistika dikenal beberapa jenis data. Data dapat berupa angka dapat pula bukan berupa angka. Data berupa angka disebut data kuantitatif dan data yang bukan angka disebut data kualitatif.

Berdasarkan nilainya dikenal dua jenis data kuantitatif yaitu data diskrit yang diperoleh dari hasil perhitungan dan data kontinue yang diperoleh dari hasil pengukuran.

Menurut sumbernya data dibedakan menjadi dua jenis yaitu data interenadalah data yang bersumber dari dalam suatu instansi atau lembaga pemilik data dandata eksteren yaitu data yang diperoleh dari luar.

Data eksteren dibagi menjadi dua jenis yaitu data primer dan data sekunder. Data primer adalah data yang langsung dikumpulkan oleh orang yang berkepentingan dengan data tersebut dan data sekunder adalah data yang tidak secara langsung dikumpulkan oleh orang yang berkepentingan dengan data tersebut.

Jenis – Jenis Statistika

Statistika dibedakan berdasarkan jenisnya menjadi dua yaitu Statistika Deskriptif dan Statistika Inferensia.

Statistika deskriptif adalah statistika yang berkaitan dengan metode atau cara medeskripsikan, menggambarkan, menjabarkan atau menguraikan data. Statistika deskripsi mengacu pada bagaimana menata, menyajikan dan menganalisis data, yang dapat dilakukan misalnya dengan menentukan nilai rata-rata hitung, median, modus, standar deviasi atau menggunakan cara lain yaitu dengan membuat tabel distribusi frekuensi dan diagram atau grafik.

Statistika inferensia adalah statistika yang berkaitan dengan cara penarikan kesimpulan berdasarkan data yang diperoleh dari sampel untuk menggambarkan karakteristik dari suatu populasi. Dengan demikian dalam statistika inferensia data yang diperoleh dilakukan generalisasi dari hal yang bersifat kecil (khusus) menjadi hal yang bersifat luas (umum).

Populasi Dan Sampel

Populasi adalah keseluruhan pengamatan atau obyek yang menjadi perhatian sedangkan Sample adalah bagian dari populasi yang menjadi perhatian.

Populasi dan sample masing-masing mempunyai karakteristik yang dapat diukur atau dihitung. Karakteristik untuk populasi disebut parameter dan untuk sample disebut statistik

 

Cara Mengumpulkan Data

Untuk memperoleh data yang benar dan dapat dipertanggung jawabkan keabsahannya, data harus dikumpulkan dengan cara dan proses yang benar. Terdapat beberapa cara atau teknik untuk mengumpulkan data yaitu :

1. Wawancara (interview) yaitu cara untuk mengumpulkan data dengan mengadakan tatap muka secara langsung. Wawancara harus dilakukan dengan memakai suatu pedoman wawancara yang berisi daftar pertanyaan sesuai tujuan yang ingin dicapai.

Ada dua jenis wawancara yaitu wawancara berstruktur (structured interview) dan wawancara takberstruktur (unstructured interview). Wawancara berstruktur adalah wawancara yang jenis dan urutan dari sejumlah pertanyaannya sudah disusun sebelumnya, sedangkan wawancara takberstruktur adalah wawancara yang tidak secara ketat ditentukan sebelumnya. Wawancara takberstruktur lebih fleksibel karena pertanyaannya dapat dikembangkan meskipun harus tetap pada pencapaian sasaran yang telah ditentukan.

Ciri-ciri pertanyaan yang baik adalah :

a. Sesuai dengan masalah atau tujuan penelitian.

b. Jelas dan tidak meragukan.

c. Tidak menggiring pada jawaban tertentu.

d. Sesuai dengan pengetahuan dan pengalaman orang yang diwawancarai.

e. Pertanyaan tidak boleh yang bersifat pribadi.

Kelebihan dari wawancara adalah data yang diperlukan langsung diperoleh sehingga lebih akurat dan dapat dipertanggung jawabkan.

Kekurangannya adalah tidak dapat dilakukan dalam skala besar dan sulit memperoleh keterangan yang sifatnya pribadi.

2. Kuesioner (angket) adalah cara mengumpulkan data dengan mengirim atau menggunakan kuesioner yang berisi sejumlah pertanyaan.

Kelebihannya adalah dapat dilakukan dalam skala besar, biayanya lebih murah dan dapat memperoleh jawaban yang sifatnya pribadi.

Kelemahannya adalah jawaban bisa tidak akurat, bisa jadi tidak semua pertanyaan terjawab bahkan tidak semua lembar jawaban dikembalikan.

3. Observasi (pengamatan) adalah cara mengumpulkan data dengan mengamati obyek penelitian atau kejadian baik berupa manusia, benda mati maupun gejala alam. Data yang diperoleh adalah untuk mengetahui sikap dan perilaku manusia, benda mati atau gejala alam.

Kebaikan dari observasi adalah data yang dieroleh lebih dapat dipercaya.

Kelemahannya adalah bisa terjadi kesalahan interpretasi terhadap kejadian yang diamati.

4. Tes dan Skala Obyektif adalah cara mengumpulkan data dengan memberikan tes kepada obyek yang diteliti. Cara ini banyak dilakukan pada tes psikologi untuk mengukur karakteristik kepribadian seseorang. Beberapa contoh tes skala obyektif yaitu :

a. Tes kecerdasan dan bakat.

b. Tes kepribadian.

c. Tes sikap.

d. Tes tentang nilai.

e. Tes prestasi belajar, dsb.

5. Metode proyektif adalah cara mengumpulkan data dengan mengamati atau menganalisis suatu obyek melalui ekspresi luar dari obyek tersebut dalam bentuk karya lukisan atau tulisan. Metode ini dipakai dalam psikologi untuk mengetahui sikap, emosi dan kepribadian seseorang. Kelemahan dari metode ini adalah obyek yang sama dapat disimpulkan berbeda oleh pengamat yang berbeda

Refrensi

http://sangiang.wordpress.com/2008/11/13/pengertian-statistik-dan-probabilitas/

Hello world!

1

Selamat datang di Student Blogs. Ini adalah posting pertamaku!

M.Cholil Abdilla's RSS Feed
Go to Top