RSS Feed

Archive for the ‘STATISTIK DAN PROBABILITAS’ Category

STATISTIK DAN PROBABILITAS

10 June 2012 by arief bachtiar No Comments »

DISTRIBUSI STUDENT t

 

SEJARAH

W.S. Gosset menuliskan distribusi peluang t pada saat bekerja diperusahaan bir di Irlandia (1908). Perusahaan tersebut melarang semua karyawan untuk menerbitkan hasil penelitiannya. Untuk menghindari larangan tersebut W.S. Gosset menerbitkan karyanya secara rahasia dengan nama student. Oleh sebab itulah distribusi t disebut sebagai distribusi peluang student t.

 

DASAR

Distribusi Student atau distribusi t, ialah Distribusi dengan variabel acak kontinu lainnya, selain daripada distribusi normal dengan fungsi densitas.

Derajat kebebasan (dk)= (n-1)

 

Untuk harga-harga n yang besar, biasanya n ≥ 30, distribusi t mendekati distribusi normal baku.

 

Distribusi probabilitas t-Student diturunkan dari distribusi probabilitas normal baku, dalam bentuk yang berkaitan dengan distribusi probabilitas khi-kuadrat, yakni :

dengan z1, z2, z3, . . . sebagai distribusi probabilitas normal baku dan

c2n= z21 + z22 + z23 + . . . + z2n

dari distribusi probabilitas khi-kuadrat.

 

 

 

KURVA DISTRIBUSI t

 

TABEL DISTRIBUSI t

 


 

STATISTIK DAN PROBABILITAS

by arief bachtiar No Comments »

Distribusi Khi-Kuadrat

Dalam teori probabilitas dan statistika, distribusi khi-kuadrat (bahasa InggrisChi-square distribution) atau distribusi χ² dengan k derajat bebas adalah distribusi jumlah kuadrat k peubah acak normal baku yang saling bebas. Distribusi ini seringkali digunakan dalam statistika inferensial, seperti dalam uji hipotesis, atau dalam penyusunan selang kepercayaan.[2][3][4][5] Apabila dibandingkan dengan distribusi khi-kuadrat nonsentral, distribusi ini dapat juga disebut distribusi khi-kuadrat sentral.

Salah satu penggunaan distribusi ini adalah uji khi-kuadrat untukkebersesuaian (goodness of fit) suatu distribusi pengamatan dengan distribusi teoretis, kriteria klasifikasi analisis data yang saling bebas, serta pendugaan selang kepercayaan untuk simpangan baku populasi berdistribusi normal dari simpangan baku sampel. Sejumlah pengujian statistika juga menggunakan distribusi ini, seperti Uji Friedman.

Distribusi khi-kuadrat merupakan kasus khusus distribusi gamma.

 

Uji Goodness of Fit

Seberapa tepat frekuensi yang teramati (observed frequencies) cocok dengan frekuensi yang diharapkan (expected frequencies). Dapat dipergunakan untuk data skala nominal, ordinal, interval, maupun rasio.

Ciri-ciri distribusi Chi Square :

  1. Selalu positif
  2. df = k – 1, dimana k adalah jumlah katagori. Jadi bentuk distribusi chi square tidak ditentukan banyaknya sampel, melainkan banyaknya derajat bebas.
  3. Bentuk distribusi chi square menjulur positif. Semakin besar derajat bebas, semakin mendekati distribusi normal.

Keterbatasan statistik Chi Square

Tidak dapat dipergunakan bila ada satu atau lebih nilai frekuensi yang diharapkan dalam sel yang nilainya kecil sekali, sehingga kesimpulannya bisa salah.

Cara mengatasinya :

v  Jika tabel hanya terdiri dari dua sel, maka frekuensi yang diharapkan untuk masing-masing sel seharusnya tidak kurang dari 5.

v  Untuk tabel yang mempunyai lebih dari dua sel, X2 seharusnya tidak digunakan jika lebih dari 20 % frekuensi yang diharapkan memiliki nilai kurang dari 5. Jika memungkinkan sel-sel yang bernilai kurang dari 5 dapat digabungkan menjadi satu dengan harapan nilainya lebih dari 5.

(sumber : Rahmad Wijaya, 2003, Diktat Kuliah Chi Square)

Nilai χ²

Nilai χ² adalah nilai kuadrat karena itu nilai χ² selalu positif. Bentuk distribusi χ² tergantung dari derajat bebas(db)/degree of freedom. Pengertian α pada Uji χ² sama dengan pengujian hipotesis yang lain, yaitu luas daerah penolakan H0 atau taraf nyata pengujian. Uji χ² dapat digunakan untuk :

a. Uji Kecocokan = Uji kebaikan-suai = Goodness of fit Test

b. Uji Kebebasan

c. Uji beberapa proporsi

 

Rumus χ²

 

k : banyaknya kategori/sel, 1,2 … k

oi : frekuensi observasi untuk kategori ke-i

ei : frekuensi ekspektasi untuk kategori ke-i

 

(sumber : yosephine.staff.gunadarma.ac.id)

Pengujian Kai Kuadrat

 

DISTRIBUSI CHI KUADRAT dipakai dalam PENGUJIAN HIPOTESIS, al.:

  1. UJI KECOCOKAN (goodness of fit), membandingkan antara Frekuensi Observasi dengan Frekuensi Teoretis /Harapan. Apakah Frekuensi hasil Observasi menyimpang dari Frekuensi Harapan. Jika nilai (chi square) kecil, berarti kedua frekuensi tersebut sangat dekat, mengarah pada penerimaan kepada hipotesa nol ( Ho).

 

 

Di mana :

Oi = fo = Frekuensi Observasi

Ei = fe = frekuensi Harapan / Teoretis

V = Derajat kebebasan / Degrees of Freedom = k – 1

 

  1. UJI INDEPENDENSI : menguji apakah ada atau tak ada hubungan antara dua kategori suatu hasil observasi dari suatu populasi dengan kategori populasi lain. disebut pula sebagai analisis tabel kontingensi.

Tabel kontingensi adalah tabel berbentuk matriks ( r x k ), r baris dan k kolom. derajat kebebasan bagi adalah v = (r – 1)(k – 1)

 

(sumber : file.upi.edu)

 

STATISTIK DAN PROBABILITAS

by arief bachtiar No Comments »

PENGUJIAN HIPOTESIS

Jenis-Jenis Pengujian Hipotesis

 

1. Berdasarkan Jenis Parameternya

a. Pengujian hipotesis tentang rata-rata

b. Pengujian hipotesis tentang proporsi

c. Pengujian hipotesis tentang varians

 

2. Berdasarkan Jumlah Sampelnya

a. Pengujian sampel besar (n > 30)

b. Pengujian sampel kecil (n ≤ 30)

 

3. Berdasarkan Jenis Distribusinya

a. Pengujian hipotesis dengan distribusi Z

b. Pengujian hipotesis dengan distribusi t (t-student)

c. Pengujian hipotesis dengan distribusi χ2 (chi-square)

d. Pengujian hipotesis dengan distrbusi F (F-ratio)

 

4. Berdasarkan Arah atau Bentuk Formulasi Hipotesisnya

a. Pengujian hipótesis dua pihak (two tail test)

b. Pengujian hipotesis pihak kiri atau sisi kiri

c. Pengujian hipotesis pihak kanan atau sisi kanan.

(sumber : http://muhammadwinafgani.wordpress.com  )

 

ANALISIS VARIAN

Analisis varians (analysis of variance, ANOVA) adalah suatu metode analisis statistika yang termasuk ke dalam cabang statistika inferensi. Dalam literatur Indonesia metode ini dikenal dengan berbagai nama lain, seperti analisis ragam, sidik ragam, dan analisis variansi. Ia merupakan pengembangan dari masalah Behrens-Fisher, sehingga uji-F juga dipakai dalam pengambilan keputusan. Analisis varians pertama kali diperkenalkan oleh Sir Ronald Fisher, bapak statistika modern. Dalam praktik, analisis varians dapat merupakan uji hipotesis (lebih sering dipakai) maupun pendugaan (estimation, khususnya di bidang genetika terapan).

Secara umum, analisis varians menguji dua varians (atau ragam) berdasarkan hipotesis nol bahwa kedua varians itu sama. Varians pertama adalah varians antarcontoh (among samples) dan varians kedua adalah varians di dalam masing-masing contoh (within samples). Dengan ide semacam ini, analisis varians dengan dua contoh akan memberikan hasil yang sama dengan uji-t untuk dua rerata (mean).

Supaya sahih (valid) dalam menafsirkan hasilnya, analisis varians menggantungkan diri pada empat asumsi yang harus dipenuhi dalam perancangan percobaan:

  1. Data berdistribusi normal, karena pengujiannya menggunakan uji F-Snedecor
  2. Varians atau ragamnya homogen, dikenal sebagai homoskedastisitas, karena hanya digunakan satu penduga (estimate) untuk varians dalam contoh
  3. Masing-masing contoh saling bebas, yang harus dapat diatur dengan perancangan percobaan yang tepat
  4. Komponen-komponen dalam modelnya bersifat aditif (saling menjumlah).

Analisis varians relatif mudah dimodifikasi dan dapat dikembangkan untuk berbagai bentuk percobaan yang lebih rumit. Selain itu, analisis ini juga masih memiliki keterkaitan dengan analisis regresi. Akibatnya, penggunaannya sangat luas di berbagai bidang, mulai dari eksperimen laboratorium hingga eksperimen periklanan, psikologi, dan kemasyarakatan.

 

Untuk menentukan varian suatu percobaan atau hasil data statistik perlu dicari

Nilai rata-rata seluruh sampel                :

Jumlah kuadrat perlakuan (JKP)           :

Jumlah kuadrat galat (JKG)                   :

Jumlah kuadrat total (JKT)                    : JKT = JKP + JKG                                  (3-8)

Kuadrat tengah perlakuan (KTP)           :KTP = JKP/k-1                                       (3-9)

Kuadrat tengah galat (KTG)                  : KTG = JKG/n(k-1)                                (3-10)

Fhitung                                                                       : KTP/KTG                                              (3-11)

Untuk membuat uji analisis, variabel analisis varian dibuat table analisis varian satu arah seperti table dibawah ini :

 

Jumlah varian

Db

JK

JT

Fhitung

Pengujian

k-1

JKP

KTP

Galat

k(n-1)

JKG

KTG

Total

nk-1

JKT

 

Pengujian ada tidaknya pengaruh perlakuan adalah dengan membandingkan Fhitung dengan tingkat keberartian α :

  1. Jika Fhitung > F(α, k, db) berarti H0 ditolak H1 diterima
  2. Jika Fhitung < F(α, k, db) berarti H0 diterima H1 ditolak

 

(sumber : Ronald E. Walpole, Pengantar Statistik)

 

F Test

Uji statistik F digunakan untuk mengetahui apakah semua variabel bebasyang dimasukkan dalam model mempunyai pengaruh secara bersama-samaterhadap variabel dependen. Pengujian F-statistik ini dilakukan dengan cara membandingkan antara F-hitung dengan F-tabel. (Damodar Gujarati, 2003)

 

F-tabel   = (α: k-1, n-k )  α  = 5 %, ( 5-1= 4 ; 20-5 =15 )

Jika F-tabel < F-hitung berarti Ho ditolak atau variabel independen secara bersama-sama berpengaruh signifikan terhadap variabel independen, tetapi jika F-tabel > F-hitung berarti Ho diterima atau variabel independen secara bersama-sama tidak berpengaruh signifikan terhadap variabel dependen.

Hipotesis yang digunakan adalah :

Ho : β1 = β2 = β3 = 0, berarti variabel independen secara  keseluruhan tidak berpengaruh terhadap variabel independen.

Ha : β1 ≠ β2 ≠ β3 ≠ 0, berarti variabel independen secara  keseluruhan berpengaruh terhadap variabel independen.

(sumber  : Dadang Firmansyah, 2008, Skripsi Faktor-Faktor Yang Mempengaruhi Investasi Di Indonesia Periode Tahun  1985 – 2004)

 

 

Chi – Square

Dalam teori probabilitas dan statistika, distribusi khi-kuadrat (bahasa Inggris: Chi-square distribution) atau distribusi χ² dengan k derajat bebas adalah distribusi jumlah kuadrat k peubah acak normal baku yang saling bebas. Distribusi ini seringkali digunakan dalam statistika inferensial, seperti dalam uji hipotesis, atau dalam penyusunan selang kepercayaan. Apabila dibandingkan dengan distribusi khi-kuadrat nonsentral, distribusi ini dapat juga disebut distribusi khi-kuadrat sentral.

Salah satu penggunaan distribusi ini adalah uji khi-kuadrat untuk kebersesuaian (goodness of fit) suatu distribusi pengamatan dengan distribusi teoretis, kriteria klasifikasi analisis data yang saling bebas, serta pendugaan selang kepercayaan untuk simpangan baku populasi berdistribusi normal dari simpangan baku sampel. Sejumlah pengujian statistika juga menggunakan distribusi ini, seperti Uji Friedman.

Distribusi khi-kuadrat merupakan kasus khusus distribusi gamma.

 

Ciri-ciri distribusi Chi Square :

  1. Selalu positif
  2. df = k – 1, dimana k adalah jumlah katagori. Jadi bentuk distribusi chi square tidak ditentukan banyaknya sampel, melainkan banyaknya derajat bebas.
  3. Bentuk distribusi chi square menjulur positif. Semakin besar derajat bebas, semakin mendekati distribusi normal.

Keterbatasan statistik Chi Square :

Tidak dapat dipergunakan bila ada satu atau lebih nilai frekuensi yang diharapkan dalam sel yang nilainya kecil sekali, sehingga kesimpulannya bisa salah.

Cara mengatasinya :

v  Jika tabel hanya terdiri dari dua sel, maka frekuensi yang diharapkan untuk masing-masing sel seharusnya tidak kurang dari 5.

v  Untuk tabel yang mempunyai lebih dari dua sel, X2 seharusnya tidak digunakan jika lebih dari 20 % frekuensi yang diharapkan memiliki nilai kurang dari 5. Jika memungkinkan sel-sel yang bernilai kurang dari 5 dapat digabungkan menjadi satu dengan harapan nilainya lebih dari 5.

(sumber : Rahmad Wijaya, 2003, Diktat Kuliah Chi Square)

 

 

STATISTIK DAN PROBABILITAS

by arief bachtiar No Comments »

                                                                                                                        BAB 7

Regresi Multilinier

Sering kali ada lebih dari 1 variabel independen (Xk) yang menentukan variabel dependen (Y). Sehingga model Regresi Jamak (Multiple Regression Model) diperlukan. Jikalau hubungan antara Y dan Xk linear maka model disebut Model Regresi Linear Jamak (Multiple Linear Regression Model).

Untuk populasi model tsb, berarti nilai rata-rata Y akan diberikan oleh

Y = β0 + β1X1 + β2X2 + ….+ βkXk

Dan estimasi bagi Y yang diperoleh dari sampel adalah:

 

Misalkan dari sampel diperoleh data {Yi, X1i, X2i, …, Xki} untuk i=1,n maka model regresi linear jamaknya adalah:

 

Dengan ei adalah random error.

Memakai cara yg sama dengan regresi linear, didefinisikan SSE:

 

Dengan diferensiasi thd b0, b1, dst hasilnya = 0, maka diperoleh satu set sistem persamaan linear bari b0,b1, ….

 

Sistem Persamaan Linear ini diselesaikan dengan metoda yg dikenal, misalnya Eliminasi-Gauss atau Gauss-Jordan, Dekomposisi LU dll

 

 

Koefisien Regresi dan Korelasi

 

Interpretasi Terhadap Nilai Koefisien Regresi :

Tanda positif atau negatif dari nilai koefisien regresi bukanlah menyatakan tanda aljabar, melainkan menyatakan arah hubungan atau lebih tegasnya menyatakan pengaruh variabel bebas X terhadap variabel terikat Y. Nilai b yang positif menyatakan bahwa variabel bebas X berpengaruh positif terhadap nilai variabel terikat Y. Sedangkan nilai b yang negatif (b dengan tanda negatif) menyatakan bahwa variabel bebas X berpengaruh negatif terhadap nilai variabel terikat Y.
Interpretasi terhadap nilai koefisien regresi (b), adalah sebagai berikut :

b = A (b bertanda positif), artinya bila nilai variabel bebas X naik/bertambah/meningkat 1 unit, maka nilai variabel Y akan naik/bertambah/meningkat sebesar A unit. Sebaliknya bila nilai variabel turun/berkurang 1 unit, maka nilai variabel Y akan turun/berkurang sebesar A unit.

b = – A (b bertanda negatif), artinya bila nilai variabel bebas X naik/bertambah/meningkat 1 unit, maka nilai variabel Y akan turun/berkurang sebesar A unit. Sebaliknya bila nilai variabel turun/berkurang 1 unit, maka nilai variabel Y akan naik/bertambah/meningkat sebesar A unit.
Menaksir Nilai Variabel Terikat Y :

Dari serangkaian data sampel yang terdiri dari n pasangan data (Xi,Yi), nilai a dan b dihitung, kemudian persamaan regresi sampel Y = a + bX disusun. Berdasarkan persamaan regresi tersebut, kita dapat menaksir nilai variabel terikat Y, berdasarkan nilai variabel bebas (X) tertentu, dalam batas-batas nilai X data pengamatan dengan mensubstitusikan nilai X tertentu tersebut kedalam persamaan regresi, Y = a + bX

(http://aryaajus.blogspot.com/2010/01/bahan-kuliah-statistik-ekonomi-stimi_18.html)

 

Koefisien Korelasi

Adalah suatu ukuran tingkat hubungan antara dua variabel

r=

Sifat r adalah

  1. r dapat posotif atau negatif
  2. Terletak antara batas -1 dan +1 yaitu -1≤ r ≤1
  3. Sifat dasarnya simetris
  4. Tidak tergantung pada titik asal dan skala
  5. Kalau X dan Y bebas secara statistik, koefisien korelasi antara mereka adalah nol.
  6. r hanyalah suatu ukuran hubungan linear atau ketergantungan linear saja.

Setelah diperoleh koefisien korelasinya maka untuk menginterpretasikan koefisien korelasi tersebut digunakan pedoman sebagai berikut:

 

(http://titaviolet.wordpress.com/2009/11/12/metode-kuadrat-terkecil-biasa-ols/)

(http://cchapung.blogspot.com/2011/07/uji-koefisien-korelasi.html)

 

 

Sifat Penaksiran Kuadrar Kecil

Sifat-sifat Penaksir Kuadrat Terkecil

Teorema Gauss – Markov

Koefisien Determinasi r2 – Suatu Ukuran Kebaikan – Suai (Goodness of Fit)

Koefisien determinasi (r2) merupakan suatu ukuran yang menyatakan seberapa baik garis regresi sampel mencocokkan data.

Untuk menghitung r2 dalam bentuk simpangan:  yi= ŷi = ei

Jika dikuadratkan pada kedua sisis dan menjumlahkan untuk semua sampel, diperoleh:

∑yi2 = ∑ŷi2 + ∑ei2 + 2 ∑ŷiei

= ∑ŷi2 + ∑ei2

= β12 ∑ xi2 + ∑ei2

Total variansi Y sebenarnya di sekitar rata-rata sampelnya disebut jumlah kuadrat total (total sum of squares / TSS). Yaitu:  ∑yi2 = ∑(Yi – Ŷi2)

ESS ( Explained sum of squares) adalah jumlah kuadrat yang dijelaskan.

Regression Sum of Square

(SSR) = yang menyatakan variasi nilai Y yang ditaksir disekitar rata –ratanya. Sedangkan Error Sum Square (SSE) = e’e = ( y – X3)’ (y-X

β) dan Total Sum of Square (SST) = . SST menyatakan total variasi nilai Y sebenarnya di sekitar rata-rata sampelnya. Hubungan SSR, SSE dan SST adalah SST = SSR + SSE.

Hubungan ini menunjukkan bahwa total variasi dalam nilai Y yang diobservasi di sekitar nilai rata-ratanya dapat dipisahkan ke dalam dua bagian. Sebagian yang diakibatkan oleh garis regresi dan bagian lain diakibatkan oleh kekuatan random karena tidak semua pengamatan Y yang sebenarnya terletak pada garis yang dicocokkan.

Sifat r2 bisa dicatat:

  1. r2 merupakan besaran nonnegatif
  2. Batasnya adalah 0≤ r2 ≤ 1. suatu r2 sebesar 1 berarti suatu kecocokan sempurna, sedangkan r2 bernilai 0 berarti tidak ada hubungan antara variabel yak bebeas dengan variabel yang menjelaskan.

Secara lebih cepat, r2 bisa didiapat dengan rumus:

R2 = β12

Jika besarnya sampel N atau N – 1 kalau ukuran sampelnya kecil, maka diperoleh:

R2 = β12 dimana S dan S secara berurutan adalah varians sampel Y dan X

 

(http://titaviolet.wordpress.com/2009/11/12/metode-kuadrat-terkecil-biasa-ols/)

 

Inferensi Mengenai Koefisien Regresi

 

inferensi tentang parameter regresi, b0 dan b1, dalam bentuk pendugaan selang dan uji hipotesis bagi kedua parameter itu. Selanjutnya, kita akan mendiskusikan pendugaan selang bagi rataan E{Y} dari sebaran peluang peubah Y, untuk X tertentu, dan selang peramalan bagi amatan baru Y, untuk X tertentu. Terakhir, kita akan mengupas pendekatan analisis ragam terhadap analisis regresi, pendekatan uji linear umum, dan ukuran deskripsi bagi asosiasi.

Model regresi:

Y = b0 +b1X +εi                                                   (9.2.1)

Dalam hal ini :

b0 dan b1 adalah parameter.

Xi konstanta yang diketahui nilainya.

ei menyebar N(0, s2) dan bebas satu sama lain.

Seringkali kita ingin menarik kesimpulan tentang b1, kemiringan garis regresi dalam model (9.1). Misalnya, seorang analis penelitian pasar ingin memperoleh dugaan selang bagi b1 sebab ini akan memberi informasi tentang rata-rata peningkatan penjualan (dalam dolar) yang akan diperoleh dari setiap peningkatan belanja untuk iklan sebesar satu dolar.

Ada kalanya kita tertarik untuk menguji tentang b1, khususnya yang berbentuk :

H0 : b1 = 0 dan H0 : b1 ¹ 0

Alasan mengapa kita tertarik untuk menguji apakah b1 = 0 atau tidak adalah bahwa b1 = 0 mengindikasikan tidak adanya asosiasi linear antara Y dan X. Gambar (9.2.1) mengilustrasikan kasus bila b1 = 0 untuk model regresi bergalat normal (9.2.1). Perhatikan bahwa garis regresi mendatar dan bahwa, oleh karenanya, rataan sebaran Y sama, yaitu sebesar :

E{Y} – b0 + (0)X = b0

Karena model regresi (9.2.1) mengasumsikan bahwa sebaran peluang Y normal dengan ragam yang sama, karena rataan-rataannya sama bila b1 = 0, maka ini berarti bahwa sebaran-sebaran peubah Y sama semuanya bila b1 = 0. Ini menunjukkan dalam Gambar 9.2.1. Jadi, b1 = 0 bagi model regresi (9.2.2) berimplikasi bahwa tidak hanya tidak ada asosiasi linear antara Y dan X namun juga tidak ada hubungan dalam bentuk apapun antara Y dan X, karena sebaran peluang peubah Y sama pada semua taraf X.

(suwarnostatistik.files.wordpress.com)

 

Prediksi Statistika

Estimasi dari populasi dapat berupa estimasi titik atau estimasi selang. Estimasi titik dari parameter  θ adalah suatu nilai tunggal θ^ daristatistik  Θ^.

Contoh: nilai x dari statistik X yng dihitung dari n-buah cuplikandari populasi merupakan estimasi parameter μ dari populasi.

(Besaran) Statistik yang dipakai seseorang untuk menentukan estimasititik disebut estimator atau fungsi keputusan.Dngan demikian, keputusan S yang merupakan fungsi daricuplikan acak adalah estimator dari σ dan estimasi s adalahtindakan yang diambilnya.

 

Himpunan semua tindakan yang mungkin, yang dapat diambil dalam permasalahan estimasi disebut sebagai ruang tindakanatau ruang keputusan.

Estimator selalu memberikan kesalahan. Untuk suatu cuplikan tertentu, mis. 2, 5, 11, estimasi dari μ dpt menghasilkan x=6 jika dipakai mean cuplikan atau x~=5 jika dipakai median. Disini X~ menghasilkan nilaiyng lebih baik. Sebaliknya, cuplikan 2, 6, 7 memberikan x=5 dan x~=6 dimana X lebih baik. Yang mana sebaiknya dipilih?

Misalkan Θ^ adalah estimator yang nilai θ^-nya adalah estimasi titik dari parameter populasi tak diketahui θ. Tentu diinginkan bahwa sebaran cuplikan Θ^ akan memiliki mean yang sama dengan parameter yang diestimasi. Parameter yng spt ini disebut bersifat takbias.

Suatu statistik Θ^ disebut estimator takbias dari parameter θ jika μΘ = E(Θ^)= θ. Dapat ditunjukkan (lihat buku) bahwa S2 adalah estimator takbias dari σ2, akan tetapi S sendiri adalah estimator σ yang bias.

Jika Θ1^ dan Θ2^ adalah dua estimator takbias dari populasi yang sama dengan parameter θ, estimator dengan variansi terkecil-lahyang akan dipilih. Dengan demikian, jika σ2Θ1 < σ2Θ2, maka Θ^1disebut lebih efisian daripada Θ^2.

Estimator dengan nilai variansi terkecil disebut sebagai estimator yang paling efisien.

(http://radar.ee.itb.ac.id/~suksmono/Lectures/el2002/ppt/VI.%20Teori%20Estimasi.pdf)

 

 

MATERI 6

12 April 2012 by arief bachtiar No Comments »

DISTRIBUSI NORMAL

Distribusi normal, disebut pula distribusi Gauss, adalah distribusi probabilitas yang paling banyak digunakan dalam berbagai analisis statistika. Distribusi normal baku adalah distribusi normal yang memiliki rata-rata nol dan simpangan baku satu. Distribusi ini juga dijuluki kurva lonceng (bell curve) karena grafik fungsi kepekatan probabilitasnya mirip dengan bentuk lonceng.

Distribusi normal memodelkan fenomena kuantitatif pada ilmu alam maupun ilmu sosial. Beragam skor pengujian psikologi dan fenomena fisika seperti jumlah foton dapat dihitung melalui pendekatan dengan mengikuti distribusi normal. Distribusi normal banyak digunakan dalam berbagai bidang statistika, misalnya distribusi sampling rata-rata akan mendekati normal, meski distribusi populasi yang diambil tidak berdistribusi normal. Distribusi normal juga banyak digunakan dalam berbagai distribusi dalam statistika, dan kebanyakan pengujian hipotesis mengasumsikan normalitas suatu data. (sumber : id.wikipedia.org/wiki/Distribusi_normal)

Kurva normal adalah bila X adalah suatu peupab acak normal dengan nilai tengah µ dan ragam σ2, maka persamaannya adalah

n(x; µ; σ) = 

 

Untuk – ∞ < x < ∞. Dalam hal ini π = 3.14159… dan e = 2.71828…

Bentuk kurva normal itu sendiri berbeda tergantung dari nilai µ dan σ2 nya. Jika nilai µ berharga positif maka kurva akan bergeser ke kanan dan jika bernilai negatif maka kurva akan bergeser ke kiri dari titik X = 0. Jika nilai σ2 bernilai semakin besar maka kurva normal akan semakin landai dan jika nilai σ2 bernilai semakin kecil maka kurva normal akan semakin curam. Berikut perbandingan kurvanya

 

Dari gambar di atas maka dapat diperoleh sifat-sifat kurva  normal, yaitu :

  1. Modusnya yaitu titik pada sumbu mendatar yang membuat fungsi mencapai maksimum yang terjadi pada x = µ
  2. Kurvanya setangkup terhadapa suatu garis tegak yang melalui nilai tengah µ
  3. Kurva ini mendekati sumbu mendatar secara asimtotik dalam kedua arah bila kita semakin menjauhi nilai tengahnya.
  4. Luasan daerah yang terletak di bawah kurva tetapi di atas sumbu mendatar sama dengan 1

(sumber : Ronald E. Walpole, Pegantar Statistik edisi ke-3, PT Gramedia Pustaka Utama, Jakarta)

 

DISTRIBUSI BINOMIAL

Dalam teori probabilitas dan statistika, distribusi binomial adalah distribusi probabilitas diskret jumlah keberhasilan dalam n percobaan ya/tidak (berhasil/gagal) yang saling bebas, dimana setiap hasil percobaan memiliki probabilitas p. Eksperimen berhasil/gagal juga disebut percobaan bernoulli. Ketika n = 1, distribusi binomial adalah distribusi bernoulli. Distribusi binomial merupakan dasar dari uji binomial dalam uji signifikansi statistik.

Distribusi ini seringkali digunakan untuk memodelkan jumlah keberhasilan pada jumlah sampel n dari jumlah populasi N. Apabila sampel tidak saling bebas (yakni pengambilan sampel tanpa pengembalian), distribusi yang dihasilkan adalah distribusi hipergeometrik, bukan binomial. Semakin besar N daripada n, distribusi binomial merupakan pendekatan yang baik dan banyak digunakan

(sumber : http://id.wikipedia.org/wiki/Distribusi_binomial)

Distribusi binomial juga didefinisikan bila suatu ulangan binomial mempunyai peluang keberhasilan p dan nilai peluang kegagalan a = 1 – p, maka sebaran peluang bagi peubah acak binomial X, yaitu banyaknya keberhasilan dalam n ulangan yang bebas adalah

 

b(x,n,p)= 

untuk x = 0,1, 2, …, n

sedangkan untuk nilai tengah dan ragam bagi sebaran binomial adalah µ = np dan σ2 = npq. Hal ini dpat dibuktikan misalkan hasil pada ulangan ke-j dinyatakan oleh peubah acak Ij yang bernilai 0 dan 1, masing-masing dengan peluang q dan p. Ini disebur peubah Bernoulli atau lebih tepat disebut peubah indikator, Karena Ij = 0 berarti kegagalan dan Ij = 1 yang berarti keberhasilan. Dengan demiklian, dalam suatu percobaan binomial banyaknya keberhasilan dapat dituliskan sebagai jumlah n peubah indikator yang bebas, sehingga

X = I1 + I2 + … + In

Nilai tengah Ij adalah E(Ij) = 0.q + 1.p = p. Maka kita mendapatkan nilai tengah bagi sebaran binomial, yaitu

 

µ = E(X) = E(X1) + E(X2) + … + E(Xn)

= p + p + … + p

 

n suku

= np

Ragam bagi setiap Ij adalah

σ2Ij = E[(Ij – p)2] = E(Ij2) – p2

= (0)2q + (1)2pp2

                                      = p(1 – p) = pq

Dengan demikian, ragam sebaran binomial adalah

σ2x = σ2I1 + σ2I2 + … + σ2In

= pq + pq + + pq

 

n suku

= npq

 

 

 

DISTRIBUSI POISSON

 

Dalam teori probabilitas dan statistika, distribusi poisson (dilafalkan ejaan Perancis: [pwasɔ̃]) adalah distribusi probabilitas diskret yang menyatakan peluang jumlah peristiwa yang terjadi pada periode waktu tertentu apabila rata-rata kejadian tersebut diketahui dan dalam waktu yang saling bebas sejak kejadian terakhir. (distribusi poisson juga dapat digunakan untuk jumlah kejadian pada interval tertentu seperti jarak, luas, atau volume).

Distribusi ini pertama kali diperkenalkan oleh Siméon-Denis Poisson (1781–1840) dan diterbitkan, bersama teori probabilitasnya, pada tahun 1838 dalam karyanyaRecherches sur la probabilité des jugements en matière criminelle et en matière civile (“Penelitian Probabilitas Hukum Masalah Pidana dan Perdata”). Karyanya memfokuskan peubah acak N yang menghitung antara lain jumlah kejadian diskret (kadang juga disebut “kedatangan”) yang terjadi selama interval waktu tertentu.

Apabila nilai harapan kejadian pada suatu interval adalah , maka probabilitas terjadi peristiwa sebanyak k kali (k adalah bilangan bulat non negatif, k = 0, 1, 2, …) maka sama dengan

dimana

  • e adalah basis logaritma natural (e = 2.71828…)
  • k adalah jumlah kejadian suatu peristiwa  — peluang yang diberikan oleh fungsi ini
  • k! adalah faktorial dari k
  • λ adalah bilangan riil positif, sama dengan nilai harapan peristiwa yang terjadi dalam interval tertentu. Misalnya, peristiwa yang terjadi rata-rata 4 kali per menit, dan akan dicari probabilitas terjadi peristiwa k kali dalam interval 10 menit, digunakan distribusi poisson sebagai model dengan λ = 10×4 = 40.

Sebagai fungsi k, ini disebut fungsi massa probabilitas. The Distribusi poisson dapat diturunkan sebagai kasus terbatas distribusi binomial. Distribusi poisson dapat diterapkan pada sistem dengan kejadian berjumlah besar yang yang mungkin terjadi, yang mana kenyataannya cukup jarang. Contoh klasik adalah peluruhan nuklir atom.

 

 

MATERI 5

25 March 2012 by arief bachtiar No Comments »

UKURAN DISPERSI

  • Rentang. adalah :  data terbesar – data terkecil, biasanya banyak digunakan pada cabang statistika industri
  • Contoh : Untuk ke 80 data yang terdapat pada halaman 45 dimana data terbesar = 99
  • Rentang antar kuartil juga mudah ditentukan, dan ini merupakan selisih antara K3 dan K1., yakni : RAK = K3 – K1
  • Contoh : Daftar berikut menyatakan upah tiap jam untuk 65 pegawai di suatu pabrik .

Upah (x100 Rupiah)

Dengan Rumus IV (17) nilai-nilai K1 dan K3 dapat dihitung. Hasilnya K1 = Rp. 68,25 dan K3 = Rp. 90,75

Dari rumus V (2), maka RAK = Rp. 22,50.

f1

50,00 – 59,99

60,00 – 69,99

70,00 – 79,99

80,00 – 89,99

90,00 – 99,99

100,00 – 109,99

110,00 – 119,99

8

10

16

14

10

5

2

JUMLAH

65

 

  • Simpangan kuartil atau deviasi kuartil atau disebut pula rentang semi antar kuartil, harganya setengah dari rentang antar kuartil. yakni : SK = ½ (K3 – K1).
  • Contoh :

Dari daftar di atas: SK = ½ (Rp.90,75 – Rp. 68,25) = Rp. 11,25

Karena ½ (K3 + K­1) = Rp. 79,50, maka 50 % dari pegawai mendapat upah terletak dalam interval Rp. 79,50 + Rp. 11,25.

Rata-rata Simpangan ?

  • Misalkan data hasil pengamatan berbentuk x1, x2, …, xn dengan rata-rata . Jarak antara tiap data dengan rata-rata =  dan, , ….,  dijumlahkan, lalu dibagi oleh n, maka diperoleh satuan yang disebut rata-rata simpangan atau rata-rata deviasi.
  • Contoh :

Dari data di samping ini, jika dihitung, rata-ratanya = 9. Jumlah harga-harga mutlaknya, yaitu jumlah bilangan-bilangan pada kolam akhir, adalah 6. Maka RS =  ½

 

 

xi

xi -
    8

7

10

11

- 1

- 2

1

2

1

2

1

2

 

 

 

  • Barangkali ukaran simpangan yang paling banyak digunakan dalah Simpangan baku atau deviasi standar. Simpangan baku data sampel disimbul dengan s, sedangkan untuk populasi diberi simbul s (baca : sigma).

Jika kita mempunyai sampel berukuran n dengan data x1, x2, . . . , xn dan rata-rata , maka statistik s dihitung dengan: s =

 

  • Pangkat dua dari simpangan bakudinamakan varians.
  • Simpanganbakus dihitung sebagai berikut

1). Hitung rata-rata

2). Tentukan selisih x1 – , x2 – , . . . , xn -

3). Tentukan kuadrat selsisih tersebut, yakni (x1 – )2, (x2 – )2,  . . . , (xn – )2

4). Kuadrat-kuadrat tersebut dijumlahkan

5). Jumlah tersebut dibagi oleh (n – 1)

6). Lalu diambil akarnya yang positif.

 

  • Cara koding, seperti ketika menghitung rata-rata , l dapat digunakan juga di sini sehingga perhitungan akan lebih sederhana. Rumusnya adalah :

s2 = p2

dengan :

p = panjang kelas interval,

ci = nilai koding, dan n = åfi.

 

  • Contoh :

Untuk data di atas, jika dipakai Rumus IV (9) ini, maka diperlukan tabel berikut :

 

 

 

Kelembaban (x)

fI

xI

cI

fici

fici2

31 – 40

41 -50

51 – 60

61 – 70

71 – 80

81 – 90

90 – 100

1

2

5

15

25

20

12

35,5

45,5

55,5

65,5

75,5

85,5

95,5

- 4

- 3

- 2

- 1

0

1

2

-4

-6

-10

-15

0

20

24

16

18

20

15

0

20

48

Jumlah

80

-

-

    9

137

Dari tabel didapat p = 10, n = åfi = 80, åfici = 9 dan åfi ci2= 137, sehingga didapat varians.

s2 = (10)2

  • Hasilnya sama dengan bila digunakan sebelumnya. sebenarnya yang terakhir didapat dari yang pertama dengan menggunakan transpormasi ci = berdasarkan sifat :

1)     Jika tiap nilai data xi ditambah atau dikurangi dengan bilangan yang sama, maka simpangan baku s tidak berubah.

 

2)     Jika tiap nilai data xi dikalikan dengan bilangan yang sama d, maka simpangan bakunya menjadi hal d kali simpanganbaku yang asal.

 

  • Simpangan baku gabungan. Jika terdapat k buah subsampel :

Subsampel 1 : berukuran n1 dengan simpangan baku s1

Subsampel 2 : berukuran n2 dengan simpangan baku s2

Subsampel k : berukuran nk dengan simpangan baku sk

merupakan sebuah sampel berukuran n = n1 + n2 + …+ nk, maka simpangan baku untuk sampel ini merupakan simpangan baku gabungan yang dihitung dengan rumus :

dengan s2 berarti varians gabungan.

  • Contoh :

Hasil pengamatan pertama terhadap 14 obyek memberikan s = 2,75 sedangkan pengamatan yang kedua kalinya terhadap 23 obyek menghasilkan s = 3,308. Maka, dengan Rumus V(10) untuk k = 2, didapat varians gabungan.

 

s2 =

sehingga simpanganbakugabungan s = 2,96

 

Angka Baku dan Koefisien Variasi ?

  • Satuan simpangan baku. Misalkan sebuah sampel berukuran n dengan data x1, x2, …, xn sedangkan rata-ratanya =  dan simpanganbaku = s., dirumuskan stuan simpanganbaku::

zi =  untuk i = 1, 2, …, n   (1)

 

  • Angka baku atau angka standar adalah distribusi baru, yang mempunyai rata-rata  dan simpangan baku s0 yang ditentukan. dirumus : zi =   (2)

Perhatikan bahwa untuk  = 0 dan s0 = 1, Rumus (2) menjadi Rumus (1), sehingga angka z sering pula disebut angka standar.

 

  • Contoh :

1)     Dalam psikologi, test Wechsler-Bellevue diubah ke dalam angkabakudengan rata-rata = 10 dan simpanganbaku= 3.

 

2)     Test Klasifikasi Umum Tentara di Amerika biasa dijadikan angkabakudengan rata-rata = 100 dan sipanganbaku= 20

 

3)     “Graduate Record Examination” diUSAdinyatakan dalam angka standar dengan rata-rata = 500 dan simpanganbaku= 100

 

  • Angkabakudipakai untuk membandingkan keadaan distribusi sesuatu hal.
    • Contoh :

Seorang mahasiswa mendpat nilai 86 pada ujian akhir matematika dimana rata-rata dan simpanganbakukelompok, masing-masing 78 dan 10. pada ujian akhir statistika dimana rata-rata kelompok 84 dan simpanganbaku18, ia mendapat nilai 92. Dalam mata ujian mana ia mencapai kedudukan yang lebih baik?

 

  • Jawab :

Mahasiswa itu mendapat 0,8 simpangan baku diatas rata-rata nilai matematika dan hanya 0,44 simpangan baku diatas rata-rata nilai statistika. Kedudukannya lebih tinggi dalam hal matematika.

Kalau saja nilai-nilai di atas diubah kedalam angka baku dengan rata-rata 100 dan simpangan baku 20, maka :

untuk matematika z = 100 + 20

untuk statistika      z = 100 + 20

Dalam sistem ini ia lebih unggul dalam matematika.

 

  • Ukuran variasi atau dispersi yang diuraikan dalam bagian-bagian lalu merupakan dispersi absolut. Variasi 5 cm untuk ukuran jarak 100 m dan variasi 5 cm untuk ukuran jarak 20 m jelas mempunyai pengaruh yang berlainan. Untuk mengukur pengaruh demikian dan untuk membandingkan variasi antara nilai-nilai besar dan nilai-nilai kecil, digunakan dispersi relatif yang ditentukan oleh :

Dispersi Relatif

  • Jika untuk dispersi absolut diambil simpangan baku, maka didapat koefisien variasi, disingkat KV. dirumuskan dalam persen. Jadi diperoleh : KV =
  • Koefisien variasi tidak tergantung pada satuan yang digunakan, karenanya dapat dipakai untuk membandingkan variasi relatif beberapa kumpulan data dengan satuan yang berbeda.

 Teori Peluang

 

Peluang semata-mata adalah suatu cara untuk menyatakan kesempatan terjadinya suatu peristiwa. Secara kualitatif peluang dapat dinyatakan dalam bentuk kata sifat untuk menunjukkan kemungkinan terjadinya suatu keadaan seperti “baik”, “lemah”, “kuat”, “miskin”, “sedikit” dan lain sebagainya. Secara kuantitatif, peluang dinyatakan sebagai nilai-nilai numeris baik dalam bentuk pecahan maupun desimal antara 0 dan 1. Peluang sama dengan 0 berarti sebuah peristiwa tidak bisa terjadi sedangkan peluang sama dengan 1 berarti peristiwa tersebut pasti terjadi.

Dalam kehidupan sehari-hari kita sering mendengar perkiraan terjadinya hujan dalam bentuk peluang baik secara kualitatif seperti “kemungkinannya kecil akan terjadi hujan esok hari”, atau dalam bentuk kuantitatif seperti “kemungkinan hujan esok hari sekitar 30%”. Jelas di sini bahwa berbicara mengenai peluang kita dihadapkan dalam suatu kondisi yang tidak pasti, akan tetapi kita hanya diberikan suatu petunjuk atau gambaran seberapa besar keyakinan kita bahwa suatu peristiwa bisa terjadi. Semakin besar nilai peluang yang dihasilkan dari suatu perhitungan maka semakin besar keyakinan kita bahwa peristiwa itu akan terjadi. Dewasa ini, perkiraan tentang akan terjadinya suatu gejala alam bukanlah sesuatu pekerjaan sederhana akan tetapi telah melalui suatu proses perhitungan yang sangat kompleks. Gejala sebuah peristiwa tidak hanya dikaji dari satu sisi saja, misalnya pengaruh waktu, akan tetapi juga melibatkan banyak variabel yang terkait dengan peristiwa tersebut.  Olehkarena itu peluang yang didasarkan pada latar belakang ilmiah bisa memberikan tingkat keyakinan yang lebih tinggi bagi orang yang memerlukannya.

Salah satu cara untuk menyatakan peluang dari suatu peristiwa adalah penggunaan diagram Venn seperti yang dilukiskan dalam gambar 1.  Meski konvensional, tetapi cara ini ternyata lebih mudah dipahami oleh masyarakat luas khususnya bagi orang-orang yang bukan berlatar belakang matematika. Diagram Venn berbentuk persegi panjang untuk menyatakan semua peristiwa yang bisa terjadi dan lingkaran untuk menggambarkan peluang terjadinya peristiwa tertentu. Pengambaran diagram umumnya tidak menggunakan skala yang sesungguhnya, artinya jika peluang terjadi peristiwa hujan 30% bukan berarti bahwa lingkaran yang dimaksud luasnya harus 30% dari luas persegi panjang.

 

 

Peristiwa

Istilah peristiwa yang kita kenal sehari-hari seringkali agak berbeda makna  jika kita berbicara tentang teori peluang. Biasanya orang berpikir bahwa peristiwa adalah suatu kejadian layaknya peristiwa sejarah, gejala-gejala fisik, pesta dan lain sebagainya. Dalam statistika, pengertian ini diperluas dengan memasukkan unsur-unsur kesempatan atau peluang atas terjadinya suatu peristiwa yang didasarkan pada hasil sebuah percobaan atau eksperimen yang dilakukan secara berulang-ulang. Sebagai contoh peristiwa terambilnya kartu As dari setumpuk kartu bridge, jumlah cairan yang disaring dari mesin pengisi, jumlah kendaraan niaga yang melalui jalan protokol, jumlah barang yang cacat dalam satu lot, dan karakteristik lainnya yang secara umum tidak dapat disebutkan sebagai peristiwa.

Untuk keperluan penentuan peluang ada gunanya untuk membagi peristiwa ke dalam dua jenis peristiwa yakni peristiwa sederhana dan peristiwa majemuk. Peristiwa sederhana tidak dapat dibagi lebih lanjut lagi ke dalam komponen-komponen peristiwa, sedangkan peritiwa majemuk selalu memiliki dua atau lebih komponen peristiwa sederhana. Peristiwa “Kartu Sekop” secara definisi adalah peristiwa sederhana karena hanya ada satu jenis kartu sekop dalam setumpuk kartu bridge. Akan tetapi peristiwa “As Sekop” dapat dianggap sebagai peristiwa majemuk karena kartunya haruslah berisikan keduanya yakni kartu As dan kartu Sekop.  Namun definisi ini tergantung dari pandangan si pelaku percobaan. Bisa saja seseorang mengatakan bahwa As Sekop sebagai suatu peristiwa sederhana jika dia mengganggap hal ini sebagai suatu kesatuan. Pembagian jenis peristiwa ini dimaksudkan untuk kemudahan dalam mempelajari teori peluang selanjutnya.

 

Peluang Logis, Empiris dan Subjektif

Untuk peristiwa sederhana, peluang dapat diturunkan baik secara logis, melalui pengamatan empiris maupun secara subjektif. Ketiga bentuk peluang ini mempunyai implikasi yang penting bagi para manajer khususnya dalam proses pengambilan keputusan.

 

Peluang Logis

Semua proses yang bisa diprediksi dan didefinisikan secara lengkap memungkinkan kita secara deduktif menentukan peluang dari hasil yang terjadi. Sayangnya banyak para pebisnis yang tidak masuk dalam kategori ini. Sebenarnya penurunan peluang logis adalah sesuatu yang  berharga untuk dikaji, karena kemampuan memprediksi proses sederhana kerapkali bisa memberikan petunjuk bagi para manajer untuk memperbaiki tindakan-tindakan dalam menghadapi situasi yang kompleks atau tidak dapat diprediksi.

Peluang logis sebenarnya didasarnya pada pertimbangan logika semata, bukan berdasarkan hasil percobaan. Tetapi hasil ini bisa diuji melalui suatu percobaan. Pelemparan dua buah dadu yang merupakan salah satu upaya keras tertua dalam pengembangan teori peluang, bisa diambil sebagai contoh dari penurunan peluang logis ini.  Pada pelemparan dua buah dadu kita tahu bahwa jumlah angka dari kedua dadu yang bisa muncul adalah 2, 3, 4, 5, …, 12 atau ada 11 peristiwa yang berbeda. Berapa peluang munculnya jumlah 5? Meski peristiwa jumlah 5 ada 1 dari 11 peristiwa,  tidak berarti bahwa peluangnya adalah 1/11. Mengapa demikian, karena kita tidak mempertimbangkan bagaimana berbagai peristiwa bisa dihasilkan. Perhatikan Tabel 1 yang merupakan matriks dari semua kombinasi peristiwa yang mungkin terjadi dalam pelemparan dua buah dadu. Dari sini tampak bahwa ada 36 kombinasi yang mungkin. Peristiwa “jumlah 5” adalah hasil dari kombinasi 4 peristiwa. Berarti peluang munculnya jumlah 5 pada pelemparan dua buah dadu adalah 4/36 atau sekitar 0,11.

 

 

Tabel 1.  Empat cara munculnya jumlah 5

        dari pelemparan dua dadu

Angka pada dadu kedua

Angka pada dadu pertama

1

2

3

4

5

6

1

2

3

4

5

6

7

2

3

4

5

6

7

8

3

4

5

6

7

8

9

4

5

6

7

8

9

10

5

6

7

8

9

10

11

6

7

8

9

10

11

12

 

 

Dari contoh ini bisa dibuat definisi peluang logis sebagai berikut :

 

Definisi : Peluang logis dari sebuah peristiwa adalah rasio antara jumlah peristiwa yang bisa terjadi dengan jumlah semua hasil yang bisa terjadi, dimana hasil ini dapat diturunkan dari sebuah eksperimen.

 

Peluang Empiris

Banyak kasus dimana para manajer kurang mengikuti pola-pola peluang seperti yang dijelaskan di atas. Kemungkinan besar hal ini disebabkan tidak dipahaminya apa sebenarnya peluang itu. Untuk kasus seperti ini, yang lebih cocok untuk diacu adalah peluang yang didasarkan pada data pengamatan atau data empiris. Ambil contoh sebagai berikut.

Dalam memproduksi sebanyak 10.000 unit integrated circuit (IC) merek tertentu, diperoleh 25 unit diantaranya cacat (bengkok). Berdasarkan hasil ini maka dapat dikatakan bahwa peluang IC yang cacat adalah 25/10.000 = 0,0025. Nilai ini juga merupakan peluang terambilnya secara acak 1 unit IC yang cacat. Demikian pula rata-rata persentase barang cacat dalam suatu batch diperkirakan sebesar 0,0025.  Jika ada pesanan sebanyak 2.000 unit IC dari perusahaan ini kita berharap 0,0025(2000) = 5 unit IC yang cacat.

Peluang empiris atau ada pula yang menyebutnya sebagai peluang objektif, hanya bisa diperoleh melalui percobaan atau eksperimen yang dilakukan secara berulang-ulang, dalam kondisi yang sama dan diharapkan dalam jumlah yang besar. Dari eksperimen ini akan dihasilkan informasi berupa frekuensi relatif yang sangat berguna khususnya untuk keperluan perbaikan sebuah sistem. Misalnya saja dalam proses pengemasan susu ingin diketahui berapa persen kemasan yang berisikan lebih dari 150 ml. Dari proses pengisian yang cukup lama, maka bisa dibuat distribusi frekuensi volume susu yang terisi kedalam kotak atau susu yang tercecer pada setiap pengisian. Dari sini maka akan akan diperoleh informasi yang sangat berguna untuk melakukan penyesuaian terhadap sistem kerja mesin pengisi susu tersebut.

Meski konsep peluang ini sama seperti peluang logis, akan tetapi peluang empiris lebih mudah dimengerti dan dipahami. Hampir sebagian besar pengguna teori peluang setuju dengan definisi peluang objektif sebagai berikut :

Definisi : Jika sebuah eksperimen dilakukan sebanyak N kali dan sebuah peritiwa A terjadi sebanyak n(A) kali dari N pengulangan ini, maka peluang terjadinya peristiwa A dinyatakan sebagai proporsi terjadinya peristiwa A ini.

 

Peluang Subjektif

Masalah yang umum dihadapi oleh seorang manajer adalah ketika dia tidak mampu memprediksi proses sebuah peristiwa ditambah lagi dengan tidak tersedianya data yang memadai. Untuk memecahkan masalah seperti ini biasanya seorang manajer akan memberikan nilai peluang tertentu kepada peristiwa tersebut yang didasarkan pada faktor-faktor kualitatif, pengalaman dengan situasi yang serupa atau bahkan intuisi.

Peluang subjektif muncul ketika seorang pengambil keputusan dihadapkan oleh pertanyaan-pertanyaan yang tidak bisa dijawab berdasarkan peluang empiris atau frekuensi empiris. Sebagai contoh “Berapa peluang penjualan barang X bulan depan akan melebihi 50.000 unit jika dilakukan perubahan kemasan?”.  Sudah barang tentu eksperimen tentang pengaruh perubahan kemasan terhadap volume penjualan dengan pengulangan yang sangat besar jarang dilakukan bahkan tidak pernah dilakukan. Meski menggunakan data penjualan bulanan bukan sesuatu yang musthail, akan tetapi tidaklah efisien jika perusahaan selalu merubah kemasan setiap bulannya hanya untuk meningkatkan volume penjualan. Olehkarena itu, biasanya seorang manajer menggunakan intuisi atau perasaannya dalam menentukan nilai peluang ini. Jadi tidaklah heran jika seorang manajer menyatakan “peluang terjualnya barang X melebihi 50.000 unit pada bulan depan adalah 0,40”.  Apa artinya pernyataan ini? Secara peluang dapat didefinisikan sebagai berikut.

Definisi : Peluang subjektif adalah sebuah bilangan antara 0 dan 1 yang digunakan seseorang untuk menyatakan perasaan ketidakpastian tentang terjadinya peristiwa tertentu. Peluang 0 berarti seseorang merasa bahwa peristiwa tersebut tidak mungkin terjadi, sedangkan peluang 1 berarti bahwa seseorang yakin bahwa peristiwa tersebut pasti terjadi.

Definisi ini jelas merupakan pandangan subjektif atau pribadi tentang peluang.

Meski peluang subjektif tidak didasarkan pada suatu eksperimen ilmiah, namun penggunaannya tetap bisa dipertanggungjawabkan. Dalam menentukan nilai peluang ini, seorang pengambil keputusan tetap menggunakan prinsip-prinsip logis yang didasarkan pada pengalaman yang diperolehnya. Seorang pengambil keputusan sudah mengetahui secara nyata apa faktor-faktor yang mempengaruhi keputusannya sehingga dia bisa memprediksi apa kira-kira yang bakal terjadi dari keputusan yang diambilnya. Yang masih menjadi pertanyaan adalah apakah peluang subjektif dapat digunakan untuk keperluan analisis statistika selanjutnya. Kelompok statistika objektif atau klasik menolak penggunaan peluang subjektif ini, sebaliknya kelompok Bayes menerimanya. Bukan tujuan kita untuk membahas perdebatan ini, kecuali bahwa penggunaan peluang subjektif tampak sesuai dalam pengambilan keputusan bisnis. Berbeda halnya dengan penelitian kimia, pertanian, farmasi, kedokteran  atau ilmu eksakta lainnya yang memang harus menggunakan peluang objektif sebagai dasar analisisnya. Sampai saat ini pengambilan keputusan berdasarkan peluang subjektif masih dibilang sebagai salah satu tehnik manajerial yang terbaik.

 Ruang Sampel

Dalam tabel 1. dapat kita lihat bahwa jumlah peristiwa yang bisa terjadi dalam pelemparan dua buah dadu paling banyak adalah 36 titik (lebih dikenal sebagai titik sampel). Jika dilakukan pelemparan 1 buah dadu, angka-angka yang mungkin muncul adalah 1, 2, 3, 4, 5 dan 6 atau ada 6 titik sampel. Sebuah keluarga yang baru menikah merencanakan kelahiran 3 orang anak Anggaplah peluang lahirnya anak laki-laki (L) dan anak perempuan (P) adalah sama. Maka susunan anak (Laki-laki=L atau Perempuan=P) yang mungkin adalah LLL, LLP, LPL, LPP, PLL, PLP, PPL atau PPP, ada 8 titik sampel.

Semua hasil yang mungkin dari sebuah eksperimen, seperti yang baru dicontohkan, dalam teori peluang disebut sebagai ruang sampel atau ruang hasil. Jumlah titik yang dianggap sebagai representasi setiap peristiwa dalam ruang sampel ini dinotasikan dengan N,   sedangkan jumlah peristiwa yang sedang diamati dinotasikan dengan huruf  n. Secara formal ruang sampel ini dinyatakan dengan huruf  S. Untuk kemudahan bentuk penulisan ruang sampel ini mengunakan teori himpunan seperti contoh berikut.

Contoh :  S = { LLL, LLP, LPL, LPP, PLL, PLP, PPL, PPP} ® N = 8

S = {1, 2, 3, 4, 5, 6} ® N = 6

Menetapkan ruang sampel adalah langkah awal yang perlu dilakukan sebagai dasar untuk menghitung peluang suatu peristiwa yang ada dalam ruang sampel ini. Peluang terjadinya S adalah sama dengan satu. Ini merupakan konsekuensi logis, karena jumlah titik S adalah jumlah semua peristiwa yang mungkin demikian pula dengan peluangnya. Dalam diagram Venn notasi S ditempatkan pada ujung kanan atas persegi panjang.

Definisi :    Peluang dari ruang sample S, atau P(S) = 1

 

Beberapa Kaidah Mencacah Ruang Sampel

 

Permutasi :

Permutasi adalah susunan yang dibentuk oleh seluruh atau sebagian dari sekumpulan objek.

 

Kaidah 1 :

Banyaknya permutasi dari n objek yang berbeda adalah n ! (baca n faktorial) adalah :

 

            n ! = n × (n-1) × (n-2) …. × (2) × (1)

 

Contoh 1 :

Berapa banyak susunan yang dapat dibentuk oleh huruf abc?

Jawab :

n = 3 à   n ! = 3 × 2 × 1 = 6

yaitu : abc, acb, bac, bca, cab dan cba

Kaidah 2 :

Banyaknya permutasi akibat pengambilan r objek dari n objek yang berbeda adalah :

Contoh 2 :

Dua kupon lotere diambil dari 20 kupon untuk menentukan hadiah pertama dan kedua? Hitunglah banyaknya titik sampel dalam ruang sampelnya,

Jawab :

Banyaknya titik sampel adalah

Contoh 3 :

Berapa banyak cara sebuah regu basket dapat menjadwalkan 3 pertandingan dengan 3 regu lainnya bila semuanya bersedia pada 5 kemungkinan tanggal yang berbeda

Jawab :

Banyaknya kemungkinan jadwal pertandingan adalah

Kaidah 3 :

Banyaknya permutasi yang berbeda dari n objek yang n1 diantaranya berjenis pertama, n2 berjenis kedua, … , nk berjenis ke-k adalah :

Contoh 4 :

Rangkaian lampu hias untuk pohon natal terdiri dari 3 lampu merah, 4 kuning dan 2 biru. Berapa banyak susunan berbeda yang dapat dibuat.

Jawab :

Kaidah 4 :

Banyaknya cara menyekat sekumpulan objek ke dalam r sel, dengan n1 dalam sel pertama, n2 unsur dalam sel kedua demikian seetrusnya adalah :

Contoh 5 :

Sekelompok tamu berjumlah 7 orang akan menginap di sebuah hotel. Kamar yang tersedia adalah 1 kamar triple dan 2 kamar dobel. Berapa banyak cara ke 7 orang tersebut dapat diatur dalam kamar tersebut.

Jawab :

n = 7,  n1 = 3 , n2 = 2 , n3 = 2

Kombinasi

Bagaimana kita mengetahui banyaknya cara mengambil r objek dari n objek tanpa memperhatikan urutannya.

Kaidah 5

Banyaknya kombinasi r objek dari n objek yang berbeda adalah :

Contoh 6 :

Dari 5 orang anggota partai Lidah Tak Bertulang, akan dipilih 3 orang untuk menduduki satu komisi. Ada berapa susunan orang yang dapat dibentuk :

Jawab :

Contoh 7 :

Menyambung soal nomor 6, jika ada partai lain (Partai Loba Omong) yang beranggotakan 4 orang dan 2 diantaranya akan menjadi angota komisi diatas, berapa susunan dari kedua partai tersebut yang dapat disusun.

Jawab :

Untuk Partai Lidah Tak Bertulang ada 10 susunan,

Untuk Partai Loba Omong :

Maka untuk kedua partai tersebut dapat disusun sebanyak 10 6 = 60 susunan. (Rumus ini dikenal sebagai rumus perkalian)

 

 Kaidah-Kaidah Peluang

Sebelum membahas berbagai konsep yang menyangkut teori peluang secara formal, ada baiknya diperkenalkan terlebih dahulu beberapa hal mendasar berikut ini.

Semua nilai peluang yang dibahas dalam analisis statistika selalu dinyatakan dalam bentuk pecahan atau desimal. Sedangkan setiap peristiwa dinyatakan dalam bentuk huruf besar baik menggunakan indeks maupun tidak, seperti A, B, E, … Ai, Bi, ….

Contoh :  A = munculnya angka 1 pada pelemparan 1 buah dadu

E  = jumlah barang yang cacat

K = jumlah konsumen yang menyukai kemasan plastik

 

Peluang Sebuah Peristiwa

Untuk mempermudah penjelasan dalam menghitung peluang ini, ambil contoh tentang sebuah keluarga yang merencanakan untuk memiliki 3 anak seperti yang dijelaskan sebelumnya. Berapakah peluang sebuah keluarga memiliki paling sedikit 2 anak laki-laki?. Untuk menjawabnya perlu diketahui jumlah peristiwa yang bisa terjadi.

Misal E = paling sedikit dua anak laki-laki

Kita tahu : S = { LLL, LLP, LPL, LPP, PLL, PLP, PPL, PPP}

Dari S ini bisa dilihat bahwa E adalah kumpulan dari titik-titik {LLL,LLP, LPL, PLL} dimana jumlah titik sampelnya = 4.

Dengan menggunakan Rumus (1) :

Contoh lain : Berapa peluang munculnya angka ganjil pada pelemparan 1 buah dadu?

Jawab :

S = {1, 2, 3, 4, 5, 6} ® N = 6

Misal : A = peristiwa munculnya angka ganjil

A = {1,3,5) ® n(A) = 3

Peluang Peristiwa Sederhana

Jika peristiwa E menghindarkan terjadinya peristiwa  maka :

Peristiwa ini disebut juga sebagai peristiwa komplementer.

 

Peluang Peristiwa Majemuk

Dalam peristiwa peluang majemuk ada empat jenis peristiwa yang dapat dijelaskan yaitu peristiwa saling eksklusif, inklusif, peristiwa bersyarat, dan peristiwa bebas.

1. Peristiwa Saling Eksklusif

Definisi :

Dua peristiwa A dan B dikatakan saling eksklusif jika kedua peristiwa ini tidak memiliki titik sample yang sama atau tidak ada irisan antara kedua peristiwa.

Peristiwa saling eksklusif menggunakan kaidah penjumlahan untuk perhitungan peluangnya dan menggunakan istilah atau untuk menghubungkan keduanya. Untuk itu berlaku aturan bahwa peluang terjadinya dua peristiwa A atau B (secara notasi himpunan AÈB) adalah jumlah dari peluang tiap peristiwa tersebut. Secara matematis aturan ini dituliskan sebagai berikut :

 

Contoh 9 :

Atas prestasinya seorang manajer pemasaran memperoleh penghargaan untuk mengunjungi 3 negara. Dia memutuskan untuk memilih secara acak 3 dari 5 negara yang tersedia (Amerika, Belanda, China, Denmark dan  Ekuador) dengan  mengambil inisial dari nama negara tersebut. Berapa peluang Amerika dan Belanda selalu terpilih bersamaan, atau China dan Ecuador selalu terpilih, atau Belanda, China dan Denmark?

Jawab :

Ruang sample dari kombinasi pilihan adalah :

 S = {abc, abd, abe, acd, ace, ade, bcd, bce, bde, cde} ® N = 10

Sekarang kita tentukan peristiwa-peristiwa yang dimaksud oleh soal di atas berikut ini

Deskripsi verbal

Peristiwa

n

Amerika dan Belanda selalu terpilih

Chinadan Ekuador selalu terpilih

Belanda,ChinadanDenmarkterpilih

A1 = {abc, abd, abe}

A2 = {ace, bce, cde}

A3 = {bcd}

3

3

1

Karena pemilihan dilakukan secara acak, maka setiap kombinasi pilihan mempunyai nilai peluang yang sama yaitu 1/10 = 0,1. Selain itu, dari ketiga peristiwa di atas tidak ada satu pun yang memiliki titik sample yang sama, ini berarti bahwa peristiwa di atas adalah peristiwa yang saling eksklusif. Dengan menggunakan Rumus  (6.4) diperoleh :

P(A1 atau A2 atau A3)

2. Peristiwa Saling Inklusif

Jika dua peristiwa memiliki titik yang sama atau terdapat irisan antara kedua peristiwa, maka hubungan kedua peristiwa ini disebut saling inklusif. Hubungan inklusif sebenarnya adalah perluasan dari hubungan eksklusif. Dalam peristiwa ini berlaku hubungan : A atau B atau keduanya.

3. Peristiwa Bersyarat

Dalam kehidupan sehari-hari seringkali kita berhubungan dengan peluang dari sebagian ruang sampel. Dengan lain perkataan bahwa kita jarang bekerja dalam ruang lingkup populasi. Peluang seorang konsumen yang dipilih secara acak dari populasi masyarakat berpenghasilan tinggi tidak sama dengan peluang seorang berpenghasilan tinggi yang dipilih secara acak dari populasi konsumen. Peluang seorang konsumen yang menyukai produk A yang dipilih secara acak dari suatu komunitas akan berbeda dengan peluang terpilihnya seorang pemakai produk A  dari komunitas lainnya. Ini adalah beberapa contoh bagaimana kita harus memilah suatu peristiwa yang ada dalam suatu populasi ke dalam subpopulasi. Dalam teori peluang hal semacam ini penting untuk diketahui karena peluang dalam sebagian ruang sampel bisa berbeda dengan peluang pada ruang sampel secara keseluruhan. Subpopulasi didefinisikan secara khusus dalam populasi ini dan peluang-peluang yang berhubungan dengan setiap peristiwa dalam subpopulasi dikenal dengan nama peluang bersyarat.

Peluang bersyarat banyak digunakan dalam dunia bisnis dan ekonomi. Salah satu contohnya adalah penggunaan teorema Bayes yang banyak dipakai dalam teori pengambilam keputusan. Dalam bagian terakhir bab ini akan diberikan sebuah contoh aplikasi peluang bersyarat dalam pengambilan keputusan,

Untuk mempermudah pemahaman tentang peluang bersyarat ini sebaiknya kita ambil contoh berikut ini. Sebuah perusahaan membuka lowongan kerja untuk mengisi pekerjaan sekretaris perusahaan. Ada 100 orang pelamar yang terdiri atas berpengalaman lebih dari tiga tahun dan kurang dari tiga tahun serta dengan status menikah dan tidak menikah. Secara rinci jumlahnya diberikan dalam tabel berikut :

4. Peristiwa Bebas

Pengertian bebas di sini sebenarnya bukanlah bebas dalam pengertian umum akan tetapi bebas secara statistis. Meski pengertian bebas secara umum hampir sama dengan bebas secara statistis akan tetapi pada dasarnya keduanya tidak identik.   Peristiwa A dikatakan bebas dari peristiwa B jika salah satu peristiwa tidak dipengaruhi oleh peristiwa lainnya. Sebagai contoh jika kita mengambil kartu dari setumpuk kartu bridge secara berurutan dimana setiap pengambilan kartu selalu dikembalikan lagi, maka semua hasil dari peristiwa ini dikatakan bebas antara yang satu dengan lainnya. Peluang terambilnya kartu As pada setiap pengambilan akan selalu 4/52. Jika pengambilan kartu tidak dengan pengembalian maka hasil yang diperoleh akan bersifat tidak bebas atau saling tergantung. Peluang terambilnya kartu As pada pengambilan pertama adalah 4/52, pengambilan kedua 3/51, pengambilan ketiga 2/50 dan seterusnya.

 

 

REFERENSI :

MATERI STATISTIK, Drs. BAMBANG S. SOEDIBJO, M.Eng.Sc

METODE STATISTIKA, Ir. M. HIFNI

 

 

MATERI 4

18 March 2012 by arief bachtiar No Comments »

UKURAN LOKASI

Ukuran lokasi terdiri dari :

  • Quartil
  • Desil
  • Persentil

 

 

  • Quartil

Adalah suatu nilai yamg membagi data pada kelompok masing-masing 25% sehingga suatu kelompok data akan mempunyai 3 buah quartile, yaitu

  • Quartil bawah (Q1)
  • Quartil tengah (Q2)
  • Quartil atas (Q3)

Atau dengan kata lain quartil adalah nilai-nilai yang membagi segugus pengamatan menjadi 4 bagian sama besar.

 

  • Desil

Adalah suatu nilai yang membagi sekelompok data menjadi 10 bagian sehingga masing-masing bagian adalah 10%. Nilai nilai itu dilambangkan dengan D1,D2, ….. ,D9.

 

 

  • Persentil

Adalah nilai-nilai yang membagi sederetan data menjadi 100 bagian, sehingga sekelompok data mempunyai 99 persentil. Persentil dapat dilambangkan dengan P1,P2, ….. ,P99.

 

 

Contoh Perhitungan :

 

CONTOH SOAL
Berikut ini adalah data upah dari 13 karyawan dalam ribuan rupiah, yaitu 40, 30, 50, 65, 45, 55, 70, 60, 80, 35, 85, 95, 100, (n = 13). Cari nilai Q1, Q2, dan Q3.
• Pertama-tama data diurutkan dahulu :
X1=30, X2=35, X3=40, X4=45, X5=50, X6=55, X7=60, X8=65, X9=70, X10=80, X11=85, X12=95, X13=100.
• Q1 = nilai yang ke i(n + 1)
4
= nilai ke 1(13 + 1)
4
= nilai ke-3½ (nilai yang ke-3½, berarti
rata-rata dari X3 dan X4)
• Jadi :
Q1 = ½(X3 + X4)
= ½(40 + 45)
= 42,5
• Jadi :
Q2 = nilai yang ke i(n + 1)
4
= nilai ke 2(13 + 1)
4
= nilai ke-7, nilai X7
Jadi :
Q2 = X7 = 60

Q3 = nilai ke 3(13 + 1)
4
= nilai ke-10½ (nilai yang ke-10½
berarti rata-rata dari X10 dan X11
• Jadi :
Q1 = ½(X10 + X11)
= ½(80 + 85)
= 82,5 (nilai kuartil tidak perlu
sesuai dengan nilai data yang
asli)

Berdasarkan contoh pada kuartil (diatas), hitunglah D1, D2, dan D9

PENYELESAIAN
D1 = nilai ke 1(13 + 1)
10
= nilai ke-14/10
= nilai ke-14/10, berarti X1 + 4/10(X2 – X1)
= 30 + 4/10(35 – 30)
= 32
D2 = nilai ke 2(13 + 1)
10
= nilai ke-28/10, berarti X2 + 8/10 (X3 – X2)
= 35 + 8/10 (40 – 35)
= 39
D9 = nilai ke 9(13 + 1)
10
= nilai ke-126/10, berarti X12 + 6/10 (X13 – X12)
= 95 + 6/10 (100 – 95)
= 98

 

Referensi :

Ir. M. Hifni, Metode Statistika, Politeknik Universitas Brawijaya, 1988

Ronald E. Walpole, Pengantar Statistika Edisi ke-3, PT. Gramedia Pustaka Utama, Jakarta

 

 

 

MATERI III

12 March 2012 by arief bachtiar 1 Comment »

MATERI III

TENDENSI SENTRAL (UKURAN PEMUSATAN)

Ukuran tendensi sentral adalah suatu nilai yang dapat mewakili sekelompok data. Pada umumnya nilai tersebut mempunyai kecenderungan terletak ditengah-tengah pada suatu urutan data yang telah tersusun dari data terkecil sampai terbesar. Yang termasuk dalam ukuran tendensi sentral adalah :

  • Nilai rata-rata (mean)
  • Nilai tengah (median)
  • Mode (modus)

 

  • Nilai Rata-rata (mean)

Ada 4 macam nilai rata-rata :

  • nilai rata-rata ukur
  • nilai rata-rata harmonis
  • nilai rata-rata tertimbang
  • nilai rata-rata hitung

Ke empat nilai rata-rata ini semuanya dapat digunakansesuai dengan kebutuhan, misalnya nilai rata-rata ukur digunakan untuk menghitung trend kenaikan penduduk. Rata-rata harmonis umumnya digunakan untuk menghitung kecepatan rata-rata. Rata-rata tertimbang banyak digunakan dalam dunia pendidikan terutama dalam menghitung indeks prestasi. Rata-rata hitung biasanya digunakan untuk membandingkan nilai dari suatu data dengan kelompok data yang lain.

 

  • Nilai Tengah (median)

Median adalah suatu nilai yang membagi 2 bagian dari suatu urutan data, sehingga banyaknya pengamatan dari masing-masing bagian tersebut sama.

 

  • Mode (modus)

Modus adalah nilai yang terbanyak dalam suatu kumpulan data. Dengan kata lain modus adalah nilai dari suatu kumpulan data yang paling sering muncul.

 

Contoh Perhitungan :

Carilah mean, median dan modus untuk daftar nilai berikut:

13, 18, 13, 14, 13, 16, 14, 21, 13

Mean adalah rata-rata biasa, maka:
(13 + 18 + 13 + 14 + 13 + 16 + 14 + 21 + 13) ÷ 9 = 15

Median adalah nilai tengah, jadi aku harus menulis ulang daftar dalam rangka:

13, 13, 13, 13, 14, 14, 16, 18, 21

Ada sembilan nomor dalam daftar, jadi yang di tengah akan menjadi (9 + 1) ÷ 2 = 10 ÷ 2 = 5 nomor:

13, 13, 13, 13, 14, 14, 16, 18, 21

Jadi median adalah 14

Modus yang digunakan adalah jumlah yang diulangi lebih sering daripada yang lainnya, sehingga 13 adalah modus.

Mean : 15
median: 14
Modus: 13

 

 

UKURAN LOKASI

Ukuran lokasi terdiri dari :

  • Quartil
  • Desil
  • Persentil

 

  • Quartil

Adalah suatu nilai yamg membagi data pada kelompok masing-masing 25% sehingga suatu kelompok data akan mempunyai 3 buah quartile, yaitu

  • Quartil bawah (Q1)
  • Quartil tengah (Q2)
  • Quartil atas (Q3)

Atau dengan kata lain quartil adalah nilai-nilai yang membagi segugus pengamatan menjadi 4 bagian sama besar.

 

  • Desil

Adalah suatu nilai yang membagi sekelompok data menjadi 10 bagian sehingga masing-masing bagian adalah 10%. Nilai nilai itu dilambangkan dengan D1,D2, ….. ,D9.

 

  • Persentil

Adalah nilai-nilai yang membagi sederetan data menjadi 100 bagian, sehingga sekelompok data mempunyai 99 persentil. Persentil dapat dilambangkan dengan P1,P2, ….. ,P99.

 

 

Contoh Perhitungan :

Berikut ini adalah data upah dari 13 karyawan dalam ribuan rupiah, yaitu 40, 30, 50, 65, 45, 55, 70, 60, 80, 35, 85, 95, 100, (n = 13). Cari nilai Q1, Q2, dan Q3.
• Pertama-tama data diurutkan dahulu :
X1=30, X2=35, X3=40, X4=45, X5=50, X6=55, X7=60, X8=65, X9=70, X10=80, X11=85, X12=95, X13=100.
• Q1 = nilai yang ke i(n + 1)
4
= nilai ke 1(13 + 1)
4
= nilai ke-3½ (nilai yang ke-3½, berarti
rata-rata dari X3 dan X4)
• Jadi :
Q1 = ½(X3 + X4)
= ½(40 + 45)
= 42,5
• Jadi :
Q2 = nilai yang ke i(n + 1)
4
= nilai ke 2(13 + 1)
4
= nilai ke-7, nilai X7
Jadi :
Q2 = X7 = 60

Q3 = nilai ke 3(13 + 1)
4
= nilai ke-10½ (nilai yang ke-10½
berarti rata-rata dari X10 dan X11
• Jadi :
Q1 = ½(X10 + X11)
= ½(80 + 85)
= 82,5 (nilai kuartil tidak perlu
sesuai dengan nilai data yang
asli)

Berdasarkan contoh pada kuartil (diatas), hitunglah D1, D2, dan D9

PENYELESAIAN
D1 = nilai ke 1(13 + 1)
10
= nilai ke-14/10
= nilai ke-14/10, berarti X1 + 4/10(X2 – X1)
= 30 + 4/10(35 – 30)
= 32
D2 = nilai ke 2(13 + 1)
10
= nilai ke-28/10, berarti X2 + 8/10 (X3 – X2)
= 35 + 8/10 (40 – 35)
= 39
D9 = nilai ke 9(13 + 1)
10
= nilai ke-126/10, berarti X12 + 6/10 (X13 – X12)
= 95 + 6/10 (100 – 95)
= 98

 

Referensi :

Ir. M. Hifni, Metode Statistika, Politeknik Universitas Brawijaya, 1988

Ronald E. Walpole, Pengantar Statistika Edisi ke-3, PT. Gramedia Pustaka Utama, Jakarta

 

 

MATERI II

4 March 2012 by arief bachtiar 1 Comment »

MATERI II

  • PEMILIHAN SAMPEL

 

  • Sampel Random

Ada kalanya sampel random ini juga disebut sampel random sederhana (sampel random simple). Cara ini dapat digunakan a[abila populasi dianggap semua unsur yang terdapat dalam populasi tersebut memiliki probabilitas (peluang) yang sama untuk dipilih. Suatu contoh :

v  Pengambilan adukan canpuran beton untuk dibuat sampel kubus.

v  Pengawasan kualitas dari satu macam jenis barang produksi dari suatu mesin produksi.

  • Sampel Sistematis

Sebuah sampel dianggap sistemastis apabila proses pengambilannya dilakukan secara sistematis dari populasinya. Sebagai contoh apabila kita ingin menyelidiki lapisan tanah, dimana sampel-sampel yang kita ambil pada kedalaman tertentu sehingga secara toeritis apabila dibeberapa tempat yang kita ambil dan dalam kedalaman tertentu kita ambil dapat memproyeksikan hasil yang kita peroleh.

  • Sampel Luas

Sampel luas atau kelompok biasanya diambil dari sekelompok areal tertentu, jadi prosedur pengambilannya berdasarkan lokasi geografis. Suatu contoh pengambilan data pada pengukuran curah hujan, sensus pertanian yang diambil secara random terhadap Provinsi yang masing-masing populasi dipilih sampel-sampel kabupaten dan seterusnya sampai tingkat desa.

  • Sampel Bertingkat

Pengambilan sampel bertingkat dapat dilakukan apabila populasi dapat terbagi dalam tingkatan-tingkatan sehingga pengambilan sampel disesuaikan dengan jumlah tingkatan (stratum). Contohnya bila kita mengajukan pendapatan umum, atau kita ingin menyelidiki pengeluaran rata-rata dari penduduk kita dapat menggolongkan pada tingkat penghasilan dan sebagainya.

  • Sampel Kuota

Dalam mengambil data dari sampel kadang kita harus memperhitungkan dan memilih terlebih dahulu dari tingkatan-tingkatan (stratum) tertentu, misalnya menentukan tingkat devaluasi sampel-sampel yang diambil dibatasi pada beberapa perusahaan yang dianggap mempunyai penyebaran saham, termasuk 3 besar dan sebagainya.

 

  • TABEL

Tabel berfungsi untuk menyajikan data survey atau hasil penelitian dan untuk mempermudah pengolahan data. Tabel juga memberikan informasi  dan menjadi media informasi bagi pembacanya. Secara umum, Tabel dibagi menjadi :

  1. Tabel Referensi

Merupakan pembagian suatu bentuk penyajian data yang dapat menjadi sumber informasi bagi pembacanya. Tabel ini disusun secara rinci dan khusus untuk kepentingan referensi. Contoh table periodik unsur

  1. Tabel Ikhtisar

Merupakan bentuk penyajian beberapa data hasil pengumpulan atau pengukuran dari suatu kelompk jenis data tertentu sehingga dapat dibandingkan dengan data hasil lain. Contoh table ikhtisar sebagai berikut

 

 

 

  1. Tabel umum adalah bentuk penyajian data yang dikumpulkan dari berbagai macam jenis data yang dituliskan dalam suatu monogram. Biasanya informasi ini dikumpulka berdasarkan sensus sehingga setia data itu akan berubah sesuai perkembangan. Contoh table umum seperti berikut

Tabel Sensus Penduduk Indonesia

  1. Tabel Distribusi

Adalah bentuk penataan data yang dibuat oleh pengolah data berdasarkan hasil-hasil data yang dkumpulkan oleh penelitian tersebut yang bertujuan untuk memperolehgambaran karakteristik (sifat-sifat) data yang akan diolahnya.

 

Tabel Distribusi Progres Pekerjaan

  • GRAFIK

Grafik adalah merupakan penyajian data daam bentuk gambar. Penyajian dalam bentuk ini walaupun kurang teliti dibandingkan dengan table tetapi lebih menarik dan lebih praktis dari pembacanya. Contoh grafik adalah :

v  DIAGRAM GARIS

 

v  DIAGRAM LINGKARAN

 

 

v  DIAGRAM BATANG

 

 

 

 

v  HISTOGRAM

 

v  POLIGON FREKUENSI

 

v  OGIVE

 

 

 

  • PANCARAN FREKUENSI (DISTRIBUSI FREKUENSI)

Hasil pengukuran yang kita peroleh disebut dengan data mentah. Besarnya hasil pengukuran yang kita peroleh biasanya bervariasi. Apabila kita perhatikan data mentah tersebut, sangatlah sulit bagi kita untuk menarik kesimpulan yang berarti. Untuk memperoleh gambaran yang baik mengenai data tersebut, data mentah tersebut perlu di olah terlebih dahulu.

Pada saat kita dihadapkan pada sekumpulan data yang banyak, seringkali membantu untuk mengatur dan merangkum data tersebut dengan membuat tabel yang berisi daftar nilai data yang mungkin berbeda (baik secara individu atau berdasarkan pengelompokkan) bersama dengan frekuensi yang sesuai, yang mewakili berapa kali nilai-nilai tersebut terjadi. Daftar sebaran nilai data tersebut dinamakan dengan Daftar Frekuensi atau Sebaran Frekuensi (Distribusi Frekuensi).

Dengan demikian, distribusi frekuensi adalah daftar nilai data (bisa nilai individual atau nilai data yang sudah dikelompokkan ke dalam selang interval tertentu) yang disertai dengan nilai frekuensi yang sesuai.

Pengelompokkan data ke dalam beberapa kelas dimaksudkan agar ciri-ciri penting data tersebut dapat segera terlihat. Daftar frekuensi ini akan memberikan gambaran yang khas tentang bagaimana keragaman data. Sifat keragaman data sangat penting untuk diketahui, karena dalam pengujian-pengujian statistik selanjutnya kita harus selalu memperhatikan sifat dari keragaman data. Tanpa memperhatikan sifat keragaman data, penarikan suatu kesimpulan pada umumnya tidaklah sah.

Sebagai contoh, perhatikan contoh data pada Tabel 1. Tabel tersebut adalah daftar nilai ujian Matakuliah Statistik dari 80 Mahasiswa (Sudjana, 19xx).

Tabel 1. Daftar Nilai Ujian Matakuliah Statistik

79 49 48 74 81 98 87 80
80 84 90 70 91 93 82 78
70 71 92 38 56 81 74 73
68 72 85 51 65 93 83 86
90 35 83 73 74 43 86 88
92 93 76 71 90 72 67 75
80 91 61 72 97 91 88 81
70 74 99 95 80 59 71 77
63 60 83 82 60 67 89 63
76 63 88 70 66 88 79 75

Sangatlah sulit untuk menarik suatu kesimpulan dari daftar data tersebut. Secara sepintas, kita belum bisa menentukan berapa nilai ujian terkecil atau terbesar. Demikian pula, kita belum bisa mengetahui dengan tepat, berapa nilai ujian yang paling banyak atau berapa banyak mahasiswa yang mendapatkan nilai tertentu. Dengan demikian, kita harus mengolah data tersebut terlebih dulu agar dapat memberikan gambaran atau keterangan yang lebih baik.

Bandingkan dengan tabel yang sudah disusun dalam bentuk daftar frekuensi (Tabel 2a dan Tabel 2b). Tabel 2a merupakan daftar frekuensi dari data tunggal dan Tabel 2b merupakan daftar frekuensi yang disusun dari data yang sudah di kelompokkan pada kelas yang sesuai dengan selangnya. Kita bisa memperoleh beberapa informasi atau karakteristik dari data nilai ujian mahasiswa.

Tabel 2a.

No Nilai Ujian   Frekuensi
xi   fi
1 35   1
2 36   0
3 37   0
4 38   1
: :   :
16 70   4
17 71   3
: :   1
42 98   1
43 99   1
Total   80

Pada Tabel 2a, kita bisa mengetahui bahwa ada 80 mahasiswa yang mengikuti ujian, nilai ujian terkecil adalah 35 dan tertinggi adalah 99. Nilai 70 merupakan nilai yang paling banyak diperoleh oleh mahasiswa, yaitu ada 4 orang, atau kita juga bisa mengatakan ada 4 mahasiswa yang memperoleh nilai 70, tidak ada satu pun mahasiswa yang mendapatkan nilai 36, atau hanya satu orang mahasiswa yang mendapatkan nilai 35.

Tabel 2b.

Kelas ke- Nilai Ujian Frekuensi fi
1 31 – 40 2
2 41 – 50 3
3 51 – 60 5
4 61 – 70 13
5 71 – 80 24
6 81 – 90 21
7 91 – 100 12
Jumlah 80

Tabel 2b merupakan daftar frekuensi dari data yang sudah dikelompokkan. Daftar ini merupakan daftar frekuensi yang sering digunakan. Kita sering kali mengelompokkan data contoh ke dalam selang-selang tertentu agar memperoleh gambaran yang lebih baik mengenai karakteristik dari data. Dari daftar tersebut, kita bisa mengetahui bahwa mahasiswa yang mengikuti ujian ada 80, selang kelas nilai yang paling banyak diperoleh oleh mahasiswa adalah sekitar 71 sampai 80, yaitu ada 24 orang, dan seterusnya. Hanya saja perlu diingat bahwa dengan cara ini kita bisa kehilangan identitas dari data aslinya. Sebagai contoh, kita bisa mengetahui bahwa ada 2 orang yang mendapatkan nilai antara 31 sampai 40. Meskipun demikian, kita tidak akan tahu dengan persis, berapa nilai sebenarnya dari 2 orang mahasiswa tersebut, apakah 31 apakah 32 atau 36 dst.

 

Ada beberapa istilah yang harus dipahami terlebih dahulu dalam menyusun daftar frekuensi.

Tabel 3.

Kelas ke- Selang
Nilai Ujian
Batas Kelas Nilai Kelas
(xi)
Frekuensi
(fi)
1 31 – 40 30.5 – 40.5 35.5 2
2 41 – 50 40.5 – 50.5 45.5 3
3 51 – 60 50.5 – 60.5 55.5 5
4 61 – 70 60.5 – 70.5 65.5 13
5 71 – 80 70.5 – 80.5 75.5 24
6 81 – 90 80.5 – 90.5 85.5 21
7 91 – 100 90.5 – 100.5 95.5 12
Jumlah 80

Range : Selisih antara nilai tertinggi dan terendah. Pada contoh ujian di atas, Range = 99 – 35 = 64

Batas bawah kelas: Nilai terkecil yang berada pada setiap kelas. (Contoh: Pada Tabel 3 di atas, batas bawah kelasnya adalah 31, 41, 51, 61, …, 91)

Batas atas kelas: Nilai terbesar yang berada pada setiap kelas. (Contoh: Pada Tabel 3 di atas, batas bawah kelasnya adalah 40, 50, 60, …, 100)

Batas kelas (Class boundary): Nilai yang digunakan untuk memisahkan antar kelas, tapi tanpa adanya jarak antara batas atas kelas dengan batas bawah kelas berikutnya. Contoh: Pada kelas ke-1, batas kelas terkecilnya yaitu 30.5 dan terbesar 40.5. Pada kelas ke-2, batas kelasnya yaitu 40.5 dan 50.5. Nilai pada batas atas kelas ke-1 (40.5) sama dengan dan merupakan nilai batas bawah bagi kelas ke-2 (40.5). Batas kelas selalu dinyatakan dengan jumlah digit satu desimal lebih banyak daripada data pengamatan asalnya. Hal ini dilakukan untuk menjamin tidak ada nilai pengamatan yang jatuh tepat pada batas kelasnya, sehingga menghindarkan keraguan pada kelas mana data tersebut harus ditempatkan. Contoh: bila batas kelas di buat seperti ini:

Kelas ke-1 : 30 – 40

Kelas ke-2 : 40 – 50

dst.

Apabila ada nilai ujian dengan angka 40, apakah harus ditempatkan pada kelas-1 ataukah kelas ke-2?

Panjang/lebar kelas (selang kelas): Selisih antara dua nilai batas bawah kelas yang berurutan atau selisih antara dua nilai batas atas kelas yang berurutan atau selisih antara nilai terbesar dan terkecil batas kelas bagi kelas yang bersangkutan. Biasanya lebar kelas tersebut memiliki lebar yang sama. Contoh:

lebar kelas = 41 – 31 = 10 (selisih antara 2 batas bawah kelas yang berurutan) atau

lebar kelas = 50 – 40 = 10 (selisih antara 2 batas atas kelas yang berurutan) atau

lebar kelas = 40.5 – 30.5 = 10. (selisih antara nilai terbesar dan terkecil batas kelas pada kelas ke-1)

Nilai tengah kelas: Nilai kelas merupakan nilai tengah dari kelas yang bersangkutan yang diperoleh dengan formula berikut: ½ (batas atas kelas+batas bawah kelas). Nilai ini yang dijadikan pewakil dari selang kelas tertentu untuk perhitungan analisis statistik selanjutnya. Contoh: Nilai kelas ke-1 adalah ½(31+40) = 35.5

Banyak kelas: Sudah jelas! Pada tabel ada 7 kelas.

Frekuensi kelas: Banyaknya kejadian (nilai) yang muncul pada selang kelas tertentu. Contoh, pada kelas ke-1, frekuensinya = 2. Nilai frekuensi = 2 karena pada selang antara 30.5 – 40.5, hanya ada 2 angka yang muncul, yaitu nilai ujian 31 dan 38.

Teknik pembuatan Tabel Distribusi Frekuensi (TDF)

Distribusi frekuensi dibuat dengan alasan berikut:

  • kumpulan data yang besar dapat diringkas
  • kita dapat memperoleh beberapa gambaran mengenai karakteristik data, dan
  • merupakan dasar dalam pembuatan grafik penting (seperti histogram).

Banyak software (teknologi komputasi ) yang bisa digunakan untuk membuat tabel distribusi frekuensi secara otomatis. Meskipun demikian, di sini tetap akan diuraikan mengenai prosedur dasar dalam membuat tabel distribusi frekuensi.

Langkah-langkah dalam menyusun tabel distribusi frekuensi:

  • Urutkan data, biasanya diurutkan dari nilai yang paling kecil
    • Tujuannya agar range data diketahui dan mempermudah penghitungan frekuensi tiap kelas!
  • Tentukan range (rentang atau jangkauan)
    • Range = nilai maksimum – nilai minimum
  • Tentukan banyak kelas yang diinginkan. Jangan terlalu banyak/sedikit, berkisar antara 5 dan 20, tergantung dari banyak dan sebaran datanya.
    • Aturan Sturges:
    • Banyak kelas = 1 + 3.3 log n, dimana n = banyaknya data
  • Tentukan panjang/lebar kelas interval (p)
    • Panjang kelas (p) = [rentang]/[banyak kelas]
  • Tentukan nilai ujung bawah kelas interval pertama

Pada saat menyusun TDF, pastikan bahwa kelas tidak tumpang tindih sehingga setiap nilai-nilai pengamatan harus masuk tepat ke dalam satu kelas. Pastikan juga bahwa tidak akan ada data pengamatan yang tertinggal (tidak dapat dimasukkan ke dalam kelas tertentu). Cobalah untuk menggunakan lebar yang sama untuk semua kelas, meskipun kadang-kadang tidak mungkin untuk menghindari interval terbuka, seperti ” ≥ 91 ” (91 atau lebih). Mungkin juga ada kelas tertentu dengan frekuensi nol.

Contoh:

Kita gunakan prosedur di atas untuk menyusun tabel distribusi frekuensi nilai ujian mahasiswa (Tabel 1).

Berikut adalah nilai ujian yang sudah diurutkan:

35  38  43  48  49  51  56  59  60  60

61  63  63  63  65  66  67  67  68  70

70  70  70  71  71  71  72  72  72  73

73  74  74  74  74  75  75  76  76  77

78  79  79  80  80  80  80  81  81  81

82  82  83  83  83  84  85  86  86  87

88  88  88  88  89  90  90  90  91  91

91  92  92  93  93  93  95  97  98  99

 

 

 

 

 

 

 

 

 

 

2. Range:

[nilai tertinggi – nilai terendah] = 99 – 35 = 64

 

3. Banyak Kelas:

Tentukan banyak kelas yang diinginkan.

Apabila kita lihat nilai Range = 64, mungkin banyak kelas

sekitar 6 atau 7.

Sebagai latihan, kita gunakan aturan Sturges.

banyak kelas = 1 + 3.3 x log(n)

= 1 + 3.3 x log(80)

= 7.28 ≈ 7

 

4. Panjang Kelas:

Panjang Kelas = [range]/[banyak kelas]

= 64/7

= 9.14 ≈ 10

(untuk memudahkan dalam penyusunan TDF)

 

5. Tentukan nilai batas bawah kelas pada kelas pertama.

Nilai ujian terkecil = 35

Penentuan nilai batas bawah kelas bebas saja,

asalkan nilai terkecil masih masuk ke dalam kelas tersebut.

Misalkan: apabila nilai batas bawah yang kita pilih adalah 26,

maka interval kelas pertama: 26 – 35, nilai 35 tepat jatuh

di batas atas kelas ke-1. Namun apabila kita pilih

nilai batas bawah kelas 20 atau 25, jelas nilai terkecil, 35,

tidak akan masuk ke dalam kelas tersebut.

Namun untuk kemudahan dalam penyusunan dan pembacaan TDF,

tentunya juga untuk keindahan, he2.. lebih baik kita memilih

batas bawah 30 atau 31.  Ok, saya tertarik dengan angka 31,

sehingga batas bawahnya adalah 31.

 

Dari prosedur di atas, kita dapat info sebagai berikut:

Banyak kelas       : 7

Panjang kelas      : 10

Batas bawah kelas  : 31

Selanjutnya kita susun TDF:

Form TDF:

————————————————————

Kelas ke- | Nilai Ujian | Batas Kelas | Turus | Frekuensi

————————————————————

1        31 -

2        41 -

3        51 -

:        :  -

6        81 -

7        91 -

————————————————————

Jumlah

————————————————————

 

 

 

 

 

 

 

 

 

 

 

Tabel berikut merupakan tabel yang sudah dilengkapi

Kelas ke- Nilai Ujian Batas Kelas Frekuensi
(fi)
1 31 – 40 30.5 – 40.5 2
2 41 – 50 40.5 – 50.5 3
3 51 – 60 50.5 – 60.5 5
4 61 – 70 60.5 – 70.5 13
5 71 – 80 70.5 – 80.5 24
6 81 – 90 80.5 – 90.5 21
7 91 – 100 90.5 – 100.5 12
Jumlah 80

atau dalam bentuk yang lebih ringkas:

 

Kelas ke- Nilai Ujian Frekuensi
(fi)
1 31 – 40 2
2 41 – 50 3
3 51 – 60 5
4 61 – 70 13
5 71 – 80 24
6 81 – 90 21
7 91 – 100 12
Jumlah 80

Distribusi Frekuensi Relatif dan Kumulatif

Variasi penting dari distribusi frekuensi dasar adalah dengan menggunakan nilai frekuensi relatifnya, yang disusun dengan membagi frekuensi setiap kelas dengan total dari semua frekuensi (banyaknya data). Sebuah distribusi frekuensi relatif mencakup batas-batas kelas yang sama seperti TDF, tetapi frekuensi yang digunakan bukan frekuensi aktual melainkan frekuensi relatif. Frekuensi relatif kadang-kadang dinyatakan sebagai persen.

Frekuensi relatif =

Contoh: frekuensi relatif kelas ke-1:

fi = 2; n = 80

Frekuensi relatif = 2/80 x 100% = 2.5

Kelas ke- Nilai Ujian Frekuensi relatif (%)
1 31 – 40 2.50
2 41 – 50 3.75
3 51 – 60 6.25
4 61 – 70 16.25
5 71 – 80 30.00
6 81 – 90 26.25
7 91 – 100 15.00
Jumlah 100.00

 

 

Distribusi Frekuensi kumulatif

Variasi lain dari distribusi frekuensi standar adalah frekuensi kumulatif. Frekuensi kumulatif untuk suatu kelas adalah nilai frekuensi untuk kelas tersebut ditambah dengan jumlah frekuensi semua kelas sebelumnya.

Perhatikan bahwa kolom frekuensi selain label headernya diganti dengan frekuensi kumulatif kurang dari, batas-batas kelas diganti dengan “kurang dari” ekspresi yang menggambarkan kisaran nilai-nilai baru.

Nilai Ujian Frekuensi kumulatif kurang dari
kurang dari 30.5 0
kurang dari 40.5 2
kurang dari 50.5 5
kurang dari 60.5 10
kurang dari 70.5 23
kurang dari 80.5 47
kurang dari 90.5 68
kurang dari 100.5 80

atau kadang disusun dalam bentuk seperti ini:

Nilai Ujian Frekuensi kumulatif kurang dari
kurang dari 41 2
kurang dari 51 5
kurang dari 61 10
kurang dari 71 23
kurang dari 81 47
kurang dari 91 68
kurang dari 101 80

Variasi lain adalah Frekuensi kumulatif lebih dari. Prinsipnya hampir sama dengan prosedur di atas.

 

Sumber :

  1. Id.wikipedia.com/statistik
  2. Ir. HM Hifni, Metode Statistika, Universitas Brawijaya
  3. http://smartstat.wordpress.com/2010/03/29/distribusi-frekuensi/
  4.  Kimia Fisika Matematika on Facebook

 

 

MATERI I

24 February 2012 by arief bachtiar No Comments »

MATERI I

PENDAHULUAN

Pengolahan informasi statistik mempunyai sejarah jauh kebelakang sejak awal peradaban manusia. Pada awal zaman masehi, bangsa-bangsa mengumpulkan data statistik untuk mendapat informasi deskriptif mengenai banyak hal, misalnya pajak, perang, hasil pertanian dan bahkan pertandingan atletik. Pada masa kini dengan berkembangnya teori peluang, kita dapat menggunakan berbagai metode statistik yang memungkinkan kita menerawang jauh diluar data yang kita kumpulkan dan masuk kedalam wilayah pengambilan keputusan melalui generalisasi dan peramalan. (Sumber : Pengantar Statistika edisi ke-3, Ronald E. Walpole, halaman 1)

DEFINISI

  • Statistika adalah ilmu yang mempelajari bagaimana merencanakan, mengumpulkan, menganalisis, menginterpretasi, dan mempresentasikan data. Singkatnya, statistika adalah ilmu yang berkenaan dengan data. Istilah ‘statistika’ (bahasa inggris : statistics) berbeda dengan ‘statistik’ (statistic). Statistika merupakan ilmu yang berkenaan dengan data, sedang statistik adalah data, informasi, atau hasil penerapan algoritma statistika pada suatu data. Dari kumpulan data, statistika dapat digunakan untuk menyimpulkan atau mendeskripsikan data; ini dinamakan statistika deskriptif. Sebagian besar konsep dasar statistika mengasumsikan teori probabilitas. Beberapa istilah statistika antara lain: populasi, sampel, unit sampel dan  probabilitas. (Sumber : Wikipedia Bahasa Indonesia, Ensiklopedia Bebas)
  • Dengan kata lain, statistik adalah data atau segala informasi yang bisa kita dapatkan dari data, dalam pengertian yang lebih luas statistik artinya kumpulan data dalam bentuk angka maupun bukan angka yang disusun dalam bentuk tabel dan atau diagram  yang menggambarkan suatu masalah tertentu. (Sumber : EDU-CORNER , Santhi Rakhmawati, S.Pd)
  •  Sedangkan statistika adalah pengetahuan yang berkaitan dengan metode, teknik, atau cara untuk mengumpulkan data, mengolah data, menyajikan data, menganalisis data, dan menarik kesimpulan atau interpretasi data. . (Sumber : EDU-CORNER , Santhi Rakhmawati, S.Pd)
  •  Peluang atau  kebolehjadian atau dikenal juga sebagai probabilitas adalah cara untuk mengungkapkan pengetahuan atau kepercayaan bahwa suatu kejadian akan berlaku atau telah terjadi. Konsep ini telah dirumuskan dengan lebih ketat dalam matematika dan kemudian digunakan secara lebih luas dalam tidak hanya dalam matematika atau statistika, tapi juga keuangan, sains dan filsafat. (Sumber : Wikipedia Bahasa Indonesia, Ensiklopedia Bebas)

 

KONSEP DASAR

Dalam mengaplikasikan statistika terhadap permasalahan sains, industri, atau sosial, pertama-tama dimulai dari mempelajari populasi. Makna populasi dalam statistika dapat berarti populasi benda hidup, benda mati, ataupun benda abstrak. Populasi juga dapat berupa pengukuran sebuah proses dalam waktu yang berbeda-beda, yakni dikenal dengan istilah deret waktu.

Melakukan pendataan (pengumpulan data) seluruh populasi dinamakan sensus. Sebuah sensus tentu memerlukan waktu dan biaya yang tinggi. Untuk itu, dalam statistika seringkali dilakukan pengambilan sampel (sampling), yakni sebagian kecil dari populasi, yang dapat mewakili seluruh populasi. Analisis data dari sampel nantinya digunakan untuk menggeneralisasi seluruh populasi.

Jika sampel yang diambil cukup representatif, inferensial (pengambilan keputusan) dan simpulan yang dibuat dari sampel dapat digunakan untuk menggambarkan populasi secara keseluruhan. Metode statistika tentang bagaimana cara mengambil sampel yang tepat dinamakan teknik sampling.

Analisis statistik banyak menggunakan probabilitas sebagai konsep dasarnya hal terlihat banyak digunakannya uji statistika yang mengambil dasar pada sebaran peluang. Sedangkan matematika statistika merupakan cabang dari matematika terapan yang menggunakan teori probabilitas dan analisa matematika untuk mendapatkan dasar-dasar teori statistika.

Ada dua macam statistika, yaitu statistika deskriptif dan statistika inferensial. Statistika deskriptif berkenaan dengan deskripsi data, misalnya dari menghitung rata-rata dan varians dari data mentah; mendeksripsikan menggunakan tabel-tabel atau grafik sehingga data mentah lebih mudah “dibaca” dan lebih bermakna. Sedangkan statistika inferensial lebih dari itu, misalnya melakukan pengujian hipotesis, melakukan prediksi observasi masa depan, atau membuat model regresi.

Probabilitas suatu kejadian adalah angka yang menunjukkan kemungkinan terjadinya suatu kejadian. Nilainya di antara 0 dan 1. Kejadian yang mempunyai nilai probabilitas 1 adalah kejadian yang pasti terjadi atau sesuatu yang telah terjadi. Misalnya matahariyang masih terbit di timur sampai sekarang. Sedangkan suatu kejadian yang mempunyai nilai probabilitas 0 adalah kejadian yang mustahil atau tidak mungkin terjadi. Misalnya seekor kambing melahirkan seekor sapi.

Probabilitas/Peluang suatu kejadian A terjadi dilambangkan dengan notasi P(A), p(A), atau Pr(A). Sebaliknya, probabilitas [bukan A] atau komplemen A, atau probabilitas suatu kejadian A tidak akan terjadi, adalah 1-P(A). Sebagai contoh, peluang untuk tidak munculnya mata dadu enam bila sebuah dadu bersisi enam digulirkan adalah .

(Sumber : Wikipedia Bahasa Indonesia, Ensiklopedia Bebas)

 

HUBNGAN STATISTIK DAN PROBABILITAS

 Metode Statistik

Adalah prosedur yang digunakan dalam pengumpulan, penyajian, analisis dan penafsiran data. . (Sumber : Pengantar Statistika edisi ke-3, Ronald E. Walpole, halaman 2)

Teori Probabilitas

Probabilitas – peluang adalah suatu angka yang menunjukan tingkat keyakinan tentang terjadinya suatu peristiwa. Probabilitas merupakan bagian dari ilmu statistik

 

 

 

JENIS-JENIS STATISTIKA

Berdasarkan jenisnya statistika dibagi menjadi dua yaitu:

1.    Statistika deskriptif, metode yang berkaitan dengan pengumpulan dan penyajian suatu gugus data sehingga memberikan informasi yang berguna.

2.    Statistika inference, mencakup semua metode yang berhubungan dengan analisis sebagian data untuk kemudian sampai pada peramalan atau penarikan kesimpulan mengenai keseluruhan gugus data induknya. . (Sumber : Pengantar Statistika edisi ke-3, Ronald E. Walpole)

 

 

CONTOH DATA STATISTIKA

 

DIAGRAM GARIS

 

 

 

DIAGRAM LINGKARAN

 

DIAGRAM BATANG

 

 

 

 

HISTOGRAM

 

POLIGON FREKUENSI

 

OGIVE NAIK DAN OGIVE TURUN

 

SSumber Gambar : http://www.google.co.id/search?tbm=isch&hl=id&source=hp&biw=1360&bih=634&q=diagram+statistika&gbv=2&oq=diagram+statistika&aq=f&aqi=g-S1&aql=&gs_sm=3&gs_upl=1050l13017l0l13807l18l18l0l9l9l0l107l756l7.2l9l0#hl=id&gbv=2&tbm=isch&sa=1&q=ogive&pbx