Selasa, 27 Maret 2012

EVALUASI

Nama : Nila Sari Hutasuhut
NIM : 209411018
Kelas : Dik A Reguler 2009
MK : Evaluasi Belajar

BAB I
PENGERTIAN PENILAIAN HASIL BELAJAR
Ciri penilaan adalah adanya objek atau program yang dinilai dan adanya kritreria sebagai dasar untuk membandingkan antara apa yang dicapai dengan kriteria yang harus dicapai. Sutrisno hadi mengemukakan pengukuran sebagai suatu tindakan untuk mengidentifikasi besar kecilnya gejala. Penggunaan tes disini dimaksudkan untuk mengetahuai seberapa jauh siswa-siswa berhasil dalam belajar atau berhasil menguasain isi pengajaran yang diberikan oleh gurunya. Oleh karena itu, apabila tes yang dimaksudkan untuk memenuhi hal tersebut harus disusun sedemikian rupa sehingga dapat menggunakan tujuan dimaksudkan. Tujuan selanjutnya dipergunakan sebagai bahan/dasar penyusunan tes.
Penilaian adalah suatu tundakan untuk memberikan interpretasi terhadap hasil pengukuran. Dengan menggunakan norma tertentu, untuk mengetahui tinggi/rendahnya atau baik buruknya aspek tertentu. Interpretasi berarti memberikan/menetapkan harga/value tentang baik buruknya atau tinggi rendahnya hasil pengukuran.
Sebagai contoh:
A=8, B=4, C=7, D=6, E=6, dan F=6.
Hasil-hasil pengukuran tersebut sebenarnya tidak akan dapat kita nilai tanpa menggunakan norma tertentu. Jika 6 kita nyatakan sebagai norma untuk menentapkan baik dan buruknya atau inggi rendahnya atau pandai/ kurang pandai dalam menguasai suatu pelajaran tertentu, maka interpretasi kita adalah bahwa:
A dan C (8 dan 7)termasuk siswa yang pandai D, E, dan F (6, 6 dan 6) termasuk siswa yang sedang, dan B (4 termasuk siswa yang kurang).

Pengukuran bersifat kuantitatif selalu dihubungkan dengan standar, tujuan yang diukur penilaian dihubungkan dengan norma. J.C. stanley mengatakan kata standar dihubungkan dengan tujuan yang dicapai, sedangkan kata norma selalu dihubungkan dengan status/posisi/kedudukan tertentu.
Salah satu tugas penting guru adalah memimpin, membimbing, dan mengerjakan bahan-bahan pelajaran kepada siswa. Dilihat dari segi ini sebagai guru bertanggung jawab akan tugasnya, maka dia akan sadar untuk selalu mengetahui seberapa jauh pimpinan, bimbingan atau bahan-bahan pelajaran itu dikuasai oleh siswa. Seberapa jauh guru dapat memindahkan/ memasukkan materi-materi pelajaran kepada siswa-siswanya karena tuntutan untuk selalu harus mengtahui sampai pada tingkat mana siswa-siswa menguasai materi pelajaran itulah maka diperlukan adanya penilaian. Dengan adanya penialian ini maka guru akan selalu dapat mengikutu perkembangan dalam proses belajarnya.
Ditinjau dari segi siswa dimana siswa-siswa sebagai salah satu faktor/komponen dalam proses pendidikan, maka siswa-siswa yang sadar bahwa sebenarnya aktivitas untuk memajukan dirinya sebagian besar tergantung pada mereka sendiri, dengan sendirinya mereka harus selalu aktif, giat untuk belajar dengan sebaik-baiknya. Selanjutnya, apakah dalam kegiatan belajar tersebut siswa-siswa sudah mendekati orang lain dalam hal ini gurunya dapat menilai proses belajarnya.
Dengan hasil penilaian yang diberikan oleh gurunya, siswa-siswa akan dapat mengetahui prestasi belajarnya sendiri, yang selanjutnya dia juga akan dapat mengetahui statusnya diantara teman-temannya yang lain dalam kelasnya, apabila dia termasuk pandai, sedang atau kurang dalam hal prestasi belajarnya. Keadaan hasil belajar siswa di samping menggambarkan prestasi belajar siswa juga merupakan pencerminan keberhasilan mengajar gurunya.

BAB II
FUNGSI EVALUASI HASIL BELAJAR
Remmens dan N.L Gage dalam bukunya Educational Measurement and Evaluation mengemukakan tujuan evaluasi hasil belajar antara lain sebagai berikut:
1. Untuk mempertahankan standar
2. Untuk menyeleksi siswa
3. Untuk memberkan motivasi belajar
4. Untuk memberikan pedoman mengajar
5. Untuk menilai guru, metode belajar, buku pedoman dan isi kurikulum
6. Untuk memberikan pengalaman kepada siswa dalam menilai proses belajarnya
Selanjutnya, Arden N. Frandsen, dalam bukunya Educational Psyhology mengemukakan fungsi-fungsi evaluasi hasil belajar sebagai berikut:
1. Untuk menempatkan siswa dalam kelompok/kelas-kelas tertentu
2. Untuk/mengetahui tentang sebagai-sebab kesulitan belajar siswa
3. Untuk membimbing cara belajar siswa
4. Untuk menilai kemajuan belajar siswa
5. Untuk meramal keberhasilan belajar berikutnya
6. Untuk menilai kurikulum dan metode mengajarnya
Selanjutnya, CC. Ross dan Julian C. Stanley dalam bukunya Measurement In Today’s School, mengemukakan bahwa evaluasi hasil belajar berfungsi sebagai berikut:
1. Memberikan motivasi belajar
2. Diagnosis kesulitan belajar
3. Penempatan/menggolong-golongkan anak sesuai dengan prestasinya dan selanjutnya untuk kepentingan kenaikan kelas
4. Memberikan bimbingan belajar
5. Memberikan penilaian terhadap sekolah, seperti organisasinya, program, hasilnya dan sebagainya.
Selanjutnya Sumadi Suryobroto dalam bukunya Psychology Pendidikan menjelaskan tentang fungsi-fungsi penilaian hasil belajar ke dalam golongan yaitu:
1. Fungsi Psyckologis
Yaitu agar dapat memperoleh kepastian tentang statusnya dalam kelasnya. Di samping itu bagi guru akan merupakan pertanggungjawaban sampai seberapa jauh usaha mengajarnya dikuasai ooleh siswa-siswanya.
2. Fungsi Dikdaktis
a. Bagi anak didik, keberhasilan maupun kegagalan belajar berikutnya. Jadi, akan dapat memberikan motivasi belajar selanjutnya
b. Bagi pendidik, penilai hasil belajar akan dapat menilai tentang keberhasilan mengajarnya termasuk metode mengajar yang dipergunakan.
3. Fungsi Administratif
Dengan adanya hasil penilaian dalam bentuk Rapor (T ranscrip) atau buku laporan tentang kemajuan belajarnya, akan dapat dipenuhi berbagai fungsi administratif seperti:
a. Merupakan inti laporan kepada orang tua, pejabat-pejabat, guru-guru dan siswa-siswa tersebut
b. Merupakan data bagi siswa, apabila dia akan naik kelas, pindah sekolah maupun untuk melamar pekerjaan,
c. Dari data tersebut kemudian dapat berfungsi untuk menentukan status anak dalam kelasnya
d. Memberikan ikhtisar mengenai segala hasil usaha yang telah dilakukan oleh lembaga pendidikan.
Dari beberapa pendapat tersebut ternyata tidak terdapat perbedaan yang menyolok antara pendapat yang satu dengan yang lainnya, justru terdapat saling melengkapi:
Pada kesempatan ini penulis akan mengggolongkan fungsi-fungsi evaluasi tersebut ke dalam:
1. Fungsi-fungsi evaluasi untuk kepentingan siswa
2. Fungsi-fungsi evaluasi untuk kepentingan pendidikan
3. fungsi-fungsi evaluasi untuk kepentingan organisasi/lembaga yang mengatur pendidikan
1) Fungsi-fungsi evaluasi untuk kepentingan siswa
1.1 Untuk mengetahui kemajuan belajarnya
1.2 Untuk dipergunakan sebagai pedoman (motivasi) belajar
1.3 Untuk memberikan pengalaman belajar (self evaluation)
2) Fungsi-fungsi evaluasi untuk kepentingan pendidikan
2.1 Untuk menyeleksi siswa-siswa yang selanjutnya berguna untuk meramal keberhasilan berikutnya.
2.2 Untuk mengetahui sebab-sebab kesulitan belajar siswa selanjutnya berguna untuk memberikan bimbingan belajar kepada siswa
2.3 Untuk memberikan pedoman belajar
2.4 Untuk mengetahui ketepatan metode mengajar
2.5 Untuk penempatan murid dalam kelasnya dalam grade-grade (tingkat-tingkat tertentu, pandai, sedang, dan kurang).
3) Fungsi-fungsi evaluasi untuk kepentingan organisasi/lembaga yang mengatur pendidikan
3.1 untuk mempertahankan standar pendidikan
3.2 untuk menilai ketepatan kurukulum yang disediakan.
3.3 untuk menilai kemajuan sekolah yang bersangkutan.
1. Fungsi-fungsi evaluasi untuk kepentingan siswa
2.1 Untuk mengetahui kemaju an belajar siswa
Kemajuan belajar siswa dapat diketahui dengan membandingkan statusnya sebelum dan sesudah melakukan prestasi sebelum mengikuti pelajaran dan prestasinya sesudah belajarnya.

2.2 Memberikan motivasi belajar siswanya
Keberhasilan maupun kegagalan usaha belajar yang tercermin dalam hasil studi akan berpengaruh besar bagi usaha-usaha belajar selanjutnya. Bagi siswa-siswa yang telah berhasil memperoleh studi yang baik yang berarti mengalami keberhasilan studi, hal itu akan dapat dijadikan pegangan/ukuran bahwa proses atau cara belajar yang telah dilaksanakan selama ini sudah cukup baik, sehingga bagi usaha-usaha belajar berikutnya akkan mempertahankan cara belajar yang pernah dilakukan, lebih-lebih jika dapat meningkatkan lagi.
Demikian juga kegagalan belajar, sebenarnya akan dapat dijadikakan keputusan, melainkan dapat dijadikan cambuk, dorongan, motif untuk memperbaiki cara belajarnya agar selanjutnya memperoleh hasil yang lebih baik.

2.3 Self evaluation
Mengetahui akan keberhasilan/kegagalan akan dapat dijadikan pegangan atau ukuran terhadap usaha-usaha belajar selanjutnya. Seorang siswa yang berhasil memmperoleh skor yang baik, memberikan pelajaran/pengalaman baginya, cara/ belajar yang telah dilakukannya telah memenuhi sasaran ini selanjutnya merupakan pengalaman baginya untuk melakukan usaha-usaha yang lebih baik lagi, dan setidak-tidaknya melakukan hal yang sama.
Dilain pihak bagi siswa yang mengalami kegagalan (memperoleh skor yang rendah) menandakan bahwa hasil belajar yang dilakukan belum memenuhi sasaran (banyak mengalami kesalahan-kesalahan dalam belajarnya). Ini selanjutnya dapat dijadikan ukuran/pegangan/pengalaman untuk mengulangi lagi cara/usaha belajar sama, yang salah tersebut.
2. Fungsi evaluasi hasil belajar untuk kepentingan pendidikan
2.1 Untuk menyeleksi siswa
Seleksi artinya menyaring beberapa dari banyak orang untuk satu program studi tertentu. Alat yang digunakan adalah tes/ujian/tugas-tugas dll. Seleksi ini dilakukan untuk memprediksikan keberhasilan dalam tugas yang dilakukan. Dan tes yang dilakukan harus memenuhi syarat sebagai berikut, validitas realibilitas, dan daya bedanya.
2.2 Untuk mengetahui sebab-sebab kesulitan belajar siswa
Salah satu tugas guru adalah memberi bimbingan belajar pada siswanya dan mengatasi kekurangan-kekurangan siswa tersebut. Kemudian mencari faktor-faktor yang menjdai penyebab kekurangan tersebut dengan jalan tetap memperhatikan kelebihannya.
2.3 Untuk memberikan pedoman mengajar
Tes diagnostik digunakan untuk mengetahui kesulitan siswa dalam belajar, karena dengan jalan tersebut guru akan menyesuaikan cara mengajarnya kepada siswa. Cara lain yang bisa ditempuh adalah dengan menggunakan tes hasil belajar.
2.4 Untuk mengetahui ketepatan metode mengajar
Baik tidaknya hasil belajar siswa ditentukan oleh metode yang diberikan guru kepada murid tersebut pada asaat mengajar. Karena tidak semua murid cocok dengan satu metode yang sama. Dikarenakan kemampuan siswa yang berbeda dalam menerima pelajaran maka guru diharapkan untuk mampu mencari metode yang tepat kepada semua muridnya. Oleh karena itu guru bisa saja menggunakan berbagai metode untuk melihat hasil belajar dari muridnya, kemudian menanyakan kepada muris tersebut metode mana yang mereka lebig sukai.
2.5 Untuk penempatan siswa di dalam kelasnya
Pengukuran presetasi kepada siswa akan dapat diketahui bagaimana perbedaan tingkat hasil prestasi siswa tersebut. Setelah melihat hal ini, guru dapat menggolongkan siswa sesuai dengan tingkatan hasil prestasi siswa, misalnya kelompok tinggi, sedang dan rendah. Dengan cara ini juga guru bisa menyesuaikan kurikulum yang diajarkan agar berhasil sesuai tujuan.
3. Fungsi evaluasi untuk kepentingan Lembaga Pendidikan
3.1 Untuk mempertahankan standar pendidikan
Tes hasil belajar yang diberikan guru kepda setiap muridnya tentu tidak akan memberikan nilai yang sama. Dan juga tidak semua siswa memiki ketuntasan yang baik pada materi yang diajarkan. Maka ditetapkanlah standar/ukuran minimum untuk memisahkan anatar siswa yang mampu dan kurang mamapu dalam menangkap materi atau bahan yang diajarkan.
3.2 Untuk menilai ketepatan kurikulum yang disediakan
Kurikulum adalah salah satu sarana untuk mencapai tujuan pendidikan yang disusun oleh para ahli pendidikan melalui pembahasan dan diskusi-diskusi. Dan kurikulum biasanya disesuaikan dengan kebutuhan masyrakat yang akan menampung siswa setelah menyelesaiakan pendidikan nantinya, tetapi juga harus disesuaikan dengan perkembangan dan tingkat kesiapan siswa.
3.3 Untuk menilai kemajuan sekolah
Salah satu faktor yang paling penting untuk menilai kemajuan sekolah adalah dengan melihat prestasi belajar siswa-siswinya. Dan masyarakat juga biasanya melihat cermiana sekolah itu baik atau tidak dari hasil prestasi yang dieproleh siswanya tersebut. Apabila prestasi siswanya baik maka mereka akan mencap sekolah itu sebagai sekolah yang bagus pula. Begitu juga dengan sebaliknya.

BAB III
VALIDITAS TES HASIL BELAJAR
Validitas tes adalah:
1. Tingkat ketelitian tes untuk menggambarkan keadaan aspek yang diukur.
2. Tingkat kesesuaian tes untuk menggambarkan keadaan aspek yang diukur atau kata lain apakah tes tersebut sudah memenuhi fungsinya sebagai alat pengukur.
Ada 4 macam tipe validitas, yaitu:
1. Content validity
Content validity adalah validitas alat pengukur yang dicari dengan menggunakan isi/materi program/tugas yang dibebankan kepadanya sebagai kriteria/pedoman. Jika tes dimasukkan untuk mengungkapkan kecakapan siswa dalam menerima/mengikuti pelajaran-pelajaran maka yang dipergunakan sebagai kriteria/pedoman adalah kurikulum. Analisis kurikulum akan dijadikan pedoman untuk menyusun tes.
Sebagai dasar penyusunan tes dapat dipergunakan:
a. Analisis tentang kurikulum dari mata pelajaran yang akan diteskan yang meliputi:
• Tujuan pemberian pelajaran
• Seberapa luasnya skor mata pelajaran yang disediakan
• Bagaimana deskripsi dari materi-materi/ bahan/ pelajaran yang disediakan
b. Buku pegangan yang dipergunakan
c. Soal-soal ujian/ tes yang pernah diberikan untuk sesuatu kelas/ group.
2. Concurrent validity
Concurrent validity adalah kesesuaian/ ketepatan alat pengukur di mana yang dijadikan kriteria ketepatan adalah alat pengukur lain yang sudah dipandang valid.
Hasil pengukuran dari ujian-ujian akhir/ ulangan-ulangan harian/ mingguan dari guru kelas akan dapat dijadikan ukuran. Di samping itu hasil tes bahasa Indonesia yang disusun oleh suatu panitia ahli, yang sebelum diteskan telah dilakukan beberapa kali try out, juga dapat dijadikan ukuran. Selanjutnya, untuk mencari kesesuaian tes bahasa Indonesia yang sudah dipandang valid tersebut dilakukan dengan analisis statistik, yaitu dengan mengkorelasikan kedua hasil tes tersebut dari suatu kelas/ sampel.
Sebagai contoh dapat dilihat tabulasi berikut:
TABEL 1
TABULASI
No. Subjek Hasil tes baru
(yang sedang dicari
Validitasnya) Hasil tes lama
(yang sudah dipandang
Valid)
1 6 7
2 4 5
3 6 6
4 7 6
5 5 6
6 6 6
7 6 7
8 7 7
9 8 7
10 7 8
11 4 4
12 6 5
13 6 6
14 8 7
15 5 3
16 4 6
17 3 4
18 6 7
19 6 6
20 6 7

Dari tabulasi tersebut dapat dipergunakan teknik korelasi product moment dari Pearson untuk keperluan analisis hasil tes baru kita sebut (beri kode) variabel X dan hasil tes lama kita beri variabel Y.


TABEL 2
VARIABEL X DAN Y
Subjek No. X Y X y x2 y2 xy
1 6 7 0,2 1 0,4 1 0,2
2 4 5 -1,8 -1 3,24 1 1,8
3 6 6 0,2 0 0,4 0 0
4 7 6 1,2 0 1,44 0 0
5 5 6 -0,8 0 0,64 0 0
6 6 6 0,2 0 0,4 0 0
7 6 7 0,2 1 0,4 1 0,2
8 7 7 1,2 1 1,44 1 1,2
9 8 7 2,2 1 4,84 1 2,2
10 7 8 1,2 2 1,44 4 2,4
11 4 4 -1,8 -2 3,24 4 3,6
12 6 5 0,2 -1 0,4 1 0,2
13 6 6 0,2 0 0,4 0 0
14 8 7 -2,2 1 4,84 1 2,2
15 5 3 -0,8 -3 0,64 9 0,24
16 4 6 -1,8 0 3,24 0 0
17 3 4 -3,8 -2 14,44 4 7,6
18 6 7 0,2 1 0,4 1 0,2
19 6 6 0,2 0 0,4 0 0
20 6 7 0,2 1 0,4 1 0,2
N=20 116 120 33,2 30 22

Mean ͞X = = 5,8
Mean ͞Y = = 6,0
rxy =
=
=
= 0,69
3. Predictive Validity
Tes yang dapat meramal keberhasilan sesuatu yang dipangkunya. Dalam validitas prediktif itu yang dijadikan criteria kesesuaian adalah bukti/keterangan/laporan yang dikumpulkan tentang keberhasilan itu pada beberapa waktu kemudian.
Tes masuk sekolah misalnya akan mempunyai daya prediksi apabila apa yang dinyatakan pada tes pada masuk tersebut sesuai dengan prestasinya setelah di SMP kemudian.
4. Contruct Validity
Contruct Validity adalah validity tes yang dicari dengan menguraikan aspek (kontruksi) dari sesuatu hal yang hendak diukur. Validitas construktif ini biasanya digunakan apabila tidak ada kriterium difinitif yang dijadikan criterion penyusunan tes.
Jika item-item tes telah memuat komponen tersebut maka dapat dikatakan bahwa tes tersebut secara konstruktip telah valid. Validitas construktif ini biasanya dipergunakan sebagai dasar penyusunan tes. Suatu produk untuk menilai validitas tes kita sebut prosedur validitas. Langkah-langkah secara umum, yaitu:
 Susunlah tes yang akan dinilai validitasnya
 Carilah alat lain yang akan dipergunakan sebagai ukuran/bahan/pembanding/keriteruim.

FAKTOR-FAKTOR YANG MEMPENGARUHI VALIDITAS TES
1. Mempengaruhi latar belakang kebudayaan subjek, seperti keadaan status ekonomi, perbedaan struktur social (status social tinggi/rendah) perbedaan tersebut akan mempengaruhi validitas tes.
2. Keadaan tipe tes
Tiap-tiap tes akan berpengaruh terhadap validitas jawaban anak. Tes subjektif (essay tes) akan mempunyai validitas yang berbeda dibandingkan dengan tes objektif.
3. Kurang jelasnya petunjuk mengerjakan tes
Kurang jelasnya dalam memberikan petunjuk cara mengerjakan tes, dapat pula mempengaruhi validitas tes.

BAB IV
TEKNIK PENGUJIAN RELIABILITAS TES HASIL BELAJAR
Suatu tes dapat dikatakan reliable apabila tes tersebut dikenakan terhadap subjek yang sama tetapi pada saat berlainan hasilnya tetap sama. Sebagai contoh suatu meteran yang dipergunakan untuk mengukur panjang sesuatu benda. Meteran tersebut akan dapat dikatakan reliabel jika dipergunakan untuk mengukur benda (X) menunjukkan hasil yang sama walaupun saat pengukurannya berbeda.
Sebaliknya jika meteran yang mudah karena suhu, terang tidak akan reliable, karena sebenarnya benda yang diukur sama, akan tetapi pengukuran pertama yang diselenggarakan pada pagi hari, yang suhunya rendah tidak menunjukakan hasil yang sama dengan pengukuran yang kedua, yang diselenggarakan pada siang hari dengan suhu\ yang lebih tinggi. Perbedaan hasil tersebut bukan disebabkan oleh berubahnya subjek yang diukur, tetapi karena alat pengukuran yang sebenarnya telah mengalami perubahan. Untuk lebih jelas dapat dilihat diagram di bawah ini.
Meteran X
50m (diukur tgl 10-5-1989)

50m (diukur tgl 25-5-1989)
Kemungkinan perubahan pribadi yang menjadi sasaran pengukuran tersebut dipengaruhi antara lain oleh:
1. Perubahan pribadi yang diukur
2. Perubahan sementara terhadap sifat pribadi
3. Keadaan sifat pengukuran sendiri yang mudah berubah oleh kondisi dan situasi pengukuran
4. Perubahan hasil pengukuran karena pengaruh pennyelenggaraan pengukuran.
5. Perubahan hasil pengukuran karena penilaian atau cara menginterpretasi hasilnya.
Banyak teknik-teknik untuk menguji reliabilitas tes hasil belajar, pada kesempatan ini dapat dikemukakan tiga buah teknik:

1. Teknik Ulangan
Prinsip dari teknik ini adalah memberikan tes yang sama pada subjek yang sama pada saat yang berbeda, dengan kondisi penyelenggaraan pengukuran yang relative sama. Langkah-langkanya adalah:
a. Kenakan satu tes (X) pada sejumlah subjek (sebagai sampel)
b. Setelah beberapa waktu berselang, ulangi lagi langkah (a)
c. Hitung korelasi antara hasil tes pertama dengan hasil tes kedua
Untuk lebih jelas, liat diagram di bawah ini.






Dari diagram tersebut dapat diberikan contoh konkret, misalnya sampel yang kita ambil berjumlah 10 (sekedar untuk menyederhanakan penghitungan), dengan hasil tes berikut:
TABEL 3
SAMPEL YANG DIAMBIL BERJUMLAH 10 ORANG
No Subjek Hasil tes I (X) Hasil tes II (Y)
1 61 49
2 74 61
3 39 47
4 49 60
5 19 35
6 37 29
7 73 66
8 61 55
9 53 58
10 64 70

Maka untuk mengetahui tinggi rendahnya reliabilitas tes kita dapat menggunakan teknik korelasi product moment. Tenik ini sederhana, mudah dipahami dan sudah mengenai sasarannya.
Tetapi jika kita ingat bahwa keadaan pribadi anak itu dalam keadaan selalu berkembang, tidak statis maka sebenarnya teknik ini kurang tepat dipergunakan, jika jarak waktu pengukuran cukup lama.
Kelemahan yang lainnya ialah bahwa kita harus membuat kondisi penyelenggaran pengukuran yang sama, akan sukar dipenuhi karena sudah adanya tenggang waktu tersebut.
2. Teknik Bentuk Paralel
Dalam teknik bentuk parallel ini dua bentuk tes dikenakan pada sejumlah sampel. Kedua tes ini harus seimbang. Untuk mempermudah anggaplah kedua tes tesebut item-itemlah merupakan sampel dari keseluruhan item yang akan mempergunakan aspek yang dimaksud.
Teknik ini dapat menghindari kekurangan-kekurangan pada teknik ulangan yaitu kemungkinan terhadap perubahan atau perkembangan para pribadi yang diukur kecil kemungkinannya. Tetapi teknik bentuk peralel ini juga memiliki kelemahan yaitu sukarnya membuat (menyusun) dua buah tes yang seimbang yang masing-masing dapat mewakili keseluruhan aspek.

3. Teknik Belah Dua
Dalam teknik belah dua ini satu tes diberikan kepada sejumlah subjek (sampel). Kemudian item-itemnya pada tes itu dibagi dua dan skor tes dari setengah item-item tes pada bagian yang kedua. Sedangkan cara membelah item-item tersebut dapat dilakukan dengan mengumpulkan skor item-item yang bernomor gasal sebagai bagian yang pertama dan mengumpulkan skor item-item yang bernomor genap sebagai bagian yang kedua.
Dengan teknik belah dua ini faktor-faktor yang mempengaruhi stabilitas hasil pengukuran dapat dikurangi atau dihindarkan, yaitu:
a. Adanya practice effect dapat dihindarkan.
b. Demikian juga carry over effect tidak terjadi.
c. Karena penyelenggaraan pengukuran hanya satu kali perubahan pribadi yang mungkin disebabkan karena pengukuran yang diulang tidak akan terjadi pada teknik ini.
d. Perubahan kondisi pengukuran, suasana pengukuran,\penyelenggaraan pengukuran dan sebagainya karena pengukuran yang diulang tidak akan terjadi karena pengukuran hanya dilakukan satu kali.

Sebagai contoh dapat diperiksa pada table sebagai berikut:
TABEL 4
CONTOH
No. Subjek Skor item-item Gasal Skor item-item Genap
1 36 40
2 27 25
3 32 30
4 40 36
5 30 33
6 37 40
7 42 39
8 25 23
9 24 28
10 35 37
Untuk menghitung koefisien reliabilitasnya masih harus dilanjutkan dengan menggunakan Formula Spearman Brown sebagai berikut:




Keterangan:
r₂₂= reliabilitas tes
rtt = hasil korelasi antara dua kelompok tes
Ternyata dari hasil korelasi tes dapat diketahui reliabilitas tes sebagai berikut:
Kita ambil saja hasil korelasi pada table 5 yaitu: rxy= 0,81
r₂₂=
r₂₂=
r₂₂= 0,89
Untuk menafsirkan arti suatu koefisien reliabilitas dapat dipergunakan pedoman sebagai berikut:
0,00 – 0,40 = Reliabilitas rendah
0,41 – 0,70 = Reliabilitas sedang
0,71 – 0,90 = Reliabilitas tinggi
0,91 – 1,00 = Reliabilitas sangat tinggi


TABEL 5
PERHITUNGAN KORELASI PRODUCT MOMENT DARI PEARSON
UNTUK MENCARI KORELASI ANTARA HASIL TES PERTAMA (X)
DENGAN HASIL TES KEDUA (Y)
NO X Y X y x² y² xy
1 61 49 7 -4 49 16 -28
2 74 61 20 8 400 4 160
3 39 47 -15 -6 225 36 90
4 49 60 -5 7 25 49 -35
5 29 35 -25 -18 625 324 450
6 37 29 -17 -24 289 576 408
7 73 66 19 13 361 169 247
8 61 55 7 2 49 4 14
9 53 58 -1 5 1 25 -5
10 64 70 10 17 100 289 170
540 530 - - 2124 1552 1471

Mean X = 54
Mean Y = 53
Maka, rху =
=
=
= 0,18
Tabel 7
DISTRIBUSI FREKUENSI TOTAL SKOR INDIVIDU TES
BAHASA INDONESIA YANG DIBERIKAN KEPADA SISWA-SISWA KELAS IV DI BEBERAPA SEKOLAH DASAR DI DAERAH TAPANULI UTARA.
TABEL INI UNTUK MENCARI MEAN DAN STANDAR DEVIASI


Interval F x1 Fx1 Fx12
61 – 65
56 – 60
51 – 55
46 – 50
41 – 45
36 – 40
31 – 35
26 – 30
21 – 25
16 – 20 6
5
21
18
16
26
29
88
19
2 5
4
3
2
1
0
-1
-2
-3
-4 30
20
63
36
16
0
-29
-18
-57
-8 150
80
189
72
16
0
29
32
171
32
150 - 55 671

Mean = SD =
= 38 + =
= 38 + 1,83 =
= 39,83 =
=

Tabel 8
PROPORSI SUBJEK YANG MENJAWAB BENAR UNTUK TIAP-TIAP
ITEM BAHASA INDONESIA YANGIBERIKAN KEPADA SISWA-SISWA KELAS IV DI BEBERAPA SEKOLAH DASAR DI TAPANULI UTARA.
TABEL INI UNTUK MENCARI p, q dan pq TIAP ITEM

Nomor Item Jumlah subjek yang menjawab benar p q pq
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
45
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82 111
88
112
104
49
45
110
109
102
103
103
79
64
74
79
64
44
87
78
98
58
101
40
75
64
44
95
38
56
41
58
54
60
43
80
55
82
49
55
79
49
50
53
48
39
38
48
52
70
55
53
90
92
43
61
57
55
102
111
80
96
77
92
99
82
63
56
106
44
99
67
96


70
101
48
53
58
73
44
58 0,70
0,59
0,75
0,69
0,33
0,30
0,73
0,73
0,68
0,69
0,69
0,53
0,43
0,49
0,53
0,43
0,29
0,58
0,52
0,65
0,39
0,67
0,27
0,50
0,43
0,29
0,63
0,25
0,37
0,27
0,39
0,36
0,40
0,29
0,53
0,37
0,55
0,35
0,37
0,53
0,37
0,33
0,34
0,32
0,26
0,25
0,32
0,35
0,47
0,37
0,35
0,60
0,61
0,19
0,41
0,38
0,37
0,68
0,70
0,53
0,65
0,51
0,61
0,66
0,55
0,42
0,37
0,71
0,29
0,73
0,45
0,64


0,47
0,67
0,32
0,35
0,39
0,52
0,29
0,39 0,30
0,41
0,25
0,31
0,67
0,70
0,27
0,27
0,32
0,31
0,31
0,47
0,57
0,51
0,47
0,57
0,71
0,42
0,48
0,35
0,61
0,33
0,73
0,50
0,57
0,71
0,37
0,75
0,68
0,73
0,61
0,64
0,60
0,71
0,47
0,63
0,45
0,67
0,63
0,47
0,63
0,67
0,66
0,68
0,74
0,75
0,68
0,65
0,53
0,63
0,40
0,39
0,81
0,59
0,62
0,63
0,32
0,30
0,47
0,35
0,49
0,39
0,34
0,45
0,58
0,63
0,29
0,71
0,27
0,55
0,36
0,36


0,53
0,33
0,68
0,65
0,61
0,48
0,71
0,61 0,21
0,24
0,19
0,21
0,22
0,21
0,20
0,20
0,22
0,21
0,25
0,25
0,25
0,25
0,25
0,25
0,21
0,24
0,25
0,23
0,24
0,22
0,20
0,25
0,25
0,21
0,23
0,19
0,23
0,20
0,24
0,23
0,24
0,21
0,25
0,23
0,25
0,22
0,23
0,25
0,23
0,22
0,22
0,22
0,19
0,19
0,22
0,23
0,25
0,23
0,23
0,24
0,24
0,15
0,24
0,23
0,23
0,22
0,21
0,25
0,23
0,25
0,25
0,22
0,25
0,24
0,23
0,21
0,21
0,20
0,25
0,23


0,25
0,22
0,22
0,23
0,25
0,25
0,21
0,24
- 39,02 42,93 18,60


Dimana : R = koefisien reliabilitas tes yang dicari
n = jumlah item tes
St = standar deviasi tes
p = proporsi subjek yang menjawab benar untuk tiap item
q = proporsi subjek yang menjawab salah untuk tiap item

sedangkan cara mencari p dan q dapat dipergunakan rumus sebagai berikut :
a. Cara mencari p
 Jika tesnya berbentuk pilihan b, dipergunakan rumus :




Dimana : R = jumlah subjek yang menjawab benar untuk tiap-tiap item
W = jumlah subjek yang menjawab salah untuk tiap-tiap item
0 = option, yaitu pilihan yang disediakan untuk tiap-tiap item
N = jumlah seluruh subjek yang dites
 Jika tesnya berbentuk isian (Supply), rumus yang dipergunakan lebih sederhana yaitu:


b. Untuk mencari q
Jika p sudah diketahui dengan rumus tersebut di atas, p dapat dihitung dengan :


Cara mencari p, q dan pq

 Item nomor 1.
Untuk item nomor 1, diantara 150 subjek yang dites, terdapat 111 subjek yang menjawab benar, maka :






 Item nomor 10.
Dari 150 subjek yang dites, 103 subjek menjawab benar, maka :






 Item nomor 82.
Dari 150 subjek yang dites, 58 subjek menjawab benar, maka :





1. Formula Kuder - Richardson “20”
Dengan tersedianya tabel-tabel tersebut (tabel 4 dan 5), kita dengan mudah dapat menghitung koefisien reliabilitas tes dengan Formula Kuder Richardson “20”.
Karena telah diketahui n = 82
S1= 10,4
pq = 18,6
Maka tinggal memasukkan ke dalam rumus :









2. Formula Kuder - Richardson “21”
Formula Kuder-Richardson “21” menggunakan rumus sebagai berikut :


Dalam rumus :

n = banyaknya butir soal
M = mean skor


Untuk menghitung koefisien reliabilitas tes dengan Formula Kuder Richardson, tidak perlu menggunakan data-data sebagaimana tabel 5, tetapi cukup hanya dengan mempergunakan tabel 4 saja, sehingga prosedurnya sederhana, dan praktis.
Selanjutnya mari kita hitung koefisien reliabilitasnya dengan mempergunakan formula tersebut. Pada tabel 4 kita ketahui bahwa :
Mean = 39,83
SD = 10,40
Kemudian kita masukkan ke dalam rumus :












= 0,82

Faktor-faktor yang mempengaruhi reliabilitas tes
Banyak faktor yang mempengaruhi koefisien reliabilitas tes, 3 (tiga) faktor di bawah ini merupakan faktor yang banyak mempengaruhi, yaitu :
1. Panjang (banyaknya) item-item tes
Panjang-pendeknya atau banyak sedikitnya item-item tes, akan mempengaruhi koefisien reliabilitas tes. Suatu tes yang terdiri dari item-item yang lebih banyak akan tinggi koefisien reliabilitas dibandingkan dengan tes lain yang hanya terdiri dari item-item yang lebih sedikit.
Tes yang terdiri dari item-item yang panjang akan lebih tuntas dalam mengungkapkan aspek-aspek yang hendak diukur dan itu berarti bahwa tes yang lebih panjang akan lebih representatif dibandingkan dengan tes yang lebih pendek atau sedikit. Selanjutnya, tes yang lebih representatif akan lebih memungkinkan untuk dapat mengukur keadaan subjek yang sebenarnya, sehingga hal itu akan lebih menjamin konsistensi dari jawaban subjek.
Sebagai ilustrasi dapat dilihat dari diagram di bawah ini :
1
0,9 0,9
0,8
0,7
0,6
0,5
0,4
0,3
0,2
0,1
0 0
50 100 150 200 250 300 350
Panjang kelas
Berapa kita harus memperbanyak item-item tes agar diperoleh koefisien reliabilitas yang diinginkan, dapat dipergunakan Spearman-Brown sebagai berikut:


dalam rumus :
rm = koefisien reliabilitas tes baru (setelah diperpanjang)
r = koefisien reliabilitas tes lama (sebelum diperpanjang)
n = angka perkalian yang dipergunakan untuk memperpanjang tes
Contoh perhitungan:
a) Jika panjang tes semua yang terdiri dari 50 item diperoleh koefisien reliabilitas sebesar 0,60, dan kita ingin memperpanjang menjadi 100 item, maka koefisien reliabilitas yang baru setelah diperpanjang akan diperoleh :




= 0,75

b) Jika koefisien reliabilitas yang diperoleh dari tes yang terdiri dari 50 item sama dengan 0,60, sedangkan kita ingin meningkatkan menjadi 0,75, maka panjang tes yang baru dapat diperoleh dengan perhitungan sebagai berikut:

















Jadi, untuk mempertinggi koefisien reliabilitas tes yang terdiri dari 50 item, dari 0,60 menjadi 0,75, maka item-item tes tersebut harus diperpanjang 2 kali lipat, sehingga menjadi 100 item.

2. Tingkatan kemampuan kelompok subjeknya yang dites
Suatu kelompok subjek yang mempunyai variabilitas kemampuan yang lebih besar akan menghasilkan koefisien reliabilitas yang lebih tinggi. Konsekuensinya ialah tes yang diberikan kepada kelompok subjek yang terdiri dari beberapa tingkatan kemampuan (tinggi, cukup, sedang, dan kurang) akan menghasilkan koefisien reliabilitas yang lebih tinggi dari pada tes tersebut diberikan kepada kelompok subjek yang terdiri dari satu tingkatan kemampuan saja.

3. Kondisi penyelengaraan tes
Kondisi penyelenggaraan tes juga akan dapat mempengaruhi koefisien reliabilitas tes. Tes yang diberiakan dalam suasana yang gaduh, hawa terlalu panas, ribut, tempat duduk berjejal-jejal, soal tidak jelas, isi pulpen tiba-tiba habis, gangguan emosi saat menjelang tes dan sebagainya, akan menyebabkan rendahnya koefisien reliabilitas tes.


BAB V
TAKSONOMI BLOOM
1. Arti Dan Letak Taksonomi Dalam Pendidikan
Suharsimi mengemukakan tujuan pendidikan dapat dirumuskan pada tiga tingkatan. Pertama, tujuan umum pendidikan. Tujuan ini menentukan perlu dan tidaknya suatu program diadakan. Kedua, tujuan yang didasarkan atas tingkah laku. Yang dimaksud adalah berhasil pendidikan dalam bentuk tingkah laku. Inilah yang dimaksud dengan taksonomi. Ada 3 macam tingkah laku yang dikenal umum, yaitu kognitif, afektif, dan psikomotor. Ketiga, tujuan yang lebih jelas yang dirumuskan secara operasional.
Secara garis besar, Bloom bersama kawan-kawan merumuskan tujuan-tujuan pendidikan pada 3 tingkatan :
1. Kategori tingkah laku yang masih verbal.
2. Perluasan kategori menjadi sederetan tujuan.
3. Tingkah laku kongkret yang terdiri dari tugas-tugas dalam pernyataan-pernyataan sebagai ujian dan butir-butir soal.
Ada 3 ranah atau dominan besar, yang terletak pada tingkatan kedua yang selanjutnya disebutkan taksonomi yaitu:
1. Ranah kognif
2. Ranah afektif
3. Ranah psikomotor
Keterangan lebih lanjut adalah sebagai berikut:
(1) Ranah kognitif
Menurut Bloom segi kognitif memiliki enam taraf, meliputi pengetahuan sampai evalusai. Pengetahuan, taraf ini mencakup ingatan, tentang hal-hal yang khusus atau hal-hal yang umum, tentang metode-metode dan proses-proses, atau tentang pola, struktur atau setting.
Pemahaman, taraf ini mencakup bentuk pengertian yang paling rendah, taraf ini berhubungan dengan sejenis pemahaman yang menunjukkan bahwa siswa mengetahui apa yang sedang dikomunikasikan dan dapat menggunakan bahan pengetahuan atau ide tertentu tanpa perlu menghubungkannya dengan bahan lain atau tanpa perlu melihat seluruh implikasinya.
Aplikasi, taraf ini mencakup digunakannya abstraksi dalam situasi yang khusus atau konkret. Analisis, taraf ini mencakup penguraian suatu ide kedalam unsur-unsur pokoknya. Sintesis, taraf ini mencakup kemampuan menyatukan unsur-unsur dan bagian-bagian sehingga merupakan suatu keseluruhan.
Evaluasi, taraf ini mencakup penilaian bahan dan metode untuk mencapai tujuan tertentu. Evaluasi terdiri dari dua kategori, yaitu “penilaian dengan menggunakan kriteria internal” dan “penilaian dengan menggunakan kriteria eksternal”. Taraf pengetahuan terdiri dari dua belas kategori. Apabila guru membagi taksonomi kognitif itu menjadi dua ketgori saja, taraf yang rendah yaitu pengetahuan dan taraf yang lebih tinggi, meliputi pemahaman sampai evaluasi.
(2) Segi Afaktif
Segi afaktif oleh Krathwohl dibagi menjadi lima taraf. Pembagian atas tarf-tarf ini sedikit banyak berguna juga dalam arti merangsang guru memikirkan berbagai jenis tujuan. Tetapi tidak dianjurkan untuk menyita banyak waktu untuk mengadakan pengelolaan berbagai tujuan sesuai dengan taraf ini.
Memperlihatkan, taraf pertama ini adalah mengenai kepekaan siswa terhadap fenomena dan pengarang-pengarang tertentu. Yaitu menyangkut kesediaan siwa untuk menerima atau memperlihatkannya. Taraf ini di bagi lagi menjadi tiga kategori sejalan dengan tingkatan dengan memperlihatkan fenomena yaitu kesadaran akan fenomena, kesediaan menerima fenomena dan perhatian yang terkontrol atau terseleksi terhadap fenomena.
Merespon pada taraf ini siswa sudah merespon. Respon ini sudah lebih dari hanya memperlihatkan fenomena. Siswa sudah memiliki motivasi yang cukup sehingga ia bukan saja mau memperhatikan melainkan sudah memberikan respon.
Menghayati nilai pada taraf ini Nampak siswa bahwa sudah menghayati nilai tertentu. Perilaku siswa sudah cukup konsisten dalam situasi tertentu sehingga ia sudah dipandang sebagai orang yang sudah menghayati nilai yang bersangkutan.
Mengorganisasikan , dalam mempelajari nilai-nila itu menjadi suatu system sehinnga nilai-nilai tertentu sajalah yang lebih memberikan pengarahan kepada mereka.
Mempribadikan nilai atau seperangkat nilai pada taraf tertinggi ini siswa telah mendarah daging nilai-nilai sedemikian rupa sehinnga dalam praktiknya ia sudah dapat di golongkan sebagai orang yang memegang nilai atau seperangkat nilai tertentu.
(3) Segi psikomotoris
Bloom dan kawan-kawan belum menyusun taksonomi untuk segi ini. Tapi sudah ada suatu taksonomi untuk segi ini dan telah mendapat perhatian belakangan ini yang dikembangkan oleh E.j Simpson sebagaimana dijelaskan di bawah ini.
Presepsi adlah langkah pertama dalam melakukan kegiatan yang bersifat motoris ialah menyadari opjek, sifat, atau hubungan melalui alat indra. Langkah inilah bagian utama dalam rangkaian situasi interpretasi tindakan yang menimbulkan kegiatan motoris.
Set adalah kesiapan untuk melakukan suatu tindakan atau untuk beraksi terhadap suatu kejadian menurut cara tertentu. Ada tiga asfek yaitu intelektual, fisis, emosional.
Respon terbimbing inilah tingkatan permulaan dalam mengembangkan keterampilan motoris. Yang ditekankan ialah kemampuan-kemampuan yang merupakan bagian dari keterampilan yang lebih kompleks. Respon terbimbing adalah perbuatan individu yang dapat diamati, yang terjadi dengan bimbingan individu lain.
Respon mekanis pada tarap ini siswa sudah yakin akan kemampuannya dalam dirinya untuk merespon sesuai dengan jenis perangsanga atau situasi yang dihadapi.
Respon kompleks pada taraf ini dapat melakukan perbuatan motoris yang boleh dianggap kopleks, karena pola gerakan yang dituntut sudah kopleks. Perbuatan ini dapat dilakukan secara efesien dan lancar, yaitu dengan menggunakan tenaga dan waktu yang sedikit mungkin.

BAB VI
CARA SEDERHANA UNTUK MENGUKUR TARAF KESUKARAN ITEM DAN DAYA BEDA ITEM TES HASIL BELAJAR
Tes yang baik harus mengandung item-tem yang baik, item-item yang baik disamping harus dapat mengungkapkan atau menggambarkan aspek-aspek yang hendak diukur, harus pula memiliki taraf kesukaran dan daya beda tertentu. Untuk mengetahui taraf kesukaran item dan daya beda item diperlukan analisis item.
Ada beberapa cara untuk mengadakan analisis item tersebut. Pada kesempatan ini akan disajikan salah satu cara yang paling sederhana yang dipandang cukup memberikan petunjuk untuk mengetahui hal tersebut.
Analisis item dilaksanakan dengan menghitung beberapa jumlah aspek yang menjawab benar, dan berapa jumlah subjek yang menjawab salah satu tiap-tiap item.
Bagaimana caranya, kita ikuti uraian berikut. Setelah item-item tes disusun dengan seksama dengan memperhatikan persyaratan-persyaratan, kemudian tes tersebut diberikan atau dikenakan kepada sekelompok siswa sebagai sampel. Setelah itu kertas jawaban siswa diperiksa dan di skor item demi item sampai diketahui skor total tiap-tiap pekerjaan siswa. Setelah diketahui skor total masing-masing pekerjaan siswa, kemudian perlu dikerjakan langkah-langkah sebagai berikut:
1. Susunlah kertas jawaban testee dari bawah, yaitu mulai dari kertas jawaban yang mendapat skor terendah ke atas sampai pada kertas jawaban yang mendapat skor skor tertinggi.
2. Bagilah kertas-kertas jawaban tersebut dengan komposisi 27% yang termasuk mendapat skor terbaik 46% yang termasuk mendapat skor sedang dan 27% yang termasuk mendapat skor terendah. Dapat juga digolongkan dengan komposisi 25% kelompok skor baik/pandai, 50% kelompok skor sedang dan 25% kelompok skor kurang.
3. Cara menetapkan 27% kertas jawaban yang tergolong kategori baik/pandai tersebut ialah dengan mengambil kertas pekerjaan mereka mulai dari kertas jawaban yang mendapat skor tertinggi, ke bawah, sampai dipenuhi jumlah 27% dari seluruh kertas jawaban. Ini digolongkan ke dalam kelompok pandai.
4. Sedang cara menetapkan 27% kertas jawaban yang tergolong kategori kurang, ialah dengan mengambil kertas jawaban mereka mulai dari kertas jawaban yang mendapat skor terendah ke atas, sampai dipenuhi jumlah 27% dari seluruh kertas jawaban, ini digolongkan ke dalam kelompok kurang.
5. Jumlah 27% dari seluruh subjek yang di tes tersebut kita beri simbol “n”.
6. Setelah diambil 27% dari skor tertinggi dan menyolok/tajam dari skor terendah, sisanya tinggal 46%, dan digolongkan ke dalam kelompok sedang. Mereka yang termasuk ke dalam kelompok sedang ini, untuk keperluan mengukur taraf kesukaran item dan daya beda item tidak diikutsertakan. Salah satu alasan diambilnya dua kelompok saja kelompok pandai dan kelompok kurang, sebenarnya kita telah tahu bahwa kedua kelompok tersebut memiliki perbedaan skor yang menyolok/tajam suatu item dipergunakan untuk membedakan dua kelompok yang mempunyai perbedaan skor menyolok/tajam saja tidak dapat, apalagi untuk membedakan dua kelompok yang tidak begitu menyolok/tajam perbedaannya, niscaya akan lebih tidak mampu lagi.
7. Selanjutnya item-item tes yang akan dianalisis ialah item-item tes yang dikerjakan oleh 27% kelompok pandai dan item-item yang dikerjakan oleh 27% kelompok kurang.
8. Tahapan berikutnya ialah perlu dihitung beberapa jumlah subjek yang menjawab salah pada kelompok pandai, dan berapa jumlah subjek tes yang menjawab salah pada kelompok kurang.
9. Jumlah subjek yang menjawab salah pada kelompok pandai kita beri simbol .
10. Jumlah subjek yang menjawab salah pada kelompok kurang kita beri symbol .
11. Di hitungnya tersebut diperlukan untuk mengetahui indeks daya beda item dengan indeks taraf kesukaran item.
12. Indeks daya beda item dapat dicari dengan menghitung selisih presentase subjek yang menjawab salah pada kelompok kurang dengan presentase subjek yang menjawab salah pada kelompok pandai.
Daya beda = % - %
13. Indeks taraf keseluruhan item dapat dihitung dengan membagi jumlah subjek-subjek yang menjawab salah pada kelompok kurang dan subjek-subjek yang menjawab salah pada kelompok pandai dengan jumlah subjek pada kedua kelompok tersebut, kemudian dikallikan 100.
Taraf Kesukaran =

Dalam menghitung taraf kesukaran item-item kita mengambil jumlah subjek yang menjawab salah, hal itu dimaksudkan agar dimungkinkan memperoleh indeks taraf kesukaran item menaik, dalam arti bahwa item yang memiliki angka indeks tertinggi, berarti item tersebut sukar.
Sebaliknya apabila dalam menghitung taraf kesukaran item tersebut dengan mengambil jumlah subjek yang menjawab benar, maka indeks yang akan diperoleh bukanlah indeks taraf kesukaran, tetapi menjadi indeks taraf kemudahan item.
Formulasi lain untuk menghitung tara kesukaran item dikemukakan oleh Julian. C. Stanley dengan menghitung jumlah option untuk tiap-tiap item.
Taraf Kesukaran Item =

Tetapi jika kita menggunakan rumus Stanley tersebut, kemungkinan akan ditemui angka presentasi lebih dari 100, yang hal itu akan janggal dinamakan presentase. Sebagai contoh kita dapat menghitung nomor 6 tabel II.
*) O = option = alternatif yang disediakan untuk tiam item
**) jawaban yang benar pada option b.
14. Untuk jelasnya dalam menghitung daya beda dan taraf kesukaran item tersebut dapat dilihat contoh perhitungan item-item berikut ini.

Item No. 1
Komposisi jawaban subjek untuk item no. 1 sebagai berikut:


Kelompok Option
a b** c d omit
Pandai 27%
Kurang 27% 20
36 14
9 36
24 9
7 2
5 81
81

Item nomor satu dari 81 orang siswa pada kelompok pandai 60 siswa dapat menjawab benar, berarti jumlah subjek yang menjawab salah pada kelompok pandai = 21. Dan presentase = (100) = 26
Pada kelompok kurang dari 81 orang siswa yang dites, terjawab salah = 40
Dan presentase = (100) = 50
a) Daya Beda = % - %
= 50 – 26
= 24
b) Taraf Kesukaran = (100)
= (100)
= 38

Item No. 2
Komposisi jawaban subjek untuk item no. 2 sebagai berikut:


Kelompok Option
a b** c d omit
Pandai 27%
Kurang 27% 20
36 14
9 36
24 9
7 2
5 81
81

Item nomor dua memiliki

= 57, Persentase = 70
= 45, Persentase = 55

a) Daya Beda = % - %
= 70 – 55
= 25
b) Taraf Kesukaran = (100)
= (100)
= 63

Item No. 3

= 32, Persentase = 39
= 40, Persentase = 49
a) Daya Beda = 10
b) Taraf Kesukaran = (100)
= 44

Item No. 4
Komposisi jawaban subjek no. 4 sebagai berikut:


Kelompok Option
a b** c d omit
Pandai 27%
Kurang 27% 35
35 5
5 16
14 11
21 4
6 81
81

= 46, Persentase = 57
= 46, Persentase = 57

a) Daya Beda = 57 – 57
= 0

b) Taraf Kesukaran = (100)
= 57
Item No. 5
Komposisi jawaban subjek item No. 5


Kelompok Option
A b** C d omit
Pandai 27%
Kurang 27% 71
65 6
11 4
5 -
- -
- 81
81

= 16, Persentase = 20
= 10, Persentase = 12

a) Daya Beda = 20 – 12
= 8

b) Taraf Kesukaran = (100)
= 16

TABEL 10
KOMPOSISI JAWABAN SUBJEK PADA 27% KELOMPOK PANDAI (HIGH GROUP) DAN 27% KELOMPOK KURANG (LOW GROUP) TERHADAP 10 ITEM TES MULTIPLE CHOICE DENGAN JUMLAH TESTEE = 300
No. Item Group Option Jumlah testee pada tiap kelompok
A b c d omit
1. H
L 9
14 60
41 5
12 7
11 0
3 81
2. H
L 20
36 14
9 36
24 9
7 2
5 81
3. H
L 8
5 9
11 22
14 41
49 1
2 81
4. H
L 35
35 15
5 16
4 11
21 4
6 81
5. H
L 71
65 6
11 4
5 -
- -
- 81
6. H
L 24
24 31
40 10
6 9
6 7
5 81
7. H
L 4
6 75
50 2
- -
5 -
- 81
8. H
L 5
9 6
12 14
11 56
49 -
- 81
9. H
L 11
6 15
20 31
23 21
17 -
5 81
10. H
L 48
37 12
28 14
10 6
9 1
2 81


BAB VI
MACAM-MACAM TES HASIL BELAJAR
Ada banyak penggolongan tentang bentuk tes hasil belajar di mana penggolongan itu atas dasar tujuan tertentu.
Kita dapat mengadakan penggolongan bentuk tes hasil belajar sebagai berikut :
A. Ditinjau dari jawaban yang diterapkan dari testee
1. Tes Lisan : oral tes
2. Tes tertulis : written tes
B. Ditinjau dari kualitas tesnya :
1. Tes yang telah terstandar
2. Tes buatan guru sendiri yang belum terstandar
C. Ditinjau dari susunan item-itemnya
1. Tes jawab uraian (essay tes)
2. Tes objektif
Tes jawab terurai (essay tes)
Tes jawab terurai adalah suatu tes yang disusun dengan pertanyaan-pertanyaan yang relative pendek dan jawaban yang diminta dari testee dalam uraian bebas. Pertanyaan yang biasa diajukan umumnya berbentuk ;
Apa, siapa, kapan, di mana
a. Buatlah daftar
b. Buatlah online tentang
c. Lukislah/gambarkan
d. Perlawankan
e. Perbandingan
f. Terangkan
g. Diskusikan
h. Bagaimana perkembangan
i. Ringkasan
j. Pernilaian terhadap sesuatu

Dengan bentuk pertanyaan-pertanyaan tersebut testee menjawab dengan terurai dengan uraian bebas menurut cara mereka masing-masing dengan gaya bahasa tertentu dan dengan susunan kalimat tertentu.
Oleh karena jawaban testee dalam bentuk uraian, maka akan terjadi bahwa dua jawaban testee sebenarnya sama, tetapi karena diuraikan dengan gaya bahasa dan susunan kalimat yang berbeda, hal itu akan memerlukan keahlian dalam menginterpretasikan jawaban mereka yang selanjutnya akan memungkinkan pemberian penialaian yang berbeda, walaupun materi jawaban sama. Karena terhadap jawaban testee memerlukan penafsiran, sudah barang tentu di samping memerlukan keahlian dari penilaian juga diperlukan adanya sikap objektif dari penilai.

Tes Objektif
Tes objektif ialah tes yang disusun dengan perintah/pernyataan sedemikian rupa. Sehingga jawaban yang diminta dari testee cukup hanya dengan kata-kata singkat, dan bahkan cukup hanya dengan memberikan tanda-tanda tertentu. Karena jawaban testee hanya berupa kata-kata singkat, sehingga tidak perlu keahlian untuk menginterprestasi jawaban testee.

a. Tes Benar-Salah atau Tes Ya-Tidak (True-False Test, Yes-No Test)
Orang yang dites (testi) diminta menentukan pilhan atau pendapatnya mengenai pertanyaan-pertanyaan tersebut dengan cara seperti yang diminta dalam petunjuk.
Beberapa kekuatan dan kelemahan tes benar-salah antara lain adalah :
Kekuatan Kekuatan
a. Mudah disusun
b. Komprehensif
c. Dapat dinilai cepat
d. Praktis a. mendorong untuk menerka-nerka, dapat tanpa belajar
b. reliabilitasnya rendah
c. menimbulkan kekaburan, dan objektif sukar dicari item yang benar-benar benar dan benar-benar salah

b. Tes pilihan ganda (Multiple Choice Test)
Item dalam tes pilihan ganda terdiri dari suatu pertanyaan atau pernyataan yang belum selesai, diikuti oleh sejumlah kemungkinan jawaban. Pelajar atau test harus memilih jawaban yang paling tepat dalam cara sesuai dengan apa yang disebutkan dalam petunjuk.
Kebaikan dan kelemahan tes pilihan ganda antara lain adalah :
Kekuatan Kelemahan
a. Tes pilihan ganda dapat disusun untuk mneliti secara efektif kemampuan pelajaran untuk membuat tafsiran, melakukan pemilihan, mendeskripsikan pendapat, menarik, kesimpulan.
b. Cara penilaian dapat mudah dan cepat dilakukan serta objektif.
c. Faktor terkaan (menebak-nebak) dapat dihilangkan atau setidaknya dapat dikurangi minimal. a. Banyak diantara mereka yang mempergunakan tes bentuk pilihan berganda ini berusaha untuk menilai ingatan saja (dan itu memang paling mudah dikerjakan) .
b. Untuk menyusun tes pilihan berganda yang benar-benar baik adalah sukar.
c. Kerap kali terjadi :
• Terdapat lebih dari satu jawaban yang tepat
• Terlalu jelas bahwa kemungkinan jawaban yang lain-lain adalah salah, sehingga seakan-akan hanya ada satu kemungkinan jawaban saja.
d. Memakan banyak waktu dan tenaga untuk menyusunnya.


c. Tes membandingkan atau menyusun (Matching Test)
Tes membandingkan atau menyesuaikan ialah tes dimana disediakan dua kelompok bahan, dan testi harus mencari pasangan-pasangan yang sesuai antara yang terdapat pada kelompok pertama dan yang terdapat pada kelompok kedua, sesuai dengan petunjuk tes itu.
Kebaikan dan kelemahan tes membandingkan/menyesuaikan adalah :


Kekuatan Kelemahan
a. Tes ini dapat dipergunakan untuk bermacam-macam hal, misalnya :
• Problem dengan penyelesainnya
• Teori dengan penyusunannya
• Sebab dan akibatnya
• Singkatan dan kata-kata selengkapnya
• Istilah dengan defenisinya
b. Tes bentuk ini secara relative mudah disusun
c. Apabila tes ini disusun dengan baik maka factor menerka-nerka itu praktis dapat dihilangkan.
d. Dapat dinilai dengan mudah cepat dan objektif. a. Banyak diantara mereka yang mempergunakan tes bentuk pilihan berganda ini berusaha untuk menilai ingatan saja (dan itu memang paling mudah dikerjakan).
b. Untuk menyusun tes pilihan berganda yang benar-benar baik adalah sukar.
c. Kerap kali terjadi :
• Terdapat lebih dari satu jawaban yang tepat.
• Terlalu jelas bahwa kemungkinan jawaban yang lain-lain adalah salah, sehingga seakan-akan hanya ada satu kemungkinan jawaban saja.
d. Memakan banyakl waktu dan tenaga untuk menyusunnya.


d. Tes isian
Tes isian ini biasanya criteria atau karanagan, dimana kata-kata penting tertentu tidak dinyatakan (dikosongi) dan si-testi (pelajar atau anak didik) diminta mengisi bagian-bagian yang kosong itu.





Kebaikan dan kelemahan tes isian antara lain adalah :

Kekuatan Kelemahan
a. Dengan tes isian ini, masalah yang diujikan, disajikan dalam keseluruhannya, dalam konteksnya.
b. Baik untuk menyelidiki pengetahuan si pelajar secara utuh mengenai suatu bidang.
c. Mudah disusun. a. Terlalu banyak makan tempat dan waktu.
b. Kurang komprehensif, hanya dapat mencakup sebagian saja (mungkin sebagian kecil) daripada bahan yang harus dipelajari. Hal ini memungkinkan si pelajar untuk mengadakan spekulasi dalam belajar.
c. Seringkali dengan tes isian ini, yang dapat dinilainya kecakapan mengingat-ingat, sedangkan kecakapan yang lain kurang mendapat sorotan.




BAB VII
PRINSIP-PRINSIP UMUM PENYUSUNAN TES
C.C.Ross & J.C Stanley mengumakakan teknik pengukuran dan penilaian, yaitu:
1. Planing the test( perencanaan tes)
2. Preparing the test (persiapan tes)
3. Try out the test( try out tes)
4. Evaluating the test( penilaian tes)

1. Planing The Test( Perencanaan Tes)
Hal yang perlu diperhatikan, yaitu:
1 Hakikat daripada objek yang akan diukur.
2 Ditetapkan tujuan yang akan dicapai.
3 Diterapkan bagi siswa kondisi yang bagaimana dalam tes.

2. Preparing The Test (Persiapan Tes)
1 Penyusunan Item-item tes sebagai faktor dasar tes daripada tes.
2 Memasukkan bermacam-macam tipe tes yang akan memebuat siswa lebih menarik dibadingkan hanya 1 tipe.
3 Item tes harus memiliki tingkat kesukaran yang sedang.
4 Menyediakan item tes sebanyak mungkin untuk menjaga terjadinya revisi atau perubahan.
5 Item yang telah dipersiapan perlu diadakan kritik-kritik, apakah item tes tersebut benar-benar telah mencerminkan faktor.
6 Item-item tes harus menekankan materi daripada hanya sekedar pertannya akan menentukan jawabannya.
7 Item tes harus disusun sedemikian mungkin, sehingga keseluruhan isi lebih berfungsi dalam menentukan jawaban.
8 Setiap item-item disusun menjadi beberapa tipe sehingga terkelompok.
9 Item yang mudah diletakkan di nomor pemula, hingga item paling sukar.
10 Susunan pilihan jawaban yang paling benar supaya jauh dari pola jawaban teratur
11 Sediakan catatn tertulis buat siswa
12 Petunjuk-petunjuk tentang mengerjakan & menjawab dan cara memahami soal-soal.
3. Try out tes
1 Perlu diusahakan agar penyelenggara tes berjalan diatas kondisi yang normal.
2 Waktu untuk mengerjakan tes harus mencukupi.
3 Prosedur skorsing harus sessederhana mungkin.
Untuk mengetahui skor keseluruhan untuk tes objektif digunakan rumus umum, yaitu:
S=R- W
0-1
S: skor tes keseluruhan
R: jumlah jawaban yang benar

4. Standar penilaian
Standar penilaian yaitu cara yang digunakan dalam menentukan derajat keberhasilan hasil penilaian sehingga dapat diketahui kedudukan siswa apakah itu telah menguasai tujuan pembelajaran. Standar penilaian dikelompokkan menjadi 2 yaitu penilaian acuan norma dan penilaian acuan patokan.
a. Penilaian Acuan Norma (PAN)
PAN adalah penilaian yang menggunakan acuan pada rata-rata kelompok. Kriteria yang digunakan dalam menentukan derajat prestasi seorang siswa selalu dibandingkan dengan nilai rata-rata kelasnya.
b. Penilaian acuan patokan (PAP)
PAP adalah penilaian yang menggunakan acuan pada tujuan pembelajaran atau kompetensi yang harus dikuasai siswa. Derajat keberhasilan siswa dibandingkan dengan prestasi kelompoknya. Kriteria minimal yang biasa digunakan adalah 80% dari tujuan atau kompetensi yang seharusnya dikuasai siswa.