Kamis, 01 Desember 2022

Mengenal Exploratory Factor Analysis dan Confirmatory Factor Analysis (Langkah Inti, Bukti Referensi, dan Contoh Data)

Own Illustrated Design

Hello Folks. Dikesempatan yang baik ini, ijinkan gw untuk berbagi ilmu yang gw pelajari secara autodidak berkaitan dengan teknik analisis data, yakni analisis faktor eksploratori dan analisis faktor konfirmatori. Gw rencana berkomitmen untuk membedah teknik analisis data lainnya di blog pribadi gw supaya para pembaca paham konsepnya, paham alurnya, paham indikator yang dibutuhkan apa aja, paham syarat validnya apa aja, dan paham outputnya seperti apa. Seenggaknya gw mau berbagi ilmu ke mahasiswa yang mau menghadapi skripsi, sehingga mereka tidak lagi menggunakan jasa joki skripsi. Sebenarnya, istilah joki skripsi itu baik kalau memang tujuannya sebagai mentor dan konsultan yang membantu memahami penelitian kamu, tapi kalau joki skripsi sudah pada tingkatan manipulasi data skripsi, mereka pantas disebut sebagai mafia akademis

    Banyak perguruan tinggi mem-pressure mahasiswanya untuk mendapatkan jumlah data yang sangat besar. Beberapa mahasiswa mungkin meresponnya dengan semangat dan ada juga yang meresponnya dengan mengeluh. Secara teori, semakin banyak data, maka hasil penelitian diharapkan akan semakin mendekati fakta lapangan. Tapi kalau boleh jujur, berdasarkan pengalaman gw pribadi, "minat responden mengisi kuesioner" di Indonesia itu masih sangat lemah, sehingga tingkat akurasi dan kualitas jawaban dalam kuesioner juga menjadi rendah, apabila kita tidak datang secara face-to-face untuk memastikan jawaban kuesioner itu secara langsung. Google form dan angket inap memiliki akurasi yang lebih rendah daripada angket yang disebarkan secara langsung dengan durasi sekitar 5-10 menit yang didiskusikan secara komprehensif. Oleh karena itu, terkadang kecacatan sistem ini dimanfaatkan oleh penyedia jasa joki skripsi. Terlebih lagi ketika dosen mengingkan hasil penelitian yang "POKOKNYA HARUS VALID, HARUS SIGNIFIKAN, HARUS BERPENGARUH" kalo gak gitu berarti penelitianmu masih gagal.  

  "Tidak ada hasil penelitian yang sempurna karena tiap teknik analisis data yang digunakan dalam penelitian memiliki kelemahannya masing-masing". Bahkan, dua penelitian dalam satu lokasi yang sama bisa mendapatkan hasil yang berbeda. Semua tergantung pada teknik analisis data yang digunakan, teknik pengambilan sampel, jumlah sampel yang digunakan, psikologis responden, dan prosedurmu melakukan penyebaran kuesioner. Pada umumnya, institusi penelitian menginginkan keputusan penelitian yang valid. Padahal, data yang tidak valid bisa dijadikan rujukan referensi yang menggambarkan fakta sebenarnya. 

    Gw sendiri pernah mengaplikasikan penelitian gw dengan metode campuran (mix method) dengan embedded nested design. Awalnya penelitian gw hanya tertulis kuantitatif, namun pada pelaksanaannya, gw juga banyak melakukan wawancara. Sehingga, daripada hanya mencantumkan hasil penelitian kuantitatifnya, gw mencoba untuk memperkaya temuan penelitian gw dengan menggandeng teknik analisis kualitatif dari hasil wawancara. Terkejutlah gw ketika output dari analisis data kuantitatif dan kualitatif menunjukkan hasil yang berbeda. Sehingga, gw menyadari bahwa penelitian untuk menggali fenomena sosial itu bisa saja bersifat subjektif. Kebetulan, lokasi penelitian gw waktu itu memiliki konflik kepentingan dengan investor, sehingga kemungkinan hal inilah yang menyebabkan jawaban dari hasil analisis kuantitatif dan kualitatif mendapatkan respon yang tumpang tindih. Hingga akhirnya, gw memilih opsi untuk memaparkan hasil kuantitatif dan kualitatif secara terpisah. Waktu itu, gw ga berani mengupas kacang penelitian dan hanya memperlihatkan kulitnya saja, karena bisa jadi ultimatum buat gw sendiri jika gw membedah dan mempublikasikan hasil penelitian lebih dalam ke ranah publik. Selain karena semua narasumber kualitatif ingin identitasnya dirahasiakan, investor ini juga bekerjasama dengan pemerintahan. Sehingga, terlalu beresiko buat gw jika mempublikasikan seluruh hasil penelitian gw ke ranah publik. Hingga akhirnya, salah satu narasumber yang merupakan satu dari sekian orang penting disana kini menyadari permasalahan di lokasi tempat gw melakukan penelitian, sehingga masalah ini diharapkan bisa dirunding secara internal tanpa melalui proses publikasi yang menyebabkan ultimatum dalam bentuk apapun. Semoga cepat berproses ya pak.... Jadi, lanjut to the poin aja deh. Lengkapnya gw tulis sebagai berikut:

Daftar Isi: 
1. Teknik menyusun kuesioner dengan benar untuk menghindari kuesioner tidak valid
2. Teknik menyebarkan kuesioner dengan pendekatan budaya lokal dan kondisi demografis
3. Jumlah responden yang ideal dan durasi faktual untuk menyelesaikannya 
4. Exploratory F.A
5. Confirmatory F.A 

1. Teknik menyusun kuesioner dengan benar untuk menghindari data tidak valid

    Berdasarkan pengalaman gw, ada beberapa alasan mengapa data yang kita peroleh tidak valid saat proses uji validasi. Alasan-alasan itu antara lain:

  • 1. Respoden 1 sampai n mencentang opsi yang sama dalam satu pernyataan. Contoh: Pernyataan "Pariwisata di Desa A menyebabkan pendapatan ekonomi saya meningkat". Dari pernyataan tersebut, responden 1 sampai 500 (misalnya) mencentang opsi "setuju" semua. Hal ini akan menyebabkan pernyataan justru tidak valid karena mengandung jawaban yang sama semua saat proses uji validitas. Menurut gw pribadi, ini memang salah satu kelemahan dari analisis kuantitatif. Bayangkan saja kalau semisal semuanya setuju namun kondisi tersebut justru dinyatakan tidak valid oleh software statistik. Solusi
    • Hindari hanya opsi Setuju dan Tidak Setuju. Gunakan 3 (TS, N, S) atau 5 Poin Skala Likert (STS, TS, N, S, SS). Jangan menggunakan lebih atau kurang dari itu. Sebab, jika kurang dari 3, maka jawaban responden bisa berpotensi sama semua dan ada kecenderungan untuk asal-asalan dalam mengisi kuesioner karena tidak tersedia opsi "netral", sedangkan jika lebih dari 5, baik responden maupun penyebar kuesioner akan merasakan "fatigue" karena terlalu banyak opsi dan cenderung membingungkan. 
    • Pastikan kamu menguasai isi kuesionermu dan mendapat jawaban yang pasti dari responden melalui diskusi yang komprehensif. Baca mimik wajah responden, kuasai responden, dan katakan bahwa data diri mereka tidak akan disebarkan kemanapun dan tidak ada ancaman atau ultimatum apapun dengan menjawab pernyataan tersebut, sehingga jawaban yang seharusnya dijawab dengan opsi "tidak setuju" bisa dijawab secara jujur dengan "setuju". Kalau perlu, kamu sendiri yang membacakan pernyataan dan kamu sendiri yang menawarkan untuk mencentang opsi jawaban. Jangan beri ruang/peluang sedikitpun bagi responden untuk menjawab asal-asalan ataupun takut untuk menjawab sehingga terpaku pada opsi jawaban tertentu.
    • Pastikan teknik penentuan sampling-mu menggunakan unsur-unsur random sampling sehingga menghasilkan sebuah probability yang menarik untuk digali. Jangan gunakan purposive sampling pada sekumpulan responden dengan kriteria yang sama dengan jawaban yang pasti sudah diketahui, tanpa adanya fenomena khusus. Dengan demikian, kamu harus menentukan teknik analisis data yang tepat pada penelitianmu. Apakah memang perlu teknik analisis kualitatif dengan pendekatan FGD atau kuantitatif yang membutuhkan sampel random sebagai generalisasi. 
Data jawaban sama semua pada X1 dan X4

Indikator tidak bisa diidentifikasi sebagai pernyataan yang valid (Indikator valid memiliki bintang 1 dan bintang 2). Indikator yang tidak valid adalah indikator yang tidak memiliki bintang / tidak dapat diidentifikasi dengan keterangan "a" seperti pada indikator x1 dan x4

  • 2. Hindari pernyataan yang menggunakan imbuhan "tapi, atau, tidak, dan" pada pernyataan kuesioner. Banyak peneliti menganggap desain kuesioner seperti ini adalah jawaban dari solusi efektifitas waktu. "Sekali mendayung maka dua pulau terlampaui". Padahal penyusunan kuesioner seperti ini sangat berisiko menghasilkan jawaban yang bias dan membingungkan. Kuesioner yang baik adalah kuesioner yang membuat responden meresapi pernyataan secara satu-persatu. Pada sebagian kasus, kesalahan justru timbul akibat kelalaian peneliti dalam menyusun kuesioner. Contohnya adalah ketika banyak pernyataan yang dominan dibuat tanpa menggunakan imbuhan "tidak", kemudian ada salah satu pernyataan yang dibuat menggunakan imbuhan "tidak", maka kemungkinan besar responden atau penyebar kuesioner justru secara tidak sadar akan salah mencentang skala indikator yang ditetapkan karena imbuhan kata "tidak" mengganggu ingatan urutan skala liker. Contoh lainnya adalah menggunakan imbuhan "dan" yang gw illustrasikan lewat gambar berikut:

2. Teknik menyebarkan kuesioner dengan pendekatan budaya lokal dan kondisi demografis

  • Bahasa kebiasaan responden : Ini berdasarkan pengalaman gw ya. Gw pernah sebar kuesioner disuatu daerah yang masih rural area. Meskipun masyarakat daerah ini bisa berhasa Indonesia, namun pada faktanya mereka lebih fasih berbicara dalam bahasa daerah. Jika menggunakan bahasa Indonesia, mereka akan terbata-bata sehingga komunikasi menjadi tidak lancar. Sehingga, ketika mengisi kuesioner saya dan responden tidak menemui koneksi. Awalnya saya tidak mengerti mengapa hal ini terjadi. Namun, setelah saya gali lagi, ternyata memang masyarakat sini lebih fasih menggunakan bahasa daerah. Sehingga, mau tidak mau saya harus mengajak rekan yang bisa berbahasa daerah dan menggunakan bahasa daerah setempat selancar mungkin untuk mengisi kuesioner dengan baik dan benar.
  • Pedesaan, Perumahan, Perkotaan, atau Instansi? Kriteria responden di daerah pedesaan dan perkotaan juga berbeda. Umumnya, responden didaerah pedesaan cenderung membutuhkan effort  lebih tinggi untuk memahami kuesioner. Maklum, biasanya orang pedesaan masih lulusan SD hingga SMP, sehingga mereka tidak bisa memahami bahasa akademis seperti kalian sekalipun itu mungkin mudah dipahami. Dengan demikian, pernyataan kuesioner yang kalian ajukan tidak bisa kalian baca dengan berpegang pada teks namun perlu adanya pendekatan yang lebih mudah dipahami oleh responden dengan bentuk-bentuk kearifan lokal. Contoh: pernyataan kamu pertama adalah "pariwisata di Desa A menyebabkan asimilasi dalam kehidupan sekitar saya". Kata asimilasi dalam pernyataan tersebut harus bisa kamu jelaskan ke respondenmu dengan bahasa yang mudah dipahami. Jangan sampai kamu yang justru lupa apa itu makna dari asimilasi dan malah menjelaskan definisi akulturasi pada responden yang bertanya. Beda lagi kalau di daerah perkotaan. Istilah-istilah yang mungkin tidak umum, mungkin menjadi umum dimata mereka, sehingga kamu tidak memerlukan effort lebih keras untuk menjelaskan kepada mereka.
  • Formal vs Santai. Ini juga berdasarkan pengalaman pribadi gw. Dulu gw pernah pakai pakaian yang formal saat menyebarkan kuesioner di daerah pedesaan dengan alasan supaya terlihat profesional dan rapih. Saya kaget kok banyak banget orang yang takut sama gw. Bahkan, mereka rata-rata tidak mau menjawab kuesioner gw dan mengarahkan gw ke orang yang mereka anggap lebih pintar. Ditambah, saat itu gw menggunakan Bahasa Indonesia yang baku layaknya berbicara dengan atasan kantor. Nah, dari sini saya akhirnya menyadari bahwa pakaian yang gw gunakan dan bahasa yang gw gunakan dalam menyebar kuesioner terlalu kaku. Hingga akhirnya gw lebih menggunakan prosedur yang tidak baku dan cenderung santai. Berbeda lagi jika responden kamu adalah pejabat penting. Dengan bahasa yang suantai bisa jadi kamu diusir terlebih dulu dan dianggap tidak profesional. Semuanya butuh eksperimen dan penyesuaian. Oleh karena itu, nikmati aja proses uji validitas kuesioner kamu. Jangan grusa-grusu pingin cepat selesai.
  • Umur Responden. Sopan santun dalam menyebarkan kuesioner juga dibutuhkan. Gunakan imbuhan kakek, nenek, bapak, ibu, adik, bang, mas, kak, dan mbak dengan mulus. Jangan sampai kamu menyebar kuesioner dengan kalimat "halo bro, minta tolong dong isiin kuesioner gw, cuman lima menit doang kok". Alangkah lebih baik kalimat itu diubah menjadi "halo kak (nama) ........ saya begini begini begini, boleh minta tolong dan meminta waktunya 5 menit saja untuk isi kuesioner saya kah?". Buatlah respondenmu tidak segan untuk mengisi kuesionermu.
  • Waktu. Nah, jika kalian mengisi kuesioner dan respondennya adalah masyarakat lokal, biasanya mereka banyak ditemui dirumah saat sore hari sepulang kerja. Ambillah waktu pukul setengah 4 sore hingga pukul setengah 6 sore. Jangan berburu responden di jam tidur siang. Apabila memang target anda ibu rumah tangga, pukul 8 pagi hingga pukul 11 siang adalah waktu yang tepat karena di jam segitulah biasanya mereka tidak begitu padat mengurus urusan rumah tangga. Apabila ada orang yang tidak bersedia mengisi kuesioner, maka jangan dipaksa daripada nanti kamu dilaporin sama pihak keamanan setempat. Terkadang, beberapa responden tidak ingin memberi tau profil mereka seperti umur, pendapatan per bulan, dan lain sebagainya, sehingga jangan lupa sediakan opsi "tidak diketahui" dalam kuesionermu. 
3. Jumlah responden yang ideal dan durasi faktual untuk menyelesaikannya

  • Jumlah ideal responden penelitian kuantitatif pada umumnya adalah minimal 100. Namun, gw merekomendasikan kalian supaya dapat responden seenggaknya 120 keatas. Hal ini harus kalian lakukan, karena software olah data terkadang membutuhkan kriteria sampel tertentu supaya dapat dikatakan valid dan reliabel atau memenuhi standar tertentu. Contoh kecilnya, suatu waktu, gw pernah mengalami kejadian dimana jumlah sampel gw 141 dengan standar nilai validitasnya 0,361. Nah, ada sebuah pernyataan dimana nilai validitasnya itu 0,359. Rasanya tuh kayak gemesss, nanggung amat kurang 0,002 udah jadi 0,361. Batinku "pingin deh nambah sampel lagi biar gak nanggung gini nilainya". Nah, disinilah pentingnya jumlah sampel. Dari berbagai sumber yang gw dapat, semakin tinggi jumlah sampelmu, maka akan semakin dijauhkan dari nilai yang tanggung tadi alias penelitianmu sudah reliabel dan validitasmu tidak perlu diragukan lagi. Semisal kalian sudah memutuskan jumlah responden sebanyak 120 nih, kalian tambahkan lagi sebanyak 10, tujuannya untuk mengantisipasi adanya responden yang menjawab asal-asalan. Asal-asalan yang gw maksud contohnya seperti: pernyataan dari nomor 1-25 dijawab setuju semua. Sebenarnya tidak salah responden menjawab setuju namun, biasanya kuesioner yang diisi dengan centang yang sama semua adalah kuesioner yang diisi tanpa dibaca terlebih dahulu alias "yang penting nyentang". Untuk rumus sampling gw merekomendasikan rumus dari William G. Cochran karena kalian bisa mengatur sendiri perkiraan jumlah sampel yang kalian mau dengan memainkan persentase taraf kesalahan (margin of error) dalam rumusnya.
  • Durasi faktual untuk menggapai responden sebanyak 100 sebetulnya sangat mudah apabila kalian menggunakan metode sebar inap atau sebar beramai. Tapi, balik lagi ke paragraf pertama tulisan gw ini, metode google form maupun sebar inap berpotensi dijawab asal-asalan jika bukan kalian sendiri yang melakukan penyebaran secara komprehensif. Lebih baik kalian lakukan penelitian kualitatif aja sekalian jika serasa kalian tidak sanggup melakukan penyebaran kuesioner secara komprehensif mandiri. Durasi faktual untuk meraih 100 responden adalah seminggu sampai dua minggu. Berdasarkan pengalaman gw pribadi, seenggaknya 100 responden itu adalah sekitar seminggu sampai dua minggu. Bisa lebih cepat dan bisa lebih lama tergantung kondisi tertentu.
Kotak Biru dengan sampel 20 => pernyataan X1 valid | Kotak Merah sampel 15 => pernyataan X1 tidak Valid | Dalam penelitian kuantitatif, jumlah sampel merupakan salah satu kriteria yang akan mempengaruhi validitas kuesioner. Semakin banyak sampelmu, maka hasil penelitian akan semakin mendekati sempurna karena banyaknya sampel yang berpartisipasi untuk merepresentasikan hasil penelitianmu. Apabila 0,30 adalah nilai standar validitas dari sebuah pernyataan, maka pernyataan yang memiliki skor 0,29, dinyatakan tidak valid meskipun hanya selisih 0,1. Dengan menambah jumlah sampel, kemungkinan pernyataan dengan skor 0,29 tadi mengalami kenaikan sehingga dinyatakan vali. Namun, bisa juga terjadi penurunan skor sehingga pernyataan dinyatakan tetap tidak valid. Naiknya jumlah sampel juga menyebabkan naiknya standar validitas, sehingga bukan 0,30 lagi melainkan 0,40 (misalnya) menyesuaikan isi dari tabel pearson r. Semakin banyak sampelmu, maka nilai standar validitasmu akan semakin tinggi, namun keuntungannya nilai reliabilitas penelitianmu juga akan semakin tinggi. Valid dan reliabel adalah koentji. hehehe

4. EXPLORATORY FACTOR ANALYSIS

    "Analisis faktor eksploratori memiliki berbagai fungsi yang dapat diaplikasikan dalam penelitian, sehingga definisi analisis faktor eksploratori bisa beragam tergantung bagaimana caramu menggunakannya." -elsonnewgate.blogspot.com.

Definisi dan kegunaan-kegunaan EFA (Exploratory Factor Analysis)

    1. Jika analisis faktor eksploratori digunakan untuk mengidentifikasi sebuah faktor laten dengan pendekatan metode formatif dimana variabel masih tersusun secara acak, maka definisi dari analisis faktor eksploratori adalah sebuah teknik analisis yang digunakan untuk mengidentifikasi faktor-faktor yang terbentuk berdasarkan variabel-variabel acak yang memiliki ciri khas khusus atau nature tertentu yang sama
    Variabel yang digunakan dalam analisis faktor eksploratori bisa diambil dengan mengadopsi variabel dari berbagai penelitian terdahulu yang disusun menjadi serangkaian variabel acak dalam satu kuesioner maupun melalui wawancara pendahuluan untuk menggali fenomena di lokasi penelitianmu yang bisa dijadikan variabel baru dalam kuesionermu. Berbeda dengan analisis faktor konfirmatori, variabel yang digunakan dalam CFA diambil dengan mengadopsi satu teori tertentu yang telah diuji sebelumnya dan kamu tinggal mencomotnya untuk diteliti di lokasi penelitianmu. Variabel dalam CFA juga bisa diambil dari variabel analisis faktor eksploratori (EFA) yang pernah dilakukan dalam suatu penelitian untuk dikonfirmasi lagi kebenarannya menggunakan confirmatory factor analysis (CFA) dalam suatu lokus yang sudah teruji validitas EFA-nya. Note: Sebelum melakukan EFA, alangkah lebih baik kuesioner diuji validitasnya terlebih dahulu dengan sampel uji coba sebanyak minimal 30 sampel. Sampel uji coba tidak boleh digunakan kembali untuk ditambahkan sebagai sampel EFA karena sampel uji coba berfungsi untuk menguji kevalidan kuesioner, sedangkan sampel EFA berfungsi untuk mendapatkan faktor laten Contoh:

        Sebuah kuesioner memiliki 13 buah pernyataan variabel yang tersusun secara acak. Variabel tersebut berisi tentang pernyataan alasan mengapa konsumen senang berbelanja di toko A. Kuesioner disusun menggunakan 5 point scale likert (sangat setuju, setuju, netral, tidak setuju, sangat tidak setuju). Anggap saja variabel ini didapatkan berdasarkan wawancara dari beragam konsumer di Toko A. Sampel yang digunakan sebanyak 50 responden dan kuesioner telah diuji validitas sebelumnya dengan sampel sebanyak 30.  Adapun 13 buah pernyataan variabel tersebut, antara lain:

  1. Saya senang berbelanja produk di Toko A karena produk tetap awet meskipun terkena air
  2. Saya senang berbelanja produk di Toko A karena produk di Toko A dijual dengan harga yang sangat terjangkau
  3. Saya senang berbelanja produk di Toko A karena produk di Toko A tidak mudah dimakan rayap
  4. Saya merasa terbantu karena Toko A menyediakan layanan set up di rumah
  5. Toko A menjadi langganan saya karena Toko A menawarkan gratis ongkir
  6. Produk di Toko A selalu tersedia tanpa harus takut kehabisan (always ready on stock)
  7. Saya dilayani dengan baik ketika berbelanja di Toko A
  8. Saya merasa nyaman ketika berbelanja di Toko A karena ruangan tersusun dengan rapi 
  9. Saya merasa nyaman ketika berbelanja di Toko A karena ruangan bersih
  10. Saya dapat melakukan booking barang di Toko A dengan kuantitas sangat banyak
  11. Saya dapat melakukan pre-order barang custom di Toko A 
  12. Saya percaya diri berbelanja di Toko A karena Toko A menyediakan layanan garansi produk
  13. Saya mendapatkan kualitas produk terbaik setiap membeli produk di Toko A
        Berdasarkan 13 variabel acak diatas, maka akan kita lakukan proses analisis faktor eksploratori yang digunakan untuk menentukan dimensi apa saja (faktor laten) yang terbentuk berdasarkan nature tertentu yang sama. Sehingga, output hasil dari analisis faktor eksploratori akan terlihat sebagai berikut:

    Ilustrasi diatas memberitahu kita bahwa variabel acak mengelompok dan membentuk suatu nature yang sama, sehingga faktor laten dapat diidentifikasi dan diberi pelabelan. Sehingga, dari 13 variabel tadi dapat kita ketahui ada 4 faktor alasan mengapa konsumen berbelanja di Toko A. 


    2. Jika analisis faktor eksploratori digunakan untuk first order validity sebelum masuk gerbang analisis faktor konfirmatori (second order validity), maupun untuk keperluan gabungan teknik analisis lainnya (EFA-> CFA+/Other MultivariateT.A), maka definisi dari analisis faktor eksploratori adalah sebuah teknik analisis yang digunakan untuk mengidentifikasi dan menguji validitas awal faktor-faktor laten yang terbentuk berdasarkan variabel-variabel acak yang memiliki ciri khas khusus atau nature tertentu yang sama dengan sampel terpisah (splited or separated sample) dan sisa sampel diujikan untuk validitas CFA maupun teknik analisis lainnya. Dalam definisi kedua ini, variabel EFA yang digunakan sama dengan keterangan nomor 1, namun kemudian dilanjutkan dengan analisis CFA yang digunakan untuk menguji kembali validitas EFA yang telah tervalidasi. (EFA sebagai first order validity dengan sampel 50%, CFA sebagai second order validity dengan sampel 50%, atau bisa EFA sebagai first order validity dengan sampel 100%, CFA sebagai second order dengan sampel 100%). Contoh:

            Sebuah kuesioner memiliki 10 buah pernyataan variabel yang tersusun secara acak. Variabel tersebut berisi tentang pernyataan-pernyataan mengapa siswa-siswa di Sekolah Z senang belajar matematika. Kuesioner disusun menggunakan 5 point scale likert (sangat setuju, setuju, netral, tidak setuju, sangat tidak setuju). Anggap saja variabel ini didapatkan berdasarkan wawancara random kepada siswa-siswa di sekolah Z. Sampel yang digunakan untuk first order validity sebanyak 50 responden (siswa) dan kuesioner telah diuji validitas sebelumnya dengan sampel sebanyak 30 sebagai pilot sample. Adapun 10 buah pernyataan variabel tersebut, antara lain:
  1. Saya senang belajar matematika di sekolah karena guru matematika saya mengajar dengan memadukan media teknologi yang menarik
  2. Saya hobi menghitung sehingga saya senang belajar matematika di sekolah
  3. Matematika adalah permainan yang menarik untuk dipecahkan di sekolah
  4. Guru matematika saya mengajar matematika dengan sabar
  5. Guru matematika saya mengajar matematika dengan detail
  6. Guru matematika saya tidak memarahi saya ketika saya kebingungan
  7. Buku matematika saya memiliki desain yang bagus sehingga menambah semangat belajar saya
  8. Guru matematika saya memperlakukan baik siswa yang sudah memahami materi, maupun siswa yang belum mengerti dengan materi yang diajarkan
  9. Guru matematika saya selalu memberi semangat untuk belajar matematika
  10. Saya diberikan hadiah menarik ketika berhasil mengerjakan soal-soal matematika dengan baik 
         Berdasarkan 10 variabel acak diatas, maka akan kita lakukan proses analisis faktor eksploratori yang digunakan untuk menentukan dimensi apa saja (faktor laten) yang terbentuk berdasarkan nature tertentu yang sama dan memastikan bahwa nilai loading factor valid sesuai nilai minimum kriteria. Hasil dari analisis faktor eksploratori akan terlihat sebagai berikut:

Anggap saja ilustrasi diatas ditentukan nilai minimum factor loading ≥ 0,60. Variabel X9 menunjukkan bahwa skor loading kurang dari 0,60, sehingga variabel X.9 dinyatakan tidak valid. Artinya, variabel "guru matematika saya selalu memberi semangat untuk belajar" dirasa tidak valid oleh 50 responden. Selain itu, X5 masuk kedalam komponen 1 dan 2. Hal ini akan membingungkan peneliti untuk menentukan dimanakah X5 seharusnya berada dalam salah satu faktor latennya. Menurut Hair et al (2010), kejadian variabel double-barel ini perlu dihapus atau dapat menggunakan metode rotasi faktor lain sampai dirasa tidak menimbulkan double-barel. Menurut Field (2005), variabel double barel seperti X5 ini bisa juga diselesaikan dengan menggunakan fitur "surpress small coefficient", asalkan salah satu nilai loading factor telah memenuhi standar minimum 0,60 yang telah ditentukan.

    3. Jika analisis faktor eksploratori digunakan untuk menguji validitas konstruk (discriminant dan convergence validity) dengan pendekatan metode reflektif / reflective method), maka definisi dari analisis faktor eksploratori adalah sebuah teknik analisis yang digunakan untuk menguji validitas faktor-faktor yang sudah tersusun dan telah ditentukan sebelumnya berdasarkan variabel-variabel penyusunnya (predicted laten factor). Contoh:

     Sebuah kuesioner memiliki 3 buah indikator. Tiap indikator didalamnya berisi 4 variabel-variabel yang telah tersusun dan ditentukan sebelumnya. Variabel tersebut berisi tentang dampak-dampak dari pariwisata yang terbagi menjadi indikator dampak ekonomi, sosial-budaya, dan lingkungan. Kuesioner disusun menggunakan 5 point scale likert (sangat setuju, setuju, netral, tidak setuju, sangat tidak setuju). Anggap saja variabel ini didapatkan berdasarkan wawancara random kepada masyarakat lokal di Desa B. Sampel yang digunakan sebanyak 50 responden (masyarakat lokal) dan kuesioner telah diuji validitas sebelumnya dengan sampel sebanyak 30 sebagai pilot sample. Adapun indikator beserta pernyataan-pernyataan variabel tersebut, antara lain:
        
1. Dampak ekonomi (X1)
Variabelnya: (X1.1) Pendapatan ekonomi saya meningkat dengan adanya kegiatan pariwisata
                      (X1.2) Saya mendapat peluang kerja dengan adanya kegiatan pariwisata
                      (X1.3) Saya mendapat peluang usaha dengan adanya kegiatan pariwisata
                      (X1.4) Penjualan hasil panen meningkat dengan adanya pariwisata
2. Dampak sosial-budaya (X2)
Variabelnya : (X2.1) Kegiatan pariwisata menganggu aktifitas adat
                       (X2.2) Kegiatan pariwisata menyebabkan budaya lokal semakin lestari
                       (X2.3) Kegiatan pariwisata menyebabkan masyarakat bisa bicara bahasa asing
                       (X2.4) Kegiatan pariwisata menyebabkan komodifikasi budaya
 3. Dampak lingkungan (X3)
 Variabelnya : (X3.1) Pariwisata menyebabkan kemacetan
                        (X3.2) Pariwisata menyebabkan polusi asap kendaraan
                        (X3.3) Pariwisata menyebabkan kerusakan lingkungan persawahan
                        (X3.4) Pariwisata menyebabkan perbaikan sarana dan prasarana desa

    Berdasarkan variabel yang telah tersusun, maka akan kita lakukan proses analisis faktor eksploratori yang digunakan untuk memastikan bahwa variabel-variabel mereflektifkan faktor yang telah dibuat atau diprediksi sebelumnya. Hasil dari analisis faktor eksploratori akan terlihat sebagai berikut:



Sampel Aman, Kriteria Aman dan Tahapan dalam melakukan Analisis Faktor Eksploratori

Sampel Aman
    Menurut Hair et al (2010), sampel aman dalam penelitian analisis faktor eksploratori adalah 100 atau lebih untuk menghindari error. Beliau juga mengatakan bahwa sampel bisa berbanding 1:5, artinya jika variabel terdapat 10 buah maka sampelnya 10x5 sehingga sampel minimal harus 50. Wieringa dkk (2009) mengatakan bahwa minimal sampel sebanyak 50. Tapi, berdasarkan pengamatan dan pengalaman gw, banyak penelitian EFA menggunakan sampel diatas 100. Jadi, jika ingin hasil penelitianmu berkualitas, setidaknya milikilah sampel yang tidak kurang dari 100. Tapi, kembali lagi semua digunakan sesuai kebutuhan.

Kriteria Aman dan Tahapan
Langsung buka SPSS kalian: Pilih Analyze ->Dimension Reduction -> Factor.



  1. Pastikan nilai KMO-MSA ≥ 0,5 
  2. Pastikan nilai sig dari bartlett's test of spehericty ≤ 0,05
  3. Nilai MSA per variabel ≥ 0,5
  4. Pastikan nilai communalities ≥ 0,60 untuk menghindari adanya loading error / error variance / double barrel 
  5. Pilihlah metode ekstraksi maximum likelihood atau principal axis factoring (EFA). Jika dirasa dari kedua metode tersebut justru banyak loading factor yang error, maka dengan sangat terpaksa gunakan principal component (PCA). Peneliti diluaran sana memperdebatkan bahwa EFA dan PCA (Principal Component) memiliki fungsi yang berbeda. Namun pada faktanya, banyak penelitian yang tidak membedakan antara EFA dan PCA. Beberapa penelitian yang dipublikasikan secara resmi juga tidak banyak mempermasalahkan antara fungsi EFA dan PCA ini. Jadi, gw merekomendasikan menggunakan maximum likelihood atau principal axis factoring terlebih dahulu sebelum menggunakan metode ektraksi principal component,untuk menghindari perdebatan-perdebatan yang tidak perlu.
  6. Umumnya, banyak penelitian menggunakan standar nilai eigenvalue ≥ 1 sebagai patokan jumlah faktor laten, namun jika kalian memang ingin percaya diri bahwa faktor laten terbentuk dengan jumlah tertentu yang sudah kalian prediksi, kalian bisa pilih opsi "fixed number of factor"
  7. Jika ingin menggunakan fitur surpress small coeficient bisa gunakan literatur dari Field (2005) atau Yong dan Sean (2013).

Semakin sedikit sampelmu, maka nilai standar loading factor akan semakin tinggi! Banyak peneliti yang melalaikan hal ini. Dengan jumlah sampel hanya 90 mereka jadikan patokan 0,3, sehingga penelitian mereka kurang presisi dan banyak penelitian dosen juga masih lalai akan hal ini. Standar nilai loading factor dapat dilihat pada gambar berikut:


Frequently Asked Question:
1. Kak, kalo misal loading factornya dibawah standar minimal gimana?
  • Ganti metode ektraksi / rotasi faktornya..... kalo gabisa, 
  • Hapus variabel yang memiliki nilai communalities rendah.... kalo gabisa
  • Terpaksa hapus variabel dengan loading factor dibawah standar minimal dimulai dari loading factor tertinggi secara satu persatu
  • Lebih lengkap solusinya ada di Buku Hair et al (2010)
2. Kak, kalo misal variabelnya tidak berada pada satu faktor tapi berada pada faktor-faktor/komponen lain gimana?
  • Ganti metode ektraksi & rotasi faktornya.... kalo gabisa, 
  • Hapus variabel yang punya double-barrel / cross-loading berurutan dimulai dari variabel yang memiliki loading factor tertinggi jika dijumlahkan antar komponennya, atau bisa juga dari variabel dengan nilai communality yang rendah
  • solusinya juga dijelaskan di Buku Hair et al (2010)
3. Kak, misal variabel x pada komponen satu memenuhi standar loading factor, tapi variabel x ini nyangkut di faktor lain dengan nilai loading factor kecil/dibawah standar loading factor gimana?
  • Bisa dipertimbangkan menggunakan fitur suppress small coeficient
  • Referensi dari Field (2005) dan Yong and Sean (2013)
  • Kalo mentok ga bisa ya dihapus aja variabelnya
4. Kak kalo harusnya variabel x lokasinya di faktor 1 tapi malah belok ke faktor 2 gimana?
  • Hapus aja karena sudah tidak sesuai format reflektif yang penting jumlah variabelnya tidak teralu banyak
  • Kalau terlalu banyak coba ganti metode ekstraksi & rotasi faktornya
5. Kak kalo communality-nya rendah tapi loading faktornya valid gimana?
  • Output hasil akhir dinyatakan jelas apabila faktor loadingnya tidak cross loading dan memenuhi standar minimum, jadi it is okay.
Sumber referensi yang pasti menjawab pertanyaan-pertanyaanmu dan akan sangat membantumu untuk melakukan analisis faktor eksploratori:

Buku e-book / offline book : 
Hair et al (2010). "Multivariat Data Analysis: Seventh Edition"
Osborne W. Jason (2005). "Best Practices in Exploratory Factor Analysis: Four Recommendation for Getting The Most From Your Analysis"

Jurnal:
Jurnal Fabrigar et al (1999). "Evaluating The Use of Exploratory Factor Analysis in Psychology Research"
Watkins (2018). "Exploratory Factor Analysis: A Guide to Best Practices"
Dr. Andy Field (2005). Factor Analysis Using SPSS.
Yong and Pearce (2013). A Beginner's Guide to Factor Analysis: Focusing  on Exploratory Factor Analysis"
Tabachnick and Fidell (2013). Using Multivariate Analysis: Sixth Edition

Video Youtube keyword:
1. #004 Exploratory Factor Analysis (EFA) dengan Banyak Variabel_ Kasus Toko Muslim Online
2. SEM Series (2016) 3. Exploratory Factor Analysis (EFA)
3. James Gaskin EFA

Researchgate:
1.https://www.researchgate.net/post/when_we_do_Exploratory_factor_analysisEFA_in_spss_do_we_need_to_include_all_variables_item_together_or_each_variables_item_seperately
2.https://www.researchgate.net/post/Can-we-do-exploratory-and-confirmatory-factor-analysis-in-the-same-data-set

5. CONFIRMATORY FACTOR ANALYSIS

    Penjelasan dari CFA ini tidak akan terlalu panjang, karena pada dasarnya CFA digunakan untuk memvalidasi ulang EFA. Variabel yang digunakan pada CFA diambil dari teori ahli yang sudah diuji kebenarannya atau bisa diambil dari variabel EFA yang sudah diujikan sebelumnya dari lokasi penelitian EFA untuk dikonfirmasi kebenarannya. 
    Hal yang perlu diperhatikan bahwa CFA ini hanya bisa diselesaikan lewat AMOS bukan SPSS. Jika melihat video-video tutorial di youtube, beberapa expert mengatakan bahwa CFA dapat dilakukan menggunakan SPSS, namun hal itu banyak di tentang oleh expert-expert di researchgate bahkan di website IBM itu sendiri dan disarankan menggunakan AMOS. Jadi, kalo mau aman sih pake AMOS aja jika mengerjakan CFA ya, tapi kalau dosennya berpandangan boleh menggunakan SPSS ya ikuti aja dosennya. Tapi, saran gw sih pake AMOS aja mengikuti arahan banyak sumber. Gw sendiri pernah baca kenapa SPSS tidak kompatibel untuk CFA tapi lupa alasannya wkwk jadi coba kalian cari tau sendiri deh.

Langsung ke Case aja yaaa

Semisal kita telah melakukan validasi EFA dan ingin mengonfirmasi kembali kevalidan datanya dengan CFA, maka tinggal kita masukan lagi data SPSS EFA ke AMOS. Contoh:

1. Dampak ekonomi (X1)
Variabelnya: (X1.1) Pendapatan ekonomi saya meningkat dengan adanya kegiatan pariwisata
                      (X1.2) Saya mendapat peluang kerja dengan adanya kegiatan pariwisata
                      (X1.3) Saya mendapat peluang usaha dengan adanya kegiatan pariwisata
                      (X1.4) Penjualan hasil panen meningkat dengan adanya pariwisata
2. Dampak sosial-budaya (X2)
Variabelnya : (X2.1) Kegiatan pariwisata menganggu aktifitas adat
                       (X2.2) Kegiatan pariwisata menyebabkan budaya lokal semakin lestari
                       (X2.3) Kegiatan pariwisata menyebabkan masyarakat bisa bicara bahasa asing
                       (X2.4) Kegiatan pariwisata menyebabkan komodifikasi budaya
 3. Dampak lingkungan (X3)
 Variabelnya : (X3.1) Pariwisata menyebabkan kemacetan
                        (X3.2) Pariwisata menyebabkan polusi asap kendaraan
                        (X3.3) Pariwisata menyebabkan kerusakan lingkungan persawahan
                        (X3.4) Pariwisata menyebabkan perbaikan sarana dan prasarana desa

Hasil EFA-nya :


Maka hasil CFA-nya hanya ada dua kemungkinan, yaitu : 
  • Variabel tetap berada faktor latennya: artinya penelitianmu sudah selesai dan dinyatakan valid. Yang perlu diperhatikan adalah kriteria aman dalam CFA yang harus dipenuhi, yakni: loading factor memenuhi standar minimum dan lolos uji goodness of fit. Tidak semua kriteria fit dipakai yaaa. Lebih jelasnya langsung download jurnal dari Pak Zainudin Awang (2015), bisa juga di scroll di forum ini: klik . Untuk CFA ini banyak-banyaklah juga nonton video youtubenya Pak Usep Suhud, 
  • Variabel x berubah ke faktor y. Untuk hal seperti ini cobalah temukan solusinya di researcgate dengan keyword "My CFA doesn't fit my EFA; CFA fail to predict EFA". Hal ini belum pernah saya rasakan, sehingga kalian coba cari solusinya ya. Kemungkinan besar kalian akan disurh untuk menghapus variabel yang cross loading.
Output dari AMOS kurang lebih seperti ini:


Kalo untuk CFA sumber yang paling gw saranin dari:

Zainudin Awang (2015) Clear dan jelas. 

Bisascroll-scroll: https://www.researchgate.net/post/Can-we-do-exploratory-and-confirmatory-factor-analysis-in-the-same-data-set

Semoga artikel ini membantu ya. Bila ada pertanyaan bisa komen atau butuh bantuan dalam analisis data bisa kirim pesan ke email : seto.zakharia@gmail.com.

Tulisan ini boleh kalian copy-paste dengan mencantumkan alamat link blog ini di: elsonnewgate.blogspot.com

Terimakasih.

Tidak ada komentar:

Posting Komentar

| Give me the best opinion Dude |