Skripsi/Tugas Akhir
Perbandingan Akurasi Algoritma Klasifikasi pada Analisis Dataset Kuesioner dengan Skala Likert
ABSTRAK
Salah satu metode machine learning yang digunakan pada data mining adalah metode classification. Metode ini memiliki banyak jenis algoritma antara lain Naïve Bayes, K-Nearest Neighbor dan Decision tree (C4.5). Seringkali para peneliti menentukan algoritma tanpa dasar referensi yang kuat sehingga hasil yang diperoleh belum tentu optimal walaupun memiliki nilai akurasi yang baik, atau kemungkinan jika menggunakan algoritma yang lain hasilnya akan lebih baik. Karena itu pada penelitian ini dimaksudkan untuk menganalisis tiga jenis algoritma classification, yaitu Naïve Bayes, K-Nearest Neighbor dan DecisionTree (C4.5), sehingga dapat diketahui algoritma mana yang memiliki nilai akurasi paling tinggi terhadap data-data yang dikumpulkan menggunakan teknik kuesioner dengan skala Likert. Dari pengujian yang telah dilakukan dengan menggunakan Bahasa Pemrograman Python dapat kita lihat bahwa terdapat perbedaan hasil akurasi, presisi, recall dan f1-Score dari masing-masing algoritma. pada algoritma Naive bayes memiliki akurasi 77%, presisi untuk Class Tidak 78% untuk class Ya 76%, recall untuk class Tidak 68% untuk class Ya 65%, f1-score class Tidak 72% untuk class Ya 80%, algoritma K-Nearest Neighbor memiliki akurasi 69% presisi untuk class Tidak 69% untuk class Ya 69%, recall untuk class Tidak 54% untuk class Ya 80%, f1-Score class tidak 61% untuk class Ya 74%, sedangkan algoritma Decision tree memiliki 49%, presisi untuk Class Tidak 43% untuk class Ya 54%, recall untuk class Tidak 43% untuk class Ya 54%, f1-Score class tidak 43% untuk class Ya 54%. Dapat disimpulkan bahwa algoritma yang memiliki kinerja terbaik untuk analisis data berbasis skala Likert adalah Naïve Bayes dengan nilai akurasi sebesar 77%.
Kata Kunci : Skala Likert, Naïve Bayes, K-Nearest Neighbor, Decision Tree
ABSTRACK
One of the machine learning methods used in data mining is the classification method. This method has many types of algorithms including Naïve Bayes, K-Nearest Neighbor and Decision tree (C4.5). Often researchers determine algorithms without a strong reference base so that the results obtained are not necessarily optimal even though they have good accuracy values, or it is possible that if you use another algorithm the results will be better. Therefore, this research is intended to analyze three types of classification algorithms, namely Naïve Bayes, K-Nearest Neighbor and DecisionTree (C4.5), so that it can be seen which algorithm has the highest accuracy value for the data collected using a questionnaire technique with Likert scale. From the tests that have been carried out using the Python Programming Language, we can see that there are differences in the accuracy, precision, recall and f1-Score results of each algorithm. the Naive bayes algorithm has an accuracy of 77%, precision for Class No 78% for class Yes 76%, recall for class No 68% for class Yes 65%, F1-Score class No 72% for class Yes 80%, K-Nearest algorithm Neighbor has 69% accuracy, precision for class No 69% for class Yes 69%, recall for class No 54% for class Yes 80%, F1-Score class not 61% for class Yes 74%, while the Decision tree algorithm has 50%, precision for Class No 43% for class Yes 54%, recall for class No 43% for class Yes 54%, F1-Score class No 43% for class Yes 54%. It can be concluded that the algorithm that has the best performance for Likert scale-based data analysis is Naïve Bayes with an accuracy value of 77%.
Keywords : Skala Likert, Naïve Bayes, K-Nearest Neighbor, Decision Tree
Tidak ada salinan data
Universitas DIPA Makassar
NPP 7371142D1000002
Jln. Perintis Kemerdekaan KM.9
Telp. (0411)587194
Hotline: +6281228221994
WhatsApp Admin: +6281342092072
e-Mail: perpustakaan@undipa.ac.id
© 2024 — Perpustakaan UNDIPA Makassar - SLiMS