Penerapan Seleksi Fitur Median Weighted Information Gain dengan K-NN pada Dataset Label Hours Software Effort Estimation
Abstract
Estimasi pengembangan perangkat lunak menjadi kebutuhan dikarenakan setiap pengembangan perangkat lunak memiliki keterbatasan biaya dan waktu dalam menyelesaikan sebuah proyek. Secara spesifik hasil percobaan diperoleh model ML lebih unggul dari pada model non-ML. Dengan hasil secara spesifik yaitu 66% (52 dari 79) menunjukkan keunggulan model ML sedangkan hanya 34% (27 dari 79) hasil percobaan mengunggulkan model non-ML. Beberapa studi yang sudah teridentifikasi, masalah utama yang paling sering ditemui dalam dataset estimasi usaha perangkat lunak yaitu masalah kategori fitur seperti fitur yang tidak relavan. Berdasarkan latar belakang tersebut maka dalam penelitian ini akan dilakukan penerapan metode seleksi fitur Median WIG dengan algoritma k-NN yang akan berfokus pada dataset label hours Software Effort Estimation dan dibandingkan dengan algoritma k-NN. Hasil perbandingan yang diperoleh dalam seluruh pengujian dataset Software Effort Estimation diketahui bahwa metode usulan seleksi fitur Median-WIG dengan k-NN terbukti mampu meningkatkan akurasi dalam proses estimasi dilihat dari penurunan nilai RMSE yang signifikan pada seluruh dataset yaitu Albrecht sebesar 5.958, Miyazaki sebesar 62.363 dan Kemerer sebesar 131.027. Terjadinya penurunan nilai RMSE pada seluruh dataset ini memperlihatkan peningkatan kinerja setelah dilakukannya metode seleksi fitur pada dataset Software Effort Estimation Terjadinya penurunan nilai RMSE ini memperlihatkan peningkatan kinerja setelah menggunakan metode seleksi fitur.