Perbandingan Random Forest Regression dan Support Vector Regression Pada Prediksi Laju Penguapan

  • Ferdinandus Edwin Penalun Magister Teknologi Informasi, Universitas Teknologi Yogyakarta
  • Arief Hermawan Universitas Teknologi Yogyakarta
  • Donny Avianto Universitas Teknologi Yogyakarta
Keywords: laju penguapan, random forest regression, support vector regression, optimasi hyperparameter

Abstract

Memprediksi laju penguapan memiliki manfaat yang luas dalam berbagai aplikasi seperti manajemen sumber daya air, pertanian, dan lingkungan hidup. Namun untuk mendapatkan data yang lengkap dan akurat dalam mempelajari laju penguapan memiliki tantangan tersendiri. Selain itu, rendahnya tingkat linieritas antara data laju penguapan dan faktor meteorologi lainnya di wilayah tropis dapat menyebabkan hasil prediksi yang bervariasi. Tujuan dari penelitian ini adalah memprediksi laju penguapan harian di Stasiun Klimatologi Yogyakarta dengan membandingkan kinerja dua model machine learning (ML) yaitu random forest regression (RFR) dan support vector regression (SVR) menggunakan data pengamatan meteorologi harian. Untuk meningkatkan akurasi prediksi, dilakukan optimasi hyperparameter menggunakan metode gridsearch cross-validation untuk mencari kombinasi hyperparameter terbaik. Hasil optimasi hyperparameter pada data training menunjukkan bahwa model RFR menghasilkan skor RMSE sebesar -0,67 sementara model SVR pada kernel RBF menghasilkan skor RMSE negatif sebesar -0,57. Evaluasi lebih lanjut dilakukan pada data testing dengan menggunakan kombinasi hyperparameter hasil optimasi model RFR menghasilkan nilai R2 sebesar 0,79 dan RMSE sebesar 0,56 sedangkan model SVR menghasilkan koefisien determinasi (R2) sebesar 0,81 dan RMSE sebesar 0,53. Berdasarkan hasil perbandingan kedua model dapat disimpulkan bahwa model SVR memiliki kinerja yang lebih baik dalam memprediksi laju penguapan harian. Penggunaan teknik prediksi dengan model ML untuk memprediksi laju penguapan dapat menjadi solusi untuk mengisi kekosongan data pengamatan meteorologi dan memiliki manfaat yang signifikan dalam bidang pertanian dan hidrologi. Penelitian selanjutnya dapat melibatkan pengembangan sistem informasi pemantauan dan pengelolaan sumber daya air yang lebih efektif dan efisien.

Downloads

Download data is not yet available.

References

L. Wang, O. Kisi, B. Hu, M. Bilal, M. Zounemat-Kermani, and H. Li,2017, “Evaporation modelling using different machine learning techniques,” Int. J. Climatol., vol. 37, pp. 1076–1092, doi: 10.1002/joc.5064.

W. Fang, S. Huang, Q. Huang, G. Huang, E. Meng, and J. Luan,2018,“Reference evapotranspiration forecasting based on local meteorological and global climate information screened by partial mutual information,” J. Hydrol., vol. 561, no. April, pp. 764–779, doi: 10.1016/j.jhydrol.2018.04.038.

Z. A. Al Sudani and G. S. A. Salem, 2022,“Evaporation Rate Prediction Using Advanced Machine Learning Models: A Comparative Study,” Adv. Meteorol., vol. 2022 doi: 10.1155/2022/1433835.

A. Ashrafzadeh, A. Malik, V. Jothiprakash, M. A. Ghorbani, and S. M. Biazar,2020, “Estimation of daily pan evaporation using neural networks and meta-heuristic approaches,” ISH J. Hydraul. Eng., vol. 26, no. 4, pp. 421–429, doi: 10.1080/09715010.2018.1498754.

Z. M. Yaseen et al., 2020,“Prediction of evaporation in arid and semi-arid regions: a comparative study using different machine learning models,” Eng. Appl. Comput. Fluid Mech., vol. 14, no. 1, pp. 70–89, doi: 10.1080/19942060.2019.1680576.

R. Muita et al.,2021, “Towards Increasing Data Availability for Meteorological Services: Inter-Comparison of Meteorological Data from a Synoptic Weather Station and Two Automatic Weather Stations in Kenya,” Am. J. Clim. Chang., vol. 10, no. 03, pp. 300–316, 2021, doi: 10.4236/ajcc.103014.

N. Pandey, P. K. Patnaik, and S. Gupta,2020, “Data Pre Processing for Machine Learning Models using Python Libraries,” Int. J. Eng. Adv. Technol., vol. 9, no. 4, pp. 1995–1999, doi: 10.35940/ijeat.d9057.049420.

V. N. G. Raju, K. P. Lakshmi, V. M. Jain, A. Kalidindi, and V. Padma,2020, “Study the Influence of Normalization/Transformation process on the Accuracy of Supervised Classification,” Proc. 3rd Int. Conf. Smart Syst. Inven. Technol. ICSSIT 2020, no. Icssit, pp. 729–735, 2020, doi: 10.1109/ICSSIT48917.9214160.

O. Simeone,2018, “A brief introduction to machine learning for engineers,” Found. Trends Signal Process., vol. 12, no. 3–4, pp. 200–431, doi: 10.1561/2000000102.

C. Strobl, J. Malley, and G. Tutz,2009, “An Introduction to Recursive Partitioning: Rationale, Application, and Characteristics of Classification and Regression Trees, Bagging, and Random Forests,” Psychol. Methods, vol. 14, no. 4, pp. 323–348, doi: 10.1037/a0016973.

M. Čeh, M. Kilibarda, A. Lisec, and B. Bajat,2018, “Estimating the Performance of Random Forest versus Multiple Regression for Predicting Prices of the Apartments,” ISPRS Int. J. Geo-Information, vol. 7, no. 5, doi: 10.3390/ijgi7050168.

A. Danandeh Mehr, V. Nourani, V. Karimi Khosrowshahi, and M. A. Ghorbani,2019, “A hybrid support vector regression–firefly model for monthly rainfall forecasting,” Int. J. Environ. Sci. Technol., vol. 16, no. 1, pp. 335–346, doi: 10.1007/s13762-018-1674-2.

M. P. Kusuma and A. Kudus, “Penerapan Metode Support Vector Regression (SVR) pada Data Survival KPR PT. Bank ABC, Tbk.,2022,” Bandung Conf. Ser. Stat., vol. 2, no. 2, pp. 167–172, doi: 10.29313/bcss.v2i2.3614.

N. D. Maulana, B. D. Setiawan, and C. Dewi,2019, “Implementasi Metode Support Vector Regression (SVR) Dalam Peramalan Penjualan Roti (Studi Kasus : Harum Bakery),” J. Pengemb. Teknol. Inf. dan Ilmu Komput., vol. 3, no. 3, pp. 2986–2995,.

A. Saiful,2021, “Prediksi Harga Rumah Menggunakan Web Scrapping dan Machine Learning Dengan Algoritma Linear Regression,” JATISI (Jurnal Tek. Inform. dan Sist. Informasi), vol. 8, no. 1, pp. 41–50, doi: 10.35957/jatisi.v8i1.701.

C. G. Siji George and B. Sumathi,2020 “Grid search tuning of hyperparameters in random forest classifier for customer feedback sentiment prediction,” Int. J. Adv. Comput. Sci. Appl., vol. 11, no. 9, pp. 173–178, doi: 10.14569/IJACSA.2020.0110920.

Y. Azhar, G. A. Mahesa, and M. C. Mustaqim, 2021, “Prediction of hotel bookings cancellation using hyperparameter optimization on Random Forest algorithm,” J. Teknol. dan Sist. Komput., vol. 9, no. 1, pp. 15–21, doi: 10.14710/jtsiskom.2020.13790.

A. Toha, P. Purwono, and W. Gata, 2022, “Model Prediksi Kualitas Udara dengan Support Vector Machines dengan Optimasi Hyperparameter GridSearch CV,” Bul. Ilm. Sarj. Tek. Elektro, vol. 4, no. 1, pp. 12–21, doi: 10.12928/biste.v4i1.6079.

P. Martínez, M. Advisor,2017, : Oriol, and P. Vila, “Smart optimization of hyper-parameters in Support Vector Machines. Studying model dropout for hyper-parameter optimization in support vector machines,” no. October, 2017.

K. Cheng, Z. Lu, Y. Wei, Y. Shi, and Y. Zhou,2017, “Mixed kernel function support vector regression for global sensitivity analysis,” Mech. Syst. Signal Process., vol. 96, pp. 201–214, 2017, doi: 10.1016/j.ymssp.04.014.

Published
2023-07-26
Abstract views: 406 , pdf downloads: 415