Pengembangan Deteksi Objek Dalam Rumah Bagi Tunanetra Berbasis Optimasi YOLOv8 Menggunakan Metode Ghost Module dan Attention Mechanism
Abstract
Penyandang tunanetra sering menghadapi kesulitan dalam mobilitas sehari-hari karena keterbatasan alat bantu yang tersedia saat ini. Meskipun tongkat khusus dapat membantu dalam berjalan, namun masih sulit bagi mereka untuk mendeteksi objek secara real-time. Kemajuan dalam pengenalan objek berbasis citra, terutama dengan penggunaan machine learning, menawarkan solusi yang menjanjikan. Untuk mewujudkan sistem pendeteksi objek yang efektif, diperlukan menjalankan deteksi objek pada perangkat kecil seperti Raspberry Pi 4. Perangkat tersebut ringan dan kompatibel untuk kebutuhan mobilitas tinggi sehingga memberikan kenyamanan bagi penyandang tunanetra ketika melakukan aktivitas sehari-hari. Namun, keterbatasan kemampuan komputasi Raspberry Pi 4 menjadi tantangan, mengingat deteksi objek membutuhkan daya komputasi besar. Penelitian terbaru menunjukkan bahwa meskipun telah dilakukan optimasi pada model deteksi objek seperti YOLOv8, namun beban komputasinya masih cukup besar untuk diimplementasikan pada Raspberry Pi 4. Oleh karena itu, penelitian ini bertujuan untuk mengembangkan model YOLOv8 versi nano dengan beban komputasi yang lebih ringan. Metode yang diusulkan melibatkan penggunaan ghost module, downsampling, dan attention mechanism. Hasil penelitian menunjukkan bahwa penggunaan ghost module dan downsampling efektif mengurangi GFLOPS model YOLOv8n dari 8.09 GFLOPS menjadi 1.77 GFLOPS, menurunkan waktu inference model hingga 57,6%, dari 401,56 ms menjadi 170,33 ms pada perangkat keras Raspberry Pi 4, tanpa mengorbankan performa deteksi. Selain itu, integrasi attention mechanism melalui attention max pooling meningkatkan akurasi model dengan peningkatan mAP sebesar 1,3% dibandingkan max pooling standar. Model ini berhasil memberikan deteksi yang lebih akurat dan efisien, menjadikannya solusi yang potensial dalam membangun sistem benam untuk membantu penyandang tunanetra dalam mendeteksi objek secara real-time.
Downloads
References
Rahmawati, R.Y., Sunandar, A.: Peningkatan Keterampilan Orientasi dan Mobilitas melalui Penggunaan Tongkat bagi Penyandang Tunanetra. J. ORTOPEDAGOGIA. 4, 100–103 (2018). https://doi.org/10.17977/um031v4i12018p100
A. Fauroq, R. Alfita, D.R.: Rancang Bangun Tongkat Cerdas Untuk Penyandang Tunanetra Berbasis Mikrokontroler Menggunakan Fuzzy Logic metode Sugeno. J. Tek. Elektro dan Komput. TRIAC. 5, (2018)
Tikasni, E., Utami, E., Ariatmanto, D.: Analisis Akurasi Object Detection Menggunakan Tensorflow Untuk Pengenalan Bahasa Isyarat Tangan Menggunakan Metode SSD. J. Fasilkom. 14, 385–393 (2024)
Fan, Y., Mao, S., Li, M., Wu, Z., Kang, J.: CM-YOLOv8: Lightweight YOLO for Coal Mine Fully Mechanized Mining Face. Sensors. 24, (2024). https://doi.org/10.3390/s24061866
Wu, Y., Han, Q., Jin, Q., Li, J., Zhang, Y.: LCA-YOLOv8-Seg: An Improved Lightweight YOLOv8-Seg for Real-Time Pixel-Level Crack Detection of Dams and Bridges. Appl. Sci. 13, (2023). https://doi.org/10.3390/app131910583
Roboflow, 2024. Indoor Object Dataset. [Online] (Updated 7 November 2024) Available at: https://universe.roboflow.com/csgitk/indoor_object_ta/dataset/10 [Accessed 20 November 2024].
Chien, C.-T., Ju, R.-Y., Chou, K.-Y., Chiang, J.-S.: YOLOv8-AM: YOLOv8 with Attention Mechanisms for Pediatric Wrist Fracture Detection. 1–25 (2024)
Wijanarko, R.G., Pradana, A.I., Hartanti, D.: IMPLEMENTASI DETEKSI DRONE MENGGUNAKAN YOLO ( You Only Look Once ). J. Fasilkom. 14, 437–442 (2024)
Terven, J., Córdova-Esparza, D.M., Romero-González, J.A.: A Comprehensive Review of YOLO Architectures in Computer Vision: From YOLOv1 to YOLOv8 and YOLO-NAS. Mach. Learn. Knowl. Extr. 5, 1680–1716 (2023). https://doi.org/10.3390/make5040083
Ultralytics, 2024. Ultralytics YOLOv8. [Online] (Updated 27 September 2024) Available at: https://docs.ultralytics.com/models/yolov8/#performance-metrics [Accessed 20 November 2024].
Han, K., Wang, Y., Tian, Q., Guo, J., Xu, C., Xu, C.: GhostNet: More features from cheap operations. Proc. IEEE Comput. Soc. Conf. Comput. Vis. Pattern Recognit. 1577–1586 (2020). https://doi.org/10.1109/CVPR42600.2020.00165
Emmert-Streib, F., Yang, Z., Feng, H., Tripathi, S., Dehmer, M.: An Introductory Review of Deep Learning for Prediction Models With Big Data. Front. Artif. Intell. 3, 1–23 (2020). https://doi.org/10.3389/frai.2020.00004
Wu, H., Gu, X.: Max-pooling dropout for regularization of convolutional neural networks. Lect. Notes Comput. Sci. (including Subser. Lect. Notes Artif. Intell. Lect. Notes Bioinformatics). 9489, 46–54 (2015). https://doi.org/10.1007/978-3-319-26532-2_6
Woo, S., Park, J., Lee, J.Y., Kweon, I.S.: CBAM: Convolutional block attention module. Lect. Notes Comput. Sci. (including Subser. Lect. Notes Artif. Intell. Lect. Notes Bioinformatics). 11211 LNCS, 3–19 (2018). https://doi.org/10.1007/978-3-030-01234-2_1
Hu, J., Shen, L., Albanie, S., Sun, G., Wu, E.: Squeeze-and-Excitation Networks. IEEE Trans. Pattern Anal. Mach. Intell. 42, 2011–2023 (2020). https://doi.org/10.1109/TPAMI.2019.2913372
Copyright (c) 2024 Syamsul Mujahidin, Muhammad Insan Kamil, Riska Kurniyanto Abdullah (Author)

This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.
Copyright Notice
An author who publishes in the Jurnal FASILKOM (teknologi inFormASi dan ILmu KOMputer) agrees to the following terms:
- Author retains the copyright and grants the journal the right of first publication of the work simultaneously licensed under the Creative Commons Attribution-ShareAlike 4.0 License that allows others to share the work with an acknowledgement of the work's authorship and initial publication in this journal
- Author is able to enter into separate, additional contractual arrangements for the non-exclusive distribution of the journal's published version of the work (e.g., post it to an institutional repository or publish it in a book) with the acknowledgement of its initial publication in this journal.
- Author is permitted and encouraged to post his/her work online (e.g., in institutional repositories or on their website) prior to and during the submission process, as it can lead to productive exchanges, as well as earlier and greater citation of the published work (See The Effect of Open Access).
Read more about the Creative Commons Attribution-ShareAlike 4.0 Licence here: https://creativecommons.org/licenses/by-sa/4.0/.

