Pengembangan Deteksi Objek Dalam Rumah Bagi Tunanetra Berbasis Optimasi YOLOv8 Menggunakan Metode Ghost Module dan Attention Mechanism

  • Syamsul Mujahidin Institut Teknologi Kalimantan
  • Muhammad Insan Kamil Institut Teknologi Kalimantan
  • Riska Kurniyanto Abdullah Institut Teknologi Kalimantan
Keywords: ghost module, downsampling, attention mechanism, tunanetra, YOLOv8, raspberry pi 4

Abstract

Penyandang tunanetra sering menghadapi kesulitan dalam mobilitas sehari-hari karena keterbatasan alat bantu yang tersedia saat ini. Meskipun tongkat khusus dapat membantu dalam berjalan, namun masih sulit bagi mereka untuk mendeteksi objek secara real-time. Kemajuan dalam pengenalan objek berbasis citra, terutama dengan penggunaan machine learning, menawarkan solusi yang menjanjikan. Untuk mewujudkan sistem pendeteksi objek yang efektif, diperlukan menjalankan deteksi objek pada perangkat kecil seperti Raspberry Pi 4. Perangkat tersebut ringan dan kompatibel untuk kebutuhan mobilitas tinggi sehingga memberikan kenyamanan bagi penyandang tunanetra ketika melakukan aktivitas sehari-hari. Namun, keterbatasan kemampuan komputasi Raspberry Pi 4 menjadi tantangan, mengingat deteksi objek membutuhkan daya komputasi besar. Penelitian terbaru menunjukkan bahwa meskipun telah dilakukan optimasi pada model deteksi objek seperti YOLOv8, namun beban komputasinya masih cukup besar untuk diimplementasikan pada Raspberry Pi 4. Oleh karena itu, penelitian ini bertujuan untuk mengembangkan model YOLOv8 versi nano dengan beban komputasi yang lebih ringan. Metode yang diusulkan melibatkan penggunaan ghost module, downsampling, dan attention mechanism. Hasil penelitian menunjukkan bahwa penggunaan ghost module dan downsampling efektif mengurangi GFLOPS model YOLOv8n dari 8.09 GFLOPS menjadi 1.77 GFLOPS, menurunkan waktu inference model hingga 57,6%, dari 401,56 ms menjadi 170,33 ms pada perangkat keras Raspberry Pi 4, tanpa mengorbankan performa deteksi. Selain itu, integrasi attention mechanism melalui attention max pooling meningkatkan akurasi model dengan peningkatan mAP sebesar 1,3% dibandingkan max pooling standar. Model ini berhasil memberikan deteksi yang lebih akurat dan efisien, menjadikannya solusi yang potensial dalam membangun sistem benam untuk membantu penyandang tunanetra dalam mendeteksi objek secara real-time.

Downloads

Download data is not yet available.

References

Rahmawati, R.Y., Sunandar, A.: Peningkatan Keterampilan Orientasi dan Mobilitas melalui Penggunaan Tongkat bagi Penyandang Tunanetra. J. ORTOPEDAGOGIA. 4, 100–103 (2018). https://doi.org/10.17977/um031v4i12018p100

A. Fauroq, R. Alfita, D.R.: Rancang Bangun Tongkat Cerdas Untuk Penyandang Tunanetra Berbasis Mikrokontroler Menggunakan Fuzzy Logic metode Sugeno. J. Tek. Elektro dan Komput. TRIAC. 5, (2018)

Tikasni, E., Utami, E., Ariatmanto, D.: Analisis Akurasi Object Detection Menggunakan Tensorflow Untuk Pengenalan Bahasa Isyarat Tangan Menggunakan Metode SSD. J. Fasilkom. 14, 385–393 (2024)

Fan, Y., Mao, S., Li, M., Wu, Z., Kang, J.: CM-YOLOv8: Lightweight YOLO for Coal Mine Fully Mechanized Mining Face. Sensors. 24, (2024). https://doi.org/10.3390/s24061866

Wu, Y., Han, Q., Jin, Q., Li, J., Zhang, Y.: LCA-YOLOv8-Seg: An Improved Lightweight YOLOv8-Seg for Real-Time Pixel-Level Crack Detection of Dams and Bridges. Appl. Sci. 13, (2023). https://doi.org/10.3390/app131910583

Roboflow, 2024. Indoor Object Dataset. [Online] (Updated 7 November 2024) Available at: https://universe.roboflow.com/csgitk/indoor_object_ta/dataset/10 [Accessed 20 November 2024].

Chien, C.-T., Ju, R.-Y., Chou, K.-Y., Chiang, J.-S.: YOLOv8-AM: YOLOv8 with Attention Mechanisms for Pediatric Wrist Fracture Detection. 1–25 (2024)

Wijanarko, R.G., Pradana, A.I., Hartanti, D.: IMPLEMENTASI DETEKSI DRONE MENGGUNAKAN YOLO ( You Only Look Once ). J. Fasilkom. 14, 437–442 (2024)

Terven, J., Córdova-Esparza, D.M., Romero-González, J.A.: A Comprehensive Review of YOLO Architectures in Computer Vision: From YOLOv1 to YOLOv8 and YOLO-NAS. Mach. Learn. Knowl. Extr. 5, 1680–1716 (2023). https://doi.org/10.3390/make5040083

Ultralytics, 2024. Ultralytics YOLOv8. [Online] (Updated 27 September 2024) Available at: https://docs.ultralytics.com/models/yolov8/#performance-metrics [Accessed 20 November 2024].

Han, K., Wang, Y., Tian, Q., Guo, J., Xu, C., Xu, C.: GhostNet: More features from cheap operations. Proc. IEEE Comput. Soc. Conf. Comput. Vis. Pattern Recognit. 1577–1586 (2020). https://doi.org/10.1109/CVPR42600.2020.00165

Emmert-Streib, F., Yang, Z., Feng, H., Tripathi, S., Dehmer, M.: An Introductory Review of Deep Learning for Prediction Models With Big Data. Front. Artif. Intell. 3, 1–23 (2020). https://doi.org/10.3389/frai.2020.00004

Wu, H., Gu, X.: Max-pooling dropout for regularization of convolutional neural networks. Lect. Notes Comput. Sci. (including Subser. Lect. Notes Artif. Intell. Lect. Notes Bioinformatics). 9489, 46–54 (2015). https://doi.org/10.1007/978-3-319-26532-2_6

Woo, S., Park, J., Lee, J.Y., Kweon, I.S.: CBAM: Convolutional block attention module. Lect. Notes Comput. Sci. (including Subser. Lect. Notes Artif. Intell. Lect. Notes Bioinformatics). 11211 LNCS, 3–19 (2018). https://doi.org/10.1007/978-3-030-01234-2_1

Hu, J., Shen, L., Albanie, S., Sun, G., Wu, E.: Squeeze-and-Excitation Networks. IEEE Trans. Pattern Anal. Mach. Intell. 42, 2011–2023 (2020). https://doi.org/10.1109/TPAMI.2019.2913372

Published
2024-12-09
Abstract views: 192 , pdf downloads: 165