한국해군과학기술학회
[ Article ]
Journal of the KNST - Vol. 7, No. 4, pp.469-475
ISSN: 2635-4926 (Print)
Print publication date 31 Dec 2024
Received 24 Nov 2024 Revised 28 Nov 2024 Accepted 27 Dec 2024
DOI: https://doi.org/10.31818/JKNST.2024.12.7.4.469

DQN 기반 대잠 헬기 호버링 제어를 위한 심층 신경망 구조 설계 및 성능 분석

김준수1 ; 박준영1 ; 신예림1 ; 이진호1 ; 한민석2, *
1해군사관학교 전기전자공학과 사관생도
2해군사관학교 전자제어공학과 부교수
Design and Performance Analysis of Deep Neural Network Structure for DQN-based Anti-submarine Helicopter Hovering Control
Junsu Kim1 ; Junyoung Park1 ; Yelim Shin1 ; Jinho Lee1 ; Min-Seok Han2, *
1Midshipman, Dept. of Electrical and Electronics Engineering, Republic of Korea Naval Academy
2Associate Professor, Dept. of Electronics and Control Engineering, Republic of Korea Naval Academy

Correspondence to: *Min-Seok Han Dept. of Electronics and Control Engineering, Republic of Korea Naval Academy 1 Jungwon-ro, Jinhae-gu, Changwon-si, Gyungsangnam-do, 51704, Republic of Korea Tel: +82-55-907-5323 E-mail: mshan1024@navy.ac.kr

Ⓒ 2024 Korea Society for Naval Science & Technology

초록

본 연구에서는 DQN(Deep Q-Network)을 활용하여 대잠 헬기의 호버링 제어를 위한 심층 신경망 구조를 설계하고 성능을 분석하였다. 시뮬레이션에서 목표 위치는 (0, 0, 10)으로 설정하고, 질량은 8,000 kg, 중력 가속도는 9.81 m/s2로 가정하였다. DQN 에이전트는 500 에피소드 동안 학습하여 평균 보상 195에 도달하였다. PID 제어기와의 비교에서 DQN 제어기는 상승 시간 0.5초, 정착 시간 3.5초, 오버슈트 0.5 %를 기록하였고, PID 제어기는 각각 0.47초, 3.8초, 1.2 %를 보였다. 평균 RMSE에서도 DQN은 0.032로, PID의 0.045보다 우수했다. 이를 통해 DQN 기반 제어기의 효과성과 안정성이 입증되었으며, 항공기 제어 분야에서의 응용 가능성을 확인하였다.

Abstract

In this study, a deep neural network structure using DQN (Deep Q-Network) was designed and analyzed for anti-submarine helicopter hovering control. The simulation set the target position at (0, 0, 10) with a mass of 8,000 kg and a gravitational acceleration of 9.81 m/s2. The DQN agent trained over 500 episodes, achieving an average reward of 195. Compared to a PID controller, the DQN controller recorded a rise time of 0.5 seconds, a settling time of 3.5 seconds, and an overshoot of 0.5 %. In contrast, the PID controller showed a rise time of 0.47 seconds, a settling time of 3.8 seconds, and an overshoot of 1.2 %. The DQN controller also outperformed the PID controller with a lower average RMSE of 0.032 compared to 0.045. These results demonstrate the DQN controller's effectiveness and stability, highlighting its potential for aircraft control applications.

Keywords:

Deep Q-Network, Hovering Control, Anti-Submarine Helicopter, Reinforcement Learning, PID Controller

키워드:

심층 Q 네트워크, 호버링 제어, 대잠 헬기, 강화학습, PID제어기

Acknowledgments

이 논문은 2024년도 해군사관학교 해양연구소 및 해사교육진흥재단 지원을 받아 수행된 논문임.

References