Land-UAV-RL

< Projeler Sayfası

Proje Adı
Pekiştirmeli Öğrenme Kullanarak Sabit Kanatlı İHA'nın İndirilmesi

Şirket Adı
Titra

Şirket Mentoru
Numan Uyar

Akademik Mentor
Asst. Prof. Muhammed Ömer Sayın

Asistan
Arda Aşçı

Takım Üyeleri
Baran Atalar, Cihan Eralp Kumbasar, Tevfik Bülent Kanmaz, Esen Ergün, Sevda Öğüt, Mehmet Ufuk Özdemir

Özet
Günümüzde insansız hava araçlarının (İHA) aktif kullanımı ve bu araçlara yönelik ihtiyacın savunma sanayisinde de artmasıyla beraber İHAların davranış kontrolü daha büyük önem kazanmıştır. Sabit kanatlı İHAların özellikle inişi sırasında klasik PID kontrolcüleri yetersiz kalmaktadır. Bu projede, Titra Teknoloji A.Ş. desteği ile pekiştirmeli öğrenme tabanlı bir akıllı kontrolcü geliştirilmiştir. Bu kontrolcü çevre koşullarını ve takip edilmesi istenen konumsal açıları göz önünde bulundurarak uçak modelinde mevcut olan PX4 PID kontrolcüsünün parametrelerini optimize etmektedir. Öğrenme sürecinde Gazebo simülasyon ortamındaki uçak modeli kullanılmış ve simülasyon ortamı ile Python tabanlı pekiştirmeli öğrenme algoritmaları MAVSDK kütüphanesi aracılığıyla bir araya getirilmiştir. Algoritmaların verilen hedef açılar ve uçağın mevcut açıları arasındaki farkları anlık olarak PID parametrelerini değiştirerek azaltması hedeflenmiştir. Bu algoritmaların iniş problemi gibi görevlerde kullanılabilmesi öngörülmektedir. Pekiştirmeli öğrenme algoritmaları anlık olarak aldıkları aksiyonların sonuçları ile öğrenme gerçekleştirebilmektedir. Bu sayede akıllı kontrolcü hangi koşullarda hangi parametrelerin daha iyi performans sergilediğini uçuş sırasında aktif olarak öğrenmektedir. Proje kapsamında CEM, DDPG ve PPO algoritmalarının performansları klasik PID kontrolcüsü ile karşılaştırılmıştır. Sonuç olarak, kullanılan algoritmaların açı takibinde PID kontrolcüsünden daha iyi performans sergilediği gözlenmiştir. Kullanılan akıllı algoritma ile yeni bir uçak modelinin parametreleri de otonom bir şekilde optimize edilebilecektir.



Abstract
Today, with the active use of unmanned aerial vehicles (UAV) and the increasing need for these vehicles in the defense industry, attitude control of UAVs has gained greater importance. Conventional PID controllers are insufficient, especially during the landing of fixed-wing UAVs. In this project, a reinforcement learning-based smart controller was developed with the help of Titra Teknoloji A.Ş. company. This controller optimizes the parameters of the PX4 PID controller which is available in the aircraft model by taking into account the environmental conditions and the desired positional angles to be followed. The airplane model of the Gazebo simulation environment was used in the learning process while the simulation environment and Python-based reinforcement learning algorithms were combined with the use of MAVSDK library. It was aimed that the algorithms would reduce the differences between the given target angles and the current angles of the aircraft by changing the PID parameters instantaneously. It is envisioned that these algorithms can be used in tasks such as the landing problem. Reinforcement learning algorithms can achieve learning with the results of the actions they take instantaneously. With this approach, the smart controller actively learns which parameters perform better under which conditions during the flight. Within the scope of the project, we compared the performances of the CEM, DDPG and PPO algorithms with the classical PID controller. As a result, it was observed that the used algorithms outperformed the PID controller in angle tracking. With the used smart algorithm, the parameters of a new aircraft model will also be optimized autonomously.