關鍵詞:深度增強學習 衛星姿態控制 動力學環境 自主姿態控制 質量參數
摘要:針對衛星在執行丟棄載荷或捕獲目標等復雜任務時遭遇的姿態突然發生變化的問題,采用深度增強學習方法對衛星姿態進行控制,使衛星恢復穩定狀態。具體來說,首先搭建飛行器的姿態動力學環境,并將連續的控制力矩輸出離散化,然后采用Deep Q Network算法進行衛星自主姿態控制訓練,以姿態角速度趨于穩定作為獎勵獲得離散行為的最優智能輸出。仿真試驗表明,面向空間衛星姿態控制的深度增強學習算法能夠在衛星受到突發隨機擾動后穩定衛星姿態,并能有效解決傳統PD控制器依賴被控對象質量參數的難題。所提出的方法采用自主學習的方式對衛星姿態進行控制,具有很強的智能性和一定的普適性,在未來衛星執行復雜空間任務中的智能控制方面有著很好的應用潛力。
中國空間科學技術雜志要求:
{1}統計學符號:按GB3358-1982《統計學名詞及符號》的有關規定書寫。
{2}內容突出理論性、學術性、實用性和探索性。
{3}參考文獻:是對引文作者、作品、出處、版本等情況的說明。文未依次排列參考文獻時,按作者、書刊名或出版社、出版年(期)、起訖頁順序標注。
{4}中英文摘要(200字左右)、中英文關鍵詞3-5個(均用分號隔開)。
{5}來稿請附作者詳細聯系方式(姓名、單位、通訊地址、郵編、郵箱、固定電話、手機等)。
注:因版權方要求,不能公開全文,如需全文,請咨詢雜志社