AI 核心算法架构
本架構專用於 ESS 2 的智能航向修正模式。
核心採用 DQN (Deep Q-Network) 結合 RNN,專注於航向保持與平滑控制。
输入 1. 状态空间
航向偏差
當前船頭朝向 (罗盘) 與目標航向的夾角。
角速度
IMU 傳感器測得的實時旋轉速率。
歷史時序數據
輸入一段時間內的狀態序列,供 RNN 判斷環境趨勢。
大脑 2. 神经网络模型
RNN/LSTM 层 (記憶)
- 處理連續的時間序列數據。
- 用於識別風流對船體的持續影響趨勢。
DQN 全连接层 (決策)
- 結合實時狀態與 RNN 輸出的特徵。
- 計算各個推力動作的 Q 值。
- 輸出最優策略。
补充信息
安全机制 (申请表未详述,需补充)
以下关键安全逻辑在 申请表 中未具体描述,但属于工程必备,需在汇报时重点补充:
- 人手操控优先: 系統檢測到 實體搖桿 或 APP 虛擬控制 有任何輸入信號時,底層邏輯會立即切斷 AI 控制,將控制權交回操作員。
- 规则安全锁: 虽然 AI 负责决策,但在输出端需增加一层硬代码逻辑,拦截任何超过物理极限的危险指令(如瞬间反转电机)。
输出 3. 动作空间
左艉推力
PWM 控制信號。
右艉推力
PWM 控制信號。
船頭側推
修正大角度或橫移。
船中側推
配合原地旋轉。
4. 奖励函数设计
依據 申请表 及 Survey 研究設定參數,訓練 AI 達到舒適度指標。
目標獎勵
保持航向: 獎勵 Heading 偏差趨近 0。
直線行駛: 獎勵軌跡誤差最小化。
精度懲罰
大幅偏航: 偏差 > 10° 給予懲罰。
S型軌跡: 懲罰無效的左右修正。
舒適度限制
擺動限制: Swing > 12° 給予懲罰。
角速度限制: Velocity > 2.5°/s 給予懲罰。