算法3:神经规划器训练集构造

输入:训练样本集,任务场景数据集 X o b s ,任务场景的隐藏表示集 H = { h 1 , h 2 , ... , h n } ,任务场景中可行路径的集 P = { P i | P i = { L 1 , L 2 , ... , L m } }

输出:下一时刻位置

1.

2. H ←Encoder( X o b s )

3. P ←LoadPath()

4. for i←1 to N do//N代表任务场景的个数

5. forj←1 to M do //M代表第i个任务场景的可行路径条数

6. Length L j P i .Length()// L j P i 代表第i个任务场景的第j条可行路径

7. Reverse←False

1 8. if Length > 0 then