マルチエージェントシステムの制御楽しんでみた．

こんにちは．デイビッドです．今回は，私が最近関心があって色々と遊んでいるマルチエージェントシステムの制御を楽しんでみたという記事です．面白さが伝わると嬉しいです・・・！

Contents

1 マルチエージェントシステムって何？
2 グラフ理論
3 合意問題
- 3.1 合意問題に対する基本的な結果
- 3.2 数値シミュレーション（ビークルの編隊協調制御）
4 被覆問題
- 4.1 数値シミュレーション（最適配置制御）
5 まとめ
6 Reference

マルチエージェントシステムって何？

二つ以上の相互作用するエージェント（構成員・要素）からなるシステムのことを言っています．最近はかなりイメージしやすい対象として，オリンピックなどで行われていたドローンショーのようにたくさんのドローン・ロボットなどがあります．ああいった多数の個体からなるシステムの総称です．（このドローンショー残念ながら現状はまだ相互作用して協調的動作を行うところまでには至っていないようで，集中的に管理されています．）

単一機では解くことのできない問題を複数機が協調的に動作することによって解決することが期待されていて，これから紹介するマルチエージェントシステムの「制御」のお話の応用先は，本当に様々です．私自身は群衛星システムの制御などに関心があります．

グラフ理論

マルチエージェントシステムの制御を議論する上で，グラフ理論が便利です．情報交換のネットワーク構造を表すのに用います．隣接行列$A$が各エージェントの接続関係を表し，次数行列$D$が，各エージェントがいくつ接続関係を有しているかを表す対角行列です．これら二つで$L$が定義され，グラフラプラシアンと呼びます．グラフラプラシアンについてはこちらの記事がとんでもなくわかりやすいのでおすすめです．ラプラシアンというのは勾配の発散のことで，そこから名前がついています．すなわち，あるエージェントについて，他のエージェント間との通信量（勾配）すべての収支＝いくつ出ていくつ入るか（発散）という量を意味しています．このグラフラプラシアンが，特に線形の綺麗な理論では，重要な役割を担います．

グラフ構造に関して，Spanning Tree（全域木）という構造が，後述の合意制御の理論では重要です．これは，Loopはなく，あるエージェントからすべてのエージェントに到達するような構造を持っているもののことを指します．

合意問題

さて次は，合意問題についてです．これは，マルチエージェントシステムの制御のもっとも基本的な制御問題です．

数学的には，ネットワーク間の通信と適切な制御入力$u_i(t)$によって，すべての$x_i(t)$が，任意の初期値$x_{0i}$から，漸近的にある値（合意値$\alpha$）に一致する

$$\lim_{t\rightarrow \infty}(x_i(t) – x_j(t))=0,\ \ \lim_{t\rightarrow \infty}x_i(t) = \alpha$$

という条件を満たす制御入力$u_i(t)$を求める．

という問題になります．

このとき，マルチエージェントシステムの制御では，基本的に，各エージェントがそれぞれ独自に得た情報だけを用いて制御を行うため，「分散制御器（Distributed Controller）」を用います．その定義が，

$$\begin{matrix}&u_i=c_i(x_i(t), x_{j_1}(t), x_{j_2}(t),\cdots, x_{j_{n_{i}}}(t)),\\&\ \{j_1,j_2,\cdots,j_{n_i}\}=\nu_i:=\{j\in\nu:(j,i)\in\epsilon\ and\ i \neq j \}: adjacency \ set\end{matrix}$$

となります．

合意問題に対する基本的な結果

例えば，以下のようなシンプルなシステムの線形ダイナミクスがあったとします．

$$\dot{x_i}(t) = u_i(t),\ x_i(0)=x_{i0}$$

その際に，先ほど述べた分散制御器を以下のように線形分散制御器として定めてやれば，

$$\begin{matrix}&u_i=c_i(x_i(t), x_{j_1}(t),\cdots)= – \sum^{n}_{j=1}a_{ij}(x_i(t)- x_j(t)),\\ &A = [a_{ij}]: Adjacency\ matrix \end{matrix}$$

各エージェントの状態量をまとめたベクトルに対して，次の式のようにかけます．

$$\begin{matrix}\dot{{\bf x}}(t) = -L{\bf x}(t), \\{\bf x}=\begin{bmatrix}x_1(t)&x_2(t)&\cdots&x_n(t)\end{bmatrix}^T, L: Graph\ Laplacian\end{matrix}$$

ここで，$L$は先述のようにグラフラプラシアンです．したがって，グラフラプラシアンが，システムの挙動を特徴づけることになります．

この線形システムに対するシミュレーションをしてみましょう．ネットワーク構造は以下のようになっています．

線形分散制御器によって，バラバラな初期値を有していた各エージェントの状態量が時間が経つにつれて合意がとれていることがわかります．

合意値は，

$$\alpha = \frac{\sum_{i=0}^nv_ix_{0i}}{\sum_{i=0}^n{v_i}}$$

と記述できて，$v_i$は$L$の固有値０のときの左固有ベクトルになることが解析的に求められます．ここではそこまで踏み込むのはやめておきます．

さて，もうひとつ．ネットワーク構造が，Spanning Treeである場合と単なるTreeである場合についても数値シミュレーションをしてみましょう．

Spanning Treeの場合には，合意が達成されますが，そうでない場合には，合意が達成できないことがわかります．これは，定性的にも理解しやすいことで，Spanning Tree，すなわちあるエージェントから全エージェントにつながる道が存在しなければ，ネットワーク上で分断がおきてしまうということです．適切なネットワーク構造を有していることが条件ではありますが，漸近安定となる制御入力$u_i(t)$の存在が確認できました．

数値シミュレーション（ビークルの編隊協調制御）

さて，次にこれまで知ったことを生かして，ビークルの編隊制御について考えます．編隊の形状を制御するということはすなわち相対位置を所望の値にするということになります．

$$\begin{matrix}\lim_{t\rightarrow\infty}{(p_{xi}(t)-p_{xj}(t))}=r_{xij}=p^*_{xi}-p^*_{xj}\\\lim_{t\rightarrow\infty}(p_{yi}(t)-p_{yj}(t))=r_{yij}=p^*_{yi}-p^*_{yj}\end{matrix}$$

$p_{xi},p_{xj},p_{yi},p_{yj}$は絶対位置を表しています．適切な座標変換を施せば，

$$\begin{matrix}\lim_{t\rightarrow\infty}{(\bar{p_{xi}}(t)-\bar{p_{xj}}(t))}=0, &\bar{p_{xi}}(t) = p_{xi}(t)- p^*_{xi}, &\bar{p_{xj}}(t) = p_{xj}(t)- p^*_{xj}\\\lim_{t\rightarrow\infty}(\bar{p_{yi}}(t)-\bar{p_{yj}}(t))=0, &\bar{p_{yi}}(t) = p_{yi}(t)- p^*_{yi}, &\bar{p_{yj}}(t) = p_{yj}(t)- p^*_{yj}\end{matrix}$$

状態量の差がゼロに漸近するような問題と考えることができます．ビークルの運動がもっともシンプルなダイナミクスに従う場合には，典型的な線形の分散制御器を以下のように定義してやることで，漸近的に収束させることができます．

$$\begin{matrix}u_i&=&- \sum^{n}_{j=1}a_{ij}(\bar{p_{xi}}(t)- \bar{p_{xj}}(t)) \\&=&- \sum^{n}_{j=1}a_{ij}(p_{xi}(t)- p_{xj}(t) – r_{xij})\end{matrix}$$

実際の数値シミュレーション結果がこちらです．