Next: 2.2.2 状態
Up: 2.2 内部表現
Previous: 2.2 内部表現
局面を表すのには、以下の3つのファンクタ構造を用いる。
- ox/9
-
アトム 'o', 'x', ' ' を引数にもつ。
これは便宜的に用意したもので、内部では特に使わない。
- b/9
-
ox/9 の各コマを数値で表したもので、 'o' → 1,
'x'→ -1, ' '→ 0
で局面を表す。
- d/10
-
b/9 に対称変換を施し、同時にプレーヤから見た局面に変換したものである。
d/10 では第1引数で対称変換情報を表し、残りの9引数で局面を表すが、
その際自分のコマは 2, 相手のコマは 1 として表されている。
Q-learning により学習を行う Tic-Tac-Toe プログラム