Next: 2.2.2 状態
Up: 2.2 内部表現
Previous: 2.2 内部表現
局面を表すのには、以下の3つのファンクタ構造を用いる。
- ox/9
-
アトム
'o'
, 'x'
, ' '
を引数にもつ。
これは便宜的に用意したもので、内部では特に使わない。
- b/9
-
ox/9 の各コマを数値で表したもので、
'o'
→ 1,
'x'
→ -1, ' '
→ 0
で局面を表す。
- d/10
-
b/9 に対称変換を施し、同時にプレーヤから見た局面に変換したものである。
d/10 では第1引数で対称変換情報を表し、残りの9引数で局面を表すが、
その際自分のコマは 2, 相手のコマは 1 として表されている。
Q-learning により学習を行う Tic-Tac-Toe プログラム