next up previous
Next: 2.2.2 状態 Up: 2.2 内部表現 Previous: 2.2 内部表現

2.2.1 局面(盤面)

 

局面を表すのには、以下の3つのファンクタ構造を用いる。

ox/9
アトム 'o', 'x', ' ' を引数にもつ。 これは便宜的に用意したもので、内部では特に使わない。
b/9
ox/9 の各コマを数値で表したもので、 'o' → 1, 'x'→ -1, ' '→ 0 で局面を表す。
d/10
b/9 に対称変換を施し、同時にプレーヤから見た局面に変換したものである。 d/10 では第1引数で対称変換情報を表し、残りの9引数で局面を表すが、 その際自分のコマは 2, 相手のコマは 1 として表されている。



Q-learning により学習を行う Tic-Tac-Toe プログラム