next up previous
Next: 2.2.3 Q値テーブル Up: 2.2 内部表現 Previous: 2.2.1 局面(盤面)

2.2.2 状態

 

前述の局面 d/10 の第2 〜 10引数を3進数に見立て、それを10進数に 変換したものを状態番号とする。8通りの状態番号を計算し、その最小値を 現局面の状態番号とすることにより、対称同値な局面を 同じ局面と看做すことが可能となる。

8つの対称形は以下の通りである(図 1参照)。

  
図 1: 盤面の対称形



[i18n checked]

Q-learning により学習を行う Tic-Tac-Toe プログラム