Next: B.1 main モジュール
Up: Q-learning により学習を行う Tic-Tac-Toe プログラム
Previous: A.2 今回用いたパラメータ
本章ではプログラムで用いたモジュールと、
その各モジュール内で定義されている主な述語について説明する。
プログラムで用いたモジュールは以下の通りである。
- main
-
プログラム本体、およびメニュー処理を行うモジュール。
- encode
-
盤面(局面)を内部表現に変換、またその逆変換を行う述語を格納した
モジュール。
- decide
-
意思決定に用いる述語を格納したモジュール。
- learn
-
学習、すなわちQ値の更新に用いられる述語を格納したモジュール。
- utils
-
盤面の出力等に用いる述語を格納したモジュール。
Q-learning により学習を行う Tic-Tac-Toe プログラム