Next:
A.1 Q-learning
Up:
ToC
Previous:
3.2 メニュー
A 背景
本章では今回用いた学習アルゴリズムであるQ-learningについて説明し、 今回用いた学習のパラメータ値について述べる。
A.1 Q-learning
A.2 今回用いたパラメータ
Q-learning により学習を行う Tic-Tac-Toe プログラム