next up previous
Next: A.1 Q-learning Up: ToC Previous: 3.2 メニュー

A 背景

 

本章では今回用いた学習アルゴリズムであるQ-learningについて説明し、 今回用いた学習のパラメータ値について述べる。





[i18n checked]

Q-learning により学習を行う Tic-Tac-Toe プログラム