next up previous
Next: A.1 Q-learning Up: Q-learning により学習を行う Tic-Tac-Toe プログラム Previous: 3.2 メニュー

A 背景

 

本章では今回用いた学習アルゴリズムであるQ-learningについて説明し、 今回用いた学習のパラメータ値について述べる。





Q-learning により学習を行う Tic-Tac-Toe プログラム