「Q-learningにより学習するTic-Tac-Toe」


この作品では、 けっこう面白く、ビジュアルにTic-Tac-Toeゲームが楽しめる ようになっている。ユーザとの対戦や紅白戦を重ねることでQ-learningアルゴ リズムに基づく学習を行ない、Tic-Tac-Toe ゲームのルールや勝ち方を学習し ていく。 システムを実行してみると、プログラムが学習して強くなって/負け なくなっていくのがはっきりわかる。解説文書は、すべて HTML で書いてある が、かなり丁寧に時間をかけて書いてある。「学習」の理論の解説もなされて いる。