q-learning

13ısı

2cevap

ε-hırslı ilke Q'nun öğrenme algoritması keşif ve istismar arasında denge çalışmalıdır biliyoruz. Bu alanda yeni başladığımdan beri, keşif/sömürü davranışının basit bir versiyonunu uygulamak istedim. O

0ısı

1cevap

Lineer fonksiyon yaklaşımı ile Q-öğrenme

Q-öğrenme algoritmasının işlev yaklaşımı ile nasıl kullanılacağı hakkında bazı yararlı talimatlar almak istiyorum. Temel Q-öğrenme algoritması için örnekler buldum ve sanırım onu anladım. Fonksiyon

9ısı

2cevap

Q Tic Tac Toe için Öğrenme Algoritması

Tic Tac Toe oyunu için Q değerlerinin nasıl güncelleneceğini anlayamadım. Tüm bunları okudum ama nasıl yapılacağını hayal edemedim. Q değerinin oyunun sonunu güncellediğini okudum, ancak her bir eylem