Q-öğrenme algoritmasının işlev yaklaşımı ile nasıl kullanılacağı hakkında bazı yararlı talimatlar almak istiyorum. Temel Q-öğrenme algoritması için örnekler buldum ve sanırım onu anladım. Fonksiyon yaklaşımı kullanılması durumunda başım belaya girer. Birisi bana kısa bir örnekle nasıl çalıştığını açıklayabilir mi?Lineer fonksiyon yaklaşımı ile Q-öğrenme
biliyorum Ne:
- Istead biz özellikleri ve parametreleri kullanın Q-değerleri için matrisi kullanarak.
- Feauters ve parametrelerin lineer kombinasyonu ile yaklaşık olun.
- Parametreleri güncelleyin.
bu kağıdı kontrol ettikten: Q-learning with function approximation
Ama nasıl kullanılacağını herhangi kullanışlı öğretici bulamıyorum.
Yardımlarınız için teşekkürler!