login
Registrieren
Login
Bibliothek
Das System
Kontakt
Künstliche Intelligenz 1 (Modul: Smart Computing)
11-MDP-QLearning
Liste
erweitert
Stapel lernen
drucken
MDP
Markov Property
transition probability
State Transition Matrix
Markov Process - Formal
Markov Reward Process
Markov Reward Process - Formal
Return
Return - Formal
Value Function
Value Function - MRP
Markov decision process
Markov decision process - Formal
policy
state-value function
action-value function
optimal state-value function
optimal action-value function
optimal policy
Bellman optimality equation
Q Learning - Formal
learning rate
Epsilon-greedy Action Selection
Boltzmann action selection
Kommentare
Nur angemeldete Nutzer dürfen kommentieren.
Hier
geht's zur kostenlosen Registrierung.
FAQ
Kontakt
Impressum
Datenschutz
Nutzungsbedingungen
© 2015 - 2024 Philipp Schweers