论文信息 - Optimal learning: computational procedures for bayes-adaptive markov decision processes - 字舞流文

Optimal learning: computational procedures for bayes-adaptive markov decision processes

Andrew G. Barto | Michael O. Duff | A. Barto | M. Duff