Estimating Optimal Policy Value in General Linear Contextual Bandits

Jonathan Lee, Weihao Kong, Aldo Pacchiano, Vidya Muthukumar, Emma Brunskill

February 2023

PDF

Type

Journal article

Publication

Transactions on Machine Learning Research