CPQL

Official code for ICLR'26 paper [Peng's Q(λ) for Conservative Value Estimation in Offline Reinforcement Learning]

Name		Name	Last commit message	Last commit date
Latest commit History 1 Commit
LICENSE		LICENSE
README.md		README.md

Provide feedback