Bendersky, D. A., & Santos, J. M. (2014). LEARNING FROM THE ENVIRONMENT WITH A UNIVERSAL REINFORCEMENT FUNCTION. International Journal of Computing, 5(3), 68-74. https://doi.org/10.47839/ijc.5.3.410