Obadan, S., and Z. Wang. “A MULTI-AGENT APPROACH TO POMDPS USING OFF-POLICY REINFORCEMENT LEARNING AND GENETIC ALGORITHMS”. International Journal of Computing, vol. 19, no. 3, Sept. 2020, pp. 377-86, doi:10.47839/ijc.19.3.1887.