https://xtech.nikkei.com/atcl/nxt/column/18/01495/010500005/?n_cid=nbpnxt_twbn

NeurIPS 2020 神経科学と機械学習に関する最高峰の国際学会で、
最高位の論文に輝いたのは、OISTの小津野将氏らが書いた
「Leverage the Average: an Analysis of KL Regularization in Reinforcement Learning」

Google Brain、DeepMind、沖縄科学技術大学(OIST)、Inriaの共同研究