-
Multi-objective latent space optimization of generative molecular design models
Pareto ranking 기반 weighted retraining을 통한 multi-objective generative molecular design 논문 리뷰
-
Proximal Policy Optimization
Proximal Policy Optimization의 기본 개념과 clipped surrogate objective
-
Actor-Critic: A2C
Actor-Critic: A2C의 기본 개념과 학습 과정
-
Deep Q-Network
Deep Q-Network의 기본 개념과 학습 과정
-
REINFORCE Algorithm
REINFORCE algorithm과 REINFORCE with baseline 정리