EXIT SIMULATION
404
REAL-TIME RL VISUALIZER
CHASER | FIT:
0
|
WALL PENALTY!
RUNNER | FIT:
0
|
WALL PENALTY!
가중치는 AI의 실시간 학습 결과에 따라 변동됩니다.
AI_REINFORCEMENT
실시간 학습형 술래잡기 시뮬레이션
[강화 학습 정책]
벽에 붙어있으면 벌점(Penalty)을 받고 뇌 구조를 즉시 수정합니다.
학습 시작