brozek/website

mirror of https://github.com/Brandon-Rozek/website.git synced 2024-12-23 16:41:17 +00:00

Brandon Rozek 50ec3688a5 Website snapshot

2020-01-15 21:51:49 -05:00

258 B

Raw Blame History

Lecture Notes for Reinforcement Learning

Chapter 1: An Introduction

Chapter 2: Multi-armed Bandits

Chapter 3: Markov Decision Processes

Chapter 4: Dynamic Programming

Chapter 5: Monte Carlo Methods