1 Introduction ▶
- 1.1 Notations
2 Iterative stochastic algorithms ▶
3 Stochastic multi-armed bandits ▶
4 Concentration inequalities ▶
- 4.1 Sub-Gaussian random variables
- 4.2 Concentration of the sums of rewards in bandit models ▶
  - 4.2.1 Sub-Gaussian rewards
5 Bandit algorithms ▶
6 Practical Algorithms ▶
- Alternative strategy: atomic typeclasses
- Error sensitivity analysis
7 Bibliography
A Conditional independence
Dependency graph

LeanBandits

Rémy Degenne, Paulo Rauber

A Lean package for bandit algorithms

1 Introduction
- 1.1 Notations
2 Iterative stochastic algorithms
3 Stochastic multi-armed bandits
4 Concentration inequalities
- 4.1 Sub-Gaussian random variables
- 4.2 Concentration of the sums of rewards in bandit models
  - 4.2.1 Sub-Gaussian rewards
5 Bandit algorithms
6 Practical Algorithms
- Alternative strategy: atomic typeclasses
- Error sensitivity analysis
7 Bibliography
A Conditional independence