Documentation

LeanBandits.AlgorithmAndRandomVariables

Equalities between definitions of random variables used in bandit algorithms #

theorem Bandits.pullCount_add_one_eq_pullCount' {K : } {a : Fin K} {n : } {h : Fin K × } :
pullCount a (n + 1) h = pullCount' n (fun (i : { x : // x Finset.Iic n }) => h i) a
theorem Bandits.pullCount_eq_pullCount' {K : } {a : Fin K} {n : } {h : Fin K × } (hn : n 0) :
pullCount a n h = pullCount' (n - 1) (fun (i : { x : // x Finset.Iic (n - 1) }) => h i) a
theorem Bandits.sumRewards_add_one_eq_sumRewards' {K : } {a : Fin K} {n : } {h : Fin K × } :
sumRewards a (n + 1) h = sumRewards' n (fun (i : { x : // x Finset.Iic n }) => h i) a
theorem Bandits.sumRewards_eq_sumRewards' {K : } {a : Fin K} {n : } {h : Fin K × } (hn : n 0) :
sumRewards a n h = sumRewards' (n - 1) (fun (i : { x : // x Finset.Iic (n - 1) }) => h i) a
theorem Bandits.empMean_add_one_eq_empMean' {K : } {a : Fin K} {n : } {h : Fin K × } :
empMean a (n + 1) h = empMean' n (fun (i : { x : // x Finset.Iic n }) => h i) a
theorem Bandits.empMean_eq_empMean' {K : } {a : Fin K} {n : } {h : Fin K × } (hn : n 0) :
empMean a n h = empMean' (n - 1) (fun (i : { x : // x Finset.Iic (n - 1) }) => h i) a