`final_momentum` parameter is never used #3

jlmelville · 2019-03-01T04:50:59Z

I don't think that the final momentum value is ever used. The momentum-decay line uses a hard-coded value of 0.85:

Lines 186 to 187 in 4b5c368

    
           mom = float(get_epsilon(initial_momentum, lrDecay, epoch)) \ 
        
                                   if epoch < momentum_switch else 0.85

Appendix C of the paper mentions the learning rate and momentum decay but not the momentum switch, which would seem to force the momentum back up to a relatively large value for most of the optimization. Is the momentum decay useful in practice?

The text was updated successfully, but these errors were encountered:

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

`final_momentum` parameter is never used #3

`final_momentum` parameter is never used #3

jlmelville commented Mar 1, 2019

final_momentum parameter is never used #3

final_momentum parameter is never used #3

Comments

jlmelville commented Mar 1, 2019

`final_momentum` parameter is never used #3

`final_momentum` parameter is never used #3