Adam
Версия от 06:49, 22 августа 2025; In.wiki (комментарии | вклад)
Adam[1] (сокращение от «метод адаптивной оценки моментов», англ. Adaptive Moment Estimation) —
Является обновлением оптимизатора RMSProp.
В этом оптимизационном алгоритме используются скользящие средние как градиентов, так и вторых моментов градиентов. Если даны параметры , а функция потерь , где отражает индекс текущей итерации (отчёт начинается с ), пересчёт параметра алгоритмом Adam задаётся формулами
где является малой добавкой, используемой для предотвращения деления на 0, а и являются коэффициентами забывания для градиентов и вторых моментов градиентов соответственно. Возведение в квадрат и квадратный корень вычисляются поэлементно.