#include #include #include #include #include #include namespace at::native { void _fused_adam_amsgrad_cuda_impl_( at::TensorList params, at::TensorList grads, at::TensorList exp_avgs, at::TensorList exp_avg_sqs, at::TensorList max_exp_avg_sqs, at::TensorList state_steps, const double lr, const double beta1, const double beta2, const double weight_decay, const double eps, const bool maximize, const std::optional& grad_scale, const std::optional& found_inf) { std::vector> tensor_lists{ params.vec(), grads.vec(), exp_avgs.vec(), exp_avg_sqs.vec(), max_exp_avg_sqs.vec()}; const float* grad_scale_ptr = grad_scale.has_value() ? grad_scale->data_ptr() : nullptr; const float* found_inf_ptr = found_inf.has_value() ? found_inf->data_ptr() : nullptr; const float* lr_ptr = nullptr; AT_DISPATCH_FLOATING_TYPES_AND2( kHalf, kBFloat16, params[0].scalar_type(), "fused_adam_kernel_cuda", [&]() { multi_tensor_apply_for_fused_optimizer<5>( tensor_lists, state_steps, FusedAdamMathFunctor(), lr_ptr, // unused lr, beta1, beta2, weight_decay, eps, maximize, grad_scale_ptr, found_inf_ptr); }); } // The following overload simply has a Tensor lr void _fused_adam_amsgrad_cuda_impl_( at::TensorList params, at::TensorList grads, at::TensorList exp_avgs, at::TensorList exp_avg_sqs, at::TensorList max_exp_avg_sqs, at::TensorList state_steps, const at::Tensor& lr, const double beta1, const double beta2, const double weight_decay, const double eps, const bool maximize, const std::optional& grad_scale, const std::optional& found_inf) { std::vector> tensor_lists{ params.vec(), grads.vec(), exp_avgs.vec(), exp_avg_sqs.vec(), max_exp_avg_sqs.vec()}; const float* grad_scale_ptr = grad_scale.has_value() ? grad_scale->data_ptr() : nullptr; const float* found_inf_ptr = found_inf.has_value() ? found_inf->data_ptr() : nullptr; const float* lr_ptr = lr.const_data_ptr(); AT_DISPATCH_FLOATING_TYPES_AND2( kHalf, kBFloat16, params[0].scalar_type(), "fused_adam_kernel_cuda", [&]() { multi_tensor_apply_for_fused_optimizer<5>( tensor_lists, state_steps, FusedAdamMathFunctor(), lr_ptr, 1.0, // unused beta1, beta2, weight_decay, eps, maximize, grad_scale_ptr, found_inf_ptr); }); } } // namespace at::native