#define TORCH_ASSERT_NO_OPERATORS #define _USE_MATH_DEFINES #include #include #include #include #include #include #include #include #include #include #include namespace at::native { // ----------------------------------- // prelu // ----------------------------------- void prelu_kernel(TensorIterator &iter) { AT_DISPATCH_FLOATING_TYPES_AND2(kBFloat16, kHalf, iter.dtype(), "prelu_cuda", [&] { gpu_kernel(iter, [] GPU_LAMBDA (scalar_t input, scalar_t weight) -> scalar_t { return (input > 0) ? input : weight * input; }); }); } void prelu_backward_kernel(TensorIterator &iter) { AT_DISPATCH_FLOATING_TYPES_AND2(kBFloat16, kHalf, iter.dtype(), "prelu_backward_cuda", [&] { gpu_kernel_multiple_outputs(iter, [] GPU_LAMBDA (scalar_t input, scalar_t weight, scalar_t grad) -> thrust::tuple { auto mask = input > 0; auto grad_input = mask ? grad : weight * grad; auto grad_weight = mask ? scalar_t{0} : input * grad; return {grad_input, grad_weight}; }); }); } REGISTER_DISPATCH(prelu_stub, &prelu_kernel) REGISTER_DISPATCH(prelu_backward_stub, &prelu_backward_kernel) } // namespace at::native