#define TORCH_ASSERT_NO_OPERATORS #define _USE_MATH_DEFINES #include #include #include #include #include #include #include #include #include #include #include namespace at::native { namespace { void hardshrink_kernel(TensorIteratorBase& iter, const Scalar& value) { AT_DISPATCH_FLOATING_TYPES_AND2( at::ScalarType::Half, at::ScalarType::BFloat16, iter.dtype(), "hardshrink_cuda", [&]() { auto lambd = value.to(); gpu_kernel(iter, [lambd] GPU_LAMBDA(scalar_t a) -> scalar_t { return (a >= -lambd && a <= lambd) ? scalar_t(0) : a; }); }); } } // namespace REGISTER_DISPATCH(hardshrink_stub, &hardshrink_kernel) } // namespace at::native