#define TORCH_ASSERT_NO_OPERATORS #include #include #include #include #include #include #include #include #include #include #include #include #include #include namespace at::native { template struct MinNanFunctor { __device__ __forceinline__ acc_t operator()(acc_t a, acc_t b) const { return (at::_isnan(a) || a < b) ? a : b; } }; template void min_values_kernel_cuda_impl(TensorIterator& iter) { gpu_reduce_kernel( iter, func_wrapper (MinNanFunctor()), at::numeric_limits::upper_bound()); } void min_values_kernel_cuda(TensorIterator& iter) { AT_DISPATCH_ALL_TYPES_AND3(kBFloat16, kHalf, kBool, iter.dtype(), "min_values_cuda", [&]() { min_values_kernel_cuda_impl(iter); }); } void min_launch_kernel(TensorIterator &iter) { AT_DISPATCH_ALL_TYPES_AND3(kBFloat16, kHalf, kBool, iter.input_dtype(), "min_cuda", [&]() { gpu_reduce_kernel( iter, MinOps{}, thrust::pair(at::numeric_limits::upper_bound(), 0)); }); } void min_all_launch_kernel(TensorIterator &iter) { AT_DISPATCH_ALL_TYPES_AND3(kBFloat16, kHalf, kBool, iter.input_dtype(), "min_all_cuda", [&] { min_values_kernel_cuda_impl(iter); }); } REGISTER_DISPATCH(min_values_stub, &min_values_kernel_cuda) } // namespace at::native