#define TORCH_ASSERT_NO_OPERATORS #include #include #include #include #include #include #include #include #include #include #include #include #include #include namespace at::native { template void _min_max_values_kernel_cuda_impl(TensorIterator& iter) { gpu_reduce_kernel( iter, MinMaxOps{}, thrust::pair( at::numeric_limits::upper_bound(), at::numeric_limits::lower_bound())); } void aminmax_allreduce_launch_kernel(TensorIterator& iter) { AT_DISPATCH_ALL_TYPES_AND3( kBFloat16, kHalf, kBool, iter.input_dtype(), "aminmax_all_cuda", [&] { _min_max_values_kernel_cuda_impl(iter); }); } void aminmax_launch_kernel(TensorIterator& iter) { AT_DISPATCH_ALL_TYPES_AND3( kBFloat16, kHalf, kBool, iter.input_dtype(), "aminmax_cuda", [&]() { gpu_reduce_kernel( iter, MinMaxOps{}, thrust::pair( at::numeric_limits::upper_bound(), at::numeric_limits::lower_bound())); }); } } // namespace at::native