#define TORCH_ASSERT_NO_OPERATORS #include #include #include #include #include #include #include #include #include namespace at::native { // We manually overload angle because std::arg does not work with types other than c10::complex. template __host__ __device__ static inline scalar_t angle_wrapper(scalar_t v) { if (at::_isnan(v)){ return v; } return v < 0 ? M_PI : 0; } template __host__ __device__ static inline c10::complex angle_wrapper(c10::complex v) { return c10::complex{std::arg(v), 0}; } #if AT_USE_JITERATOR() constexpr char angle_name[] = "angle_kernel"; #endif void angle_kernel_cuda(TensorIteratorBase& iter) { auto dtype = iter.common_dtype(); if (at::isComplexType(dtype)) { #if AT_USE_JITERATOR() static const auto angle_string = jiterator_stringify( template T angle_kernel(T v) { return T{std::arg(v)}; } ); // angle string AT_DISPATCH_COMPLEX_TYPES_AND(kComplexHalf, dtype, "angle_cuda", [&]() { jitted_gpu_kernel< /*name=*/ angle_name, /*return_dtype=*/ scalar_t, /*common_dtype=*/ scalar_t, /*arity=*/ 1>(iter, angle_string); }); #else AT_DISPATCH_COMPLEX_TYPES_AND(kComplexHalf, dtype, "angle_cuda", [&]() { gpu_kernel(iter, []GPU_LAMBDA(scalar_t a) -> scalar_t { return angle_wrapper(a); }); }); #endif } else { AT_DISPATCH_FLOATING_TYPES(dtype, "angle_cuda", [&]() { gpu_kernel(iter, []GPU_LAMBDA(scalar_t a) -> scalar_t { return angle_wrapper(a); }); }); } } // NB: Ignores the negative bit on tensors constexpr char conj_name[] = "conj_kernel"; void conj_kernel_cuda(TensorIteratorBase& iter) { auto conj_chalf = [&] { using scalar_t = c10::complex; #if AT_USE_JITERATOR() static const auto conj_string = jiterator_stringify( template T conj_kernel(T z) { return std::conj(z); } ); jitted_gpu_kernel(iter, conj_string); #else gpu_kernel(iter, [] GPU_LAMBDA(scalar_t a) -> scalar_t { return std::conj(a); }); #endif }; AT_DISPATCH_SWITCH(iter.common_dtype(), "conj_cuda", AT_DISPATCH_CASE_ALL_TYPES_AND3(kBool, kBFloat16, kHalf, [&] { // Conj is a no-op for non-complex types direct_copy_kernel_cuda(iter); }) AT_DISPATCH_CASE_COMPLEX_TYPES([&] { gpu_kernel(iter, [] GPU_LAMBDA(scalar_t a) -> scalar_t { return std::conj(a); }); }) AT_DISPATCH_CASE(kComplexHalf, conj_chalf) ); } REGISTER_DISPATCH(angle_stub, &angle_kernel_cuda) REGISTER_DISPATCH(conj_physical_stub, &conj_kernel_cuda) } // namespace at::native