#include #ifdef USE_CUDA #include #endif #ifdef USE_XPU #include #endif #ifdef __APPLE__ #include #endif #include #include #include #include namespace torch::inductor { void initAOTIRunnerBindings(PyObject* module) { auto rootModule = py::handle(module).cast(); auto m = rootModule.def_submodule("_aoti"); py::class_(m, "AOTIModelContainerRunnerCpu") .def(py::init()) .def( "run", &AOTIModelContainerRunnerCpu::run, py::arg("inputs"), py::arg("stream_handle") = nullptr) .def("get_call_spec", &AOTIModelContainerRunnerCpu::get_call_spec) .def( "get_constant_names_to_original_fqns", &AOTIModelContainerRunnerCpu::getConstantNamesToOriginalFQNs) .def( "get_constant_names_to_dtypes", &AOTIModelContainerRunnerCpu::getConstantNamesToDtypes) .def( "extract_constants_map", &AOTIModelContainerRunnerCpu::extract_constants_map) .def( "update_constant_buffer", static_cast&, bool, bool, bool)>( &AOTIModelContainerRunnerCpu::update_constant_buffer), py::arg("tensor_map"), py::arg("use_inactive"), py::arg("validate_full_updates"), py::arg("user_managed") = false) .def( "swap_constant_buffer", &AOTIModelContainerRunnerCpu::swap_constant_buffer) .def( "free_inactive_constant_buffer", &AOTIModelContainerRunnerCpu::free_inactive_constant_buffer); #ifdef USE_CUDA py::class_(m, "AOTIModelContainerRunnerCuda") .def(py::init()) .def(py::init()) .def(py::init< const std::string&, int, const std::string&, const std::string&>()) .def( "run", &AOTIModelContainerRunnerCuda::run, py::arg("inputs"), py::arg("stream_handle") = nullptr) .def("get_call_spec", &AOTIModelContainerRunnerCuda::get_call_spec) .def( "get_constant_names_to_original_fqns", &AOTIModelContainerRunnerCuda::getConstantNamesToOriginalFQNs) .def( "get_constant_names_to_dtypes", &AOTIModelContainerRunnerCuda::getConstantNamesToDtypes) .def( "extract_constants_map", &AOTIModelContainerRunnerCuda::extract_constants_map) .def( "update_constant_buffer", static_cast&, bool, bool, bool)>( &AOTIModelContainerRunnerCuda::update_constant_buffer), py::arg("tensor_map"), py::arg("use_inactive"), py::arg("validate_full_updates"), py::arg("user_managed") = false) .def( "swap_constant_buffer", &AOTIModelContainerRunnerCuda::swap_constant_buffer) .def( "free_inactive_constant_buffer", &AOTIModelContainerRunnerCuda::free_inactive_constant_buffer); #endif #ifdef USE_XPU py::class_(m, "AOTIModelContainerRunnerXpu") .def(py::init()) .def(py::init()) .def(py::init< const std::string&, int, const std::string&, const std::string&>()) .def( "run", &AOTIModelContainerRunnerXpu::run, py::arg("inputs"), py::arg("stream_handle") = nullptr) .def("get_call_spec", &AOTIModelContainerRunnerXpu::get_call_spec) .def( "get_constant_names_to_original_fqns", &AOTIModelContainerRunnerXpu::getConstantNamesToOriginalFQNs) .def( "get_constant_names_to_dtypes", &AOTIModelContainerRunnerXpu::getConstantNamesToDtypes) .def( "extract_constants_map", &AOTIModelContainerRunnerXpu::extract_constants_map) .def( "update_constant_buffer", static_cast&, bool, bool, bool)>( &AOTIModelContainerRunnerXpu::update_constant_buffer), py::arg("tensor_map"), py::arg("use_inactive"), py::arg("validate_full_updates"), py::arg("user_managed") = false) .def( "swap_constant_buffer", &AOTIModelContainerRunnerXpu::swap_constant_buffer) .def( "free_inactive_constant_buffer", &AOTIModelContainerRunnerXpu::free_inactive_constant_buffer); #endif #if defined(USE_MPS) && defined(__APPLE__) && \ !(defined(FBCODE_CAFFE2) || defined(OVRSOURCE)) py::class_(m, "AOTIModelContainerRunnerMps") .def(py::init()) .def( "run", &AOTIModelContainerRunnerMps::run, py::arg("inputs"), py::arg("stream_handle") = nullptr) .def("get_call_spec", &AOTIModelContainerRunnerMps::get_call_spec) .def( "get_constant_names_to_original_fqns", &AOTIModelContainerRunnerMps::getConstantNamesToOriginalFQNs) .def( "get_constant_names_to_dtypes", &AOTIModelContainerRunnerMps::getConstantNamesToDtypes) .def( "extract_constants_map", &AOTIModelContainerRunnerMps::extract_constants_map) .def( "update_constant_buffer", static_cast&, bool, bool, bool)>( &AOTIModelContainerRunnerMps::update_constant_buffer), py::arg("tensor_map"), py::arg("use_inactive"), py::arg("validate_full_updates"), py::arg("user_managed") = false) .def( "swap_constant_buffer", &AOTIModelContainerRunnerMps::swap_constant_buffer) .def( "free_inactive_constant_buffer", &AOTIModelContainerRunnerMps::free_inactive_constant_buffer); #endif m.def( "unsafe_alloc_void_ptrs_from_tensors", [](const std::vector& tensors) { std::vector handles = torch::aot_inductor::unsafe_alloc_new_handles_from_tensors(tensors); std::vector result( reinterpret_cast(handles.data()), reinterpret_cast(handles.data()) + handles.size()); return result; }); m.def("unsafe_alloc_void_ptr_from_tensor", [](at::Tensor& tensor) { return reinterpret_cast( torch::aot_inductor::new_tensor_handle(std::move(tensor))); }); m.def( "alloc_tensors_by_stealing_from_void_ptrs", [](std::vector& raw_handles) { return torch::aot_inductor::alloc_tensors_by_stealing_from_handles( reinterpret_cast(raw_handles.data()), raw_handles.size()); }); m.def("alloc_tensor_by_stealing_from_void_ptr", [](void* raw_handle) { return *torch::aot_inductor::tensor_handle_to_tensor_pointer( reinterpret_cast(raw_handle)); }); } } // namespace torch::inductor