openvinotoolkit · smirnov-alexey · Aug 26, 2025 · Sep 16, 2025 · Sep 16, 2025 · Sep 17, 2025
@@ -212,6 +212,10 @@ void ov::npuw::IBaseInferRequest::handle_set_remote_input(const ov::Output<const
     }
 }
 
+std::size_t ov::npuw::IBaseInferRequest::get_input_allocated_size() const {
+    return m_input_allocated.size();
+}
+
 std::vector<ov::SoPtr<ov::IVariableState>> ov::npuw::IBaseInferRequest::query_state() const {
     std::vector<ov::SoPtr<ov::IVariableState>> variable_states = {};
     for (const auto& request : m_subrequests) {

@@ -51,6 +51,9 @@ class IBaseInferRequest : public ov::ISyncInferRequest {
 
     void handle_set_remote_input(const ov::Output<const ov::Node>& port, const ov::SoPtr<ov::ITensor>& tensor);
 
+    // Used by tests only
+    std::size_t get_input_allocated_size() const;
+
     // Query APIs - some default implementations here
     std::vector<ov::SoPtr<ov::IVariableState>> query_state() const override;
     std::vector<ov::ProfilingInfo> get_profiling_info() const override;

@@ -4,6 +4,10 @@
 
 set(TARGET_NAME "ov_npu_unit_tests")
 
+# FIXME: All those dependencies below need a huge rework!
+# All of them are required to test complex (in terms of dependencies) classes,
+# such as npuw::CompiledModel or npuw::JustSyncInferRequest.
+
 set(MANDATORY_UNIT_TESTS_LIBS
         "openvino::commonTestUtils"
         "openvino::gmock"
@@ -14,6 +18,8 @@ set(MANDATORY_UNIT_TESTS_LIBS
         "openvino::npu_common"
         "openvino::npu_al"
         "openvino::npu_logger_utils"
+        "openvino_npu_driver_compiler_adapter"
+        "openvino_npu_level_zero_backend"
 )
 
 ov_add_test_target(
@@ -27,15 +33,33 @@ ov_add_test_target(
             ${CMAKE_CURRENT_SOURCE_DIR}
             ${CMAKE_CURRENT_SOURCE_DIR}/npuw
             ${CMAKE_CURRENT_SOURCE_DIR}/npuw/model_generator
-            ${OpenVINO_SOURCE_DIR}/src/plugins/intel_npu/src/plugin/npuw
-            ${OpenVINO_SOURCE_DIR}/src/plugins/intel_npu/src/utils/include
+            ${OpenVINO_SOURCE_DIR}/src/plugins/intel_npu/src/plugin
             ${OpenVINO_SOURCE_DIR}/src/plugins/intel_npu/src/plugin/include
             ${OpenVINO_SOURCE_DIR}/src/plugins/intel_npu/src/al/include
+            ${OpenVINO_SOURCE_DIR}/src/plugins/intel_npu/src/compiler_adapter/include
+            ${OpenVINO_SOURCE_DIR}/src/plugins/intel_npu/src/utils/include
+            ${OpenVINO_SOURCE_DIR}/src/plugins/intel_npu/src/plugin/npuw
         OBJECT_FILES
             ${OpenVINO_SOURCE_DIR}/src/plugins/intel_npu/src/plugin/src/metadata.cpp
+            ${OpenVINO_SOURCE_DIR}/src/plugins/intel_npu/src/plugin/src/plugin.cpp
+            ${OpenVINO_SOURCE_DIR}/src/plugins/intel_npu/src/plugin/src/compiled_model.cpp
+            ${OpenVINO_SOURCE_DIR}/src/plugins/intel_npu/src/plugin/src/remote_context.cpp
+            ${OpenVINO_SOURCE_DIR}/src/plugins/intel_npu/src/plugin/src/metrics.cpp
+            ${OpenVINO_SOURCE_DIR}/src/plugins/intel_npu/src/plugin/src/properties.cpp
+            ${OpenVINO_SOURCE_DIR}/src/plugins/intel_npu/src/plugin/src/async_infer_request.cpp
+            ${OpenVINO_SOURCE_DIR}/src/plugins/intel_npu/src/plugin/src/backends_registry.cpp
             ${OpenVINO_SOURCE_DIR}/src/plugins/intel_npu/src/plugin/npuw/llm_compiled_model_utils.cpp
             ${OpenVINO_SOURCE_DIR}/src/plugins/intel_npu/src/plugin/npuw/logging.cpp
+            ${OpenVINO_SOURCE_DIR}/src/plugins/intel_npu/src/plugin/npuw/compiled_model.cpp
+            ${OpenVINO_SOURCE_DIR}/src/plugins/intel_npu/src/plugin/npuw/llm_compiled_model.cpp
+            ${OpenVINO_SOURCE_DIR}/src/plugins/intel_npu/src/plugin/npuw/base_sync_infer_request.cpp
+            ${OpenVINO_SOURCE_DIR}/src/plugins/intel_npu/src/plugin/npuw/just_sync_infer_request.cpp
+            ${OpenVINO_SOURCE_DIR}/src/plugins/intel_npu/src/plugin/npuw/unfold_sync_infer_request.cpp
+            ${OpenVINO_SOURCE_DIR}/src/plugins/intel_npu/src/plugin/npuw/llm_infer_request.cpp
+            ${OpenVINO_SOURCE_DIR}/src/plugins/intel_npu/src/plugin/npuw/weights_bank.cpp
             ${OpenVINO_SOURCE_DIR}/src/plugins/intel_npu/src/plugin/npuw/serialization.cpp
+            ${OpenVINO_SOURCE_DIR}/src/plugins/intel_npu/src/plugin/npuw/spatial.cpp
+            ${OpenVINO_SOURCE_DIR}/src/plugins/intel_npu/src/plugin/npuw/accuracy/comparator.cpp
             ${OpenVINO_SOURCE_DIR}/src/plugins/intel_npu/src/plugin/npuw/util.cpp
             ${OpenVINO_SOURCE_DIR}/src/plugins/intel_npu/src/plugin/npuw/util_xarch.cpp
             ${OpenVINO_SOURCE_DIR}/src/plugins/intel_npu/src/plugin/npuw/lazy_tensor.cpp
@@ -51,6 +75,8 @@ if(ENABLE_AVX2)
     target_compile_definitions(${TARGET_NAME} PRIVATE HAVE_AVX2)
 endif()
 
+target_compile_definitions(${TARGET_NAME} PRIVATE CI_BUILD_NUMBER=\"mock_version\")
+
 install(TARGETS ${TARGET_NAME}
         RUNTIME DESTINATION tests
         COMPONENT tests

@@ -0,0 +1,74 @@
+// Copyright (C) 2025 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+
+#include <gtest/gtest.h>
+
+#include <iostream>
+
+#include "openvino/openvino.hpp"
+#include "npuw/compiled_model.hpp"
+#include "npuw/just_sync_infer_request.hpp"
+#include "model_generator/model_generator.hpp"
+#include "plugin.hpp"
+
+// FIXME: parametrize all the tests below
+
+// TODO: add tests on Unfold, Base and Just for inputs and outputs (where applicable)
+TEST(SetTensor, RemoteTensorOutputJust) {
+    // Only run this test on NPU device
+    ov::Core ov_core;
+    auto core_devices = ov_core.get_available_devices();
+    if (std::find(core_devices.begin(), core_devices.end(), "NPU") == core_devices.end()) {
+        GTEST_SKIP() << "No available devices.";
+    }
+
+    // Create model
+    ModelGenerator mg;
+    auto model = mg.get_model_with_repeated_blocks();
+
+    ov::element::Type element_type = ov::element::i32;
+    auto output_tensor_shape = model->outputs()[0].get_shape();
+    // Calculate total number of elements
+    size_t total_elements = ov::shape_size(output_tensor_shape);
+
+    // Create output data
+    std::vector<int> data = std::vector<int>(total_elements, 0);
+    std::iota(data.begin(), data.end(), 1);
+
+    // Create the remote tensor output
+    auto npu_context = ov_core.get_default_context("NPU");
+    auto output = npu_context.create_host_tensor(element_type, output_tensor_shape);
+
+    // Initialize remote input with non-zero data
+    ov::Tensor values(element_type, output_tensor_shape, data.data());
+    values.copy_to(output);
+
+    // Create plugin object
+    auto plugin = std::make_shared<intel_npu::Plugin>();
+
+    // Compile NPUW
+    auto compiled = std::make_shared<ov::npuw::CompiledModel>(model, plugin, ov::AnyMap{});
+
+    // Create infer request
+    std::shared_ptr<ov::ISyncInferRequest> request;
+    request = std::make_shared<ov::npuw::JustInferRequest>(compiled);
+
+    // Set remote io
+    request->set_tensor(compiled->outputs()[0], ov::get_tensor_impl(output));
+
+    // Check output tensor is not zero
+    auto output_tensor = request->get_tensor(compiled->outputs()[0]);
+
+    auto check_non_zero = [](const ov::npuw::util::TensorPtr& t, size_t size) {
+        int32_t* tdata = t->data<int32_t>();
+        for (size_t i = 0; i < size; ++i) {
+            if (tdata[i] == 0) {
+                return false;
+            }
+        }
+        return true;
+    };
+
+    EXPECT_TRUE(check_non_zero(output_tensor, total_elements));
+}