Merge branch 'fix_apu' into 'master'

fix: fix so file selection error and op type selection errors on apu runtime See merge request applied-machine-learning/sysml/mace!1341
XiaoMi · Jan 10, 2021 · d5ae855 · d5ae855
2 parents d79dc74 + 0d27d59
commit d5ae855
Show file tree

Hide file tree

Showing 7 changed files with 37 additions and 25 deletions.
diff --git a/mace/core/runtime/apu/apu_wrapper.cc b/mace/core/runtime/apu/apu_wrapper.cc
@@ -89,12 +89,12 @@ bool ApuWrapper::DoInit(const NetDef &net_def, unsigned const char *model_data,
 
   // parse model argument
   int const_data_num = 0;
-  int apu_data_type = -1;
+  int apu_dt = -1;
   for (auto arg : net_def.arg()) {
     if (arg.name().compare("const_data_num") == 0) {
       const_data_num = arg.i();
     } else if (arg.name().compare("apu_data_type") == 0) {
-      apu_data_type = arg.i();
+      apu_dt = arg.i();
     }
   }
   // input tensors
@@ -104,7 +104,7 @@ bool ApuWrapper::DoInit(const NetDef &net_def, unsigned const char *model_data,
     tensor.tensor_id = input_info.node_id();
     tensor.tensor_type = APU_TENSOR_MODEL_INPUT;
     tensor.data_type = static_cast<apu_data_type>(
-        MapToApuDataType(static_cast<DataType>(apu_data_type)));
+        MapToApuDataType(static_cast<DataType>(apu_dt)));
     tensor.scale = input_info.has_scale() ? input_info.scale() : -1.0f;
     tensor.zero_point = input_info.has_zero_point() ?
                             input_info.zero_point() : 0;
@@ -137,7 +137,7 @@ bool ApuWrapper::DoInit(const NetDef &net_def, unsigned const char *model_data,
     tensor.tensor_id = output_info.node_id();
     tensor.tensor_type = APU_TENSOR_MODEL_OUTPUT;
     tensor.data_type = static_cast<apu_data_type>(
-        MapToApuDataType(static_cast<DataType>(apu_data_type)));
+        MapToApuDataType(static_cast<DataType>(apu_dt)));
     tensor.dim_size = output_info.dims_size();
     ApuTensorInfo info;
     info.name = output_info.name();

diff --git a/tools/device.py b/tools/device.py
@@ -27,7 +27,7 @@
 import sh_commands
 
 sys.path.insert(0, "tools/python")  # noqa
-from utils.device import AndroidDevice
+from copy_apu_so import get_apu_so_paths_by_props
 
 
 class DeviceWrapper:
@@ -146,7 +146,7 @@ def get_apu_so_paths(self):
         target_props = sh_commands.adb_getprop_by_serialno(self.address)
         target_soc = target_props["ro.board.platform"]
         android_ver = (int)(target_props["ro.build.version.release"])
-        return AndroidDevice.get_apu_so_paths_by_props(android_ver, target_soc)
+        return get_apu_so_paths_by_props(android_ver, target_soc)
 
     def pull(self, src_path, file_name, dst_path='.'):
         if not os.path.exists(dst_path):

diff --git a/tools/generate_data.py b/tools/generate_data.py
@@ -51,6 +51,7 @@ def generate_input_data(input_file, input_node, input_shape, input_ranges,
         input_ranges = [r for r in input_ranges.split(':')]
     else:
         input_ranges = ["-1,1"] * len(input_names)
+    print("The scope of generated data: ", input_ranges)
     if input_data_type:
         input_data_types = [data_type
                             for data_type in input_data_type.split(',')]

diff --git a/tools/python/run_model.py b/tools/python/run_model.py
@@ -22,6 +22,7 @@
 import shutil
 import numpy as np
 
+from copy_apu_so import get_apu_so_paths
 from py_proto import mace_pb2
 from utils import util
 from utils import device
@@ -100,6 +101,8 @@ def run_model_for_device(flags, args, dev, model_name, model_conf):
             runtime = DeviceType.GPU
     else:
         runtime = config_parser.parse_device_type(runtime)
+    mace_check(runtime != DeviceType.APU or target_abi == "arm64-v8a",
+               "APU runtime does only support arm64-v8a")
 
     # install models to devices
     workdir = flags.output + "/" + model_name
@@ -197,7 +200,7 @@ def run_model_for_device(flags, args, dev, model_name, model_conf):
     if model_conf[ModelKeys.runtime] == DeviceType.HEXAGON:
         libs += ["third_party/nnlib/%s/libhexagon_controller.so" % target_abi]
     elif model_conf[ModelKeys.runtime] == DeviceType.APU:
-        apu_libs = dev.get_apu_so_paths()
+        apu_libs = get_apu_so_paths(dev)
         libs += apu_libs
 
     target = Target(build_dir + "/install/bin/mace_run", libs,
@@ -259,6 +262,7 @@ def run_model_for_device(flags, args, dev, model_name, model_conf):
 def generate_input_data(input_file, input_node, input_shape, input_ranges,
                         input_data_type):
     np.random.seed()
+    print("The scope of generated data: ", input_ranges)
     for i in range(len(input_node)):
         data = np.random.random(input_shape[i]) * (
             input_ranges[i][1] - input_ranges[i][0]) + input_ranges[i][0]
@@ -289,7 +293,7 @@ def parse_args():
     parser.add_argument(
         "--target_abi",
         type=str,
-        default="armeabi-v7a",
+        default="arm64-v8a",
         help="Target ABI: host, armeabi-v7a, arm64-v8a,"
              " arm-linux-gnueabihf, aarch64-linux-gnu"
     )

diff --git a/tools/python/transform/apu_converter.py b/tools/python/transform/apu_converter.py
@@ -294,6 +294,13 @@ def convert_ops(self):
             op.type = self._apu_ops.map_nn_op(op.type)
         self.change_activation_to_prelu()
 
+    def get_input_type(self, op, type_map):
+        mace_check(len(op.input) > 0, "op %s has no input" % op.name)
+        for input in op.input:
+            if input in type_map:
+                return type_map[input]
+        mace_check(False, "op %s have no inputs in type_map" % op.name)
+
     def add_op_output_type(self):
         type_map = {}
         for input_info in self._model.input_info:
@@ -310,9 +317,8 @@ def add_op_output_type(self):
                 print([op.name, len(op.output), len(op.output_type)])
                 type_map[op.output[0]] = op.output_type[0]
                 continue
-            mace_check(op.input[0] in type_map,
-                       op.input[0] + ' not in type_map')
-            op.output_type.extend([type_map[op.input[0]]])
+            input_type = self.get_input_type(op, type_map)
+            op.output_type.extend([input_type])
             type_map[op.output[0]] = op.output_type[0]
 
         for op in self._model.op:

diff --git a/tools/python/transform/keras_converter.py b/tools/python/transform/keras_converter.py
@@ -127,19 +127,19 @@ def conv_output_length(input_length,
                        padding,
                        stride,
                        dilation=1):
-        if input_length is None:
-            return None
-
-        mace_check(padding in {'same', 'valid', 'full', 'causal'},
-                   "Not supported padding type: %s" % padding)
-        dilated_filter_size = filter_size + (filter_size - 1) * (dilation - 1)
-        if padding in ['same', 'causal']:
-            output_length = input_length
-        elif padding == 'valid':
-            output_length = input_length - dilated_filter_size + 1
-        elif padding == 'full':
-            output_length = input_length + dilated_filter_size - 1
-        return (output_length + stride - 1) // stride
+    if input_length is None:
+        return None
+
+    mace_check(padding in {'same', 'valid', 'full', 'causal'},
+               "Not supported padding type: %s" % padding)
+    dilated_filter_size = filter_size + (filter_size - 1) * (dilation - 1)
+    if padding in ['same', 'causal']:
+        output_length = input_length
+    elif padding == 'valid':
+        output_length = input_length - dilated_filter_size + 1
+    elif padding == 'full':
+        output_length = input_length + dilated_filter_size - 1
+    return (output_length + stride - 1)  # stride
 
 
 activation_types_dict = {

diff --git a/tools/python/transform/tensorflow_converter.py b/tools/python/transform/tensorflow_converter.py
@@ -604,7 +604,6 @@ def is_commutative(eltwise_type):
                         value_arg = op.arg.add()
                         value_arg.name = MaceKeyword.mace_scalar_input_str
                         value_arg.f = scalar
-                        self._skip_tensor.add(tf_op.inputs[1].name)
                         value_index_arg = op.arg.add()
                         value_index_arg.name = \
                             MaceKeyword.mace_scalar_input_index_str
@@ -938,6 +937,7 @@ def convert_expand_dims(self, tf_op):
         axis_arg = op.arg.add()
         axis_arg.name = MaceKeyword.mace_axis_str
         axis_arg.i = axis_value
+        self._skip_tensor.add(tf_op.inputs[1].name)
         del op.input[1]
 
     def convert_squeeze(self, tf_op):
@@ -1180,6 +1180,7 @@ def convert_cumsum(self, tf_op):
         axis_arg = op.arg.add()
         axis_arg.name = MaceKeyword.mace_axis_str
         axis_arg.i = axis
+        self._skip_tensor.add(tf_op.inputs[1].name)
         del op.input[1]
 
         exclusive = tf_op.get_attr('exclusive')