Add group parameter for deconv API

Limitation: only support depthwise deconvolution Signed-off-by: xiang.zhang <xiang.zhang@verisilicon.com>
2021-05-19 15:41:29 +08:00 · 2021-05-19 15:41:29 +08:00 · b1b7eadefc
parent 8ab7759e3c
commit b1b7eadefc
4 changed files with 107 additions and 16 deletions
--- a/include/tim/vx/ops/deconv.h
+++ b/include/tim/vx/ops/deconv.h
@ -34,23 +34,25 @@ namespace ops {
 class DeConv2d : public Operation {
  public:
-    DeConv2d(Graph* graph, int32_t weights, PadType pad_type,
+    DeConv2d(Graph* graph, int32_t oc_count_, PadType pad_type,
        const std::array<uint32_t, 2>& ksize,
        const std::array<uint32_t, 2>& stride,
        const std::array<uint32_t, 2>& output_padding);
-    DeConv2d(Graph* graph, int32_t weights, PadType pad_type,
+    DeConv2d(Graph* graph, int32_t oc_count_, PadType pad_type,
        const std::array<uint32_t, 2>& ksize,
        const std::array<uint32_t, 2>& stride,
        const std::array<uint32_t, 2>& output_padding,
-        const std::array<uint32_t, 4>& pad);
+        const std::array<uint32_t, 4>& pad,
        const uint32_t group = 1);
  protected:
-    const uint32_t weights_;
+    const uint32_t oc_count_; // output channel count
    const PadType pad_type_;
    const std::array<uint32_t, 2> ksize_;
    const std::array<uint32_t, 2> stride_;
    const std::array<uint32_t, 2> output_padding_;
    const std::array<uint32_t, 4> pad_;
    const uint32_t group_;
 };
 } // namespace ops
--- a/src/tim/CMakeLists.txt
+++ b/src/tim/CMakeLists.txt
@ -30,9 +30,6 @@ if(TIM_VX_ENABLE_LAYOUT_INFER)
    )
 endif()
 set(UT_SRC)
 aux_source_directory(./vx/ut VX_UT_SRC)
 list(APPEND UT_SRC ${VX_UT_SRC})
 foreach(src_file ${SRC})
    if(${src_file} MATCHES ".*_test\.cc")
        list(REMOVE_ITEM SRC ${src_file})
--- a/src/tim/vx/ops/deconv.cc
+++ b/src/tim/vx/ops/deconv.cc
@ -21,9 +21,10 @@
 *    DEALINGS IN THE SOFTWARE.
 *
 *****************************************************************************/
 #include "tim/vx/ops/deconv.h"
 #include <cassert>
 #include "operation_private.h"
 #include "type_utils.h"
 #include "vsi_nn_pub.h"
@ -32,33 +33,38 @@ namespace tim {
 namespace vx {
 namespace ops {
-DeConv2d::DeConv2d(Graph* graph, int32_t weights, PadType pad_type,
+DeConv2d::DeConv2d(Graph* graph, int32_t oc_count, PadType pad_type,
    const std::array<uint32_t, 2>& ksize,
    const std::array<uint32_t, 2>& stride,
    const std::array<uint32_t, 2>& output_padding)
-  : DeConv2d(graph, weights, pad_type, ksize, stride, output_padding,
+  : DeConv2d(graph, oc_count, pad_type, ksize, stride, output_padding,
      {0, 0, 0, 0}) {
 }
-DeConv2d::DeConv2d(Graph* graph, int32_t weights, PadType pad_type,
+DeConv2d::DeConv2d(Graph* graph, int32_t oc_count, PadType pad_type,
    const std::array<uint32_t, 2>& ksize,
    const std::array<uint32_t, 2>& stride,
    const std::array<uint32_t, 2>& output_padding,
-    const std::array<uint32_t, 4>& pad)
+    const std::array<uint32_t, 4>& pad,
    const uint32_t group)
  : Operation(graph, VSI_NN_OP_DECONVOLUTION),
-    weights_(weights),
+    oc_count_(oc_count),
    pad_type_(pad_type),
    ksize_(ksize),
    stride_(stride),
    output_padding_(output_padding),
-    pad_(pad) {
+    pad_(pad),
    group_(group) {
  // TODO(Sven): only support depthwise usage
  assert(group != 1 && group == oc_count);
  this->impl()->node()->nn_param.deconv.ksize[0] = ksize_[0];
  this->impl()->node()->nn_param.deconv.ksize[1] = ksize_[1];
  this->impl()->node()->nn_param.deconv.stride[0] = stride_[0];
  this->impl()->node()->nn_param.deconv.stride[1] = stride_[1];
  this->impl()->node()->nn_param.deconv.pad_type = TranslatePadType(pad_type_);
-  this->impl()->node()->nn_param.deconv.weights = weights_;
+  this->impl()->node()->nn_param.deconv.weights = oc_count_;
-  this->impl()->node()->nn_param.deconv.group = 1;
+  this->impl()->node()->nn_param.deconv.group = group_;
  this->impl()->node()->nn_param.deconv.output_padding[0] = output_padding_[0];
  this->impl()->node()->nn_param.deconv.output_padding[1] = output_padding_[1];
  this->impl()->node()->nn_param.deconv.pad[0] = pad_[0];
--- a/src/tim/vx/ops/deconv2d_test.cc
+++ b/src/tim/vx/ops/deconv2d_test.cc
@ -0,0 +1,86 @@
 #include "tim/vx/context.h"
 #include "tim/vx/graph.h"
 #include "tim/vx/ops/deconv.h"
 #include "gtest/gtest.h"
 namespace {
 size_t element_count(const tim::vx::ShapeType& shape) {
  size_t sz = 1;
  for (auto d : shape) {
    sz *= d;
  }
  return sz;
 }
 }  // namespace
 TEST(OP, deconv_group) {
    auto ctx = tim::vx::Context::Create();
    auto graph = ctx->CreateGraph();
    tim::vx::ShapeType input_shape ({3, 3, 2, 1});  //whcn
    tim::vx::ShapeType kernel_shape({3, 3, 2, 1});  //whc1 same as depthwise convolution
    tim::vx::ShapeType output_shape({5, 5, 2, 1});  //whcn
    tim::vx::TensorSpec input_spec  (tim::vx::DataType::FLOAT32, input_shape, tim::vx::TensorAttribute::INPUT);
    tim::vx::TensorSpec kernel_spec (tim::vx::DataType::FLOAT32, kernel_shape, tim::vx::TensorAttribute::CONSTANT);
    tim::vx::TensorSpec output_spec (tim::vx::DataType::FLOAT32, output_shape, tim::vx::TensorAttribute::OUTPUT);
    auto input_tensor = graph->CreateTensor(input_spec);
    auto output_tensor = graph->CreateTensor(output_spec);
    auto kernel_tensor = graph->CreateTensor(kernel_spec);
    std::vector<float> input_data = {3.0f, 8.0f, 1.0f,
                                     9.0f, 5.0f, 7.0f,
                                     3.0f, 2.0f, 3.0f,
                                     7.0f, 9.0f, 1.0f,
                                     5.0f, 2.0f, 3.0f,
                                     9.0f, 0.0f, 2.0f};
    std::vector<float> kernel_data =
                                    {9.0f, 0.0f, 3.0f,
                                     0.0f, 0.0f, 0.0f,
                                     1.0f, 0.0f, 2.0f,
                                    3.0f, 0.0f, 7.0f,
                                    0.0f, 0.0f, 0.0f,
                                    0.0f, 0.0f, 8.0f,
                                    };
    std::vector<float> output_data(element_count(output_shape));
    EXPECT_TRUE(input_tensor->CopyDataToTensor(input_data.data(), input_data.size()*4));
    EXPECT_TRUE(kernel_tensor->CopyDataToTensor(kernel_data.data(), kernel_data.size()*4));
    auto add = graph->CreateOperation<tim::vx::ops::DeConv2d>(
        2,
        tim::vx::PadType::SAME,
        std::array<uint32_t, 2>({3, 3}),    /*ksize*/
        std::array<uint32_t, 2>({1, 1}),    /*stride*/
        std::array<uint32_t, 2>({1, 1}),    /*dilation*/
        std::array<uint32_t, 4>({0, 0, 0, 0}), /*pad*/
        2/*group*/);
    (*add).BindInputs({input_tensor, kernel_tensor}).BindOutputs({output_tensor});
    EXPECT_TRUE(graph->Compile());
    EXPECT_TRUE(graph->Run());
    EXPECT_TRUE(output_tensor->CopyDataFromTensor(output_data.data()));
    std::vector<float> golden = {
                        27.0f, 72.0f, 18.0f, 24.0f, 3.0f,
                        81.0f, 45.0f, 90.0f, 15.0f, 21.0f,
                        30.0f, 26.0f, 43.0f, 22.0f, 11.0f,
                        9.0f, 5.0f, 25.0f, 10.0f, 14.0f,
                        3.0f, 2.0f, 9.0f, 4.0f, 6.0f,
                        21.0f, 27.0f, 52.0f, 63.0f, 7.0f,
                        15.0f, 6.0f, 44.0f, 14.0f, 21.0f,
                        27.0f, 0.0f, 125.0f, 72.0f, 22.0f,
                        0.0f, 0.0f, 40.0f, 16.0f, 24.0f,
                        0.0f, 0.0f, 72.0f, 0.0f, 16.0f};
    EXPECT_EQ(golden, output_data) << "Result mismatch";
 }