armnn/latest/_conv2d_operator_8cpp_source.html

//

// Copyright © 2022-2024 Arm Ltd and Contributors. All rights reserved.

// SPDX-License-Identifier: MIT

//


#include "Conv2dOperator.hpp"

#include "TosaRescaleOperatorUtils.hpp"

#include <ResolveType.hpp>


TosaSerializationBasicBlock* ConvertConv2dToTosaOperator(const Layer* layer,

                                                         const std::vector<const TensorInfo*>& inputs,

                                                         const std::vector<const TensorInfo*>& outputs,

                                                         const Convolution2dDescriptor* conv2dDescriptor)

{

    std::vector<std::string> inputNames;

    std::string outputName = std::string("output0_");

    std::string blockName  = std::string("Op_CONV2D_block_") + GetUniqueTosaMappingID();


    DType inputDType0 = ArmNNToDType(inputs[0]->GetDataType());

    DType outputDType0 = ArmNNToDType(outputs[0]->GetDataType());


    // Set input names for validation purposes only.

    if(layer == nullptr)

    {

        inputNames.emplace_back("input_0");

        inputNames.emplace_back("input_1");

        if(conv2dDescriptor->m_BiasEnabled)

        {

            inputNames.emplace_back("input_2");

        }

    }

    // If a layer is present then the block will be used for execution, so input and output names need to be

    // determined using the previous and following layers so the graph is connected correctly.

    // For validation this doesn't matter.

    else

    {

        // Get the layer connected to the input slot and determine unique tensor names.

        for (uint32_t i = 0; i < inputs.size(); ++i)

        {

            std::string inputName = GenerateUniqueInputName(layer->GetInputSlot(i));

            inputNames.push_back(inputName);

        }


        // Determine unique output tensor name.

        outputName = GenerateUniqueOutputName(*layer);

    }


    std::vector<TosaSerializationTensor*> tensors;

    std::vector<TosaSerializationOperator*> operators;


    // Setup input Tensor

    // Only add tensor if connected layer is an input layer.

    // As intermediate or constant tensors will be created separately.

    // There also can't be duplicate tensors.

    std::vector<int32_t> inputShape0 = GetTosaTensorShape(inputs[0]->GetShape());

    if(inputNames[0].find("input_") != std::string::npos)

    {

        tensors.push_back(new TosaSerializationTensor(inputNames[0], inputShape0, inputDType0, {}));

    }


    // Only add input tensors if weights and bias are not constant or if running validation.

    // Constant tensors will be created in the ConvertConstantToTosaOperator function.

    std::vector<int32_t> inputShape1 = GetTosaTensorShape(inputs[1]->GetShape());

    if(!inputs[1]->IsConstant() || layer == nullptr)

    {

        DType inputDType1 = ArmNNToDType(inputs[1]->GetDataType());

        tensors.push_back(new TosaSerializationTensor(inputNames[1], inputShape1, inputDType1, {}));

    }


    if(conv2dDescriptor->m_BiasEnabled)

    {

        if(!inputs[2]->IsConstant() || layer == nullptr)

        {

            std::vector<int32_t> inputShape2 = GetTosaTensorShape(inputs[2]->GetShape());

            DType inputDType2 = ArmNNToDType(inputs[2]->GetDataType());


            tensors.push_back(new TosaSerializationTensor(inputNames[2], inputShape2, inputDType2, {}));

        }

    }

    else

    {

        // If bias is disabled, create a constant bias of 0 as three inputs are required.

        std::string constantName = std::string("constant_") + GetUniqueTosaMappingID();


        operators.push_back(new TosaSerializationOperator(Op_CONST, Attribute_NONE, nullptr, {}, {constantName}));


        // The size of the bias must match the channels dimension, so get the correct index.

        unsigned int index = (conv2dDescriptor->m_DataLayout == DataLayout::NHWC) ? 3 : 1;


        const DType dType = (inputDType0 == DType_INT8) ? DType_INT32 : outputDType0;

        std::vector<float> data(outputs[0]->GetShape()[index], 0);


        std::vector<uint8_t> uint8Data;

        TosaSerializationHandler::ConvertF32toU8(data, uint8Data);


        tensors.push_back(new TosaSerializationTensor(constantName,

                                                      {static_cast<int32_t>(outputs[0]->GetShape()[index])},

                                                      dType,

                                                      uint8Data));

        inputNames.emplace_back(constantName);

    }


    // Setup Output Tensor

    std::vector<int32_t> outputShape0 = {GetTosaTensorShape(outputs[0]->GetShape())};

    std::string outputConv2dName;

    bool isInputInt8 = (inputDType0 == DType_INT8);

    if (isInputInt8)

    {

        outputConv2dName = std::string("layer_intermediate0_") + GetUniqueTosaMappingID();

        tensors.push_back(new TosaSerializationTensor(outputConv2dName, outputShape0, DType_INT32, {}));

    }

    else

    {

        tensors.push_back(new TosaSerializationTensor(outputName, outputShape0, outputDType0, {}));

    }


    // Set up CONV2D operator

    std::vector<int> pad = {static_cast<int>(conv2dDescriptor->m_PadTop),

                            static_cast<int>(conv2dDescriptor->m_PadBottom),

                            static_cast<int>(conv2dDescriptor->m_PadLeft),

                            static_cast<int>(conv2dDescriptor->m_PadRight)};

    std::vector<int> stride = {static_cast<int>(conv2dDescriptor->m_StrideY),

                               static_cast<int>(conv2dDescriptor->m_StrideX)};

    std::vector<int> dilation = {static_cast<int>(conv2dDescriptor->m_DilationY),

                                 static_cast<int>(conv2dDescriptor->m_DilationX)};


    std::string sliceOutputName = GetInputSlicedToItsUsedSize(inputShape0,

                                                              inputNames[0],

                                                              conv2dDescriptor->m_DataLayout,

                                                              inputDType0,

                                                              inputShape1,

                                                              pad,

                                                              stride,

                                                              dilation,

                                                              tensors,

                                                              operators);


    TosaConvAttribute attribute(pad, stride, dilation,

                                inputs[0]->GetQuantizationOffset(), // input_zp

                                inputs[1]->GetQuantizationOffset(), // weight_zp

                                false); // local_bound


    std::string& convOutStr = isInputInt8 ? outputConv2dName : outputName;

    auto* conv2d_op = new TosaSerializationOperator(Op_CONV2D,

                                                    Attribute_ConvAttribute,

                                                    &attribute,

                                                    {sliceOutputName, inputNames[1], inputNames[2]},

                                                    {convOutStr});

    operators.push_back(conv2d_op);


    if (isInputInt8)

    {

        int32_t output_zp = outputs[0]->GetQuantizationOffset();

        double output_scale = outputs[0]->GetQuantizationScales()[0];

        double input_scale = inputs[0]->GetQuantizationScales()[0];

        const std::vector<float>& weight_scales = inputs[1]->GetQuantizationScales();


        TosaSerializationOperator* rescaleOp = nullptr;

        CreateRescaleTosaOperatorForWeights(outputConv2dName,

                                            outputName,

                                            0,

                                            output_zp,

                                            false,

                                            false,

                                            true,

                                            true,

                                            input_scale,

                                            output_scale,

                                            weight_scales,

                                            &rescaleOp);

        operators.push_back(rescaleOp);

        tensors.push_back(new TosaSerializationTensor(outputName,

                                                      outputShape0,

                                                      DType_INT8,

                                                      {}));

    }


    // operatorInputNames/operatorOutputNames ends up being the same as

    // blockInputNames/blockOutputNames for one-to-one ArmNN to TOSA mappings

    return new TosaSerializationBasicBlock(blockName,     // name

                                           mainName,      // region name

                                           operators,     // operators

                                           tensors,       // tensors

                                           inputNames,    // inputs

                                           {outputName}); // outputs

}


ConvertConv2dToTosaOperator
TosaSerializationBasicBlock * ConvertConv2dToTosaOperator(const Layer *layer, const std::vector< const TensorInfo * > &inputs, const std::vector< const TensorInfo * > &outputs, const Convolution2dDescriptor *conv2dDescriptor)
Definition Conv2dOperator.cpp:10

Conv2dOperator.hpp

ResolveType.hpp

GenerateUniqueOutputName
std::string GenerateUniqueOutputName(const Layer &layer, uint32_t layerSlot=0)
Definition TosaOperatorUtils.hpp:137

mainName
const std::string mainName
Definition TosaOperatorUtils.hpp:23

ArmNNToDType
DType ArmNNToDType(const DataType &type)
Definition TosaOperatorUtils.hpp:26

GenerateUniqueInputName
std::string GenerateUniqueInputName(const armnn::InputSlot &slot)
Definition TosaOperatorUtils.hpp:113

GetInputSlicedToItsUsedSize
std::string GetInputSlicedToItsUsedSize(const std::vector< int32_t > &inputShape, const std::string &inputName, const DataLayout layout, const DType datatype, const std::vector< int32_t > &kernel, const std::vector< int32_t > &pad, const std::vector< int32_t > &stride, const std::vector< int32_t > &dilations, std::vector< TosaSerializationTensor * > &tensors, std::vector< TosaSerializationOperator * > &operators, const bool isPoolingOp=false)
Definition TosaOperatorUtils.hpp:602

GetUniqueTosaMappingID
std::string GetUniqueTosaMappingID()
Definition TosaOperatorUtils.hpp:155

GetTosaTensorShape
std::vector< int32_t > GetTosaTensorShape(const TensorShape &shape)
Definition TosaOperatorUtils.hpp:83

TosaRescaleOperatorUtils.hpp

CreateRescaleTosaOperatorForWeights
void CreateRescaleTosaOperatorForWeights(const std::string &inputName, const std::string &outputName, int32_t input_zp, int32_t output_zp, bool input_unsigned, bool output_unsigned, bool double_round, bool scale32, double input_scale, double output_scale, const std::vector< float > &weight_scales, TosaSerializationOperator **op)
Creates a TOSA rescale operator for weight tensors.
Definition TosaRescaleOperatorUtils.hpp:258

armnn::Layer
Definition Layer.hpp:231

armnn::Layer::GetInputSlot
const InputSlot & GetInputSlot(unsigned int index) const override
Get a const input slot handle by slot index.
Definition Layer.hpp:337

armnn::Convolution2dDescriptor
A Convolution2dDescriptor for the Convolution2dLayer.
Definition Descriptors.hpp:535

armnn::Convolution2dDescriptor::m_PadRight
uint32_t m_PadRight
Padding right value in the width dimension.
Definition Descriptors.hpp:568

armnn::Convolution2dDescriptor::m_DilationY
uint32_t m_DilationY
Dilation along y axis.
Definition Descriptors.hpp:580

armnn::Convolution2dDescriptor::m_PadTop
uint32_t m_PadTop
Padding top value in the height dimension.
Definition Descriptors.hpp:570

armnn::Convolution2dDescriptor::m_DataLayout
DataLayout m_DataLayout
The data layout to be used (NCHW, NHWC).
Definition Descriptors.hpp:584

armnn::Convolution2dDescriptor::m_DilationX
uint32_t m_DilationX
Dilation along x axis.
Definition Descriptors.hpp:578

armnn::Convolution2dDescriptor::m_PadBottom
uint32_t m_PadBottom
Padding bottom value in the height dimension.
Definition Descriptors.hpp:572

armnn::Convolution2dDescriptor::m_PadLeft
uint32_t m_PadLeft
Padding left value in the width dimension.
Definition Descriptors.hpp:566

armnn::Convolution2dDescriptor::m_StrideY
uint32_t m_StrideY
Stride value when proceeding through input for the height dimension.
Definition Descriptors.hpp:576

armnn::Convolution2dDescriptor::m_BiasEnabled
bool m_BiasEnabled
Enable/disable bias.
Definition Descriptors.hpp:582

armnn::Convolution2dDescriptor::m_StrideX
uint32_t m_StrideX
Stride value when proceeding through input for the width dimension.
Definition Descriptors.hpp:574