armnn/latest/_fold_pad_into_layer2d_8hpp_source.html

 //

 // Copyright © 2021-2024 Arm Ltd and Contributors. All rights reserved.

 // SPDX-License-Identifier: MIT

 //


 #pragma once


 #include "Optimization.hpp"


 #include <armnnUtils/QuantizeHelper.hpp>


 #include <armnn/utility/PolymorphicDowncast.hpp>

 #include <armnnUtils/DataLayoutIndexed.hpp>


 namespace armnn

 {

 namespace optimizations

 {

 namespace pad_fold

 {

 inline float GetZeroElement(const TensorInfo& tensorInfo)

 {

     return static_cast<float>(tensorInfo.IsQuantized() ? tensorInfo.GetQuantizationOffset() : 0);

 }


 inline float GetLowestElement(const TensorInfo& tensorInfo)

 {

     constexpr float negativeInfinity = -std::numeric_limits<float>::infinity();

     const float scale = tensorInfo.GetQuantizationScale();

     const int32_t offset = tensorInfo.GetQuantizationOffset();


     switch (tensorInfo.GetDataType())

     {

         case DataType::Float16:

             return armnnUtils::SelectiveQuantize<armnn::Half>(negativeInfinity, scale, offset);

         case DataType::Float32:

             return armnnUtils::SelectiveQuantize<float>(negativeInfinity, scale, offset);

         case DataType::QAsymmU8:

             return armnnUtils::SelectiveQuantize<uint8_t>(negativeInfinity, scale, offset);

         case DataType::QSymmS16:

             return armnnUtils::SelectiveQuantize<int16_t>(negativeInfinity, scale, offset);

         case DataType::QSymmS8:

             // Fall-through

         case DataType::QAsymmS8:

             return armnnUtils::SelectiveQuantize<int8_t>(negativeInfinity, scale, offset);

         case DataType::BFloat16:

             return armnnUtils::SelectiveQuantize<armnn::BFloat16>(negativeInfinity, scale, offset);

         default:

         {

             ARMNN_ASSERT_MSG(false, "Unsupported DataType");

             return NAN;

         }

     }

 }


 inline bool IsNeutralElement(const Convolution2dDescriptor&, const TensorInfo& tensorInfo, const float tensorValue)

 {

     return tensorValue == GetZeroElement(tensorInfo);

 }


 inline bool IsNeutralElement(const DepthwiseConvolution2dDescriptor&,

                              const TensorInfo& tensorInfo,

                              const float tensorValue)

 {

     return tensorValue == GetZeroElement(tensorInfo);

 }


 inline bool IsNeutralElement(

     const Pooling2dDescriptor& descriptor, const TensorInfo& tensorInfo, const float tensorValue)

 {

     return (descriptor.m_PoolType == PoolingAlgorithm::Max)

         ? tensorValue <= GetLowestElement(tensorInfo)

         : tensorValue == GetZeroElement(tensorInfo);

 }


 inline bool IsPooling2dPadded(const Pooling2dDescriptor& poolDescriptor)

 {

     const auto poolingPadValues = std::make_tuple(poolDescriptor.m_PadLeft, poolDescriptor.m_PadRight,

                                                   poolDescriptor.m_PadTop, poolDescriptor.m_PadBottom);

     if (poolingPadValues != std::make_tuple(0U, 0U, 0U, 0U))

     {

         return true;

     }

     return false;

 }


 template <typename Descriptor>

 bool TryFoldPadIntoLayer2d(

     const PadDescriptor& padDescriptor, Descriptor& layerDescriptor, const TensorInfo& tensorInfo)

 {

     armnnUtils::DataLayoutIndexed layout = armnnUtils::DataLayoutIndexed(layerDescriptor.m_DataLayout);

     constexpr unsigned int batchIndex = 0;


     constexpr auto noPad = std::make_pair(0U, 0U);


     if ((!IsNeutralElement(layerDescriptor, tensorInfo, padDescriptor.m_PadValue)) ||

         (padDescriptor.m_PadList[batchIndex] != noPad) || (padDescriptor.m_PadList[layout.GetChannelsIndex()] != noPad))

     {

         return false;

     }


     const auto& padList = padDescriptor.m_PadList;


     // In Convolution2dDescriptor/Pooling2dDescriptor, padLeft and padRight are defined as paddings

     // on width dimension whereas padTop and padBottom - paddings on height dimension, so updating

     // these according to data layout

     layerDescriptor.m_PadLeft += padList[layout.GetWidthIndex()].first;

     layerDescriptor.m_PadRight += padList[layout.GetWidthIndex()].second;

     layerDescriptor.m_PadTop += padList[layout.GetHeightIndex()].first;

     layerDescriptor.m_PadBottom += padList[layout.GetHeightIndex()].second;


     return true;

 }


 inline bool TryFoldPadIntoLayer2d(const PadDescriptor& padDescriptor,

                                   Pooling2dDescriptor& poolDescriptor,

                                   const TensorInfo& tensorInfo,

                                   bool isBackendOptimization = false)

 {

     // Cannot fold Average or L2 pooling if padding exists and the padding method is Exclude.

     if (poolDescriptor.m_PoolType != PoolingAlgorithm::Max &&

         IsPooling2dPadded(poolDescriptor) &&

         poolDescriptor.m_PaddingMethod == PaddingMethod::Exclude)

     {

         return false;

     }


     // Cannot fold Average pooling if data type is quantized and layout is NHWC in Neon backend.

     // Therefore, this specific case will become a backend specific optimization.

     if  (!isBackendOptimization &&

          tensorInfo.IsQuantized() &&

          poolDescriptor.m_PoolType == PoolingAlgorithm::Average &&

          poolDescriptor.m_DataLayout == DataLayout::NHWC)

     {

         return false;

     }


     poolDescriptor.m_PaddingMethod = PaddingMethod::IgnoreValue;


     return TryFoldPadIntoLayer2d<Pooling2dDescriptor>(padDescriptor, poolDescriptor, tensorInfo);

 }


 template <typename Layer2dT>

 Layer2dT* FoldPadIntoLayer2dImpl(Graph& graph, InputSlot& connection)

 {

     PadLayer& padLayer = *PolymorphicDowncast<PadLayer*>(&connection.GetConnectedOutputSlot()->GetOwningLayer());

     Layer2dT& layer2d = *PolymorphicDowncast<Layer2dT*>(&connection.GetOwningLayer());


     const PadDescriptor& padDescriptor = padLayer.GetParameters();

     auto newLayer2dDescriptor = layer2d.GetParameters();


     if (!TryFoldPadIntoLayer2d(padDescriptor, newLayer2dDescriptor, padLayer.GetOutputSlot().GetTensorInfo()))

     {

         return nullptr;

     }


     // Workaround an issue in the compute library. The conv2d algorithm that the

     // compute library is choosing is not handling the 1x1 filter case when

     // the padding size >= filter size

     if (layer2d.GetType() == armnn::LayerType::Convolution2d)

     {

         // Get filter width and height

         armnnUtils::DataLayoutIndexed dataLayoutIndex(newLayer2dDescriptor.m_DataLayout);

         const TensorShape& filterShape = layer2d.GetInputSlot(1).GetTensorInfo().GetShape();

         unsigned int filterWidth       = filterShape[dataLayoutIndex.GetWidthIndex()];

         unsigned int filterHeight      = filterShape[dataLayoutIndex.GetHeightIndex()];

         // Calculate total padding and check conditions

         auto horizontalPadding = newLayer2dDescriptor.m_PadLeft + newLayer2dDescriptor.m_PadRight;

         auto verticalPadding   = newLayer2dDescriptor.m_PadTop  + newLayer2dDescriptor.m_PadBottom;

         if ((filterWidth == 1) && (horizontalPadding >= filterWidth))

         {

             return nullptr;

         }

         else if ((filterHeight == 1) && (verticalPadding >= filterHeight))

         {

             return nullptr;

         }

     }


     // Save original parent output slot of the pad layer

     OutputSlot& parentSlot = *padLayer.GetInputSlot(0).GetConnectedOutputSlot();


     // Insert new layer2d layer between the pad layer and its parent layer.

     const std::string name = std::string("folded-") + padLayer.GetName() + "-into-" + layer2d.GetName();

     auto& newLayer2d = *graph.InsertNewLayer<Layer2dT>(padLayer.GetInputSlot(0), newLayer2dDescriptor, name.c_str());


     newLayer2d.GetOutputSlot().MoveAllConnections(parentSlot);

     // Start at 1 to connect only weights and bias

     for (unsigned int i = 1; i < layer2d.GetNumInputSlots(); ++i)

     {

         if (layer2d.GetInputSlot(i).GetConnectedOutputSlot() != nullptr)

         {

             Layer& tgtLayer = layer2d.GetInputSlot(i).GetConnectedOutputSlot()->GetOwningLayer();

             // Remove old connection and connect to new layer2d

             tgtLayer.GetOutputSlot(0).Disconnect(layer2d.GetInputSlot(i));

             tgtLayer.GetOutputSlot(0).Connect(newLayer2d.GetInputSlot(i));

         }

     }


     // Moves connections in old layer2d layer output to new layer.

     // Old layer2d layer will be removed as it's left unconnected.

     // Pad layer will be removed if left unconnected.

     layer2d.GetOutputSlot().MoveAllConnections(newLayer2d.GetOutputSlot());


     return &newLayer2d;

 }


 class FoldPadIntoConvolution2dImpl

 {

 public:

     void Run(Graph& graph, InputSlot& connection) const

     {

         const auto newConv2dLayer = FoldPadIntoLayer2dImpl<Convolution2dLayer>(graph, connection);


         if (newConv2dLayer != nullptr)

         {

             const auto conv2dLayer = PolymorphicDowncast<Convolution2dLayer*>(&connection.GetOwningLayer());

             ARMNN_ASSERT_MSG(newConv2dLayer->GetInputSlot(1).GetConnection() != nullptr,

                              "FoldPadIntoConvolution2d: New convolution layer is missing connection to weights layer");


             if (conv2dLayer->GetParameters().m_BiasEnabled)

             {

                 ARMNN_ASSERT_MSG(newConv2dLayer->GetInputSlot(2).GetConnection() != nullptr,

                                  "FoldPadIntoConvolution2d: New convolution layer is missing "

                                  "connection to bias layer.");

             }

         }

     }


 protected:

     FoldPadIntoConvolution2dImpl() =  default;

     ~FoldPadIntoConvolution2dImpl() = default;

 };


 class FoldPadIntoDepthwiseConvolution2dImpl

 {

 public:

     void Run(Graph& graph, InputSlot& connection) const

     {

         const auto newConv2dLayer = FoldPadIntoLayer2dImpl<DepthwiseConvolution2dLayer>(graph, connection);


         if (newConv2dLayer != nullptr)

         {

             const auto conv2dLayer = PolymorphicDowncast<DepthwiseConvolution2dLayer*>(&connection.GetOwningLayer());

             ARMNN_ASSERT_MSG(newConv2dLayer->GetInputSlot(1).GetConnection() != nullptr,

                              "FoldPadIntoDepthwiseConvolution2d: New convolution layer is missing "

                              "connection to weights layer");


             if (conv2dLayer->GetParameters().m_BiasEnabled)

             {

                 ARMNN_ASSERT_MSG(newConv2dLayer->GetInputSlot(2).GetConnection() != nullptr,

                                  "FoldPadIntoConvolution2d: New convolution layer is missing "

                                  "connection to bias layer.");

             }

         }

     }

 protected:

     FoldPadIntoDepthwiseConvolution2dImpl() =  default;

     ~FoldPadIntoDepthwiseConvolution2dImpl() = default;

 };


 class FoldPadIntoPooling2dImpl

 {

 public:

     void Run(Graph& graph, InputSlot& connection) const

     {

         FoldPadIntoLayer2dImpl<Pooling2dLayer>(graph, connection);

     }


 protected:

     FoldPadIntoPooling2dImpl() =  default;

     ~FoldPadIntoPooling2dImpl() = default;

 };

 } // namespace pad_fold


 using FoldPadIntoConvolution2d =

     OptimizeForExclusiveConnection<PadLayer, Convolution2dLayer, pad_fold::FoldPadIntoConvolution2dImpl>;

 using FoldPadIntoDepthwiseConvolution2d =

     OptimizeForExclusiveConnection <PadLayer,

                                     DepthwiseConvolution2dLayer,

                                     pad_fold::FoldPadIntoDepthwiseConvolution2dImpl>;

 using FoldPadIntoPooling2d =

     OptimizeForExclusiveConnection<PadLayer, Pooling2dLayer, pad_fold::FoldPadIntoPooling2dImpl>;


 } // namespace optimizations

 } // namespace armnn


ARMNN_ASSERT_MSG
#define ARMNN_ASSERT_MSG(COND, MSG)
Definition: Assert.hpp:15

DataLayoutIndexed.hpp

Optimization.hpp

PolymorphicDowncast.hpp

QuantizeHelper.hpp

armnn::DepthwiseConvolution2dLayer
This layer represents a depthwise convolution 2d operation.
Definition: DepthwiseConvolution2dLayer.hpp:16

armnn::Graph
Definition: Graph.hpp:31

armnn::Graph::InsertNewLayer
LayerT * InsertNewLayer(InputSlot &insertBefore, Args &&... args)
Inserts a new layer between the output slot currently connected to insertBefore and insertBefore itse...
Definition: Graph.hpp:481

armnn::InputSlot
Definition: Layer.hpp:43

armnn::InputSlot::GetOwningLayer
Layer & GetOwningLayer() const
Definition: Layer.hpp:53

armnn::InputSlot::GetConnectedOutputSlot
const OutputSlot * GetConnectedOutputSlot() const
Definition: Layer.hpp:56

armnn::Layer
Definition: Layer.hpp:231

armnn::Layer::GetOutputSlot
const OutputSlot & GetOutputSlot(unsigned int index=0) const override
Get the const output slot handle by slot index.
Definition: Layer.hpp:339

armnn::Layer::GetName
const char * GetName() const override
Returns the name of the layer.
Definition: Layer.hpp:332

armnn::Layer::GetInputSlot
const InputSlot & GetInputSlot(unsigned int index) const override
Get a const input slot handle by slot index.
Definition: Layer.hpp:337

armnn::LayerWithParameters::GetParameters
const Parameters & GetParameters() const override
If the layer has a descriptor return it.
Definition: LayerWithParameters.hpp:19

armnn::OptimizeForExclusiveConnection
Definition: Optimization.hpp:175

armnn::OutputSlot
Definition: Layer.hpp:101

armnn::OutputSlot::GetOwningLayer
Layer & GetOwningLayer() const
Definition: Layer.hpp:132

armnn::OutputSlot::Disconnect
void Disconnect(InputSlot &slot)
Definition: Layer.cpp:131

armnn::OutputSlot::GetTensorInfo
const TensorInfo & GetTensorInfo() const override
Definition: Layer.cpp:100

armnn::OutputSlot::Connect
int Connect(InputSlot &destination)
Definition: Layer.cpp:123

armnn::PadLayer
This layer represents a pad operation.
Definition: PadLayer.hpp:15

armnn::TensorInfo
Definition: Tensor.hpp:153

armnn::TensorInfo::GetQuantizationScale
float GetQuantizationScale() const
Definition: Tensor.cpp:461

armnn::TensorInfo::GetQuantizationOffset
int32_t GetQuantizationOffset() const
Definition: Tensor.cpp:482

armnn::TensorInfo::IsQuantized
bool IsQuantized() const
Definition: Tensor.cpp:508

armnn::TensorInfo::GetDataType
DataType GetDataType() const
Definition: Tensor.hpp:200

armnn::TensorShape
Definition: Tensor.hpp:21

armnn::optimizations::pad_fold::FoldPadIntoConvolution2dImpl
Definition: FoldPadIntoLayer2d.hpp:209

armnn::optimizations::pad_fold::FoldPadIntoConvolution2dImpl::FoldPadIntoConvolution2dImpl
FoldPadIntoConvolution2dImpl()=default

armnn::optimizations::pad_fold::FoldPadIntoConvolution2dImpl::Run
void Run(Graph &graph, InputSlot &connection) const
Definition: FoldPadIntoLayer2d.hpp:211

armnn::optimizations::pad_fold::FoldPadIntoConvolution2dImpl::~FoldPadIntoConvolution2dImpl
~FoldPadIntoConvolution2dImpl()=default

armnn::optimizations::pad_fold::FoldPadIntoDepthwiseConvolution2dImpl
Definition: FoldPadIntoLayer2d.hpp:236

armnn::optimizations::pad_fold::FoldPadIntoDepthwiseConvolution2dImpl::Run
void Run(Graph &graph, InputSlot &connection) const
Definition: FoldPadIntoLayer2d.hpp:238

armnn::optimizations::pad_fold::FoldPadIntoDepthwiseConvolution2dImpl::FoldPadIntoDepthwiseConvolution2dImpl
FoldPadIntoDepthwiseConvolution2dImpl()=default

armnn::optimizations::pad_fold::FoldPadIntoDepthwiseConvolution2dImpl::~FoldPadIntoDepthwiseConvolution2dImpl
~FoldPadIntoDepthwiseConvolution2dImpl()=default

armnn::optimizations::pad_fold::FoldPadIntoPooling2dImpl
Definition: FoldPadIntoLayer2d.hpp:263

armnn::optimizations::pad_fold::FoldPadIntoPooling2dImpl::Run
void Run(Graph &graph, InputSlot &connection) const
Definition: FoldPadIntoLayer2d.hpp:265

armnn::optimizations::pad_fold::FoldPadIntoPooling2dImpl::~FoldPadIntoPooling2dImpl
~FoldPadIntoPooling2dImpl()=default

armnn::optimizations::pad_fold::FoldPadIntoPooling2dImpl::FoldPadIntoPooling2dImpl
FoldPadIntoPooling2dImpl()=default

armnnUtils::DataLayoutIndexed
Provides access to the appropriate indexes for Channels, Height and Width based on DataLayout.
Definition: DataLayoutIndexed.hpp:18

armnnUtils::DataLayoutIndexed::GetWidthIndex
unsigned int GetWidthIndex() const
Definition: DataLayoutIndexed.hpp:25

armnnUtils::DataLayoutIndexed::GetHeightIndex
unsigned int GetHeightIndex() const
Definition: DataLayoutIndexed.hpp:24

armnnUtils::DataLayoutIndexed::GetChannelsIndex
unsigned int GetChannelsIndex() const
Definition: DataLayoutIndexed.hpp:23

armnn::optimizations::pad_fold::FoldPadIntoLayer2dImpl
Layer2dT * FoldPadIntoLayer2dImpl(Graph &graph, InputSlot &connection)
Definition: FoldPadIntoLayer2d.hpp:144

armnn::optimizations::pad_fold::GetLowestElement
float GetLowestElement(const TensorInfo &tensorInfo)
Definition: FoldPadIntoLayer2d.hpp:26

armnn::optimizations::pad_fold::TryFoldPadIntoLayer2d
bool TryFoldPadIntoLayer2d(const PadDescriptor &padDescriptor, Descriptor &layerDescriptor, const TensorInfo &tensorInfo)
Definition: FoldPadIntoLayer2d.hpp:88

armnn::optimizations::pad_fold::GetZeroElement
float GetZeroElement(const TensorInfo &tensorInfo)
Definition: FoldPadIntoLayer2d.hpp:21

armnn::optimizations::pad_fold::IsPooling2dPadded
bool IsPooling2dPadded(const Pooling2dDescriptor &poolDescriptor)
Definition: FoldPadIntoLayer2d.hpp:76

armnn::optimizations::pad_fold::IsNeutralElement
bool IsNeutralElement(const Convolution2dDescriptor &, const TensorInfo &tensorInfo, const float tensorValue)
Definition: FoldPadIntoLayer2d.hpp:56

armnn
Copyright (c) 2021 ARM Limited and Contributors.
Definition: 01_00_quick_start.dox:7

armnn::PaddingMethod::Exclude
@ Exclude
The padding fields don't count and are ignored.

armnn::PaddingMethod::IgnoreValue
@ IgnoreValue
The padding fields count, but are ignored.

armnn::LayerType::Convolution2d
@ Convolution2d

armnn::PoolingAlgorithm::Max
@ Max

armnn::PoolingAlgorithm::Average
@ Average

armnn::DataLayout::NHWC
@ NHWC

armnn::DataType::QSymmS16
@ QSymmS16

armnn::DataType::QAsymmU8
@ QAsymmU8

armnn::DataType::Float32
@ Float32

armnn::DataType::Float16
@ Float16

armnn::DataType::QSymmS8
@ QSymmS8

armnn::DataType::QAsymmS8
@ QAsymmS8

armnn::DataType::BFloat16
@ BFloat16

armnn::Convolution2dDescriptor
A Convolution2dDescriptor for the Convolution2dLayer.
Definition: Descriptors.hpp:535

armnn::DepthwiseConvolution2dDescriptor
A DepthwiseConvolution2dDescriptor for the DepthwiseConvolution2dLayer.
Definition: Descriptors.hpp:660

armnn::PadDescriptor
A PadDescriptor for the PadLayer.
Definition: Descriptors.hpp:1197

armnn::PadDescriptor::m_PadValue
float m_PadValue
Optional value to use for padding, defaults to 0.
Definition: Descriptors.hpp:1221

armnn::PadDescriptor::m_PadList
std::vector< std::pair< unsigned int, unsigned int > > m_PadList
Specifies the padding for input dimension.
Definition: Descriptors.hpp:1218

armnn::Pooling2dDescriptor
A Pooling2dDescriptor for the Pooling2dLayer.
Definition: Descriptors.hpp:372

armnn::Pooling2dDescriptor::m_PadRight
uint32_t m_PadRight
Padding right value in the width dimension.
Definition: Descriptors.hpp:409

armnn::Pooling2dDescriptor::m_PoolType
PoolingAlgorithm m_PoolType
The pooling algorithm to use (Max. Average, L2).
Definition: Descriptors.hpp:405

armnn::Pooling2dDescriptor::m_PadTop
uint32_t m_PadTop
Padding top value in the height dimension.
Definition: Descriptors.hpp:411

armnn::Pooling2dDescriptor::m_DataLayout
DataLayout m_DataLayout
The data layout to be used (NCHW, NHWC).
Definition: Descriptors.hpp:427

armnn::Pooling2dDescriptor::m_PaddingMethod
PaddingMethod m_PaddingMethod
The padding method to be used. (Exclude, IgnoreValue).
Definition: Descriptors.hpp:425

armnn::Pooling2dDescriptor::m_PadBottom
uint32_t m_PadBottom
Padding bottom value in the height dimension.
Definition: Descriptors.hpp:413

armnn::Pooling2dDescriptor::m_PadLeft
uint32_t m_PadLeft
Padding left value in the width dimension.
Definition: Descriptors.hpp:407