armnn/latest/_create_workload_8hpp_source.html

 //

 // Copyright © 2017,2021-2023 Arm Ltd and Contributors. All rights reserved.

 // SPDX-License-Identifier: MIT

 //

 #pragma once


 #include "TestUtils.hpp"


 #include <Graph.hpp>

 #include <Network.hpp>

 #include <ResolveType.hpp>


 #include <armnnUtils/DataLayoutIndexed.hpp>

 #include <armnn/backends/TensorHandle.hpp>

 #include <armnn/backends/WorkloadData.hpp>

 #include <armnn/backends/WorkloadFactory.hpp>

 #include <armnn/utility/Assert.hpp>

 #include <armnn/utility/IgnoreUnused.hpp>

 #include <armnn/utility/PolymorphicDowncast.hpp>


 #include <doctest/doctest.h>


 #include <utility>


 using namespace armnn;


 namespace

 {


 using namespace std;


 // Calls CreateWorkload for a layer, and checks the returned pointer is of the correct type.

 template<typename Workload>

 std::unique_ptr<Workload> MakeAndCheckWorkload(Layer& layer,

                                                const IWorkloadFactory& factory,

                                                const ModelOptions& modelOptions = {})

 {

     std::unique_ptr<IWorkload> workload = layer.CreateWorkload(factory);

     CHECK_MESSAGE(workload.get() == PolymorphicDowncast<Workload*>(workload.get()),

                "Cannot convert to derived class");

     std::string reasonIfUnsupported;

     layer.SetBackendId(factory.GetBackendId());

     CHECK(factory.IsLayerSupported(layer, layer.GetDataType(), reasonIfUnsupported, modelOptions));

     return std::unique_ptr<Workload>(static_cast<Workload*>(workload.release()));

 }


 // Helper function to create tensor handlers for workloads, assuming they all use the same factory.

 void CreateTensorHandles(armnn::Graph& graph,

                          armnn::IWorkloadFactory& factory)

 {

     TensorHandleFactoryRegistry tmpRegistry;

     for (auto&& layer : graph.TopologicalSort())

     {

         layer->CreateTensorHandles(tmpRegistry, factory);

     }

 }


 /////////////////////////////////////////////////////////////////////////////////////////////

 // The following functions are called by backendsCommon/test/CreateWorkload*.cpp

 // They build very simple graphs, and then create a workload.

 // Some checks are performed on the workload to ensure parameters have been passed correctly.

 // They return the created workloads so that backend-specific checks can be performed.

 /////////////////////////////////////////////////////////////////////////////////////////////


 template <typename ActivationWorkload, armnn::DataType DataType>

 std::unique_ptr<ActivationWorkload> CreateActivationWorkloadTest(armnn::IWorkloadFactory& factory,

                                                                  armnn::Graph&            graph)

 {

     // Creates the layer we're testing.

     ActivationDescriptor layerDesc;

     layerDesc.m_Function = ActivationFunction::ReLu;

     layerDesc.m_A        = 3.5f;

     layerDesc.m_B        = -10.0f;


     ActivationLayer* const layer = graph.AddLayer<ActivationLayer>(layerDesc, "layer");


     // Creates extra layers.

     Layer* const input = graph.AddLayer<InputLayer>(0, "input");

     Layer* const output = graph.AddLayer<OutputLayer>(0, "output");


     // Connects up.

     armnn::TensorInfo tensorInfo({1, 1}, DataType);


     Connect(input, layer, tensorInfo);

     Connect(layer, output, tensorInfo);


     CreateTensorHandles(graph, factory);


     // Makes the workload and checks it.

     auto workload = MakeAndCheckWorkload<ActivationWorkload>(*layer, factory);


     ActivationQueueDescriptor queueDescriptor = workload->GetData();

     CHECK(queueDescriptor.m_Inputs.size() == 1);

     CHECK(queueDescriptor.m_Outputs.size() == 1);

     CHECK(queueDescriptor.m_Parameters.m_A == 3.5f);

     CHECK(queueDescriptor.m_Parameters.m_B == -10.0f);

     CHECK((queueDescriptor.m_Parameters.m_Function == ActivationFunction::ReLu));


     // Returns so we can do extra, backend-specific tests.

     return workload;

 }


 template <typename WorkloadType,

           typename DescriptorType,

           typename LayerType,

           armnn::DataType DataType>

 std::unique_ptr<WorkloadType> CreateElementwiseWorkloadTest(armnn::IWorkloadFactory & factory,

                                                             armnn::Graph & graph)

 {

     // Creates the layer we're testing.

     Layer* const layer = graph.AddLayer<LayerType>("layer");


     // Creates extra layers.

     Layer* const input1 = graph.AddLayer<InputLayer>(1, "input1");

     Layer* const input2 = graph.AddLayer<InputLayer>(2, "input2");

     Layer* const output = graph.AddLayer<OutputLayer>(0, "output");


     // Connects up.

     armnn::TensorInfo tensorInfo({2, 3}, DataType);

     Connect(input1, layer, tensorInfo, 0, 0);

     Connect(input2, layer, tensorInfo, 0, 1);

     Connect(layer, output, tensorInfo);

     CreateTensorHandles(graph, factory);


     // Makes the workload and checks it.

     auto workload = MakeAndCheckWorkload<WorkloadType>(*layer, factory);


     auto queueDescriptor = workload->GetData();

     CHECK(queueDescriptor.m_Inputs.size() == 2);

     CHECK(queueDescriptor.m_Outputs.size() == 1);


     // Returns so we can do extra, backend-specific tests.

     return workload;

 }


 template <typename WorkloadType, armnn::DataType DataType>

 std::unique_ptr<WorkloadType> CreateElementwiseBinaryWorkloadTest(armnn::IWorkloadFactory & factory,

                                                                   armnn::Graph & graph,

                                                                   armnn::BinaryOperation binaryOperation)

 {

     // Creates the layer we're testing.

     ElementwiseBinaryDescriptor descriptor(binaryOperation);

     //ElementwiseBinaryDescriptor descriptor = ElementwiseBinaryDescriptor(binaryOperation);


     Layer* const layer = graph.AddLayer<ElementwiseBinaryLayer>(descriptor, "layer");


     // Creates extra layers.

     Layer* const input1 = graph.AddLayer<InputLayer>(1, "input1");

     Layer* const input2 = graph.AddLayer<InputLayer>(2, "input2");

     Layer* const output = graph.AddLayer<OutputLayer>(0, "output");


     // Connects up.

     armnn::TensorInfo tensorInfo({2, 3}, DataType);

     Connect(input1, layer, tensorInfo, 0, 0);

     Connect(input2, layer, tensorInfo, 0, 1);

     Connect(layer, output, tensorInfo);

     CreateTensorHandles(graph, factory);


     // Makes the workload and checks it.

     auto workload = MakeAndCheckWorkload<WorkloadType>(*layer, factory);


     auto queueDescriptor = workload->GetData();

     CHECK(queueDescriptor.m_Inputs.size() == 2);

     CHECK(queueDescriptor.m_Outputs.size() == 1);


     // Returns so we can do extra, backend-specific tests.

     return workload;

 }


 template<typename WorkloadType,

          typename DescriptorType,

          armnn::DataType DataType>

 std::unique_ptr<WorkloadType> CreateSubtractionWithBlobWorkloadTest(armnn::IWorkloadFactory& factory,

                                                                     armnn::Graph& graph)

 {

     // Creates the layer we're testing.

     SubtractionLayer* const layer = graph.AddLayer<SubtractionLayer>("layer");


     auto activationDesc = std::make_shared<ActivationDescriptor>();

     activationDesc->m_A        = 10.0f;

     activationDesc->m_B        = 5.0f;

     activationDesc->m_Function = armnn::ActivationFunction::BoundedReLu;


     layer->SetAdditionalInfoForObject(activationDesc);


     // Creates extra layers.

     Layer* const input1 = graph.AddLayer<InputLayer>(1, "input1");

     Layer* const input2 = graph.AddLayer<InputLayer>(2, "input2");

     Layer* const output = graph.AddLayer<OutputLayer>(0, "output");


     // Connects up.

     armnn::TensorInfo tensorInfo({2, 3}, DataType);

     Connect(input1, layer, tensorInfo, 0, 0);

     Connect(input2, layer, tensorInfo, 0, 1);

     Connect(layer, output, tensorInfo);

     CreateTensorHandles(graph, factory);


     // Check that the additional information can be queried from the layer

     std::shared_ptr<ActivationDescriptor>

         activationDescPtr = layer->GetAdditionalInformation<ActivationDescriptor>();


     ARMNN_ASSERT(static_cast<float>(activationDescPtr->m_A) == 10.0f);

     ARMNN_ASSERT(static_cast<float>(activationDescPtr->m_B) == 5.0f);

     ARMNN_ASSERT(

         static_cast<ActivationFunction>(activationDescPtr->m_Function) == armnn::ActivationFunction::BoundedReLu

     );


     // Makes the workload and checks it.

     auto workload = MakeAndCheckWorkload<WorkloadType>(*layer, factory);


     DescriptorType queueDescriptor = workload->GetData();


     const ActivationDescriptor* queueDescBlobPtr =

         queueDescriptor.template GetAdditionalInformation<ActivationDescriptor>();

     IgnoreUnused(queueDescBlobPtr);

     ARMNN_ASSERT(static_cast<float>(queueDescBlobPtr->m_A) == 10.0f);

     ARMNN_ASSERT(static_cast<float>(queueDescBlobPtr->m_B) == 5.0f);

     ARMNN_ASSERT(

         static_cast<ActivationFunction>(queueDescBlobPtr->m_Function) == armnn::ActivationFunction::BoundedReLu

     );


     CHECK(queueDescriptor.m_Inputs.size() == 2);

     CHECK(queueDescriptor.m_Outputs.size() == 1);


     return workload;

 }


 template<typename WorkloadType,

          typename DescriptorType,

          armnn::DataType DataType>

 std::unique_ptr<WorkloadType> CreateMultiplicationWithBlobWorkloadTest(armnn::IWorkloadFactory& factory,

                                                                        armnn::Graph& graph)

 {

     // Creates the layer we're testing.

     MultiplicationLayer* const layer = graph.AddLayer<MultiplicationLayer>("layer");


     auto activationDesc = std::make_shared<ActivationDescriptor>();

     activationDesc->m_A        = 10.0f;

     activationDesc->m_B        = 5.0f;

     activationDesc->m_Function = armnn::ActivationFunction::BoundedReLu;


     layer->SetAdditionalInfoForObject(activationDesc);


     // Creates extra layers.

     Layer* const input1 = graph.AddLayer<InputLayer>(1, "input1");

     Layer* const input2 = graph.AddLayer<InputLayer>(2, "input2");

     Layer* const output = graph.AddLayer<OutputLayer>(0, "output");


     // Connects up.

     armnn::TensorInfo tensorInfo({2, 3}, DataType);

     Connect(input1, layer, tensorInfo, 0, 0);

     Connect(input2, layer, tensorInfo, 0, 1);

     Connect(layer, output, tensorInfo);

     CreateTensorHandles(graph, factory);


     // Check that the additional information can be queried from the layer

     std::shared_ptr<ActivationDescriptor>

         activationDescPtr = layer->GetAdditionalInformation<ActivationDescriptor>();


     ARMNN_ASSERT(static_cast<float>(activationDescPtr->m_A) == 10.0f);

     ARMNN_ASSERT(static_cast<float>(activationDescPtr->m_B) == 5.0f);

     ARMNN_ASSERT(

         static_cast<ActivationFunction>(activationDescPtr->m_Function) == armnn::ActivationFunction::BoundedReLu

     );


     // Makes the workload and checks it.

     auto workload = MakeAndCheckWorkload<WorkloadType>(*layer, factory);


     DescriptorType queueDescriptor = workload->GetData();

     CHECK(queueDescriptor.m_Inputs.size() == 2);

     CHECK(queueDescriptor.m_Outputs.size() == 1);

     const ActivationDescriptor* queueDescBlobPtr =

         queueDescriptor.template GetAdditionalInformation<ActivationDescriptor>();

     IgnoreUnused(queueDescBlobPtr);

     ARMNN_ASSERT(static_cast<float>(queueDescBlobPtr->m_A) == 10.0f);

     ARMNN_ASSERT(static_cast<float>(queueDescBlobPtr->m_B) == 5.0f);

     ARMNN_ASSERT(

         static_cast<ActivationFunction>(queueDescBlobPtr->m_Function) == armnn::ActivationFunction::BoundedReLu

     );


     return workload;// Returns so we can do extra, backend-specific tests.

 }


 template<typename WorkloadType,

          typename DescriptorType,

          armnn::DataType DataType>

 std::unique_ptr<WorkloadType> CreateAdditionWithBlobWorkloadTest(armnn::IWorkloadFactory& factory,

                                                                  armnn::Graph& graph)

 {

     // Creates the layer we're testing.

     AdditionLayer* const layer = graph.AddLayer<AdditionLayer>("layer");


     auto activationDesc = std::make_shared<ActivationDescriptor>();

     activationDesc->m_A        = 10.0f;

     activationDesc->m_B        = 5.0f;

     activationDesc->m_Function = armnn::ActivationFunction::BoundedReLu;


     layer->SetAdditionalInfoForObject(activationDesc);


     // Creates extra layers.

     Layer* const input1 = graph.AddLayer<InputLayer>(1, "input1");

     Layer* const input2 = graph.AddLayer<InputLayer>(2, "input2");

     Layer* const output = graph.AddLayer<OutputLayer>(0, "output");


     // Connects up.

     armnn::TensorInfo tensorInfo({2, 3}, DataType);

     Connect(input1, layer, tensorInfo, 0, 0);

     Connect(input2, layer, tensorInfo, 0, 1);

     Connect(layer, output, tensorInfo);

     CreateTensorHandles(graph, factory);


     // Check that the additional information can be queried from the layer

     std::shared_ptr<ActivationDescriptor>

         activationDescPtr = layer->template GetAdditionalInformation<ActivationDescriptor>();


     ARMNN_ASSERT(static_cast<float>(activationDescPtr->m_A) == 10.0f);

     ARMNN_ASSERT(static_cast<float>(activationDescPtr->m_B) == 5.0f);

     ARMNN_ASSERT(

         static_cast<ActivationFunction>(activationDescPtr->m_Function) == armnn::ActivationFunction::BoundedReLu

     );


     // Makes the workload and checks it.

     auto workload = MakeAndCheckWorkload<WorkloadType>(*layer, factory);


     DescriptorType queueDescriptor = workload->GetData();

     const ActivationDescriptor* queueDescBlobPtr =

         queueDescriptor.template GetAdditionalInformation<ActivationDescriptor>();

     IgnoreUnused(queueDescBlobPtr);

     CHECK(queueDescriptor.m_Inputs.size() == 2);

     CHECK(queueDescriptor.m_Outputs.size() == 1);

     ARMNN_ASSERT(static_cast<float>(queueDescBlobPtr->m_A) == 10.0f);

     ARMNN_ASSERT(static_cast<float>(queueDescBlobPtr->m_B) == 5.0f);

     ARMNN_ASSERT(

         static_cast<ActivationFunction>(queueDescBlobPtr->m_Function) == armnn::ActivationFunction::BoundedReLu

     );


     return workload;

 }


 template <typename WorkloadType,

           typename DescriptorType,

           armnn::DataType DataType>

 std::unique_ptr<WorkloadType> CreateElementwiseUnaryWorkloadTest(armnn::IWorkloadFactory & factory,

                                                                  armnn::Graph & graph,

                                                                  armnn::UnaryOperation op)

 {

     ElementwiseUnaryDescriptor desc = ElementwiseUnaryDescriptor(op);

     Layer* const layer = graph.AddLayer<armnn::ElementwiseUnaryLayer>(desc, "layer");


     Layer* const input  = graph.AddLayer<InputLayer>(0, "input");

     Layer* const output = graph.AddLayer<OutputLayer>(0, "output");


     armnn::TensorInfo tensorInfo({ 2, 3 }, DataType);

     Connect(input, layer, tensorInfo, 0, 0);

     Connect(layer, output, tensorInfo, 0, 0);

     CreateTensorHandles(graph, factory);


     auto workload = MakeAndCheckWorkload<WorkloadType>(*layer, factory);

     DescriptorType queueDescriptor = workload->GetData();


     CHECK(queueDescriptor.m_Inputs.size()  == 1);

     CHECK(queueDescriptor.m_Outputs.size() == 1);


     return workload;

 }


 template <typename BatchNormalizationWorkloadType, armnn::DataType DataType>

 std::unique_ptr<BatchNormalizationWorkloadType> CreateBatchNormalizationWorkloadTest(

     armnn::IWorkloadFactory& factory, armnn::Graph& graph, DataLayout dataLayout = DataLayout::NCHW)

 {

     TensorShape tensorShape;

     switch (dataLayout)

     {

         case DataLayout::NHWC:

             tensorShape = { 2, 4, 4, 3 };

             break;

         case DataLayout::NCHW:

         default:

             tensorShape = { 2, 3, 4, 4 };

     }


     // Creates the layer we're testing.

     BatchNormalizationDescriptor layerDesc;

     layerDesc.m_Eps = 0.05f;

     layerDesc.m_DataLayout = dataLayout;


     BatchNormalizationLayer* const layer = graph.AddLayer<BatchNormalizationLayer>(layerDesc, "layer");


     armnn::TensorInfo weightInfo({3}, DataType);

     layer->m_Mean     = std::make_unique<ScopedTensorHandle>(weightInfo);

     layer->m_Variance = std::make_unique<ScopedTensorHandle>(weightInfo);

     layer->m_Beta     = std::make_unique<ScopedTensorHandle>(weightInfo);

     layer->m_Gamma    = std::make_unique<ScopedTensorHandle>(weightInfo);

     layer->m_Mean->Allocate();

     layer->m_Variance->Allocate();

     layer->m_Beta->Allocate();

     layer->m_Gamma->Allocate();


     // Creates extra layers.

     Layer* const input = graph.AddLayer<InputLayer>(0, "input");

     Layer* const output = graph.AddLayer<OutputLayer>(0, "output");


     // Connects up.

     armnn::TensorInfo tensorInfo(tensorShape, DataType);

     Connect(input, layer, tensorInfo);

     Connect(layer, output, tensorInfo);

     CreateTensorHandles(graph, factory);


     // Makes the workload and checks it.

     auto workload = MakeAndCheckWorkload<BatchNormalizationWorkloadType>(*layer, factory);

     BatchNormalizationQueueDescriptor queueDescriptor = workload->GetData();

     CHECK(queueDescriptor.m_Parameters.m_Eps == 0.05f);

     CHECK(queueDescriptor.m_Inputs.size() == 1);

     CHECK(queueDescriptor.m_Outputs.size() == 1);

     CHECK((queueDescriptor.m_Mean->GetTensorInfo() == TensorInfo({3}, DataType)));

     CHECK((queueDescriptor.m_Variance->GetTensorInfo() == TensorInfo({3}, DataType)));

     CHECK((queueDescriptor.m_Gamma->GetTensorInfo() == TensorInfo({3}, DataType)));

     CHECK((queueDescriptor.m_Beta->GetTensorInfo() == TensorInfo({3}, DataType)));

     CHECK((queueDescriptor.m_Parameters.m_DataLayout == dataLayout));


     // Returns so we can do extra, backend-specific tests.

     return workload;

 }


 template <typename BatchNormalizationWorkloadType, armnn::DataType DataType>

 std::unique_ptr<BatchNormalizationWorkloadType> CreateBatchNormalizationWithBlobWorkloadTest(

     armnn::IWorkloadFactory& factory, armnn::Graph& graph, DataLayout dataLayout = DataLayout::NCHW)

 {

     TensorShape tensorShape;

     switch (dataLayout)

     {

         case DataLayout::NHWC:

             tensorShape = { 2, 4, 4, 3 };

             break;

         case DataLayout::NCHW:

         default:

             tensorShape = { 2, 3, 4, 4 };

     }


     // Creates the layer we're testing.

     BatchNormalizationDescriptor layerDesc;

     layerDesc.m_Eps = 0.05f;

     layerDesc.m_DataLayout = dataLayout;


     BatchNormalizationLayer* const layer = graph.AddLayer<BatchNormalizationLayer>(layerDesc, "layer");


     armnn::TensorInfo weightInfo({3}, DataType);

     layer->m_Mean     = std::make_unique<ScopedTensorHandle>(weightInfo);

     layer->m_Variance = std::make_unique<ScopedTensorHandle>(weightInfo);

     layer->m_Beta     = std::make_unique<ScopedTensorHandle>(weightInfo);

     layer->m_Gamma    = std::make_unique<ScopedTensorHandle>(weightInfo);

     layer->m_Mean->Allocate();

     layer->m_Variance->Allocate();

     layer->m_Beta->Allocate();

     layer->m_Gamma->Allocate();


     auto activationDesc = std::make_shared<ActivationDescriptor>();

     activationDesc->m_A        = 10.0f;

     activationDesc->m_B        = 5.0f;

     activationDesc->m_Function = armnn::ActivationFunction::BoundedReLu;


     layer->SetAdditionalInfoForObject(activationDesc);


     // Check that the additional information can be queried from the layer

     std::shared_ptr<ActivationDescriptor> activationDescPtr = layer->GetAdditionalInformation<ActivationDescriptor>();

     ARMNN_ASSERT(static_cast<float>(activationDescPtr->m_A) == 10.0f);

     ARMNN_ASSERT(static_cast<float>(activationDescPtr->m_B) == 5.0f);

     ARMNN_ASSERT(

         static_cast<ActivationFunction>(activationDescPtr->m_Function) == armnn::ActivationFunction::BoundedReLu

     );


     // Creates extra layers.

     Layer* const input = graph.AddLayer<InputLayer>(0, "input");

     Layer* const output = graph.AddLayer<OutputLayer>(0, "output");


     // Connects up.

     armnn::TensorInfo tensorInfo(tensorShape, DataType);

     Connect(input, layer, tensorInfo);

     Connect(layer, output, tensorInfo);

     CreateTensorHandles(graph, factory);


     // Makes the workload and checks it.

     auto workload = MakeAndCheckWorkload<BatchNormalizationWorkloadType>(*layer, factory);

     BatchNormalizationQueueDescriptor queueDescriptor = workload->GetData();

     const ActivationDescriptor* queueDescBlobPtr = queueDescriptor.GetAdditionalInformation<ActivationDescriptor>();

     IgnoreUnused(queueDescBlobPtr);

     ARMNN_ASSERT(static_cast<float>(queueDescBlobPtr->m_A) == 10.0f);

     ARMNN_ASSERT(static_cast<float>(queueDescBlobPtr->m_B) == 5.0f);

     ARMNN_ASSERT(

         static_cast<ActivationFunction>(queueDescBlobPtr->m_Function) == armnn::ActivationFunction::BoundedReLu

     );


     CHECK(queueDescriptor.m_Parameters.m_Eps == 0.05f);

     CHECK(queueDescriptor.m_Inputs.size() == 1);

     CHECK(queueDescriptor.m_Outputs.size() == 1);

     CHECK((queueDescriptor.m_Mean->GetTensorInfo() == TensorInfo({3}, DataType)));

     CHECK((queueDescriptor.m_Variance->GetTensorInfo() == TensorInfo({3}, DataType)));

     CHECK((queueDescriptor.m_Gamma->GetTensorInfo() == TensorInfo({3}, DataType)));

     CHECK((queueDescriptor.m_Beta->GetTensorInfo() == TensorInfo({3}, DataType)));

     CHECK((queueDescriptor.m_Parameters.m_DataLayout == dataLayout));


     // Returns so we can do extra, backend-specific tests.

     return workload;

 }


 template <typename Convolution2dWorkload, armnn::DataType DataType>

 std::unique_ptr<Convolution2dWorkload> CreateConvolution2dWorkloadTest(armnn::IWorkloadFactory& factory,

                                                                        armnn::Graph&            graph,

                                                                        DataLayout dataLayout = DataLayout::NCHW,

                                                                        const ModelOptions& modelOptions = {})

 {

     // Creates the layer we're testing.

     Convolution2dDescriptor layerDesc;

     layerDesc.m_PadLeft = 3;

     layerDesc.m_PadRight = 3;

     layerDesc.m_PadTop = 1;

     layerDesc.m_PadBottom = 1;

     layerDesc.m_StrideX = 2;

     layerDesc.m_StrideY = 4;

     layerDesc.m_BiasEnabled = false;

     layerDesc.m_DataLayout = dataLayout;


     float inputsQScale = 1.0f;

     float outputQScale = DataType == armnn::DataType::QAsymmU8 ? 2.0f : 1.0;


     Convolution2dLayer* const layer = graph.AddLayer<Convolution2dLayer>(layerDesc, "layer");


     TensorShape weightShape = (dataLayout == DataLayout::NCHW) ? TensorShape{2, 3, 5, 3} : TensorShape{2, 5, 3, 3};

     TensorShape inputShape  = (dataLayout == DataLayout::NCHW) ? TensorShape{2, 3, 8, 16} : TensorShape{2, 8, 16, 3};

     TensorShape outputShape = (dataLayout == DataLayout::NCHW) ? TensorShape{2, 2, 2, 10} : TensorShape{2, 2, 10, 2};


     armnn::TensorInfo weightsTensorInfo(weightShape, DataType, inputsQScale);

     weightsTensorInfo.SetConstant();


     // Creates extra layers.

     Layer* const input = graph.AddLayer<InputLayer>(0, "input");

     auto const weights = graph.AddLayer<ConstantLayer>("weights");

     Layer* const output = graph.AddLayer<OutputLayer>(0, "output");


     weights->m_LayerOutput = std::make_unique<ScopedTensorHandle>(weightsTensorInfo);

     weights->m_LayerOutput->Allocate();


     // Connects up.

     Connect(input, layer, TensorInfo(inputShape, DataType, inputsQScale));

     Connect(weights, layer, weightsTensorInfo, 0, 1);

     Connect(layer, output, TensorInfo(outputShape, DataType, outputQScale));

     CreateTensorHandles(graph, factory);


     // Makes the workload and checks it.

     auto workload = MakeAndCheckWorkload<Convolution2dWorkload>(*layer, factory, modelOptions);


     Convolution2dQueueDescriptor queueDescriptor = workload->GetData();

     CHECK(queueDescriptor.m_Parameters.m_StrideX == 2);

     CHECK(queueDescriptor.m_Parameters.m_StrideY == 4);

     CHECK(queueDescriptor.m_Parameters.m_PadLeft == 3);

     CHECK(queueDescriptor.m_Parameters.m_PadRight == 3);

     CHECK(queueDescriptor.m_Parameters.m_PadTop == 1);

     CHECK(queueDescriptor.m_Parameters.m_PadBottom == 1);

     CHECK(!queueDescriptor.m_Parameters.m_BiasEnabled);

     CHECK((queueDescriptor.m_Parameters.m_DataLayout == dataLayout));


     CHECK(queueDescriptor.m_Inputs.size() == 2);

     CHECK(queueDescriptor.m_Outputs.size() == 1);


     // Returns so we can do extra, backend-specific tests.

     return workload;

 }


 template<typename Convolution2dWorkload, armnn::DataType DataType>

 std::unique_ptr<Convolution2dWorkload> CreateConvolution2dFusedActivationWithBlobWorkloadTest(

     armnn::IWorkloadFactory& factory,

     armnn::Graph& graph,

     DataLayout dataLayout = DataLayout::NCHW,

     const ModelOptions& modelOptions = {})

 {

     // Creates the layer we're testing.

     Convolution2dDescriptor layerDesc;

     layerDesc.m_PadLeft = 3;

     layerDesc.m_PadRight = 3;

     layerDesc.m_PadTop = 1;

     layerDesc.m_PadBottom = 1;

     layerDesc.m_StrideX = 2;

     layerDesc.m_StrideY = 4;

     layerDesc.m_BiasEnabled = true;

     layerDesc.m_DataLayout = dataLayout;


     float inputsQScale = 1.0f;

     float outputQScale = DataType == armnn::DataType::QAsymmU8 ? 2.0f : 1.0;


     Convolution2dLayer* const layer = graph.AddLayer<Convolution2dLayer>(layerDesc, "layer");


     TensorShape weightShape = (dataLayout == DataLayout::NCHW) ? TensorShape{2, 3, 5, 3} : TensorShape{2, 5, 3, 3};

     TensorShape inputShape  = (dataLayout == DataLayout::NCHW) ? TensorShape{2, 3, 8, 16} : TensorShape{2, 8, 16, 3};

     TensorShape outputShape = (dataLayout == DataLayout::NCHW) ? TensorShape{2, 2, 2, 10} : TensorShape{2, 2, 10, 2};


     armnn::TensorInfo weightsTensorInfo(weightShape, DataType, inputsQScale);

     weightsTensorInfo.SetConstant();

     armnn::TensorInfo biasTensorInfo({2}, DataType, inputsQScale);

     biasTensorInfo.SetConstant();


     auto activationDesc = std::make_shared<ActivationDescriptor>();

     activationDesc->m_A        = 10.0f;

     activationDesc->m_B        = 5.0f;

     activationDesc->m_Function = armnn::ActivationFunction::BoundedReLu;


     layer->SetAdditionalInfoForObject(activationDesc);


     // Check that the additional information can be queried from the layer

     std::shared_ptr<ActivationDescriptor> activationDescPtr = layer->GetAdditionalInformation<ActivationDescriptor>();


     ARMNN_ASSERT(static_cast<float>(activationDescPtr->m_A) == 10.0f);

     ARMNN_ASSERT(static_cast<float>(activationDescPtr->m_B) == 5.0f);

     ARMNN_ASSERT(

         static_cast<ActivationFunction>(activationDescPtr->m_Function) == armnn::ActivationFunction::BoundedReLu

     );


     // Creates extra layers.

     Layer* const input = graph.AddLayer<InputLayer>(0, "input");

     auto const weights = graph.AddLayer<ConstantLayer>("weights");

     auto const bias = graph.AddLayer<ConstantLayer>("bias");

     Layer* const output = graph.AddLayer<OutputLayer>(0, "output");


     weights->m_LayerOutput = std::make_unique<ScopedTensorHandle>(weightsTensorInfo);

     weights->m_LayerOutput->Allocate();

     bias->m_LayerOutput = std::make_unique<ScopedTensorHandle>(biasTensorInfo);

     bias->m_LayerOutput->Allocate();


     // Connects up.

     Connect(input, layer, TensorInfo(inputShape, DataType, inputsQScale));

     Connect(weights, layer, weightsTensorInfo, 0, 1);

     Connect(bias, layer, biasTensorInfo, 0, 2);

     Connect(layer, output, TensorInfo(outputShape, DataType, outputQScale));

     CreateTensorHandles(graph, factory);


     // Makes the workload and checks it.

     auto workload = MakeAndCheckWorkload<Convolution2dWorkload>(*layer, factory, modelOptions);


     Convolution2dQueueDescriptor queueDescriptor = workload->GetData();

     const ActivationDescriptor* queueDescBlobPtr = queueDescriptor.GetAdditionalInformation<ActivationDescriptor>();

     IgnoreUnused(queueDescBlobPtr);

     ARMNN_ASSERT(static_cast<float>(queueDescBlobPtr->m_A) == 10.0f);

     ARMNN_ASSERT(static_cast<float>(queueDescBlobPtr->m_B) == 5.0f);

     ARMNN_ASSERT(

         static_cast<ActivationFunction>(queueDescBlobPtr->m_Function) == armnn::ActivationFunction::BoundedReLu

     );


     CHECK(queueDescriptor.m_Parameters.m_StrideX == 2);

     CHECK(queueDescriptor.m_Parameters.m_StrideY == 4);

     CHECK(queueDescriptor.m_Parameters.m_PadLeft == 3);

     CHECK(queueDescriptor.m_Parameters.m_PadRight == 3);

     CHECK(queueDescriptor.m_Parameters.m_PadTop == 1);

     CHECK(queueDescriptor.m_Parameters.m_PadBottom == 1);

     CHECK(queueDescriptor.m_Parameters.m_BiasEnabled);

     CHECK((queueDescriptor.m_Parameters.m_DataLayout == dataLayout));


     CHECK(queueDescriptor.m_Outputs.size() == 1);

     CHECK(queueDescriptor.m_Inputs.size() == 3);


     // Returns so we can do extra, backend-specific tests.

     return workload;

 }


 template <typename Convolution2dWorkload, armnn::DataType DataType>

 std::unique_ptr<Convolution2dWorkload> CreateConvolution2dWorkloadFastMathTest(armnn::IWorkloadFactory& factory,

                                                                                armnn::Graph&            graph,

                                                                                DataLayout dataLayout = DataLayout::NCHW,

                                                                                const ModelOptions& modelOptions = {})

 {

     // Creates the layer we're testing.

     Convolution2dDescriptor layerDesc;

     layerDesc.m_PadLeft = 0;

     layerDesc.m_PadRight = 0;

     layerDesc.m_PadTop = 0;

     layerDesc.m_PadBottom = 0;

     layerDesc.m_StrideX = 1;

     layerDesc.m_StrideY = 1;

     layerDesc.m_BiasEnabled = true;

     layerDesc.m_DataLayout = dataLayout;


     float inputsQScale = 1.0f;

     float outputQScale = DataType == armnn::DataType::QAsymmU8 ? 2.0f : 1.0;


     Convolution2dLayer* const layer = graph.AddLayer<Convolution2dLayer>(layerDesc, "layer");


     TensorShape weightShape = TensorShape{ 32, 32, 3, 3 };

     TensorShape biasShape = TensorShape{ 32 };

     TensorShape inputShape = TensorShape{ 1, 32, 149, 149 };

     TensorShape outputShape = TensorShape{ 1, 32, 147, 147 };


     armnn::TensorInfo weightsTensorInfo(weightShape, DataType, inputsQScale);

     weightsTensorInfo.SetConstant();

     armnn::TensorInfo biasTensorInfo(biasShape, DataType, inputsQScale);

     biasTensorInfo.SetConstant();


     // Creates extra layers.

     Layer* const input = graph.AddLayer<InputLayer>(0, "input");

     auto const weights = graph.AddLayer<ConstantLayer>("weights");

     auto const bias = graph.AddLayer<ConstantLayer>("bias");

     Layer* const output = graph.AddLayer<OutputLayer>(0, "output");


     // Connects up.

     Connect(input, layer, TensorInfo(inputShape, DataType));

     Connect(weights, layer, weightsTensorInfo, 0, 1);

     Connect(bias, layer, biasTensorInfo, 0, 2);

     Connect(layer, output, TensorInfo(outputShape, DataType, outputQScale));

     CreateTensorHandles(graph, factory);


     // Makes the workload and checks it.

     auto workload = MakeAndCheckWorkload<Convolution2dWorkload>(*layer, factory, modelOptions);


     Convolution2dQueueDescriptor queueDescriptor = workload->GetData();

     CHECK(queueDescriptor.m_Parameters.m_StrideX == 1);

     CHECK(queueDescriptor.m_Parameters.m_StrideY == 1);

     CHECK(queueDescriptor.m_Parameters.m_PadLeft == 0);

     CHECK(queueDescriptor.m_Parameters.m_PadRight == 0);

     CHECK(queueDescriptor.m_Parameters.m_PadTop == 0);

     CHECK(queueDescriptor.m_Parameters.m_PadBottom == 0);

     CHECK((queueDescriptor.m_Parameters.m_DataLayout == dataLayout));


     CHECK(queueDescriptor.m_Inputs.size() == 3);

     CHECK(queueDescriptor.m_Outputs.size() == 1);


     // Returns so we can do extra, backend-specific tests.

     return workload;

 }


 template <typename LstmWorkload>

 std::unique_ptr<LstmWorkload> CreateLstmWorkloadTest(armnn::IWorkloadFactory& factory, armnn::Graph& graph)

 {

     // This parameter setting is for withCifgWithPeepholeNoProjection

     LstmDescriptor layerDesc;

     layerDesc.m_ActivationFunc = 4;

     layerDesc.m_ClippingThresCell = 0.0f;

     layerDesc.m_ClippingThresProj = 0.0f;

     layerDesc.m_CifgEnabled = true;

     layerDesc.m_PeepholeEnabled = true;

     layerDesc.m_ProjectionEnabled = false;


     LstmLayer* const layer = graph.AddLayer<LstmLayer>(layerDesc, "layer");

     unsigned int batchSize = 2;

     unsigned int inputSize = 2;

     unsigned int numUnits = 4;

     unsigned int outputSize = 4;


     layer->m_BasicParameters.m_InputToForgetWeights = std::make_unique<ScopedTensorHandle>

             (TensorInfo({ numUnits, inputSize }, DataType::Float32));

     layer->m_BasicParameters.m_InputToCellWeights = std::make_unique<ScopedTensorHandle>

             (TensorInfo({ numUnits, inputSize }, DataType::Float32));

     layer->m_BasicParameters.m_InputToOutputWeights = std::make_unique<ScopedTensorHandle>

             (TensorInfo({ numUnits, inputSize }, DataType::Float32));

     layer->m_BasicParameters.m_RecurrentToForgetWeights = std::make_unique<ScopedTensorHandle>

             (TensorInfo({ numUnits, outputSize }, DataType::Float32));

     layer->m_BasicParameters.m_RecurrentToCellWeights = std::make_unique<ScopedTensorHandle>

             (TensorInfo({ numUnits, outputSize }, DataType::Float32));

     layer->m_BasicParameters.m_RecurrentToOutputWeights = std::make_unique<ScopedTensorHandle>

             (TensorInfo({ numUnits, outputSize }, DataType::Float32));

     layer->m_BasicParameters.m_ForgetGateBias = std::make_unique<ScopedTensorHandle>

             (TensorInfo({ numUnits }, DataType::Float32));

     layer->m_BasicParameters.m_CellBias = std::make_unique<ScopedTensorHandle>

             (TensorInfo({ numUnits }, DataType::Float32));

     layer->m_BasicParameters.m_OutputGateBias = std::make_unique<ScopedTensorHandle>

             (TensorInfo({ numUnits }, DataType::Float32));


     layer->m_BasicParameters.m_InputToForgetWeights->Allocate();

     layer->m_BasicParameters.m_InputToCellWeights->Allocate();

     layer->m_BasicParameters.m_InputToOutputWeights->Allocate();

     layer->m_BasicParameters.m_RecurrentToForgetWeights->Allocate();

     layer->m_BasicParameters.m_RecurrentToCellWeights->Allocate();

     layer->m_BasicParameters.m_RecurrentToOutputWeights->Allocate();

     layer->m_BasicParameters.m_ForgetGateBias->Allocate();

     layer->m_BasicParameters.m_CellBias->Allocate();

     layer->m_BasicParameters.m_OutputGateBias->Allocate();


     if (layerDesc.m_PeepholeEnabled)

     {

         layer->m_PeepholeParameters.m_CellToForgetWeights = std::make_unique<ScopedTensorHandle>

                 (TensorInfo({ numUnits }, DataType::Float32));

         layer->m_PeepholeParameters.m_CellToOutputWeights = std::make_unique<ScopedTensorHandle>

                 (TensorInfo({ numUnits }, DataType::Float32));

         layer->m_PeepholeParameters.m_CellToForgetWeights->Allocate();

         layer->m_PeepholeParameters.m_CellToOutputWeights->Allocate();

     }


     // create input and output layers

     Layer* const input = graph.AddLayer<InputLayer>(0, "input");

     Layer* const outputStateIn = graph.AddLayer<InputLayer>(1, "outputStateIn");

     Layer* const cellStateIn = graph.AddLayer<InputLayer>(2, "cellStateIn");

     Layer* const scratchBuffer = graph.AddLayer<OutputLayer>(0, "scratchBuffer");

     Layer* const outputStateOut = graph.AddLayer<OutputLayer>(1, "outputStateOut");

     Layer* const cellStateOut = graph.AddLayer<OutputLayer>(2, "cellStateOut");

     Layer* const output = graph.AddLayer<OutputLayer>(3, "output");


     // connect up

     armnn::TensorInfo lstmTensorInfo1({ batchSize, inputSize }, DataType::Float32);

     armnn::TensorInfo lstmTensorInfo2({ batchSize, numUnits}, DataType::Float32);

     armnn::TensorInfo lstmTensorInfo3({ batchSize, outputSize }, DataType::Float32);

     armnn::TensorInfo lstmTensorInfoScratchBuff({ batchSize, numUnits * (layerDesc.m_CifgEnabled ? 3 : 4) },

                                                 DataType::Float32);

     Connect(input, layer, lstmTensorInfo1, 0, 0);

     Connect(cellStateIn, layer, lstmTensorInfo2, 0, 1);

     Connect(outputStateIn, layer, lstmTensorInfo3, 0, 2);

     Connect(layer, scratchBuffer, lstmTensorInfoScratchBuff, 0, 0);

     Connect(layer, outputStateOut, lstmTensorInfo3, 1, 0);

     Connect(layer, cellStateOut, lstmTensorInfo2, 2, 0);

     Connect(layer, output, lstmTensorInfo3, 3, 0);


     CreateTensorHandles(graph, factory);


     // make the workload and check it

     auto workload = MakeAndCheckWorkload<LstmWorkload>(*layer, factory);

     LstmQueueDescriptor queueDescriptor = workload->GetData();

     CHECK(queueDescriptor.m_Parameters.m_ActivationFunc == 4);

     CHECK(queueDescriptor.m_Parameters.m_ClippingThresCell == 0.0f);

     CHECK(queueDescriptor.m_Parameters.m_ClippingThresProj == 0.0f);

     CHECK(queueDescriptor.m_Inputs.size() == 3);

     CHECK(queueDescriptor.m_Outputs.size() == 4);


     CHECK((queueDescriptor.m_InputToForgetWeights->GetTensorInfo() == TensorInfo({ numUnits, inputSize },

                                                                                      DataType::Float32)));

     CHECK((queueDescriptor.m_OutputGateBias->GetTensorInfo() == TensorInfo({ numUnits },

                                                                                      DataType::Float32)));

     CHECK((queueDescriptor.m_CellBias->GetTensorInfo() == TensorInfo({ numUnits }, DataType::Float32)));

     return workload;

 }


 template <typename QuantizedLstmWorkload>

 std::unique_ptr<QuantizedLstmWorkload> CreateQuantizedLstmWorkloadTest(armnn::IWorkloadFactory& factory,

                                                                        armnn::Graph& graph)

 {

     auto layer = graph.AddLayer<QuantizedLstmLayer>("quantizedLstmlayer");

     unsigned int numBatches = 2;

     unsigned int inputSize = 2;

     unsigned int outputSize = 4;


     // Scale/Offset for input/output, cellState In/Out, weights, bias

     float inputOutputScale = 0.0078125f;

     int32_t inputOutputOffset = 128;


     float cellStateScale = 0.00048828125f;

     int32_t cellStateOffset = 0;


     float weightsScale = 0.00408021f;

     int32_t weightsOffset = 100;


     float biasScale = 3.1876640625e-05f;

     int32_t biasOffset = 0;


     // Weights and bias tensor and quantization info

     armnn::TensorInfo inputWeightsInfo({outputSize, inputSize},

                                        armnn::DataType::QAsymmU8,

                                        weightsScale,

                                        weightsOffset);


     armnn::TensorInfo recurrentWeightsInfo({outputSize, outputSize},

                                            armnn::DataType::QAsymmU8,

                                            weightsScale,

                                            weightsOffset);


     armnn::TensorInfo biasInfo({outputSize},

                                armnn::DataType::Signed32,

                                biasScale,

                                biasOffset);


     // Weights and bias

     layer->m_QuantizedLstmParameters.m_InputToInputWeights =

             std::make_unique<ScopedTensorHandle>(inputWeightsInfo);

     layer->m_QuantizedLstmParameters.m_InputToForgetWeights =

             std::make_unique<ScopedTensorHandle>(inputWeightsInfo);

     layer->m_QuantizedLstmParameters.m_InputToCellWeights =

             std::make_unique<ScopedTensorHandle>(inputWeightsInfo);

     layer->m_QuantizedLstmParameters.m_InputToOutputWeights =

             std::make_unique<ScopedTensorHandle>(inputWeightsInfo);


     layer->m_QuantizedLstmParameters.m_RecurrentToInputWeights =

             std::make_unique<ScopedTensorHandle>(recurrentWeightsInfo);

     layer->m_QuantizedLstmParameters.m_RecurrentToForgetWeights =

             std::make_unique<ScopedTensorHandle>(recurrentWeightsInfo);

     layer->m_QuantizedLstmParameters.m_RecurrentToCellWeights =

             std::make_unique<ScopedTensorHandle>(recurrentWeightsInfo);

     layer->m_QuantizedLstmParameters.m_RecurrentToOutputWeights =

             std::make_unique<ScopedTensorHandle>(recurrentWeightsInfo);


     layer->m_QuantizedLstmParameters.m_InputGateBias = std::make_unique<ScopedTensorHandle>(biasInfo);

     layer->m_QuantizedLstmParameters.m_ForgetGateBias = std::make_unique<ScopedTensorHandle>(biasInfo);

     layer->m_QuantizedLstmParameters.m_CellBias = std::make_unique<ScopedTensorHandle>(biasInfo);

     layer->m_QuantizedLstmParameters.m_OutputGateBias = std::make_unique<ScopedTensorHandle>(biasInfo);


     // Allocate weights and bias

     layer->m_QuantizedLstmParameters.m_InputToInputWeights->Allocate();

     layer->m_QuantizedLstmParameters.m_InputToForgetWeights->Allocate();

     layer->m_QuantizedLstmParameters.m_InputToCellWeights->Allocate();

     layer->m_QuantizedLstmParameters.m_InputToOutputWeights->Allocate();


     layer->m_QuantizedLstmParameters.m_RecurrentToInputWeights->Allocate();

     layer->m_QuantizedLstmParameters.m_RecurrentToForgetWeights->Allocate();

     layer->m_QuantizedLstmParameters.m_RecurrentToCellWeights->Allocate();

     layer->m_QuantizedLstmParameters.m_RecurrentToOutputWeights->Allocate();


     layer->m_QuantizedLstmParameters.m_InputGateBias->Allocate();

     layer->m_QuantizedLstmParameters.m_ForgetGateBias->Allocate();

     layer->m_QuantizedLstmParameters.m_CellBias->Allocate();

     layer->m_QuantizedLstmParameters.m_OutputGateBias->Allocate();


     // Create input and output layers

     Layer* const input = graph.AddLayer<InputLayer>(0, "input");

     Layer* const cellStateIn = graph.AddLayer<InputLayer>(1, "cellStateIn");

     Layer* const outputStateIn = graph.AddLayer<InputLayer>(2, "outputStateIn");


     Layer* const cellStateOut = graph.AddLayer<OutputLayer>(0, "cellStateOut");

     Layer* const outputStateOut = graph.AddLayer<OutputLayer>(1, "outputStateOut");


     // Input/output tensor info and quantization info

     armnn::TensorInfo inputInfo({numBatches , inputSize},

                                 armnn::DataType::QAsymmU8,

                                 inputOutputScale,

                                 inputOutputOffset);


     armnn::TensorInfo cellStateInfo({numBatches , outputSize},

                                     armnn::DataType::QSymmS16,

                                     cellStateScale,

                                     cellStateOffset);


     armnn::TensorInfo outputStateInfo({numBatches , outputSize},

                                       armnn::DataType::QAsymmU8,

                                       inputOutputScale,

                                       inputOutputOffset);


     // Connect input/output slots

     Connect(input, layer, inputInfo, 0, 0);

     Connect(cellStateIn, layer, cellStateInfo, 0, 1);

     Connect(outputStateIn, layer, outputStateInfo, 0, 2);


     Connect(layer, cellStateOut, cellStateInfo, 0, 0);

     Connect(layer, outputStateOut, outputStateInfo, 1, 0);


     CreateTensorHandles(graph, factory);


     // Create workload and check layer support

     auto workload = MakeAndCheckWorkload<QuantizedLstmWorkload>(*layer, factory);

     QuantizedLstmQueueDescriptor queueDescriptor = workload->GetData();


     // Validate input/output sizes

     CHECK(queueDescriptor.m_Inputs.size() == 3);

     CHECK(queueDescriptor.m_Outputs.size() == 2);


     // Validate weight tensor info

     CHECK((queueDescriptor.m_InputToInputWeights->GetTensorInfo() == inputWeightsInfo));

     CHECK((queueDescriptor.m_InputToForgetWeights->GetTensorInfo() == inputWeightsInfo));

     CHECK((queueDescriptor.m_InputToCellWeights->GetTensorInfo() == inputWeightsInfo));

     CHECK((queueDescriptor.m_InputToOutputWeights->GetTensorInfo() == inputWeightsInfo));


     CHECK((queueDescriptor.m_RecurrentToInputWeights->GetTensorInfo() == recurrentWeightsInfo));

     CHECK((queueDescriptor.m_RecurrentToForgetWeights->GetTensorInfo() == recurrentWeightsInfo));

     CHECK((queueDescriptor.m_RecurrentToCellWeights->GetTensorInfo() == recurrentWeightsInfo));

     CHECK((queueDescriptor.m_RecurrentToOutputWeights->GetTensorInfo() == recurrentWeightsInfo));


     CHECK((queueDescriptor.m_InputGateBias->GetTensorInfo() == biasInfo));

     CHECK((queueDescriptor.m_ForgetGateBias->GetTensorInfo() == biasInfo));

     CHECK((queueDescriptor.m_CellBias->GetTensorInfo() == biasInfo));

     CHECK((queueDescriptor.m_OutputGateBias->GetTensorInfo() == biasInfo));


     return workload;

 }


 template <typename QLstmWorkload>

 std::unique_ptr<QLstmWorkload> CreateQLstmWorkloadTest(armnn::IWorkloadFactory& factory,

                                                        armnn::Graph& graph)

 {

     QLstmDescriptor layerDesc;

     layerDesc.m_CifgEnabled       = true;

     layerDesc.m_PeepholeEnabled   = false;

     layerDesc.m_ProjectionEnabled = false;

     layerDesc.m_LayerNormEnabled  = true;


     layerDesc.m_CellClip       = 0.0f;

     layerDesc.m_ProjectionClip = 0.0f;


     layerDesc.m_HiddenStateZeroPoint = 0;

     layerDesc.m_HiddenStateScale     = 0.007f;


     layerDesc.m_InputIntermediateScale  = 0.007059f;

     layerDesc.m_ForgetIntermediateScale = 0.007812f;

     layerDesc.m_CellIntermediateScale   = 0.007059f;

     layerDesc.m_OutputIntermediateScale = 0.007812f;


     QLstmLayer* const layer = graph.AddLayer<QLstmLayer>(layerDesc, "qLstm");


     unsigned int numBatches = 2;

     unsigned int inputSize  = 4;

     unsigned int numUnits   = 4;

     unsigned int outputSize = 4;


     // Scale/Offset quantization info

     float inputScale    = 0.0078125f;

     int32_t inputOffset = 0;


     // if (!projectionEnabled) outputScale == hiddenStateScale

     float outputScale    = layerDesc.m_HiddenStateScale;

     int32_t outputOffset = layerDesc.m_HiddenStateZeroPoint;


     float cellStateScale    = 3.05176e-05f;

     int32_t cellStateOffset = 0;


     float weightsScale    = 0.00784314f;

     int32_t weightsOffset = 0;


     float layerNormScale    = 3.05182e-05f;

     int32_t layerNormOffset = 0;


     float biasScale    = layerNormScale / 1024;

     int32_t biasOffset = 0;


     // Weights and bias tensor and quantization info

     armnn::TensorInfo inputWeightsInfo({outputSize, inputSize},

                                        armnn::DataType::QSymmS8,

                                        weightsScale,

                                        weightsOffset);


     armnn::TensorInfo recurrentWeightsInfo({outputSize, outputSize},

                                            armnn::DataType::QSymmS8,

                                            weightsScale,

                                            weightsOffset);


     armnn::TensorInfo biasInfo({outputSize}, armnn::DataType::Signed32, biasScale, biasOffset);


     armnn::TensorInfo layerNormWeightsInfo({numUnits}, armnn::DataType::QSymmS16, layerNormScale, layerNormOffset);


     // Create and allocate tensors

     layer->m_BasicParameters.m_InputToForgetWeights = std::make_unique<ScopedTensorHandle>(inputWeightsInfo);

     layer->m_BasicParameters.m_InputToCellWeights = std::make_unique<ScopedTensorHandle>(inputWeightsInfo);

     layer->m_BasicParameters.m_InputToOutputWeights = std::make_unique<ScopedTensorHandle>(inputWeightsInfo);


     layer->m_BasicParameters.m_RecurrentToForgetWeights =

             std::make_unique<ScopedTensorHandle>(recurrentWeightsInfo);

     layer->m_BasicParameters.m_RecurrentToCellWeights =

             std::make_unique<ScopedTensorHandle>(recurrentWeightsInfo);

     layer->m_BasicParameters.m_RecurrentToOutputWeights =

             std::make_unique<ScopedTensorHandle>(recurrentWeightsInfo);


     layer->m_BasicParameters.m_ForgetGateBias = std::make_unique<ScopedTensorHandle>(biasInfo);

     layer->m_BasicParameters.m_CellBias = std::make_unique<ScopedTensorHandle>(biasInfo);

     layer->m_BasicParameters.m_OutputGateBias = std::make_unique<ScopedTensorHandle>(biasInfo);


     layer->m_LayerNormParameters.m_ForgetLayerNormWeights =

             std::make_unique<ScopedTensorHandle>(layerNormWeightsInfo);

     layer->m_LayerNormParameters.m_CellLayerNormWeights =

             std::make_unique<ScopedTensorHandle>(layerNormWeightsInfo);

     layer->m_LayerNormParameters.m_OutputLayerNormWeights =

             std::make_unique<ScopedTensorHandle>(layerNormWeightsInfo);


     layer->m_BasicParameters.m_InputToForgetWeights->Allocate();

     layer->m_BasicParameters.m_InputToCellWeights->Allocate();

     layer->m_BasicParameters.m_InputToOutputWeights->Allocate();


     layer->m_BasicParameters.m_RecurrentToForgetWeights->Allocate();

     layer->m_BasicParameters.m_RecurrentToCellWeights->Allocate();

     layer->m_BasicParameters.m_RecurrentToOutputWeights->Allocate();


     layer->m_BasicParameters.m_ForgetGateBias->Allocate();

     layer->m_BasicParameters.m_CellBias->Allocate();

     layer->m_BasicParameters.m_OutputGateBias->Allocate();


     layer->m_LayerNormParameters.m_ForgetLayerNormWeights->Allocate();

     layer->m_LayerNormParameters.m_CellLayerNormWeights->Allocate();

     layer->m_LayerNormParameters.m_OutputLayerNormWeights->Allocate();


     // Input and output layers

     Layer* const input = graph.AddLayer<InputLayer>(0, "input");

     Layer* const outputStateIn = graph.AddLayer<InputLayer>(1, "outputStateIn");

     Layer* const cellStateIn = graph.AddLayer<InputLayer>(2, "cellStateIn");


     Layer* const outputStateOut = graph.AddLayer<OutputLayer>(0, "outputStateOut");

     Layer* const cellStateOut = graph.AddLayer<OutputLayer>(1, "cellStateOut");

     Layer* const output = graph.AddLayer<OutputLayer>(2, "output");


     // Input/Output tensor info

     armnn::TensorInfo inputInfo({numBatches , inputSize},

                                 armnn::DataType::QAsymmS8,

                                 inputScale,

                                 inputOffset);


     armnn::TensorInfo cellStateInfo({numBatches , numUnits},

                                     armnn::DataType::QSymmS16,

                                     cellStateScale,

                                     cellStateOffset);


     armnn::TensorInfo outputStateInfo({numBatches , outputSize},

                                       armnn::DataType::QAsymmS8,

                                       outputScale,

                                       outputOffset);


     // Connect layers to slots

     Connect(input, layer, inputInfo, 0, 0);

     Connect(outputStateIn, layer, outputStateInfo, 0, 1);

     Connect(cellStateIn, layer, cellStateInfo, 0, 2);


     Connect(layer, outputStateOut, outputStateInfo, 0, 0);

     Connect(layer, cellStateOut, cellStateInfo, 1, 0);

     Connect(layer, output, outputStateInfo, 2, 0);


     CreateTensorHandles(graph, factory);


     // Create and check workload

     auto workload = MakeAndCheckWorkload<QLstmWorkload>(*layer, factory);

     QLstmQueueDescriptor queueDescriptor = workload->GetData();

     CHECK(queueDescriptor.m_Parameters.m_CellClip == 0.0f);

     CHECK(queueDescriptor.m_Parameters.m_ProjectionClip == 0.0f);

     CHECK(queueDescriptor.m_Inputs.size() == 3);

     CHECK(queueDescriptor.m_Outputs.size() == 3);


     CHECK((queueDescriptor.m_InputToForgetWeights->GetTensorInfo() == inputWeightsInfo));

     CHECK((queueDescriptor.m_InputToCellWeights->GetTensorInfo() == inputWeightsInfo));

     CHECK((queueDescriptor.m_InputToOutputWeights->GetTensorInfo() == inputWeightsInfo));


     CHECK((queueDescriptor.m_RecurrentToForgetWeights->GetTensorInfo() == recurrentWeightsInfo));

     CHECK((queueDescriptor.m_RecurrentToCellWeights->GetTensorInfo() == recurrentWeightsInfo));

     CHECK((queueDescriptor.m_RecurrentToOutputWeights->GetTensorInfo() == recurrentWeightsInfo));


     CHECK((queueDescriptor.m_ForgetGateBias->GetTensorInfo() == biasInfo));

     CHECK((queueDescriptor.m_CellBias->GetTensorInfo() == biasInfo));

     CHECK((queueDescriptor.m_OutputGateBias->GetTensorInfo() == biasInfo));


     return workload;

 }


 template<typename Convolution2dWorkload, armnn::DataType DataType>

 std::unique_ptr<Convolution2dWorkload> CreateDirectConvolution2dWorkloadTest(armnn::IWorkloadFactory& factory,

                                                                              armnn::Graph& graph)

 {

     // Creates the layer we're testing.

     Convolution2dDescriptor layerDesc;

     layerDesc.m_PadLeft = 1;

     layerDesc.m_PadRight = 1;

     layerDesc.m_PadTop = 1;

     layerDesc.m_PadBottom = 1;

     layerDesc.m_StrideX = 1;

     layerDesc.m_StrideY = 1;

     layerDesc.m_BiasEnabled = true;


     Convolution2dLayer* const layer = graph.AddLayer<Convolution2dLayer>(layerDesc, "layer");


     float inputsQScale = 1.0f;

     float outputQScale = DataType == armnn::DataType::QAsymmU8 ? 2.0f : 1.0;


     TensorShape biasShape = TensorShape{ 2 };

     TensorShape weightShape = TensorShape{ 2, 3, 3, 3 };

     armnn::TensorInfo weightsTensorInfo(weightShape, DataType, inputsQScale);

     weightsTensorInfo.SetConstant();

     armnn::TensorInfo biasTensorInfo(biasShape, GetBiasDataType(DataType), inputsQScale);

     biasTensorInfo.SetConstant();


     // Creates extra layers.

     Layer* const input = graph.AddLayer<InputLayer>(0, "input");

     auto const weights = graph.AddLayer<ConstantLayer>("weights");

     auto const bias = graph.AddLayer<ConstantLayer>("bias");

     Layer* const output = graph.AddLayer<OutputLayer>(0, "output");


     weights->m_LayerOutput = std::make_unique<ScopedTensorHandle>(weightsTensorInfo);

     weights->m_LayerOutput->Allocate();

     bias->m_LayerOutput = std::make_unique<ScopedTensorHandle>(biasTensorInfo);

     bias->m_LayerOutput->Allocate();


     // Connects up.

     Connect(input, layer, TensorInfo({2, 3, 6, 6}, DataType, inputsQScale));

     Connect(weights, layer, weightsTensorInfo, 0, 1);

     Connect(bias, layer, biasTensorInfo, 0, 2);

     Connect(layer, output, TensorInfo({2, 2, 6, 6}, DataType, outputQScale));

     CreateTensorHandles(graph, factory);


     // Makes the workload and checks it.

     auto workload = MakeAndCheckWorkload<Convolution2dWorkload>(*layer, factory);


     Convolution2dQueueDescriptor queueDescriptor = workload->GetData();

     CHECK(queueDescriptor.m_Parameters.m_StrideX == 1);

     CHECK(queueDescriptor.m_Parameters.m_StrideY == 1);

     CHECK(queueDescriptor.m_Parameters.m_PadLeft == 1);

     CHECK(queueDescriptor.m_Parameters.m_PadRight == 1);

     CHECK(queueDescriptor.m_Parameters.m_PadTop == 1);

     CHECK(queueDescriptor.m_Parameters.m_PadBottom == 1);

     CHECK(queueDescriptor.m_Parameters.m_BiasEnabled == true);


     CHECK(queueDescriptor.m_Inputs.size() == 3);

     CHECK(queueDescriptor.m_Outputs.size() == 1);


     // Returns so we can do extra, backend-specific tests.

     return workload;

 }


 template <typename DepthwiseConvolution2dFloat32Workload, armnn::DataType DataType>

 std::unique_ptr<DepthwiseConvolution2dFloat32Workload> CreateDepthwiseConvolution2dWorkloadTest(

     armnn::IWorkloadFactory& factory, armnn::Graph& graph, DataLayout dataLayout = DataLayout::NCHW)

 {

     // Creates the layer we're testing.

     DepthwiseConvolution2dDescriptor layerDesc;

     layerDesc.m_PadLeft     = 1;

     layerDesc.m_PadRight    = 2;

     layerDesc.m_PadTop      = 1;

     layerDesc.m_PadBottom   = 2;

     layerDesc.m_StrideX     = 1;

     layerDesc.m_StrideY     = 1;

     layerDesc.m_BiasEnabled = false;

     layerDesc.m_DataLayout  = dataLayout;


     float inputsQScale = 1.0f;

     float outputQScale = DataType == armnn::DataType::QAsymmU8 ? 2.0f : 1.0;


     TensorShape weightShape({1, 4, 4, 2});

     TensorShape inputShape = (dataLayout == DataLayout::NCHW) ?

                              TensorShape{ 2, 2, 5, 5 } : TensorShape{ 2, 5, 5, 2 };

     TensorShape outputShape = (dataLayout == DataLayout::NCHW) ?

                               TensorShape{ 2, 2, 5, 5 } : TensorShape{ 2, 5, 5, 2 };


     DepthwiseConvolution2dLayer* const layer = graph.AddLayer<DepthwiseConvolution2dLayer>(layerDesc, "layer");


     // Creates extra layers.

     Layer* const input = graph.AddLayer<InputLayer>(0, "input");

     Layer* const weights = graph.AddLayer<ConstantLayer>("weights");

     Layer* const output = graph.AddLayer<OutputLayer>(0, "output");


     // Connects up.

     Connect(input, layer, TensorInfo(inputShape, DataType, inputsQScale));

     Connect(weights, layer, TensorInfo(weightShape, DataType, inputsQScale, 0.0f, true), 0, 1);

     Connect(layer, output, TensorInfo(outputShape, DataType, outputQScale));

     CreateTensorHandles(graph, factory);


     // Makes the workload and checks it.

     auto workload = MakeAndCheckWorkload<DepthwiseConvolution2dFloat32Workload>(*layer, factory);


     DepthwiseConvolution2dQueueDescriptor queueDescriptor = workload->GetData();

     CHECK(queueDescriptor.m_Parameters.m_StrideX == 1);

     CHECK(queueDescriptor.m_Parameters.m_StrideY == 1);

     CHECK(queueDescriptor.m_Parameters.m_PadLeft == 1);

     CHECK(queueDescriptor.m_Parameters.m_PadRight == 2);

     CHECK(queueDescriptor.m_Parameters.m_PadTop == 1);

     CHECK(queueDescriptor.m_Parameters.m_PadBottom == 2);

     CHECK(queueDescriptor.m_Parameters.m_BiasEnabled == false);

     CHECK((queueDescriptor.m_Parameters.m_DataLayout == dataLayout));


     CHECK(queueDescriptor.m_Inputs.size() == 2);

     CHECK(queueDescriptor.m_Outputs.size() == 1);


     // Returns so we can do extra, backend-specific tests.

     return workload;

 }


 template <typename FullyConnectedWorkload, armnn::DataType DataType>

 std::unique_ptr<FullyConnectedWorkload> CreateFullyConnectedWorkloadTest(armnn::IWorkloadFactory& factory,

                                                                          armnn::Graph&            graph)

 {

     // Creates the layer we're testing.

     FullyConnectedDescriptor layerDesc;

     layerDesc.m_BiasEnabled = false;

     layerDesc.m_TransposeWeightMatrix = true;


     FullyConnectedLayer* const layer = graph.AddLayer<FullyConnectedLayer>(layerDesc, "layer");


     float inputsQScale = 1.0f;

     float outputQScale = DataType == armnn::DataType::QAsymmU8 ? 2.0f : 1.0;


     armnn::TensorInfo weightsTensorInfo({7, 20}, DataType, inputsQScale);

     weightsTensorInfo.SetConstant();


     // Creates extra layers.

     Layer* const input = graph.AddLayer<InputLayer>(0, "input");

     auto const weights = graph.AddLayer<ConstantLayer>("weights");

     Layer* const output = graph.AddLayer<OutputLayer>(0, "output");


     weights->m_LayerOutput = std::make_unique<ScopedTensorHandle>(weightsTensorInfo);

     weights->m_LayerOutput->Allocate();


     // Connects up.

     Connect(input, layer, TensorInfo({3, 1, 4, 5}, DataType, inputsQScale), 0, 0);

     Connect(weights, layer, weightsTensorInfo, 0, 1);

     Connect(layer, output, TensorInfo({3, 7}, DataType, outputQScale));

     CreateTensorHandles(graph, factory);


     // Makes the workload and checks it.

     auto workload = MakeAndCheckWorkload<FullyConnectedWorkload>(*layer, factory);


     FullyConnectedQueueDescriptor queueDescriptor = workload->GetData();

     CHECK(queueDescriptor.m_Parameters.m_TransposeWeightMatrix == true);


     CHECK(queueDescriptor.m_Inputs.size() == 2);

     CHECK(queueDescriptor.m_Outputs.size() == 1);


     // Returns so we can do extra, backend-specific tests.

     return workload;

 }


 template <typename FullyConnectedWorkload, armnn::DataType DataType>

 std::unique_ptr<FullyConnectedWorkload> CreateFullyConnectedWithBlobWorkloadTest

     (armnn::IWorkloadFactory& factory,

      armnn::Graph& graph)

 {

     // Creates the layer we're testing.

     FullyConnectedDescriptor layerDesc;

     layerDesc.m_BiasEnabled = true;

     layerDesc.m_TransposeWeightMatrix = true;


     FullyConnectedLayer* const layer = graph.AddLayer<FullyConnectedLayer>(layerDesc, "layer");


     float inputsQScale = 1.0f;

     float outputQScale = DataType == armnn::DataType::QAsymmU8 ? 2.0f : 1.0;


     armnn::TensorInfo weightsTensorInfo({7, 20}, DataType, inputsQScale);

     armnn::TensorInfo biasesTensorInfo({7}, GetBiasDataType(DataType), inputsQScale);

     weightsTensorInfo.SetConstant();

     biasesTensorInfo.SetConstant();


     auto activationDesc = std::make_shared<ActivationDescriptor>();

     activationDesc->m_A        = 10.0f;

     activationDesc->m_B        = 5.0f;

     activationDesc->m_Function = armnn::ActivationFunction::BoundedReLu;


     layer->SetAdditionalInfoForObject(activationDesc);


     // Check that the additional information can be queried from the layer

     std::shared_ptr<ActivationDescriptor> activationDescPtr = layer->GetAdditionalInformation<ActivationDescriptor>();

     ARMNN_ASSERT(static_cast<float>(activationDescPtr->m_A) == 10.0f);

     ARMNN_ASSERT(static_cast<float>(activationDescPtr->m_B) == 5.0f);

     ARMNN_ASSERT(static_cast<ActivationFunction>(activationDescPtr->m_Function) ==

         armnn::ActivationFunction::BoundedReLu);


     // Creates extra layers.

     Layer* const input = graph.AddLayer<InputLayer>(0, "input");

     auto const weights = graph.AddLayer<ConstantLayer>("weights");

     auto const biases = graph.AddLayer<ConstantLayer>("biases");

     Layer* const output = graph.AddLayer<OutputLayer>(0, "output");


     weights->m_LayerOutput = std::make_unique<ScopedTensorHandle>(weightsTensorInfo);

     weights->m_LayerOutput->Allocate();

     biases->m_LayerOutput = std::make_unique<ScopedTensorHandle>(biasesTensorInfo);

     biases->m_LayerOutput->Allocate();


     // Connects up.

     Connect(input, layer, TensorInfo({3, 1, 4, 5}, DataType, inputsQScale), 0, 0);

     Connect(weights, layer, weightsTensorInfo, 0, 1);

     Connect(biases, layer, biasesTensorInfo, 0, 2);

     Connect(layer, output, TensorInfo({3, 7}, DataType, outputQScale));

     CreateTensorHandles(graph, factory);


     // Makes the workload and checks it.

     auto workload = MakeAndCheckWorkload<FullyConnectedWorkload>(*layer, factory);


     FullyConnectedQueueDescriptor queueDescriptor = workload->GetData();


     const ActivationDescriptor* queueDescBlobPtr = queueDescriptor.GetAdditionalInformation<ActivationDescriptor>();

     IgnoreUnused(queueDescBlobPtr);


     ARMNN_ASSERT(static_cast<float>(queueDescBlobPtr->m_A) == 10.0f);

     ARMNN_ASSERT(static_cast<float>(queueDescBlobPtr->m_B) == 5.0f);

     ARMNN_ASSERT(

         static_cast<ActivationFunction>(queueDescBlobPtr->m_Function) == armnn::ActivationFunction::BoundedReLu

     );


     CHECK(queueDescriptor.m_Parameters.m_BiasEnabled == true);

     CHECK(queueDescriptor.m_Parameters.m_TransposeWeightMatrix == true);

     CHECK(queueDescriptor.m_Inputs.size() == 3);

     CHECK(queueDescriptor.m_Outputs.size() == 1);


     // Returns so we can do extra, backend-specific tests.

     return workload;

 }


 template <typename FullyConnectedWorkload, armnn::DataType DataType>

 std::unique_ptr<FullyConnectedWorkload> CreateFullyConnectedWorkloadWeightsBiasesAsInputsTest

     (armnn::IWorkloadFactory& factory,

      armnn::Graph&            graph)

 {

     // Creates the layer we're testing.

     FullyConnectedDescriptor layerDesc;

     layerDesc.m_BiasEnabled = true;

     layerDesc.m_TransposeWeightMatrix = true;

     layerDesc.m_ConstantWeights = false;


     FullyConnectedLayer* const layer = graph.AddLayer<FullyConnectedLayer>(layerDesc, "layer");


     float inputsQScale = 1.0f;

     float outputQScale = DataType == armnn::DataType::QAsymmU8 ? 2.0f : 1.0;


     // Creates extra layers with weights and biases as input layers.

     Layer* const input   = graph.AddLayer<InputLayer>(1, "input");

     Layer* const weights = graph.AddLayer<InputLayer>(2, "weights");

     Layer* const biases  = graph.AddLayer<InputLayer>(3, "biases");

     Layer* const output  = graph.AddLayer<OutputLayer>(0, "output");


     // Connects up.

     Connect(input, layer, TensorInfo({3, 1, 4, 5}, DataType, inputsQScale), 0, 0);

     Connect(weights, layer, TensorInfo({7, 20}, DataType, inputsQScale), 0, 1);

     Connect(biases, layer, TensorInfo({7}, GetBiasDataType(DataType), inputsQScale), 0, 2);

     Connect(layer, output, TensorInfo({3, 7}, DataType, outputQScale));

     CreateTensorHandles(graph, factory);


     // Makes the workload and checks it.

     auto workload = MakeAndCheckWorkload<FullyConnectedWorkload>(*layer, factory);


     FullyConnectedQueueDescriptor queueDescriptor = workload->GetData();


     CHECK(queueDescriptor.m_Parameters.m_BiasEnabled == true);

     CHECK(queueDescriptor.m_Parameters.m_TransposeWeightMatrix == true);

     CHECK(queueDescriptor.m_Parameters.m_ConstantWeights == false);

     CHECK(queueDescriptor.m_Inputs.size() == 3);

     CHECK(queueDescriptor.m_Outputs.size() == 1);


     // Returns so we can do extra, backend-specific tests.

     return workload;

 }


 template <typename NormalizationWorkload, armnn::DataType DataType>

 std::unique_ptr<NormalizationWorkload> CreateNormalizationWorkloadTest(armnn::IWorkloadFactory& factory,

                                                                        armnn::Graph& graph,

                                                                        DataLayout dataLayout = DataLayout::NCHW)

 {

     // Creates the layer we're testing.

     NormalizationDescriptor layerDesc;

     layerDesc.m_NormChannelType = NormalizationAlgorithmChannel::Across;

     layerDesc.m_NormMethodType = NormalizationAlgorithmMethod::LocalBrightness;

     layerDesc.m_NormSize = 3;

     layerDesc.m_Alpha = 0.5f;

     layerDesc.m_Beta = -1.0f;

     layerDesc.m_K = 0.2f;

     layerDesc.m_DataLayout = dataLayout;


     NormalizationLayer* layer = graph.AddLayer<NormalizationLayer>(layerDesc, "layer");


     // Creates extra layers.

     Layer* const input = graph.AddLayer<InputLayer>(0, "input");

     Layer* const output = graph.AddLayer<OutputLayer>(0, "output");


     TensorShape inputShape = (dataLayout == DataLayout::NCHW) ?

                 TensorShape{ 3, 5, 5, 1 } : TensorShape{ 3, 1, 5, 5 };

     TensorShape outputShape = (dataLayout == DataLayout::NCHW) ?

                 TensorShape{ 3, 5, 5, 1 } : TensorShape{ 3, 1, 5, 5 };


     // Connects up.

     armnn::TensorInfo inputTensorInfo(inputShape, DataType);

     armnn::TensorInfo outputTensorInfo(outputShape, DataType);

     Connect(input, layer, inputTensorInfo);

     Connect(layer, output, outputTensorInfo);

     CreateTensorHandles(graph, factory);


     // Makes the workload and checks it.

     auto workload = MakeAndCheckWorkload<NormalizationWorkload>(*layer, factory);


     NormalizationQueueDescriptor queueDescriptor = workload->GetData();

     CHECK((queueDescriptor.m_Parameters.m_NormChannelType == NormalizationAlgorithmChannel::Across));

     CHECK((queueDescriptor.m_Parameters.m_NormMethodType == NormalizationAlgorithmMethod::LocalBrightness));

     CHECK(queueDescriptor.m_Parameters.m_NormSize == 3);

     CHECK(queueDescriptor.m_Parameters.m_Alpha == 0.5f);

     CHECK(queueDescriptor.m_Parameters.m_Beta == -1.0f);

     CHECK(queueDescriptor.m_Parameters.m_K == 0.2f);

     CHECK((queueDescriptor.m_Parameters.m_DataLayout == dataLayout));


     CHECK(queueDescriptor.m_Inputs.size() == 1);

     CHECK(queueDescriptor.m_Outputs.size() == 1);


     // Returns so we can do extra, backend-specific tests.

     return workload;

 }


 template <typename Pooling2dWorkload, armnn::DataType DataType>

 std::unique_ptr<Pooling2dWorkload> CreatePooling2dWorkloadTest(armnn::IWorkloadFactory& factory,

                                                                armnn::Graph&            graph,

                                                                DataLayout dataLayout = DataLayout::NCHW)

 {

     // Creates the layer we're testing.

     Pooling2dDescriptor layerDesc;

     layerDesc.m_PoolType = PoolingAlgorithm::Average;

     layerDesc.m_PoolWidth = 3;

     layerDesc.m_PoolHeight = 3;

     layerDesc.m_PadLeft = 2;

     layerDesc.m_PadRight = 2;

     layerDesc.m_PadTop = 1;

     layerDesc.m_PadBottom = 1;

     layerDesc.m_StrideX = 2;

     layerDesc.m_StrideY = 3;

     layerDesc.m_OutputShapeRounding = OutputShapeRounding::Floor;

     layerDesc.m_DataLayout = dataLayout;


     Pooling2dLayer* const layer = graph.AddLayer<Pooling2dLayer>(layerDesc, "layer");


     // Create extra layers

     Layer* const input = graph.AddLayer<InputLayer>(0, "input");

     Layer* const output = graph.AddLayer<OutputLayer>(0, "output");


     TensorShape inputShape  = (dataLayout == DataLayout::NCHW) ? TensorShape{3, 2, 5, 5} : TensorShape{3, 5, 5, 2};

     TensorShape outputShape = (dataLayout == DataLayout::NCHW) ? TensorShape{3, 2, 2, 4} : TensorShape{3, 2, 4, 2};


     // Connect up

     Connect(input, layer, TensorInfo(inputShape, DataType));

     Connect(layer, output, TensorInfo(outputShape, DataType));

     CreateTensorHandles(graph, factory);


     // Make the workload and checks it

     auto workload = MakeAndCheckWorkload<Pooling2dWorkload>(*layer, factory);


     Pooling2dQueueDescriptor queueDescriptor = workload->GetData();

     CHECK((queueDescriptor.m_Parameters.m_PoolType == PoolingAlgorithm::Average));

     CHECK((queueDescriptor.m_Parameters.m_OutputShapeRounding == OutputShapeRounding::Floor));

     CHECK(queueDescriptor.m_Parameters.m_PoolWidth == 3);

     CHECK(queueDescriptor.m_Parameters.m_PoolHeight == 3);

     CHECK(queueDescriptor.m_Parameters.m_StrideX == 2);

     CHECK(queueDescriptor.m_Parameters.m_StrideY == 3);

     CHECK(queueDescriptor.m_Parameters.m_PadLeft == 2);

     CHECK(queueDescriptor.m_Parameters.m_PadRight == 2);

     CHECK(queueDescriptor.m_Parameters.m_PadTop == 1);

     CHECK(queueDescriptor.m_Parameters.m_PadBottom == 1);

     CHECK((queueDescriptor.m_Parameters.m_DataLayout == dataLayout));


     CHECK(queueDescriptor.m_Inputs.size() == 1);

     CHECK(queueDescriptor.m_Outputs.size() == 1);


     // Return so we can do extra, backend-specific tests

     return workload;

 }


 template <typename SoftmaxWorkload, armnn::DataType DataType>

 std::unique_ptr<SoftmaxWorkload> CreateSoftmaxWorkloadTest(armnn::IWorkloadFactory& factory,

                                                            armnn::Graph&            graph)

 {

     // Create the layer we're testing.

     SoftmaxDescriptor softmaxDescriptor;

     // Set Axis to -1 if CL or Neon until further Axes are supported.

     if (factory.GetBackendId() == armnn::Compute::CpuAcc || factory.GetBackendId() == armnn::Compute::GpuAcc)

     {

         softmaxDescriptor.m_Axis = -1;

     }


     Layer* const layer = graph.AddLayer<SoftmaxLayer>(softmaxDescriptor, "layer");

     // Create extra layers.

     Layer* const input = graph.AddLayer<InputLayer>(0, "input");

     Layer* const output = graph.AddLayer<OutputLayer>(0, "output");


     // Connect up

     armnn::TensorInfo tensorInfo({4, 1}, DataType);

     if (DataType == armnn::DataType::QAsymmU8)

     {

         tensorInfo.SetQuantizationOffset(0);

         tensorInfo.SetQuantizationScale(1.f / 256);

     }

     else if (DataType == armnn::DataType::QAsymmS8)

     {

         tensorInfo.SetQuantizationOffset(-128);

         tensorInfo.SetQuantizationScale(1.f / 256);

     }


     Connect(input, layer, tensorInfo);

     Connect(layer, output, tensorInfo);

     CreateTensorHandles(graph, factory);


     // Make the workload and checks it.

     auto workload = MakeAndCheckWorkload<SoftmaxWorkload>(*layer, factory);


     SoftmaxQueueDescriptor queueDescriptor = workload->GetData();

     CHECK(queueDescriptor.m_Inputs.size() == 1);

     CHECK(queueDescriptor.m_Outputs.size() == 1);


     // Return so we can do extra, backend-specific tests.

     return workload;

 }


 template<typename SplitterWorkload, armnn::DataType DataType>

 std::unique_ptr<SplitterWorkload>

     CreateSplitterWorkloadTest(armnn::IWorkloadFactory& factory, armnn::Graph& graph)

 {

     // Create the layer we're testing.

     // NOTE: need three dimensions channels, height/y, width/x because the Compute

     //       library restricts subtensors to have the same x and y dimensions as

     //       their parent tensors, and therefore the origin on the x and y dimension

     //       has to be zero for any view. So we need a third dimension to split...

     // NOTE: arguments are: number of views, number of dimensions.

     ViewsDescriptor layerDesc(3, 3);

     // NOTE: arguments are: view, dimension, value.

     layerDesc.SetViewOriginCoord(0, 0, 0);

     layerDesc.SetViewOriginCoord(1, 0, 1);

     layerDesc.SetViewOriginCoord(2, 0, 3);


     Layer* const layer = graph.AddLayer<SplitterLayer>(layerDesc, "layer");


     // Adds extra layers.

     Layer* const input = graph.AddLayer<InputLayer>(0, "input");

     Layer* const output0 = graph.AddLayer<OutputLayer>(0, "output0");

     Layer* const output1 = graph.AddLayer<OutputLayer>(1, "output1");

     Layer* const output2 = graph.AddLayer<OutputLayer>(2, "output2");


     // Connects up.

     armnn::TensorInfo tensorInfo({5, 7, 7}, DataType);

     Connect(input, layer, tensorInfo);


     armnn::TensorInfo output0Info({1, 7, 7}, DataType);

     armnn::TensorInfo output1Info({2, 7, 7}, DataType);

     armnn::TensorInfo output2Info({2, 7, 7}, DataType);


     Connect(layer, output0, output0Info, 0, 0);

     Connect(layer, output1, output1Info, 1, 0);

     Connect(layer, output2, output2Info, 2, 0);


     CreateTensorHandles(graph, factory);


     // Makes the workload and checks it.

     auto workload = MakeAndCheckWorkload<SplitterWorkload>(*layer, factory);


     SplitterQueueDescriptor queueDescriptor = workload->GetData();

     CHECK(queueDescriptor.m_Inputs.size() == 1);

     CHECK(queueDescriptor.m_Outputs.size() == 3);

     CHECK(queueDescriptor.m_ViewOrigins.size() == 3);


     CHECK(queueDescriptor.m_ViewOrigins[0].m_Origin[0] == 0);

     CHECK(queueDescriptor.m_ViewOrigins[1].m_Origin[0] == 1);

     CHECK(queueDescriptor.m_ViewOrigins[2].m_Origin[0] == 3);

     CHECK(queueDescriptor.m_ViewOrigins[0].m_Origin[1] == 0);

     CHECK(queueDescriptor.m_ViewOrigins[1].m_Origin[1] == 0);

     CHECK(queueDescriptor.m_ViewOrigins[2].m_Origin[1] == 0);

     CHECK(queueDescriptor.m_ViewOrigins[0].m_Origin[2] == 0);

     CHECK(queueDescriptor.m_ViewOrigins[1].m_Origin[2] == 0);

     CHECK(queueDescriptor.m_ViewOrigins[2].m_Origin[2] == 0);


     // Returns so we can do extra, backend-specific tests.

     return workload;

 }


 /// This function constructs a graph with both a splitter and a concat, and returns a pair of the workloads.

 template<typename SplitterWorkload, typename ConcatWorkload, armnn::DataType DataType>

 std::pair<std::unique_ptr<SplitterWorkload>, std::unique_ptr<ConcatWorkload>>

     CreateSplitterConcatWorkloadTest(armnn::IWorkloadFactory &factory, armnn::Graph &graph)

 {

     armnn::TensorInfo inputTensorInfo({ 1, 2, 100, 10 }, DataType);


     armnn::TensorInfo splitTensorInfo1({ 1, 1, 100, 10 }, DataType);

     armnn::TensorInfo splitTensorInfo2({ 1, 1, 100, 10 }, DataType);


     //Constructs the graph.

     Layer* const input = graph.AddLayer<InputLayer>(0, "input");


     armnn::ViewsDescriptor splitterViews(2);

     splitterViews.SetViewOriginCoord(0, 0, 0);

     splitterViews.SetViewOriginCoord(0, 1, 0);

     splitterViews.SetViewOriginCoord(0, 2, 0);

     splitterViews.SetViewOriginCoord(0, 3, 0);


     splitterViews.SetViewOriginCoord(1, 0, 0);

     splitterViews.SetViewOriginCoord(1, 1, 1);

     splitterViews.SetViewOriginCoord(1, 2, 0);

     splitterViews.SetViewOriginCoord(1, 3, 0);


     // create splitter layer

     Layer* const splitter = graph.AddLayer<SplitterLayer>(splitterViews, "splitter");

     CHECK(splitter);


     armnn::OriginsDescriptor concatViews(2);

     concatViews.SetViewOriginCoord(0, 0, 0);

     concatViews.SetViewOriginCoord(0, 1, 1);

     concatViews.SetViewOriginCoord(0, 2, 0);

     concatViews.SetViewOriginCoord(0, 3, 0);


     concatViews.SetViewOriginCoord(1, 0, 0);

     concatViews.SetViewOriginCoord(1, 1, 0);

     concatViews.SetViewOriginCoord(1, 2, 0);

     concatViews.SetViewOriginCoord(1, 3, 0);


     // create concat layer

     Layer* const concat = graph.AddLayer<ConcatLayer>(concatViews, "concat");

     CHECK(concat);


     Layer* const output = graph.AddLayer<OutputLayer>(0, "output");


     // Adds connections.

     // connect input to splitter

     Connect(input, splitter, inputTensorInfo, 0, 0);

     // connect splitter[0] to concat[1]

     Connect(splitter, concat, splitTensorInfo1, 0, 1); // The splitter & concat are connected up.

     // connect splitter[1] to concat[0]

     Connect(splitter, concat, splitTensorInfo2, 1, 0); // So that the outputs are flipped round.

     // connect concat to output

     Connect(concat, output, inputTensorInfo, 0, 0);


     // created tensor handles

     CreateTensorHandles(graph, factory);


     // created splitter workload

     auto workloadSplitter = MakeAndCheckWorkload<SplitterWorkload>(*splitter, factory);

     CHECK(workloadSplitter);

     // created concat workload

     auto workloadConcat = MakeAndCheckWorkload<ConcatWorkload>(*concat, factory);

     CHECK(workloadConcat);


     return {std::move(workloadSplitter), std::move(workloadConcat)};

 }


 /// This function constructs a graph with a splitter with two outputs. Each of the outputs is then

 /// connected to two different activation layers

 template<typename SplitterWorkload, typename ActivationWorkload, armnn::DataType DataType>

 void CreateSplitterMultipleInputsOneOutputWorkloadTest(armnn::IWorkloadFactory& factory, armnn::Graph& graph,

                                  std::unique_ptr<SplitterWorkload>& wlSplitter,

                                  std::unique_ptr<ActivationWorkload>& wlActiv0_0,

                                  std::unique_ptr<ActivationWorkload>& wlActiv0_1,

                                  std::unique_ptr<ActivationWorkload>& wlActiv1_0,

                                  std::unique_ptr<ActivationWorkload>& wlActiv1_1)

 {

     armnn::TensorInfo inputTensorInfo ({ 1, 3, 100, 50 }, DataType);

     armnn::TensorInfo splitTensorInfo1({ 1, 1, 100, 50 }, DataType);

     armnn::TensorInfo splitTensorInfo2({ 1, 2, 100, 50 }, DataType);


     //Constructs the graph.

     Layer* const input = graph.AddLayer<InputLayer>(0, "input");


     armnn::ViewsDescriptor splitterViews(2);


     splitterViews.SetViewOriginCoord(0, 0, 0);

     splitterViews.SetViewOriginCoord(0, 1, 0);

     splitterViews.SetViewOriginCoord(0, 2, 0);

     splitterViews.SetViewOriginCoord(0, 3, 0);


     splitterViews.SetViewOriginCoord(1, 0, 0);

     splitterViews.SetViewOriginCoord(1, 1, 1);

     splitterViews.SetViewOriginCoord(1, 2, 0);

     splitterViews.SetViewOriginCoord(1, 3, 0);


     Layer* const splitter = graph.AddLayer<SplitterLayer>(splitterViews, "splitter");


     armnn::ActivationDescriptor activationDesc;


     Layer* const activ0_0 = graph.AddLayer<ActivationLayer>(activationDesc, "activ0_0");

     Layer* const activ0_1 = graph.AddLayer<ActivationLayer>(activationDesc, "activ0_1");

     Layer* const activ1_0 = graph.AddLayer<ActivationLayer>(activationDesc, "activ1_0");

     Layer* const activ1_1 = graph.AddLayer<ActivationLayer>(activationDesc, "activ1_1");


     Layer* const output1 = graph.AddLayer<OutputLayer>(1, "output1");

     Layer* const output2 = graph.AddLayer<OutputLayer>(2, "output2");

     Layer* const output3 = graph.AddLayer<OutputLayer>(3, "output3");

     Layer* const output4 = graph.AddLayer<OutputLayer>(4, "output4");


     // Adds connections.

     Connect(input, splitter, inputTensorInfo, 0, 0);

     Connect(splitter, activ0_0, splitTensorInfo1, 0, 0);

     Connect(splitter, activ0_1, splitTensorInfo1, 0, 0);


     Connect(splitter, activ1_0, splitTensorInfo2, 1, 0);

     Connect(splitter, activ1_1, splitTensorInfo2, 1, 0);


     Connect(activ0_0, output1, splitTensorInfo1, 0, 0);

     Connect(activ0_1, output2, splitTensorInfo1, 0, 0);

     Connect(activ1_0, output3, splitTensorInfo2, 0, 0);

     Connect(activ1_1, output4, splitTensorInfo2, 0, 0);


     CreateTensorHandles(graph, factory);


     auto workloadSplitter = MakeAndCheckWorkload<SplitterWorkload>(*splitter, factory);

     auto workloadActiv0_0 = MakeAndCheckWorkload<ActivationWorkload>(*activ0_0, factory);

     auto workloadActiv0_1 = MakeAndCheckWorkload<ActivationWorkload>(*activ0_1, factory);

     auto workloadActiv1_0 = MakeAndCheckWorkload<ActivationWorkload>(*activ1_0, factory);

     auto workloadActiv1_1 = MakeAndCheckWorkload<ActivationWorkload>(*activ1_1, factory);


     wlSplitter = std::move(workloadSplitter);

     wlActiv0_0 = std::move(workloadActiv0_0);

     wlActiv0_1 = std::move(workloadActiv0_1);

     wlActiv1_0 = std::move(workloadActiv1_0);

     wlActiv1_1 = std::move(workloadActiv1_1);

 }


 template <typename ResizeWorkload, armnn::DataType DataType>

 std::unique_ptr<ResizeWorkload> CreateResizeBilinearWorkloadTest(armnn::IWorkloadFactory& factory,

                                                                  armnn::Graph& graph,

                                                                  DataLayout dataLayout = DataLayout::NCHW)

 {

     TensorShape inputShape;

     TensorShape outputShape;


     switch (dataLayout) {

         case DataLayout::NHWC:

             inputShape =  { 2, 4, 4, 3 };

             outputShape = { 2, 2, 2, 3 };

             break;

         case DataLayout::NCHW:

         default:

             inputShape =  { 2, 3, 4, 4 };

             outputShape = { 2, 3, 2, 2 };

     }


     // Creates the layer we're testing.

     ResizeDescriptor resizeDesc;

     armnnUtils::DataLayoutIndexed dimensionIndices = dataLayout;

     resizeDesc.m_Method       = ResizeMethod::Bilinear;

     resizeDesc.m_TargetWidth  = outputShape[dimensionIndices.GetWidthIndex()];

     resizeDesc.m_TargetHeight = outputShape[dimensionIndices.GetHeightIndex()];

     resizeDesc.m_DataLayout   = dataLayout;

     Layer* const layer = graph.AddLayer<ResizeLayer>(resizeDesc, "resize");


     // Creates extra layers.

     Layer* const input  = graph.AddLayer<InputLayer>(0, "input");

     Layer* const output = graph.AddLayer<OutputLayer>(0, "output");


     // Connects up.

     armnn::TensorInfo inputTensorInfo(inputShape, DataType);

     armnn::TensorInfo outputTensorInfo(outputShape, DataType);

     Connect(input, layer, inputTensorInfo);

     Connect(layer, output, outputTensorInfo);

     CreateTensorHandles(graph, factory);


     // Makes the workload and checks it.

     auto workload = MakeAndCheckWorkload<ResizeWorkload>(*layer, factory);


     auto queueDescriptor = workload->GetData();

     CHECK(queueDescriptor.m_Inputs.size()  == 1);

     CHECK(queueDescriptor.m_Outputs.size() == 1);

     CHECK(queueDescriptor.m_Parameters.m_DataLayout == dataLayout);


     // Returns so we can do extra, backend-specific tests.

     return workload;

 }


 template <typename BatchToSpaceNdWorkload, armnn::DataType DataType>

 std::unique_ptr<BatchToSpaceNdWorkload> CreateBatchToSpaceNdWorkloadTest(armnn::IWorkloadFactory& factory,

                                                                          armnn::Graph&  graph)

 {

     BatchToSpaceNdDescriptor desc;

     Layer* const layer = graph.AddLayer<BatchToSpaceNdLayer>(desc, "batchToSpace");


     // Creates extra layers.

     Layer* const input = graph.AddLayer<InputLayer>(0, "input");

     Layer* const output = graph.AddLayer<OutputLayer>(0, "output");


     // Connects up.

     armnn::TensorInfo tensorInfo({1, 1, 1, 1}, DataType);


     Connect(input, layer, tensorInfo);

     Connect(layer, output, tensorInfo);


     CreateTensorHandles(graph, factory);


     // Makes the workload and checks it.

     auto workload = MakeAndCheckWorkload<BatchToSpaceNdWorkload>(*layer, factory);


     BatchToSpaceNdQueueDescriptor queueDescriptor = workload->GetData();

     CHECK(queueDescriptor.m_Inputs.size() == 1);

     CHECK(queueDescriptor.m_Outputs.size() == 1);


     return workload;

 }


 template <typename LogSoftmaxWorkload, armnn::DataType DataType>

 std::unique_ptr<LogSoftmaxWorkload> CreateLogSoftmaxWorkloadTest(armnn::IWorkloadFactory& factory,

                                                                  armnn::Graph& graph)

 {

     // Create the layer we're testing.

     LogSoftmaxDescriptor logSoftmaxDescriptor;

     // Set Axis to -1 if CL or Neon until further Axes are supported.

     if (factory.GetBackendId() == armnn::Compute::CpuAcc || factory.GetBackendId() == armnn::Compute::GpuAcc)

     {

         logSoftmaxDescriptor.m_Axis = -1;

     }


     Layer* const layer = graph.AddLayer<LogSoftmaxLayer>(logSoftmaxDescriptor, "layer");

     // Create extra layers.

     Layer* const input = graph.AddLayer<InputLayer>(0, "input");

     Layer* const output = graph.AddLayer<OutputLayer>(0, "output");


     // Connect up

     armnn::TensorInfo tensorInfo({4, 1}, DataType);


     Connect(input, layer, tensorInfo);

     Connect(layer, output, tensorInfo);

     CreateTensorHandles(graph, factory);


     // Make the workload and checks it.

     auto workload = MakeAndCheckWorkload<LogSoftmaxWorkload>(*layer, factory);


     LogSoftmaxQueueDescriptor queueDescriptor = workload->GetData();

     CHECK(queueDescriptor.m_Inputs.size() == 1);

     CHECK(queueDescriptor.m_Outputs.size() == 1);


     // Return so we can do extra, backend-specific tests.

     return workload;

 }


 template <typename L2NormalizationWorkload, armnn::DataType DataType>

 std::unique_ptr<L2NormalizationWorkload> CreateL2NormalizationWorkloadTest(armnn::IWorkloadFactory& factory,

     armnn::Graph& graph, DataLayout dataLayout = DataLayout::NCHW)

 {

     // Creates the layer we're testing.

     L2NormalizationDescriptor layerDesc;

     layerDesc.m_DataLayout = dataLayout;


     Layer* const layer = graph.AddLayer<L2NormalizationLayer>(layerDesc, "l2norm");


     // Creates extra layers.

     Layer* const input = graph.AddLayer<InputLayer>(0, "input");

     Layer* const output = graph.AddLayer<OutputLayer>(0, "output");


     TensorShape inputShape = (dataLayout == DataLayout::NCHW) ?

                 TensorShape{ 5, 20, 50, 67 } : TensorShape{ 5, 50, 67, 20 };

     TensorShape outputShape = (dataLayout == DataLayout::NCHW) ?

                 TensorShape{ 5, 20, 50, 67 } : TensorShape{ 5, 50, 67, 20 };


     // Connects up.

     armnn::TensorInfo inputTensorInfo(inputShape, DataType);

     armnn::TensorInfo outputTensorInfo(outputShape, DataType);

     Connect(input, layer, inputTensorInfo);

     Connect(layer, output, outputTensorInfo);

     CreateTensorHandles(graph, factory);


     // Makes the workload and checks it.

     auto workload = MakeAndCheckWorkload<L2NormalizationWorkload>(*layer, factory);


     L2NormalizationQueueDescriptor queueDescriptor = workload->GetData();

     CHECK((queueDescriptor.m_Parameters.m_DataLayout == dataLayout));

     CHECK(queueDescriptor.m_Inputs.size() == 1);

     CHECK(queueDescriptor.m_Outputs.size() == 1);


     // Returns so we can do extra, backend-specific tests.

     return workload;

 }


 template <typename ReshapeWorkload, armnn::DataType DataType>

 std::unique_ptr<ReshapeWorkload> CreateReshapeWorkloadTest(armnn::IWorkloadFactory& factory,

     armnn::Graph& graph)

 {

     // Creates the layer we're testing.

     TensorShape outputShape({ 1, 4 });

     ReshapeDescriptor reshapeDesc;

     reshapeDesc.m_TargetShape = outputShape;

     Layer* const layer = graph.AddLayer<ReshapeLayer>(reshapeDesc, "layer");


     // Creates extra layers.

     Layer* const input = graph.AddLayer<InputLayer>(0, "input");

     Layer* const output = graph.AddLayer<OutputLayer>(0, "output");


     // Connects up.

     armnn::TensorInfo inputTensorInfo({ 4, 1 }, DataType);

     armnn::TensorInfo outputTensorInfo(outputShape, DataType);

     Connect(input, layer, inputTensorInfo);

     Connect(layer, output, outputTensorInfo);

     CreateTensorHandles(graph, factory);


     // Makes the workload and checks it.

     auto workload = MakeAndCheckWorkload<ReshapeWorkload>(*layer, factory);


     ReshapeQueueDescriptor queueDescriptor = workload->GetData();

     CHECK(queueDescriptor.m_Inputs.size() == 1);

     CHECK(queueDescriptor.m_Outputs.size() == 1);


     // Returns so we can do extra, backend-specific tests.

     return workload;

 }


 template <typename ConvertFp16ToFp32Float32Workload>

 std::unique_ptr<ConvertFp16ToFp32Float32Workload> CreateConvertFp16ToFp32WorkloadTest(

     armnn::IWorkloadFactory& factory, armnn::Graph& graph)

 {

     // Creates the layer we're testing.

     ConvertFp16ToFp32Layer* const layer = graph.AddLayer<ConvertFp16ToFp32Layer>("Fp16ToFp32Converter");


     // Creates extra layers.

     Layer* const input = graph.AddLayer<InputLayer>(0, "input");

     Layer* const output = graph.AddLayer<OutputLayer>(0, "output");


     // Connects up.

     armnn::TensorInfo inputTensorInfo({1, 3, 2, 3}, armnn::DataType::Float16);

     armnn::TensorInfo outputTensorInfo({1, 3, 2, 3}, armnn::DataType::Float32);

     Connect(input, layer, inputTensorInfo);

     Connect(layer, output, outputTensorInfo);

     CreateTensorHandles(graph, factory);


     // Makes the workload and checks it.

     auto workload = MakeAndCheckWorkload<ConvertFp16ToFp32Float32Workload>(*layer, factory);


     ConvertFp16ToFp32QueueDescriptor queueDescriptor = workload->GetData();

     CHECK(queueDescriptor.m_Inputs.size() == 1);

     CHECK(queueDescriptor.m_Outputs.size() == 1);


     // Returns so we can do extra, backend-specific tests.

     return workload;

 }


 template <typename ConvertFp32ToFp16Float16Workload>

 std::unique_ptr<ConvertFp32ToFp16Float16Workload> CreateConvertFp32ToFp16WorkloadTest(

     armnn::IWorkloadFactory& factory, armnn::Graph& graph)

 {

     // Creates the layer we're testing.

     ConvertFp32ToFp16Layer* const layer = graph.AddLayer<ConvertFp32ToFp16Layer>("Fp32ToFp16Converter");


     // Creates extra layers.

     Layer* const input = graph.AddLayer<InputLayer>(0, "input");

     Layer* const output = graph.AddLayer<OutputLayer>(0, "output");


     // Connects up.

     armnn::TensorInfo inputTensorInfo({1, 3, 2, 3}, armnn::DataType::Float32);

     armnn::TensorInfo outputTensorInfo({1, 3, 2, 3}, armnn::DataType::Float16);

     Connect(input, layer, inputTensorInfo);

     Connect(layer, output, outputTensorInfo);

     CreateTensorHandles(graph, factory);


     // Makes the workload and checks it.

     auto workload = MakeAndCheckWorkload<ConvertFp32ToFp16Float16Workload>(*layer, factory);


     ConvertFp32ToFp16QueueDescriptor queueDescriptor = workload->GetData();

     CHECK(queueDescriptor.m_Inputs.size() == 1);

     CHECK(queueDescriptor.m_Outputs.size() == 1);


     // Returns so we can do extra, backend-specific tests.

     return workload;

 }


 template <typename MeanWorkload, armnn::DataType DataType>

 std::unique_ptr<MeanWorkload> CreateMeanWorkloadTest(armnn::IWorkloadFactory& factory, armnn::Graph& graph)

 {

     // Reduce along the first and second dimensions, and do not keep the reduced dimensions.

     MeanDescriptor descriptor({ 1, 2 }, false);


     // Creates the layer we're testing.

     Layer* const layer = graph.AddLayer<MeanLayer>(descriptor, "mean");


     // Creates extra layers.

     Layer* const input = graph.AddLayer<InputLayer>(0, "input");

     Layer* const output = graph.AddLayer<OutputLayer>(0, "output");


     // Connects up.

     armnn::TensorInfo inputTensorInfo({ 1, 3, 7, 4 }, DataType);

     armnn::TensorInfo outputTensorInfo({ 1, 4 }, DataType);

     Connect(input, layer, inputTensorInfo);

     Connect(layer, output, outputTensorInfo);

     CreateTensorHandles(graph, factory);


     // Makes the workload and checks it.

     auto workload = MakeAndCheckWorkload<MeanWorkload>(*layer, factory);


     MeanQueueDescriptor queueDescriptor = workload->GetData();

     CHECK(queueDescriptor.m_Parameters.m_Axis == descriptor.m_Axis);

     CHECK(queueDescriptor.m_Parameters.m_KeepDims == descriptor.m_KeepDims);

     CHECK(queueDescriptor.m_Inputs.size() == 1);

     CHECK(queueDescriptor.m_Outputs.size() == 1);


     // Returns so we can do extra, backend-specific tests.

     return workload;

 }


 template<typename ConcatWorkload, armnn::DataType DataType>

 std::unique_ptr<ConcatWorkload> CreateConcatWorkloadTest(armnn::IWorkloadFactory &factory,

                                                          armnn::Graph &graph,

                                                          const armnn::TensorShape &outputShape,

                                                          unsigned int concatAxis)

 {

     armnn::TensorInfo inputTensorInfo({ 2, 3, 2, 5 }, DataType);

     armnn::TensorInfo outputTensorInfo(outputShape, DataType);


     // Constructs the graph.

     Layer* const input0 = graph.AddLayer<InputLayer>(0, "input0");

     Layer* const input1 = graph.AddLayer<InputLayer>(1, "input1");

     armnn::OriginsDescriptor descriptor;


     std::vector<armnn::TensorShape> inputShapes{{ 2, 3, 2, 5 }, { 2, 3, 2, 5 }};


     descriptor = CreateDescriptorForConcatenation(inputShapes.begin(),

                                                   inputShapes.end(),

                                                   concatAxis);


     // create concat layer

     Layer* const concat = graph.AddLayer<ConcatLayer>(descriptor, "concat");

     CHECK(concat);


     Layer* const output = graph.AddLayer<OutputLayer>(0, "output");


     // Adds connections.

     // connect input0 to concat

     Connect(input0, concat, inputTensorInfo, 0, 0);

     // connect input1 to concat

     Connect(input1, concat, inputTensorInfo, 0, 1);

     // connect concat to output

     Connect(concat, output, outputTensorInfo, 0, 0);


     // create tensor handles

     CreateTensorHandles(graph, factory);


     // create concat workload

     auto workloadConcat = MakeAndCheckWorkload<ConcatWorkload>(*concat, factory);

     CHECK(workloadConcat);


     return workloadConcat;

 }


 template <typename PreCompiledWorkload, armnn::DataType dataType>

 std::pair<armnn::IOptimizedNetworkPtr, std::unique_ptr<PreCompiledWorkload>> CreatePreCompiledWorkloadTest(

     armnn::IWorkloadFactory& factory,

     armnn::Graph& graph,

     bool biasEnabled = false)

 {

     IgnoreUnused(graph);


     // build up the structure of the network

     armnn::INetworkPtr net(armnn::INetwork::Create());


     // Add an input layer

     armnn::IConnectableLayer* const inputLayer = net->AddInputLayer(0, "input layer");

     CHECK(inputLayer);


     // ArmNN weights tensor shape is OIHW (out channels, in channels, height, width) for NCHW

     // ArmNN weights tensor shape is OHWI (out channels, height, width, in channels) for NHWC

     // this test is using NHWC, so the weights shape is OHWI

     TensorInfo weightsTensorInfo(TensorShape({16, 1, 1, 16}), dataType, 0.9f, 0, true);

     unsigned int weightsLength = weightsTensorInfo.GetNumElements();


     using WeightType = armnn::ResolveType<dataType>;

     std::vector<WeightType> convWeightsData(weightsLength);

     for (unsigned int i = 0; i < weightsLength; ++i)

     {

         convWeightsData[i] = static_cast<WeightType>(i);

     }


     armnn::ConstTensor weights(weightsTensorInfo, convWeightsData);


     // Add a layer that can be used in the PreCompiled layer

     armnn::Convolution2dDescriptor convDesc2d;

     convDesc2d.m_StrideX = 1;

     convDesc2d.m_StrideY = 1;

     convDesc2d.m_BiasEnabled = biasEnabled;

     convDesc2d.m_DataLayout = armnn::DataLayout::NHWC;


     const std::string convLayerName("conv layer");


     armnn::IConnectableLayer* convLayer = net->AddConvolution2dLayer(convDesc2d, convLayerName.c_str());


     IConnectableLayer* weightsLayer = net->AddConstantLayer(weights);

     weightsLayer->GetOutputSlot(0).SetTensorInfo(weights.GetInfo());

     weightsLayer->GetOutputSlot(0).Connect(convLayer->GetInputSlot(1u));


     if (biasEnabled)

     {

         constexpr armnn::DataType biasDataType = ( dataType == armnn::DataType::QAsymmU8) ?

             armnn::DataType::Signed32 : armnn::DataType::Float32;


         TensorInfo biasTensorInfo(TensorShape({16}), biasDataType, 0.9f * 0.9f, 0, true);

         unsigned int biasLength = biasTensorInfo.GetNumElements();


         using BiasType = armnn::ResolveType<biasDataType>;

         std::vector<BiasType> biasData(biasLength);

         std::fill(biasData.begin(), biasData.end(), static_cast<BiasType>(0));


         armnn::ConstTensor biases(biasTensorInfo, biasData);


         IConnectableLayer* biasLayer = net->AddConstantLayer(biases);


         biasLayer->GetOutputSlot(0).SetTensorInfo(biases.GetInfo());

         biasLayer->GetOutputSlot(0).Connect(convLayer->GetInputSlot(2u));

     }


     CHECK(convLayer);


     // Add an output layer

     armnn::IConnectableLayer* const outputLayer = net->AddOutputLayer(0, "output layer");

     CHECK(outputLayer);


     // set the tensors in the network (NHWC format)

     TensorInfo inputTensorInfo(TensorShape({ 1, 16, 16, 16 }), dataType);

     if (dataType == armnn::DataType::QAsymmU8)

     {

         inputTensorInfo.SetQuantizationOffset(0);

         inputTensorInfo.SetQuantizationScale(0.9f);

     }


     TensorInfo outputTensorInfo(TensorShape({1, 16, 16, 16}), dataType);

     if (dataType == armnn::DataType::QAsymmU8)

     {

         outputTensorInfo.SetQuantizationOffset(0);

         outputTensorInfo.SetQuantizationScale(0.9f);

     }


     // Connect the layers

     inputLayer->GetOutputSlot(0).Connect(convLayer->GetInputSlot(0));

     inputLayer->GetOutputSlot(0).SetTensorInfo(inputTensorInfo);


     convLayer->GetOutputSlot(0).Connect(outputLayer->GetInputSlot(0));

     convLayer->GetOutputSlot(0).SetTensorInfo(outputTensorInfo);


     // Optimize the network for the backend supported by the factory

     std::vector<armnn::BackendId> backends = {factory.GetBackendId()};

     armnn::IRuntime::CreationOptions options;

     armnn::IRuntimePtr runtime(armnn::IRuntime::Create(options));

     armnn::OptimizerOptionsOpaque optimizerOptions;

     armnn::IOptimizedNetworkPtr optimizedNet = armnn::Optimize(*net, backends, runtime->GetDeviceSpec(),

                                                                optimizerOptions);

     CHECK(optimizedNet != nullptr);


     // Find the PreCompiled layer in the optimised graph

     armnn::Graph& optimisedGraph = GetGraphForTesting(optimizedNet.get());

     Layer* preCompiledLayer = nullptr;

     for (auto& layer : optimisedGraph)

     {

         if (layer->GetType() == LayerType::PreCompiled)

         {

             preCompiledLayer = layer;

         }

     }

     CHECK(preCompiledLayer != nullptr);


     // Create the TensorHandles.

     CreateTensorHandles(optimisedGraph, factory);


     // Make the workload and check it.

     auto workload = MakeAndCheckWorkload<PreCompiledWorkload>(*preCompiledLayer, factory);


     PreCompiledQueueDescriptor queueDescriptor = workload->GetData();

     CHECK(queueDescriptor.m_Inputs.size()  == 1);

     CHECK(queueDescriptor.m_Outputs.size() == 1);


     // Returns the workload so we can do extra, backend-specific tests.

     // NOTE: We need to return the optimised network as well, otherwise it gets

     // out of scope and the tensor handles get destructed

     return std::make_pair(std::move(optimizedNet), std::move(workload));

 }


 template<typename ConstantWorkload, armnn::DataType DataType>

 std::unique_ptr<ConstantWorkload> CreateConstantWorkloadTest(armnn::IWorkloadFactory& factory,

                                                              armnn::Graph& graph,

                                                              const armnn::TensorShape& outputShape)

 {

     armnn::TensorInfo outputTensorInfo(outputShape, DataType);


     // create constant layer

     auto constant = graph.AddLayer<ConstantLayer>("constant");

     CHECK(constant);

     constant->m_LayerOutput = std::make_unique<ScopedTensorHandle>(outputTensorInfo);


     Layer* const output = graph.AddLayer<OutputLayer>(0, "output");


     // Adds connections.

     // connect constant to output

     Connect(constant, output, outputTensorInfo, 0, 0);


     // create tensor handles

     CreateTensorHandles(graph, factory);


     // create Constant workload"

     auto workloadConstant = MakeAndCheckWorkload<ConstantWorkload>(*constant, factory);

     CHECK(workloadConstant);


     return workloadConstant;

 }


 template <typename PreluWorkload>

 std::unique_ptr<PreluWorkload> CreatePreluWorkloadTest(armnn::IWorkloadFactory& factory,

                                                        armnn::Graph& graph,

                                                        const armnn::TensorShape& inputShape,

                                                        const armnn::TensorShape& alphaShape,

                                                        const armnn::TensorShape& outputShape,

                                                        armnn::DataType dataType)

 {

     // Creates the PReLU layer

     Layer* const layer = graph.AddLayer<PreluLayer>("prelu");

     CHECK(layer != nullptr);


     // Creates extra layers

     Layer* const input  = graph.AddLayer<InputLayer> (0, "input");

     Layer* const alpha  = graph.AddLayer<InputLayer> (1, "alpha");

     Layer* const output = graph.AddLayer<OutputLayer>(0, "output");

     CHECK(input  != nullptr);

     CHECK(alpha  != nullptr);

     CHECK(output != nullptr);


     // Connects up

     armnn::TensorInfo inputTensorInfo (inputShape,  dataType);

     armnn::TensorInfo alphaTensorInfo (alphaShape,  dataType);

     armnn::TensorInfo outputTensorInfo(outputShape, dataType);

     Connect(input, layer,  inputTensorInfo,  0, 0);

     Connect(alpha, layer,  alphaTensorInfo,  0, 1);

     Connect(layer, output, outputTensorInfo, 0, 0);

     CreateTensorHandles(graph, factory);


     // Makes the workload and checks it

     auto workload = MakeAndCheckWorkload<PreluWorkload>(*layer, factory);


     PreluQueueDescriptor queueDescriptor = workload->GetData();

     CHECK(queueDescriptor.m_Inputs.size() == 2);

     CHECK(queueDescriptor.m_Outputs.size() == 1);


     // Returns so we can do extra, backend-specific tests.

     return workload;

 }


 template <typename SpaceToDepthWorkload, armnn::DataType DataType>

 std::unique_ptr<SpaceToDepthWorkload> CreateSpaceToDepthWorkloadTest(armnn::IWorkloadFactory& factory,

                                                                      armnn::Graph&  graph)

 {

     SpaceToDepthDescriptor desc;

     desc.m_BlockSize = 2;

     Layer* const layer = graph.AddLayer<SpaceToDepthLayer>(desc, "spaceToDepth");


     // Creates extra layers.

     Layer* const input = graph.AddLayer<InputLayer>(0, "input");

     Layer* const output = graph.AddLayer<OutputLayer>(0, "output");


     // Connects up.

     armnn::TensorInfo inputTensorInfo({ 1, 2, 2, 1 }, DataType);

     armnn::TensorInfo outputTensorInfo({ 1, 1, 1, 4 }, DataType);


     Connect(input, layer, inputTensorInfo);

     Connect(layer, output, outputTensorInfo);


     CreateTensorHandles(graph, factory);


     // Makes the workload and checks it.

     auto workload = MakeAndCheckWorkload<SpaceToDepthWorkload>(*layer, factory);


     SpaceToDepthQueueDescriptor queueDescriptor = workload->GetData();

     CHECK(queueDescriptor.m_Inputs.size() == 1);

     CHECK(queueDescriptor.m_Outputs.size() == 1);


     return workload;

 }


 template <typename StackWorkload, armnn::DataType DataType>

 std::unique_ptr<StackWorkload> CreateStackWorkloadTest(armnn::IWorkloadFactory& factory,

                                                        armnn::Graph& graph,

                                                        const armnn::TensorShape& inputShape,

                                                        const armnn::TensorShape& outputShape,

                                                        unsigned int axis,

                                                        unsigned int numInputs)

 {

     armnn::TensorInfo inputTensorInfo(inputShape, DataType);

     armnn::TensorInfo outputTensorInfo(outputShape, DataType);


     // Constructs the Stack layer.

     armnn::StackDescriptor descriptor(axis, numInputs, inputShape);

     Layer* const stackLayer = graph.AddLayer<StackLayer>(descriptor, "stack");

     CHECK(stackLayer != nullptr);


     // Constructs layer inputs and output.

     std::vector<Layer*> inputs;

     for (unsigned int i=0; i<numInputs; ++i)

     {

         inputs.push_back(graph.AddLayer<InputLayer>(

             static_cast<int>(i),

             ("input" + std::to_string(i)).c_str()

         ));

         CHECK(inputs[i] != nullptr);

     }

     Layer* const output = graph.AddLayer<OutputLayer>(0, "output");

     CHECK(output != nullptr);


     // Adds connections.

     for (unsigned int i=0; i<numInputs; ++i)

     {

         Connect(inputs[i], stackLayer, inputTensorInfo, 0, i);

     }

     Connect(stackLayer, output, outputTensorInfo, 0, 0);


     CreateTensorHandles(graph, factory);


     auto stackWorkload = MakeAndCheckWorkload<StackWorkload>(*stackLayer, factory);

     StackQueueDescriptor queueDescriptor = stackWorkload->GetData();

     CHECK(queueDescriptor.m_Inputs.size() == numInputs);

     CHECK(queueDescriptor.m_Outputs.size() == 1);


     return stackWorkload;

 }


 } // Anonymous namespace

Assert.hpp

ARMNN_ASSERT
#define ARMNN_ASSERT(COND)
Definition: Assert.hpp:14

DataLayoutIndexed.hpp

Graph.hpp

IgnoreUnused.hpp

Network.hpp

PolymorphicDowncast.hpp

ResolveType.hpp

TensorHandle.hpp

Connect
void Connect(armnn::IConnectableLayer *from, armnn::IConnectableLayer *to, const armnn::TensorInfo &tensorInfo, unsigned int fromIndex, unsigned int toIndex)
Definition: TestUtils.cpp:14

TestUtils.hpp

WorkloadData.hpp

WorkloadFactory.hpp

armnn::ActivationLayer
This layer represents an activation operation with the specified activation function.
Definition: ActivationLayer.hpp:13

armnn::AdditionLayer
This layer represents an addition operation.
Definition: AdditionLayer.hpp:14

armnn::BatchNormalizationLayer
This layer represents a batch normalization operation.
Definition: BatchNormalizationLayer.hpp:16

armnn::BatchNormalizationLayer::m_Mean
std::shared_ptr< ConstTensorHandle > m_Mean
A unique pointer to store Mean values.
Definition: BatchNormalizationLayer.hpp:19

armnn::BatchNormalizationLayer::m_Gamma
std::shared_ptr< ConstTensorHandle > m_Gamma
A unique pointer to store Gamma values.
Definition: BatchNormalizationLayer.hpp:25

armnn::BatchNormalizationLayer::m_Beta
std::shared_ptr< ConstTensorHandle > m_Beta
A unique pointer to store Beta values.
Definition: BatchNormalizationLayer.hpp:23

armnn::BatchNormalizationLayer::m_Variance
std::shared_ptr< ConstTensorHandle > m_Variance
A unique pointer to store Variance values.
Definition: BatchNormalizationLayer.hpp:21

armnn::BatchToSpaceNdLayer
This layer represents a BatchToSpaceNd operation.
Definition: BatchToSpaceNdLayer.hpp:14

armnn::ConcatLayer
This layer represents a merge operation.
Definition: ConcatLayer.hpp:14

armnn::ConstTensorHandle::GetTensorInfo
const TensorInfo & GetTensorInfo() const
Definition: TensorHandle.hpp:40

armnn::ConstTensor
A tensor defined by a TensorInfo (shape and data type) and an immutable backing store.
Definition: Tensor.hpp:330

armnn::ConstantLayer
A layer that the constant data can be bound to.
Definition: ConstantLayer.hpp:16

armnn::ConstantLayer::m_LayerOutput
std::shared_ptr< ConstTensorHandle > m_LayerOutput
Definition: ConstantLayer.hpp:46

armnn::ConvertFp16ToFp32Layer
This layer converts data type Float 16 to Float 32.
Definition: ConvertFp16ToFp32Layer.hpp:15

armnn::ConvertFp32ToFp16Layer
This layer converts data type Float 32 to Float 16.
Definition: ConvertFp32ToFp16Layer.hpp:14

armnn::Convolution2dLayer
This layer represents a convolution 2d operation.
Definition: Convolution2dLayer.hpp:16

armnn::DepthwiseConvolution2dLayer
This layer represents a depthwise convolution 2d operation.
Definition: DepthwiseConvolution2dLayer.hpp:16

armnn::ElementwiseBinaryLayer
This layer represents a elementwiseBinary operation.
Definition: ElementwiseBinaryLayer.hpp:15

armnn::ElementwiseUnaryLayer
This layer represents a elementwiseUnary operation.
Definition: ElementwiseUnaryLayer.hpp:15

armnn::FullyConnectedLayer
This layer represents a fully connected operation.
Definition: FullyConnectedLayer.hpp:16

armnn::Graph
Definition: Graph.hpp:31

armnn::Graph::AddLayer
LayerT * AddLayer(Args &&... args)
Adds a new layer, of type LayerType, to the graph constructed with the arguments passed.
Definition: Graph.hpp:466

armnn::Graph::TopologicalSort
Graph & TopologicalSort()
Sorts layers in topological order and return this.
Definition: Graph.hpp:191

armnn::IConnectableLayer
Interface for a layer that is connectable to other layers via InputSlots and OutputSlots.
Definition: INetwork.hpp:81

armnn::IConnectableLayer::GetInputSlot
virtual const IInputSlot & GetInputSlot(unsigned int index) const =0
Get a const input slot handle by slot index.

armnn::IConnectableLayer::GetOutputSlot
virtual const IOutputSlot & GetOutputSlot(unsigned int index) const =0
Get the const output slot handle by slot index.

armnn::INetwork::Create
static INetworkPtr Create(const NetworkOptions &networkOptions={})
Definition: Network.cpp:682

armnn::IOutputSlot::SetTensorInfo
virtual void SetTensorInfo(const TensorInfo &tensorInfo)=0

armnn::IOutputSlot::Connect
virtual int Connect(IInputSlot &destination)=0

armnn::IRuntime::Create
static IRuntimePtr Create(const CreationOptions &options)
Definition: Runtime.cpp:52

armnn::IWorkloadFactory
Definition: WorkloadFactory.hpp:23

armnn::IWorkloadFactory::IsLayerSupported
static bool IsLayerSupported(const BackendId &backendId, const IConnectableLayer &layer, Optional< DataType > dataType, std::string &outReasonIfUnsupported)
Definition: WorkloadFactory.cpp:1629

armnn::IWorkloadFactory::GetBackendId
virtual const BackendId & GetBackendId() const =0

armnn::InputLayer
A layer user-provided data can be bound to (e.g. inputs, outputs).
Definition: InputLayer.hpp:14

armnn::L2NormalizationLayer
This layer represents a L2 normalization operation.
Definition: L2NormalizationLayer.hpp:14

armnn::Layer
Definition: Layer.hpp:231

armnn::Layer::CreateWorkload
virtual std::unique_ptr< IWorkload > CreateWorkload(const IWorkloadFactory &factory) const =0

armnn::Layer::SetBackendId
void SetBackendId(const BackendId &id) override
Set the backend of the IConnectableLayer.
Definition: Layer.hpp:291

armnn::Layer::CreateTensorHandles
virtual void CreateTensorHandles(const TensorHandleFactoryRegistry &registry, const IWorkloadFactory &factory, const bool IsMemoryManaged=true)
Definition: Layer.cpp:308

armnn::Layer::SetAdditionalInfoForObject
void SetAdditionalInfoForObject(const AdditionalInfoObjectPtr &additionalInfo)
Definition: Layer.hpp:373

armnn::Layer::GetDataType
DataType GetDataType() const
Definition: Layer.cpp:345

armnn::Layer::GetAdditionalInformation
std::shared_ptr< T > GetAdditionalInformation() const
Definition: Layer.hpp:368

armnn::LogSoftmaxLayer
This layer represents a log softmax operation.
Definition: LogSoftmaxLayer.hpp:15

armnn::LstmLayer
This layer represents a LSTM operation.
Definition: LstmLayer.hpp:17

armnn::LstmLayer::m_PeepholeParameters
LstmOptPeepholeParameters m_PeepholeParameters
Definition: LstmLayer.hpp:23

armnn::LstmLayer::m_BasicParameters
LstmBasicParameters m_BasicParameters
Definition: LstmLayer.hpp:20

armnn::MeanLayer
This layer represents a mean operation.
Definition: MeanLayer.hpp:15

armnn::MultiplicationLayer
This layer represents a multiplication operation.
Definition: MultiplicationLayer.hpp:15

armnn::NormalizationLayer
This layer represents a normalization operation.
Definition: NormalizationLayer.hpp:14

armnn::OptimizerOptionsOpaque
Definition: INetwork.hpp:273

armnn::OutputLayer
A layer user-provided data can be bound to (e.g. inputs, outputs).
Definition: OutputLayer.hpp:14

armnn::Pooling2dLayer
This layer represents a pooling 2d operation.
Definition: Pooling2dLayer.hpp:14

armnn::PreluLayer
Definition: PreluLayer.hpp:15

armnn::QLstmLayer
This layer represents a QLstm operation.
Definition: QLstmLayer.hpp:80

armnn::QLstmLayer::m_BasicParameters
QLstmBasicParameters m_BasicParameters
Definition: QLstmLayer.hpp:83

armnn::QLstmLayer::m_LayerNormParameters
QLstmOptLayerNormParameters m_LayerNormParameters
Definition: QLstmLayer.hpp:87

armnn::QuantizedLstmLayer
This layer represents a QuantizedLstm operation.
Definition: QuantizedLstmLayer.hpp:46

armnn::ReshapeLayer
This layer represents a reshape operation.
Definition: ReshapeLayer.hpp:16

armnn::ResizeLayer
This layer represents a resize operation.
Definition: ResizeLayer.hpp:14

armnn::SoftmaxLayer
This layer represents a softmax operation.
Definition: SoftmaxLayer.hpp:14

armnn::SpaceToDepthLayer
This layer represents a SpaceToDepth operation.
Definition: SpaceToDepthLayer.hpp:15

armnn::SplitterLayer
This layer represents a split operation.
Definition: SplitterLayer.hpp:14

armnn::StackLayer
This layer represents a stack operation.
Definition: StackLayer.hpp:14

armnn::SubtractionLayer
This layer represents a subtraction operation.
Definition: SubtractionLayer.hpp:15

armnn::TensorHandleFactoryRegistry
Definition: TensorHandleFactoryRegistry.hpp:24

armnn::TensorInfo
Definition: Tensor.hpp:153

armnn::TensorInfo::SetQuantizationOffset
void SetQuantizationOffset(int32_t offset)
Definition: Tensor.cpp:493

armnn::TensorInfo::SetConstant
void SetConstant(const bool IsConstant=true)
Marks the data corresponding to this tensor info as constant.
Definition: Tensor.cpp:518

armnn::TensorShape
Definition: Tensor.hpp:21

armnnUtils::DataLayoutIndexed
Provides access to the appropriate indexes for Channels, Height and Width based on DataLayout.
Definition: DataLayoutIndexed.hpp:18

armnnUtils::DataLayoutIndexed::GetWidthIndex
unsigned int GetWidthIndex() const
Definition: DataLayoutIndexed.hpp:25

armnnUtils::DataLayoutIndexed::GetHeightIndex
unsigned int GetHeightIndex() const
Definition: DataLayoutIndexed.hpp:24

armnn
Copyright (c) 2021 ARM Limited and Contributors.
Definition: 01_00_quick_start.dox:7

armnn::ResolveType
typename ResolveTypeImpl< DT >::Type ResolveType
Definition: ResolveType.hpp:79

armnn::IRuntimePtr
std::unique_ptr< IRuntime, void(*)(IRuntime *runtime)> IRuntimePtr
Definition: IRuntime.hpp:39

armnn::UnaryOperation
UnaryOperation
Definition: Types.hpp:126

armnn::IgnoreUnused
void IgnoreUnused(Ts &&...)
Definition: IgnoreUnused.hpp:14

armnn::ActivationFunction
ActivationFunction
Definition: Types.hpp:87

armnn::ActivationFunction::ReLu
@ ReLu

armnn::ActivationFunction::BoundedReLu
@ BoundedReLu
min(a, max(b, input)) ReLu1 & ReLu6.

armnn::LayerType
LayerType
When adding a new layer, adapt also the LastLayer enum value in the enum class LayerType below.
Definition: Types.hpp:494

armnn::LayerType::PreCompiled
@ PreCompiled

armnn::ModelOptions
std::vector< BackendOptions > ModelOptions
Definition: BackendOptions.hpp:18

armnn::IOptimizedNetworkPtr
std::unique_ptr< IOptimizedNetwork, void(*)(IOptimizedNetwork *network)> IOptimizedNetworkPtr
Definition: INetwork.hpp:340

armnn::GetGraphForTesting
Graph & GetGraphForTesting(IOptimizedNetwork *optNet)
Definition: TestUtils.cpp:49

armnn::CreateDescriptorForConcatenation
OriginsDescriptor CreateDescriptorForConcatenation(TensorShapeIt first, TensorShapeIt last, unsigned int concatenationDimension)
Convenience template to create an OriginsDescriptor to use when creating a ConcatLayer for performing...
Definition: Descriptors.hpp:300

armnn::GetBiasDataType
DataType GetBiasDataType(DataType inputDataType)
Definition: WorkloadData.cpp:28

armnn::PoolingAlgorithm::Average
@ Average

armnn::ResizeMethod::Bilinear
@ Bilinear

armnn::Optimize
IOptimizedNetworkPtr Optimize(const INetwork &network, const std::vector< BackendId > &backendPreferences, const IDeviceSpec &deviceSpec, const OptimizerOptionsOpaque &options=OptimizerOptionsOpaque(), Optional< std::vector< std::string > & > messages=EmptyOptional())
Create an optimized version of the network.
Definition: Network.cpp:2286

armnn::NormalizationAlgorithmChannel::Across
@ Across

armnn::BinaryOperation
BinaryOperation
Definition: Types.hpp:139

armnn::INetworkPtr
std::unique_ptr< INetwork, void(*)(INetwork *network)> INetworkPtr
Definition: INetwork.hpp:339

armnn::DataLayout
DataLayout
Definition: Types.hpp:63

armnn::DataLayout::NCHW
@ NCHW

armnn::DataLayout::NHWC
@ NHWC

armnn::NormalizationAlgorithmMethod::LocalBrightness
@ LocalBrightness
Krichevsky 2012: Local Brightness Normalization.

armnn::DataType
DataType
Definition: Types.hpp:49

armnn::DataType::QSymmS16
@ QSymmS16

armnn::DataType::QAsymmU8
@ QAsymmU8

armnn::DataType::Float32
@ Float32

armnn::DataType::Float16
@ Float16

armnn::DataType::QSymmS8
@ QSymmS8

armnn::DataType::QAsymmS8
@ QAsymmS8

armnn::DataType::Signed32
@ Signed32

armnn::OutputShapeRounding::Floor
@ Floor

armnn::Compute::CpuAcc
@ CpuAcc
CPU Execution: NEON: ArmCompute.

armnn::Compute::GpuAcc
@ GpuAcc
GPU Execution: OpenCL: ArmCompute.

std
Definition: BackendId.hpp:150

armnn::ActivationDescriptor
An ActivationDescriptor for the ActivationLayer.
Definition: Descriptors.hpp:37

armnn::ActivationDescriptor::m_A
float m_A
Alpha upper bound value used by the activation functions. (BoundedReLu, Linear, TanH,...
Definition: Descriptors.hpp:61

armnn::ActivationDescriptor::m_B
float m_B
Beta lower bound value used by the activation functions. (BoundedReLu, Linear, TanH).
Definition: Descriptors.hpp:63

armnn::ActivationDescriptor::m_Function
ActivationFunction m_Function
The activation function to use (Sigmoid, TanH, Linear, ReLu, BoundedReLu, SoftReLu,...
Definition: Descriptors.hpp:59

armnn::ActivationQueueDescriptor
Definition: WorkloadData.hpp:159

armnn::BatchNormalizationDescriptor
A BatchNormalizationDescriptor for the BatchNormalizationLayer.
Definition: Descriptors.hpp:829

armnn::BatchNormalizationDescriptor::m_Eps
float m_Eps
Value to add to the variance. Used to avoid dividing by zero.
Definition: Descriptors.hpp:841

armnn::BatchNormalizationDescriptor::m_DataLayout
DataLayout m_DataLayout
The data layout to be used (NCHW, NHWC).
Definition: Descriptors.hpp:843

armnn::BatchNormalizationQueueDescriptor
Definition: WorkloadData.hpp:312

armnn::BatchNormalizationQueueDescriptor::m_Mean
const ConstTensorHandle * m_Mean
Definition: WorkloadData.hpp:321

armnn::BatchNormalizationQueueDescriptor::m_Variance
const ConstTensorHandle * m_Variance
Definition: WorkloadData.hpp:322

armnn::BatchNormalizationQueueDescriptor::m_Gamma
const ConstTensorHandle * m_Gamma
Definition: WorkloadData.hpp:324

armnn::BatchNormalizationQueueDescriptor::m_Beta
const ConstTensorHandle * m_Beta
Definition: WorkloadData.hpp:323

armnn::BatchToSpaceNdDescriptor
A BatchToSpaceNdDescriptor for the BatchToSpaceNdLayer.
Definition: Descriptors.hpp:876

armnn::BatchToSpaceNdQueueDescriptor
Definition: WorkloadData.hpp:463

armnn::ConvertFp16ToFp32QueueDescriptor
Definition: WorkloadData.hpp:453

armnn::ConvertFp32ToFp16QueueDescriptor
Definition: WorkloadData.hpp:458

armnn::Convolution2dDescriptor
A Convolution2dDescriptor for the Convolution2dLayer.
Definition: Descriptors.hpp:535

armnn::Convolution2dDescriptor::m_PadRight
uint32_t m_PadRight
Padding right value in the width dimension.
Definition: Descriptors.hpp:568

armnn::Convolution2dDescriptor::m_PadTop
uint32_t m_PadTop
Padding top value in the height dimension.
Definition: Descriptors.hpp:570

armnn::Convolution2dDescriptor::m_DataLayout
DataLayout m_DataLayout
The data layout to be used (NCHW, NHWC).
Definition: Descriptors.hpp:584

armnn::Convolution2dDescriptor::m_PadBottom
uint32_t m_PadBottom
Padding bottom value in the height dimension.
Definition: Descriptors.hpp:572

armnn::Convolution2dDescriptor::m_PadLeft
uint32_t m_PadLeft
Padding left value in the width dimension.
Definition: Descriptors.hpp:566

armnn::Convolution2dDescriptor::m_StrideY
uint32_t m_StrideY
Stride value when proceeding through input for the height dimension.
Definition: Descriptors.hpp:576

armnn::Convolution2dDescriptor::m_BiasEnabled
bool m_BiasEnabled
Enable/disable bias.
Definition: Descriptors.hpp:582

armnn::Convolution2dDescriptor::m_StrideX
uint32_t m_StrideX
Stride value when proceeding through input for the width dimension.
Definition: Descriptors.hpp:574

armnn::Convolution2dQueueDescriptor
Definition: WorkloadData.hpp:211

armnn::DepthwiseConvolution2dDescriptor
A DepthwiseConvolution2dDescriptor for the DepthwiseConvolution2dLayer.
Definition: Descriptors.hpp:660

armnn::DepthwiseConvolution2dDescriptor::m_PadRight
uint32_t m_PadRight
Padding right value in the width dimension.
Definition: Descriptors.hpp:694

armnn::DepthwiseConvolution2dDescriptor::m_PadTop
uint32_t m_PadTop
Padding top value in the height dimension.
Definition: Descriptors.hpp:696

armnn::DepthwiseConvolution2dDescriptor::m_DataLayout
DataLayout m_DataLayout
The data layout to be used (NCHW, NHWC).
Definition: Descriptors.hpp:710

armnn::DepthwiseConvolution2dDescriptor::m_PadBottom
uint32_t m_PadBottom
Padding bottom value in the height dimension.
Definition: Descriptors.hpp:698

armnn::DepthwiseConvolution2dDescriptor::m_PadLeft
uint32_t m_PadLeft
Padding left value in the width dimension.
Definition: Descriptors.hpp:692

armnn::DepthwiseConvolution2dDescriptor::m_StrideY
uint32_t m_StrideY
Stride value when proceeding through input for the height dimension.
Definition: Descriptors.hpp:702

armnn::DepthwiseConvolution2dDescriptor::m_BiasEnabled
bool m_BiasEnabled
Enable/disable bias.
Definition: Descriptors.hpp:708

armnn::DepthwiseConvolution2dDescriptor::m_StrideX
uint32_t m_StrideX
Stride value when proceeding through input for the width dimension.
Definition: Descriptors.hpp:700

armnn::DepthwiseConvolution2dQueueDescriptor
Depthwise Convolution 2D layer workload data.
Definition: WorkloadData.hpp:235

armnn::ElementwiseBinaryDescriptor
A ElementwiseBinaryDescriptor for the ElementwiseBinaryLayer.
Definition: Descriptors.hpp:110

armnn::ElementwiseUnaryDescriptor
A ElementwiseUnaryDescriptor for the ElementwiseUnaryLayer.
Definition: Descriptors.hpp:130

armnn::FullyConnectedDescriptor
A FullyConnectedDescriptor for the FullyConnectedLayer.
Definition: Descriptors.hpp:508

armnn::FullyConnectedDescriptor::m_TransposeWeightMatrix
bool m_TransposeWeightMatrix
Enable/disable transpose weight matrix.
Definition: Descriptors.hpp:528

armnn::FullyConnectedDescriptor::m_ConstantWeights
bool m_ConstantWeights
Enable/disable constant weights and biases.
Definition: Descriptors.hpp:530

armnn::FullyConnectedDescriptor::m_BiasEnabled
bool m_BiasEnabled
Enable/disable bias.
Definition: Descriptors.hpp:526

armnn::FullyConnectedQueueDescriptor
Definition: WorkloadData.hpp:181

armnn::IRuntime::CreationOptions
Definition: IRuntime.hpp:71

armnn::L2NormalizationDescriptor
A L2NormalizationDescriptor for the L2NormalizationLayer.
Definition: Descriptors.hpp:810

armnn::L2NormalizationDescriptor::m_DataLayout
DataLayout m_DataLayout
The data layout to be used (NCHW, NHWC).
Definition: Descriptors.hpp:824

armnn::L2NormalizationQueueDescriptor
Definition: WorkloadData.hpp:359

armnn::LogSoftmaxQueueDescriptor
Definition: WorkloadData.hpp:364

armnn::LstmBasicParameters::m_RecurrentToForgetWeights
std::shared_ptr< ConstTensorHandle > m_RecurrentToForgetWeights
A unique pointer to represent 2D weights tensor with dimensions [output_size, num_units].
Definition: LstmParameters.hpp:63

armnn::LstmBasicParameters::m_CellBias
std::shared_ptr< ConstTensorHandle > m_CellBias
A unique pointer to represent 1D weights tensor with dimensions [num_units].
Definition: LstmParameters.hpp:71

armnn::LstmBasicParameters::m_InputToOutputWeights
std::shared_ptr< ConstTensorHandle > m_InputToOutputWeights
A unique pointer to represent 2D weights tensor with dimensions [input_size, num_units].
Definition: LstmParameters.hpp:61

armnn::LstmBasicParameters::m_RecurrentToCellWeights
std::shared_ptr< ConstTensorHandle > m_RecurrentToCellWeights
A unique pointer to represent 2D weights tensor with dimensions [output_size, num_units].
Definition: LstmParameters.hpp:65

armnn::LstmBasicParameters::m_OutputGateBias
std::shared_ptr< ConstTensorHandle > m_OutputGateBias
A unique pointer to represent 1D weights tensor with dimensions [num_units].
Definition: LstmParameters.hpp:73

armnn::LstmBasicParameters::m_InputToForgetWeights
std::shared_ptr< ConstTensorHandle > m_InputToForgetWeights
A unique pointer to represent 2D weights tensor with dimensions [input_size, num_units].
Definition: LstmParameters.hpp:57

armnn::LstmBasicParameters::m_InputToCellWeights
std::shared_ptr< ConstTensorHandle > m_InputToCellWeights
A unique pointer to represent 2D weights tensor with dimensions [input_size, num_units].
Definition: LstmParameters.hpp:59

armnn::LstmBasicParameters::m_RecurrentToOutputWeights
std::shared_ptr< ConstTensorHandle > m_RecurrentToOutputWeights
A unique pointer to represent 2D weights tensor with dimensions [output_size, num_units].
Definition: LstmParameters.hpp:67

armnn::LstmBasicParameters::m_ForgetGateBias
std::shared_ptr< ConstTensorHandle > m_ForgetGateBias
A unique pointer to represent 1D weights tensor with dimensions [num_units].
Definition: LstmParameters.hpp:69

armnn::LstmDescriptor
An LstmDescriptor for the LstmLayer.
Definition: Descriptors.hpp:1103

armnn::LstmDescriptor::m_PeepholeEnabled
bool m_PeepholeEnabled
Enable/disable peephole.
Definition: Descriptors.hpp:1148

armnn::LstmDescriptor::m_ClippingThresCell
float m_ClippingThresCell
Clipping threshold value for the cell state.
Definition: Descriptors.hpp:1142

armnn::LstmDescriptor::m_ProjectionEnabled
bool m_ProjectionEnabled
Enable/disable the projection layer.
Definition: Descriptors.hpp:1150

armnn::LstmDescriptor::m_ClippingThresProj
float m_ClippingThresProj
Clipping threshold value for the projection.
Definition: Descriptors.hpp:1144

armnn::LstmDescriptor::m_CifgEnabled
bool m_CifgEnabled
Enable/disable cifg (coupled input & forget gate).
Definition: Descriptors.hpp:1146

armnn::LstmDescriptor::m_ActivationFunc
uint32_t m_ActivationFunc
The activation function to use.
Definition: Descriptors.hpp:1140

armnn::LstmOptPeepholeParameters::m_CellToForgetWeights
std::shared_ptr< ConstTensorHandle > m_CellToForgetWeights
A unique pointer to represent 1D weights tensor with dimensions [num_units].
Definition: LstmParameters.hpp:49

armnn::LstmOptPeepholeParameters::m_CellToOutputWeights
std::shared_ptr< ConstTensorHandle > m_CellToOutputWeights
A unique pointer to represent 1D weights tensor with dimensions [num_units].
Definition: LstmParameters.hpp:51

armnn::LstmQueueDescriptor
Definition: WorkloadData.hpp:401

armnn::LstmQueueDescriptor::m_OutputGateBias
const ConstTensorHandle * m_OutputGateBias
Definition: WorkloadData.hpp:441

armnn::LstmQueueDescriptor::m_CellBias
const ConstTensorHandle * m_CellBias
Definition: WorkloadData.hpp:440

armnn::LstmQueueDescriptor::m_InputToForgetWeights
const ConstTensorHandle * m_InputToForgetWeights
Definition: WorkloadData.hpp:428

armnn::MeanDescriptor
A MeanDescriptor for the MeanLayer.
Definition: Descriptors.hpp:1173

armnn::MeanDescriptor::m_Axis
std::vector< unsigned int > m_Axis
Values for the dimensions to reduce.
Definition: Descriptors.hpp:1190

armnn::MeanDescriptor::m_KeepDims
bool m_KeepDims
Enable/disable keep dimensions. If true, then the reduced dimensions that are of length 1 are kept.
Definition: Descriptors.hpp:1192

armnn::MeanQueueDescriptor
Definition: WorkloadData.hpp:289

armnn::NormalizationDescriptor
A NormalizationDescriptor for the NormalizationLayer.
Definition: Descriptors.hpp:770

armnn::NormalizationDescriptor::m_NormMethodType
NormalizationAlgorithmMethod m_NormMethodType
Normalization method algorithm to use (LocalBrightness, LocalContrast).
Definition: Descriptors.hpp:795

armnn::NormalizationDescriptor::m_Alpha
float m_Alpha
Alpha value for the normalization equation.
Definition: Descriptors.hpp:799

armnn::NormalizationDescriptor::m_DataLayout
DataLayout m_DataLayout
The data layout to be used (NCHW, NHWC).
Definition: Descriptors.hpp:805

armnn::NormalizationDescriptor::m_Beta
float m_Beta
Beta value for the normalization equation.
Definition: Descriptors.hpp:801

armnn::NormalizationDescriptor::m_K
float m_K
Kappa value used for the across channel normalization equation.
Definition: Descriptors.hpp:803

armnn::NormalizationDescriptor::m_NormSize
uint32_t m_NormSize
Depth radius value.
Definition: Descriptors.hpp:797

armnn::NormalizationDescriptor::m_NormChannelType
NormalizationAlgorithmChannel m_NormChannelType
Normalization channel algorithm to use (Across, Within).
Definition: Descriptors.hpp:793

armnn::NormalizationQueueDescriptor
Definition: WorkloadData.hpp:253

armnn::OriginsDescriptor
An OriginsDescriptor for the ConcatLayer.
Definition: Descriptors.hpp:202

armnn::Pooling2dDescriptor
A Pooling2dDescriptor for the Pooling2dLayer.
Definition: Descriptors.hpp:372

armnn::Pooling2dDescriptor::m_PadRight
uint32_t m_PadRight
Padding right value in the width dimension.
Definition: Descriptors.hpp:409

armnn::Pooling2dDescriptor::m_PoolType
PoolingAlgorithm m_PoolType
The pooling algorithm to use (Max. Average, L2).
Definition: Descriptors.hpp:405

armnn::Pooling2dDescriptor::m_PoolHeight
uint32_t m_PoolHeight
Pooling height value.
Definition: Descriptors.hpp:417

armnn::Pooling2dDescriptor::m_PadTop
uint32_t m_PadTop
Padding top value in the height dimension.
Definition: Descriptors.hpp:411

armnn::Pooling2dDescriptor::m_DataLayout
DataLayout m_DataLayout
The data layout to be used (NCHW, NHWC).
Definition: Descriptors.hpp:427

armnn::Pooling2dDescriptor::m_PoolWidth
uint32_t m_PoolWidth
Pooling width value.
Definition: Descriptors.hpp:415

armnn::Pooling2dDescriptor::m_PadBottom
uint32_t m_PadBottom
Padding bottom value in the height dimension.
Definition: Descriptors.hpp:413

armnn::Pooling2dDescriptor::m_PadLeft
uint32_t m_PadLeft
Padding left value in the width dimension.
Definition: Descriptors.hpp:407

armnn::Pooling2dDescriptor::m_StrideY
uint32_t m_StrideY
Stride value when proceeding through input for the height dimension.
Definition: Descriptors.hpp:421

armnn::Pooling2dDescriptor::m_StrideX
uint32_t m_StrideX
Stride value when proceeding through input for the width dimension.
Definition: Descriptors.hpp:419

armnn::Pooling2dDescriptor::m_OutputShapeRounding
OutputShapeRounding m_OutputShapeRounding
The rounding method for the output shape. (Floor, Ceiling).
Definition: Descriptors.hpp:423

armnn::Pooling2dQueueDescriptor
Definition: WorkloadData.hpp:198

armnn::PreCompiledQueueDescriptor
Definition: WorkloadData.hpp:513

armnn::PreluQueueDescriptor
Definition: WorkloadData.hpp:540

armnn::QLstmBasicParameters::m_RecurrentToForgetWeights
std::shared_ptr< ConstTensorHandle > m_RecurrentToForgetWeights
A unique pointer to represent 2D weights tensor with dimensions [num_units, outputSize] (QSymmS8).
Definition: QLstmLayer.hpp:24

armnn::QLstmBasicParameters::m_CellBias
std::shared_ptr< ConstTensorHandle > m_CellBias
A unique pointer to represent 1D bias tensor with dimensions [num_units] (int32).
Definition: QLstmLayer.hpp:33

armnn::QLstmBasicParameters::m_InputToOutputWeights
std::shared_ptr< ConstTensorHandle > m_InputToOutputWeights
A unique pointer to represent 2D weights tensor with dimensions [num_units, inputSize] (QSymmS8).
Definition: QLstmLayer.hpp:21

armnn::QLstmBasicParameters::m_RecurrentToCellWeights
std::shared_ptr< ConstTensorHandle > m_RecurrentToCellWeights
A unique pointer to represent 2D weights tensor with dimensions [num_units, outputSize] (QSymmS8).
Definition: QLstmLayer.hpp:26

armnn::QLstmBasicParameters::m_OutputGateBias
std::shared_ptr< ConstTensorHandle > m_OutputGateBias
A unique pointer to represent 1D bias tensor with dimensions [num_units] (int32).
Definition: QLstmLayer.hpp:35

armnn::QLstmBasicParameters::m_InputToForgetWeights
std::shared_ptr< ConstTensorHandle > m_InputToForgetWeights
A unique pointer to represent 2D weights tensor with dimensions [num_units, inputSize] (QSymmS8).
Definition: QLstmLayer.hpp:17

armnn::QLstmBasicParameters::m_InputToCellWeights
std::shared_ptr< ConstTensorHandle > m_InputToCellWeights
A unique pointer to represent 2D weights tensor with dimensions [num_units, inputSize] (QSymmS8).
Definition: QLstmLayer.hpp:19

armnn::QLstmBasicParameters::m_RecurrentToOutputWeights
std::shared_ptr< ConstTensorHandle > m_RecurrentToOutputWeights
A unique pointer to represent 2D weights tensor with dimensions [num_units, outputSize] (QSymmS8).
Definition: QLstmLayer.hpp:28

armnn::QLstmBasicParameters::m_ForgetGateBias
std::shared_ptr< ConstTensorHandle > m_ForgetGateBias
A unique pointer to represent 1D bias tensor with dimensions [num_units] (int32).
Definition: QLstmLayer.hpp:31

armnn::QLstmDescriptor
A QLstmDescriptor for the QLstmLayer.
Definition: Descriptors.hpp:1381

armnn::QLstmDescriptor::m_CellIntermediateScale
float m_CellIntermediateScale
Cell intermediate quantization scale.
Definition: Descriptors.hpp:1430

armnn::QLstmDescriptor::m_InputIntermediateScale
float m_InputIntermediateScale
Input intermediate quantization scale.
Definition: Descriptors.hpp:1426

armnn::QLstmDescriptor::m_PeepholeEnabled
bool m_PeepholeEnabled
Enable/disable peephole.
Definition: Descriptors.hpp:1420

armnn::QLstmDescriptor::m_HiddenStateZeroPoint
int32_t m_HiddenStateZeroPoint
Hidden State zero point.
Definition: Descriptors.hpp:1434

armnn::QLstmDescriptor::m_LayerNormEnabled
bool m_LayerNormEnabled
Enable/disable layer normalization.
Definition: Descriptors.hpp:1424

armnn::QLstmDescriptor::m_ProjectionEnabled
bool m_ProjectionEnabled
Enable/disable the projection layer.
Definition: Descriptors.hpp:1422

armnn::QLstmDescriptor::m_OutputIntermediateScale
float m_OutputIntermediateScale
Output intermediate quantization scale.
Definition: Descriptors.hpp:1432

armnn::QLstmDescriptor::m_ProjectionClip
float m_ProjectionClip
Clipping threshold value for the projection.
Definition: Descriptors.hpp:1416

armnn::QLstmDescriptor::m_CellClip
float m_CellClip
Clipping threshold value for the cell state.
Definition: Descriptors.hpp:1414

armnn::QLstmDescriptor::m_CifgEnabled
bool m_CifgEnabled
Enable/disable CIFG (coupled input & forget gate).
Definition: Descriptors.hpp:1418

armnn::QLstmDescriptor::m_HiddenStateScale
float m_HiddenStateScale
Hidden State quantization scale.
Definition: Descriptors.hpp:1436

armnn::QLstmDescriptor::m_ForgetIntermediateScale
float m_ForgetIntermediateScale
Forget intermediate quantization scale.
Definition: Descriptors.hpp:1428

armnn::QLstmOptLayerNormParameters::m_CellLayerNormWeights
std::shared_ptr< ConstTensorHandle > m_CellLayerNormWeights
A unique pointer to represent 1D weights tensor with dimensions [num_units] (QSymmS16).
Definition: QLstmLayer.hpp:73

armnn::QLstmOptLayerNormParameters::m_OutputLayerNormWeights
std::shared_ptr< ConstTensorHandle > m_OutputLayerNormWeights
A unique pointer to represent 1D weights tensor with dimensions [num_units] (QSymmS16).
Definition: QLstmLayer.hpp:75

armnn::QLstmOptLayerNormParameters::m_ForgetLayerNormWeights
std::shared_ptr< ConstTensorHandle > m_ForgetLayerNormWeights
A unique pointer to represent 1D weights tensor with dimensions [num_units] (QSymmS16).
Definition: QLstmLayer.hpp:71

armnn::QLstmQueueDescriptor
Definition: WorkloadData.hpp:563

armnn::QLstmQueueDescriptor::m_InputToOutputWeights
const ConstTensorHandle * m_InputToOutputWeights
Definition: WorkloadData.hpp:592

armnn::QLstmQueueDescriptor::m_ForgetGateBias
const ConstTensorHandle * m_ForgetGateBias
Definition: WorkloadData.hpp:601

armnn::QLstmQueueDescriptor::m_RecurrentToOutputWeights
const ConstTensorHandle * m_RecurrentToOutputWeights
Definition: WorkloadData.hpp:596

armnn::QLstmQueueDescriptor::m_OutputGateBias
const ConstTensorHandle * m_OutputGateBias
Definition: WorkloadData.hpp:603

armnn::QLstmQueueDescriptor::m_CellBias
const ConstTensorHandle * m_CellBias
Definition: WorkloadData.hpp:602

armnn::QLstmQueueDescriptor::m_InputToCellWeights
const ConstTensorHandle * m_InputToCellWeights
Definition: WorkloadData.hpp:591

armnn::QLstmQueueDescriptor::m_InputToForgetWeights
const ConstTensorHandle * m_InputToForgetWeights
Definition: WorkloadData.hpp:590

armnn::QLstmQueueDescriptor::m_RecurrentToCellWeights
const ConstTensorHandle * m_RecurrentToCellWeights
Definition: WorkloadData.hpp:595

armnn::QLstmQueueDescriptor::m_RecurrentToForgetWeights
const ConstTensorHandle * m_RecurrentToForgetWeights
Definition: WorkloadData.hpp:594

armnn::QuantizedLstmQueueDescriptor
Definition: WorkloadData.hpp:615

armnn::QuantizedLstmQueueDescriptor::m_InputToOutputWeights
const ConstTensorHandle * m_InputToOutputWeights
Definition: WorkloadData.hpp:636

armnn::QuantizedLstmQueueDescriptor::m_RecurrentToInputWeights
const ConstTensorHandle * m_RecurrentToInputWeights
Definition: WorkloadData.hpp:638

armnn::QuantizedLstmQueueDescriptor::m_ForgetGateBias
const ConstTensorHandle * m_ForgetGateBias
Definition: WorkloadData.hpp:644

armnn::QuantizedLstmQueueDescriptor::m_InputGateBias
const ConstTensorHandle * m_InputGateBias
Definition: WorkloadData.hpp:643

armnn::QuantizedLstmQueueDescriptor::m_RecurrentToOutputWeights
const ConstTensorHandle * m_RecurrentToOutputWeights
Definition: WorkloadData.hpp:641

armnn::QuantizedLstmQueueDescriptor::m_OutputGateBias
const ConstTensorHandle * m_OutputGateBias
Definition: WorkloadData.hpp:646

armnn::QuantizedLstmQueueDescriptor::m_CellBias
const ConstTensorHandle * m_CellBias
Definition: WorkloadData.hpp:645

armnn::QuantizedLstmQueueDescriptor::m_InputToCellWeights
const ConstTensorHandle * m_InputToCellWeights
Definition: WorkloadData.hpp:635

armnn::QuantizedLstmQueueDescriptor::m_InputToForgetWeights
const ConstTensorHandle * m_InputToForgetWeights
Definition: WorkloadData.hpp:634

armnn::QuantizedLstmQueueDescriptor::m_InputToInputWeights
const ConstTensorHandle * m_InputToInputWeights
Definition: WorkloadData.hpp:633

armnn::QuantizedLstmQueueDescriptor::m_RecurrentToCellWeights
const ConstTensorHandle * m_RecurrentToCellWeights
Definition: WorkloadData.hpp:640

armnn::QuantizedLstmQueueDescriptor::m_RecurrentToForgetWeights
const ConstTensorHandle * m_RecurrentToForgetWeights
Definition: WorkloadData.hpp:639

armnn::QueueDescriptor::GetAdditionalInformation
const T * GetAdditionalInformation() const
Definition: WorkloadData.hpp:47

armnn::QueueDescriptor::m_Inputs
std::vector< ITensorHandle * > m_Inputs
Definition: WorkloadData.hpp:26

armnn::QueueDescriptor::m_Outputs
std::vector< ITensorHandle * > m_Outputs
Definition: WorkloadData.hpp:27

armnn::QueueDescriptorWithParameters::m_Parameters
LayerDescriptor m_Parameters
Definition: WorkloadData.hpp:66

armnn::ReshapeDescriptor
A ReshapeDescriptor for the ReshapeLayer.
Definition: Descriptors.hpp:1024

armnn::ReshapeDescriptor::m_TargetShape
TensorShape m_TargetShape
Target shape value.
Definition: Descriptors.hpp:1039

armnn::ReshapeQueueDescriptor
Definition: WorkloadData.hpp:381

armnn::ResizeDescriptor
A ResizeDescriptor for the ResizeLayer.
Definition: Descriptors.hpp:986

armnn::ResizeDescriptor::m_TargetHeight
uint32_t m_TargetHeight
Target height value.
Definition: Descriptors.hpp:1009

armnn::ResizeDescriptor::m_DataLayout
DataLayout m_DataLayout
The data layout to be used (NCHW, NHWC).
Definition: Descriptors.hpp:1014

armnn::ResizeDescriptor::m_Method
ResizeMethod m_Method
The Interpolation method to use (Bilinear, NearestNeighbor).
Definition: Descriptors.hpp:1012

armnn::ResizeDescriptor::m_TargetWidth
uint32_t m_TargetWidth
Target width value.
Definition: Descriptors.hpp:1007

armnn::SoftmaxDescriptor
A SoftmaxDescriptor for the SoftmaxLayer.
Definition: Descriptors.hpp:178

armnn::SoftmaxDescriptor::m_Axis
int m_Axis
Scalar, defaulted to the last index (-1), specifying the dimension the activation will be performed o...
Definition: Descriptors.hpp:192

armnn::SoftmaxQueueDescriptor
Definition: WorkloadData.hpp:106

armnn::SpaceToDepthDescriptor
A SpaceToDepthDescriptor for the SpaceToDepthLayer.
Definition: Descriptors.hpp:1076

armnn::SpaceToDepthDescriptor::m_BlockSize
unsigned int m_BlockSize
Scalar specifying the input block size. It must be >= 1.
Definition: Descriptors.hpp:1092

armnn::SpaceToDepthQueueDescriptor
Definition: WorkloadData.hpp:391

armnn::SplitterQueueDescriptor
Definition: WorkloadData.hpp:112

armnn::SplitterQueueDescriptor::m_ViewOrigins
std::vector< ViewOrigin > m_ViewOrigins
Definition: WorkloadData.hpp:124

armnn::StackDescriptor
A StackDescriptor for the StackLayer.
Definition: Descriptors.hpp:1252

armnn::StackQueueDescriptor
Definition: WorkloadData.hpp:153

armnn::ViewsDescriptor
A ViewsDescriptor for the SplitterLayer.
Definition: Descriptors.hpp:245