armnn/latest/_neon_fused_workload_8cpp_source.html

//

// Copyright © 2023 Arm Ltd and Contributors. All rights reserved.

// SPDX-License-Identifier: MIT

//


#include "NeonFusedWorkload.hpp"

#include "NeonWorkloadUtils.hpp"


#include <aclCommon/ArmComputeTensorUtils.hpp>

#include <aclCommon/ArmComputeUtils.hpp>


#include <armnn/utility/PolymorphicDowncast.hpp>

#include <armnn/backends/TensorHandle.hpp>


#include <arm_compute/runtime/NEON/functions/NEAddMulAdd.h>


namespace armnn

{


using namespace armcomputetensorutils;


arm_compute::Status NeonFusedWorkloadValidate(const std::vector<std::reference_wrapper<TensorInfo>>& inputInfos,

                                              const std::vector<std::reference_wrapper<TensorInfo>>& outputInfos,

                                              const FusedDescriptor& fusedDescriptor,

                                              const ActivationDescriptor* activationDescriptor)

{

    std::vector<arm_compute::TensorInfo> actInputInfos;

    actInputInfos.reserve(inputInfos.size());

    for (size_t i = 0u; i < inputInfos.size(); ++i)

    {

        actInputInfos.emplace_back(BuildArmComputeTensorInfo(inputInfos[i]));

    }


    std::vector<arm_compute::TensorInfo> actOutputInfos;

    actOutputInfos.reserve(outputInfos.size());

    for (size_t i = 0u; i < outputInfos.size(); ++i)

    {

        actOutputInfos.emplace_back(BuildArmComputeTensorInfo(outputInfos[i]));

    }


    const arm_compute::ActivationLayerInfo activationInfo =

            ConvertActivationDescriptorToAclActivationLayerInfo(activationDescriptor);


    switch (fusedDescriptor.m_FusedKernelType)

    {

        case FusedKernelType::AddMulAdd:

            return arm_compute::NEAddMulAdd::validate(

                                &actInputInfos[0],

                                &actInputInfos[1],

                                &actInputInfos[2],  // bn_mul

                                &actInputInfos[3],  // bn_add

                                actOutputInfos.size() == 1 ? nullptr : &actOutputInfos[0], // add_output

                                actOutputInfos.size() == 1 ? &actOutputInfos[0] : &actOutputInfos[1], // final_output

                                arm_compute::ConvertPolicy::SATURATE,

                                activationInfo);

        default:

            return arm_compute::Status{arm_compute::ErrorCode::RUNTIME_ERROR,

                                       "NeonFusedWorkloadValidate: no valid kernel type"};

    }

}


NeonFusedWorkload::NeonFusedWorkload(const FusedQueueDescriptor& descriptor, const WorkloadInfo& info)

    : NeonBaseWorkload<FusedQueueDescriptor>(descriptor, info)

{

    m_Data.ValidateInputsOutputs("NeonFusedWorkload",

                                 static_cast<unsigned int>(info.m_InputTensorInfos.size()),

                                 static_cast<unsigned int>(info.m_OutputTensorInfos.size()));


    std::vector<arm_compute::ITensor*> inputs;

    inputs.reserve(info.m_InputTensorInfos.size());

    for (auto input : m_Data.m_Inputs)

    {

        inputs.emplace_back(&PolymorphicDowncast<IAclTensorHandle*>(input)->GetTensor());

    }


    std::vector<arm_compute::ITensor*> outputs;

    outputs.reserve(info.m_OutputTensorInfos.size());

    for (auto output : m_Data.m_Outputs)

    {

        outputs.emplace_back(&PolymorphicDowncast<IAclTensorHandle*>(output)->GetTensor());

    }


    const arm_compute::ActivationLayerInfo activationInfo =

            ConvertAdditionalInfoToAclActivationLayerInfo(descriptor);


    switch (descriptor.m_Parameters.m_FusedKernelType)

    {

        case FusedKernelType::AddMulAdd:

        {

            auto layer = std::make_unique<arm_compute::NEAddMulAdd>();

            layer->configure(inputs[0],

                             inputs[1],

                             inputs[2],  // bn_mul

                             inputs[3],  // bn_add

                             outputs.size() == 1 ? nullptr : outputs[0], // add_output

                             outputs.size() == 1 ? outputs[0] : outputs[1], // final_output

                             arm_compute::ConvertPolicy::SATURATE,

                             activationInfo);

            m_FusedLayer.reset(layer.release());

            break;

        }

        default:

            throw Exception("NeonFusedWorkload: no valid kernel type.");

    }

}


void NeonFusedWorkload::Execute() const

{

    ARMNN_SCOPED_PROFILING_EVENT_NEON_GUID("NeonFusedWorkload_Execute", this->GetGuid());

    m_FusedLayer->run();

}


} //namespace armnn


ArmComputeTensorUtils.hpp

ArmComputeUtils.hpp

NeonFusedWorkload.hpp

NeonWorkloadUtils.hpp

ARMNN_SCOPED_PROFILING_EVENT_NEON_GUID
#define ARMNN_SCOPED_PROFILING_EVENT_NEON_GUID(name, guid)
Definition NeonWorkloadUtils.hpp:25

PolymorphicDowncast.hpp

TensorHandle.hpp

armnn::BaseWorkload< FusedQueueDescriptor >::GetGuid
arm::pipe::ProfilingGuid GetGuid() const final
Definition Workload.hpp:52

armnn::BaseWorkload< FusedQueueDescriptor >::m_Data
FusedQueueDescriptor m_Data
Definition Workload.hpp:74

armnn::Exception
Base class for all ArmNN exceptions so that users can filter to just those.
Definition Exceptions.hpp:47

armnn::NeonBaseWorkload< FusedQueueDescriptor >::NeonBaseWorkload
NeonBaseWorkload(const FusedQueueDescriptor &descriptor, const WorkloadInfo &info)
Definition NeonBaseWorkload.hpp:16

armnn::NeonFusedWorkload::NeonFusedWorkload
NeonFusedWorkload(const FusedQueueDescriptor &descriptor, const WorkloadInfo &info)
Definition NeonFusedWorkload.cpp:63

armnn::NeonFusedWorkload::Execute
virtual void Execute() const override
Definition NeonFusedWorkload.cpp:108

armnn
Copyright (c) 2021 ARM Limited and Contributors.
Definition 01_00_quick_start.dox:7

armnn::BoostLogSeverityMapping::info
@ info
Definition Logging.hpp:200

armnn::FusedKernelType::AddMulAdd
@ AddMulAdd
Definition Types.hpp:269

armnn::ConvertAdditionalInfoToAclActivationLayerInfo
arm_compute::ActivationLayerInfo ConvertAdditionalInfoToAclActivationLayerInfo(const QueueDescriptor &queueDescriptor)
Definition ArmComputeUtils.hpp:105

armnn::NeonFusedWorkloadValidate
arm_compute::Status NeonFusedWorkloadValidate(const std::vector< std::reference_wrapper< TensorInfo > > &inputInfos, const std::vector< std::reference_wrapper< TensorInfo > > &outputInfos, const FusedDescriptor &fusedDescriptor, const ActivationDescriptor *activationDescriptor)
Definition NeonFusedWorkload.cpp:22

armnn::ConvertActivationDescriptorToAclActivationLayerInfo
arm_compute::ActivationLayerInfo ConvertActivationDescriptorToAclActivationLayerInfo(const ActivationDescriptor &actDesc)
Definition ArmComputeUtils.hpp:87

armnn::ActivationDescriptor
An ActivationDescriptor for the ActivationLayer.
Definition Descriptors.hpp:37

armnn::FusedDescriptor
A FusedDescriptor for the FusedLayer.
Definition Descriptors.hpp:945

armnn::FusedDescriptor::m_FusedKernelType
FusedKernelType m_FusedKernelType
Definition Descriptors.hpp:961

armnn::FusedQueueDescriptor
Definition WorkloadData.hpp:186

armnn::QueueDescriptorWithParameters::m_Parameters
LayerDescriptor m_Parameters
Definition WorkloadData.hpp:66

armnn::WorkloadInfo
Contains information about TensorInfos of a layer.
Definition WorkloadInfo.hpp:17