armnn/latest/_neon_convolution3d_workload_8cpp_source.html

//

// Copyright © 2021-2024 Arm Ltd and Contributors. All rights reserved.

// SPDX-License-Identifier: MIT

//


#include "NeonConvolution3dWorkload.hpp"


#include <aclCommon/ArmComputeTensorUtils.hpp>

#include <aclCommon/ArmComputeUtils.hpp>

#include <armnn/utility/PolymorphicDowncast.hpp>

#include <armnn/backends/TensorHandle.hpp>

#include <neon/workloads/NeonWorkloadUtils.hpp>


#include <arm_compute/runtime/NEON/functions/NEConv3D.h>


#include <armnn/Types.hpp>

#include <Half.hpp>


namespace armnn

{


using namespace armcomputetensorutils;


arm_compute::Status NeonConvolution3dWorkloadValidate(const TensorInfo& input,

                                                      const TensorInfo& output,

                                                      const Convolution3dDescriptor& descriptor,

                                                      const TensorInfo& weights,

                                                      const Optional<TensorInfo>& biases,

                                                      bool isFastMathEnabled,

                                                      const ActivationDescriptor* activationDescriptor)

{

    const arm_compute::TensorInfo aclInputInfo = BuildArmComputeTensorInfo(input, descriptor.m_DataLayout);

    const arm_compute::TensorInfo aclWeightsInfo = BuildArmComputeTensorInfo(weights, descriptor.m_DataLayout);

    arm_compute::TensorInfo aclBiasesInfo;

    arm_compute::TensorInfo *optionalAclBiasesInfo = nullptr;

    if (descriptor.m_BiasEnabled)

    {

        if (!biases.has_value())

        {

            return arm_compute::Status{arm_compute::ErrorCode::RUNTIME_ERROR,

                                       "ArmNN NeonConvolution3dWorkload has empty bias value."};

        }


        aclBiasesInfo = BuildArmComputeTensorInfo(biases.value(), descriptor.m_DataLayout);

        optionalAclBiasesInfo = &aclBiasesInfo;

    }

    const arm_compute::TensorInfo aclOutputInfo = BuildArmComputeTensorInfo(output, descriptor.m_DataLayout);


    const arm_compute::Conv3dInfo aclConv3DInfo = ComputeConv3DInfo(descriptor,

                                                                    isFastMathEnabled,

                                                                    activationDescriptor);


    return arm_compute::NEConv3D::validate(&aclInputInfo,

                                           &aclWeightsInfo,

                                           optionalAclBiasesInfo,

                                           &aclOutputInfo,

                                           aclConv3DInfo);

}


NeonConvolution3dWorkload::NeonConvolution3dWorkload(const Convolution3dQueueDescriptor& descriptor,

                                                     const WorkloadInfo& info,

                                                     std::shared_ptr<arm_compute::MemoryManagerOnDemand>& memoryManager,

                                                     const bool isFastMathEnabled)

    : NeonBaseWorkload<Convolution3dQueueDescriptor>(descriptor, info)

{

    IgnoreUnused(memoryManager);


    using arm_compute::NEConv3D;

    uint32_t numInputs = m_Data.m_Parameters.m_BiasEnabled ? 3: 2;

    m_Data.ValidateInputsOutputs("NeonConvolution3dWorkload", numInputs, 1);


    arm_compute::ITensor& input = PolymorphicDowncast<IAclTensorHandle*>(m_Data.m_Inputs[0])->GetTensor();

    arm_compute::ITensor& weights = PolymorphicDowncast<IAclTensorHandle*>(m_Data.m_Inputs[1])->GetTensor();

    arm_compute::ITensor* biasesPtr = nullptr;

    if (m_Data.m_Parameters.m_BiasEnabled)

    {

        biasesPtr = &PolymorphicDowncast<IAclTensorHandle *>(m_Data.m_Inputs[2])->GetTensor();

    }

    arm_compute::ITensor& output = PolymorphicDowncast<IAclTensorHandle*>(m_Data.m_Outputs[0])->GetTensor();


    arm_compute::DataLayout aclDataLayout = ConvertDataLayout(m_Data.m_Parameters.m_DataLayout);

    input.info()->set_data_layout(aclDataLayout);

    weights.info()->set_data_layout(aclDataLayout);

    output.info()->set_data_layout(aclDataLayout);


    const arm_compute::Conv3dInfo aclConv3DInfo = ComputeConv3DInfo(descriptor, isFastMathEnabled);


    auto convolutionLayer = std::make_unique<arm_compute::NEConv3D>();

    convolutionLayer->configure(&input,

                                &weights,

                                biasesPtr,

                                &output,

                                aclConv3DInfo);


    // Add details for profiling output

    WorkloadInfo detailsInfo;


    detailsInfo.m_InputTensorInfos = info.m_InputTensorInfos;

    detailsInfo.m_OutputTensorInfos = info.m_OutputTensorInfos;


    // Report Profiling Details

    ARMNN_REPORT_PROFILING_WORKLOAD_DESC("NeonConvolution3dWorkload_Construct",

                                         descriptor.m_Parameters,

                                         detailsInfo,

                                         this->GetGuid());


    m_ConvolutionLayer.reset(convolutionLayer.release());

    m_ConvolutionLayer->prepare();

}


void NeonConvolution3dWorkload::Execute() const

{

    ARMNN_SCOPED_PROFILING_EVENT_NEON_NAME_GUID("NeonConvolution3dWorkload_Execute");

    m_ConvolutionLayer->run();

}


} //namespace armnn

ArmComputeTensorUtils.hpp

ArmComputeUtils.hpp

Half.hpp

NeonConvolution3dWorkload.hpp

NeonWorkloadUtils.hpp

ARMNN_SCOPED_PROFILING_EVENT_NEON_NAME_GUID
#define ARMNN_SCOPED_PROFILING_EVENT_NEON_NAME_GUID(label)
Creates a profiling event that uses GetGuid() and GetName() from the calling class.
Definition NeonWorkloadUtils.hpp:33

PolymorphicDowncast.hpp

ARMNN_REPORT_PROFILING_WORKLOAD_DESC
#define ARMNN_REPORT_PROFILING_WORKLOAD_DESC(name, desc, infos, guid)
Definition Profiling.hpp:227

TensorHandle.hpp

Types.hpp

armnn::BaseWorkload< Convolution3dQueueDescriptor >::m_Data
Convolution3dQueueDescriptor m_Data
Definition Workload.hpp:74

armnn::NeonBaseWorkload< Convolution3dQueueDescriptor >::NeonBaseWorkload
NeonBaseWorkload(const Convolution3dQueueDescriptor &descriptor, const WorkloadInfo &info)
Definition NeonBaseWorkload.hpp:16

armnn::NeonConvolution3dWorkload::NeonConvolution3dWorkload
NeonConvolution3dWorkload(const Convolution3dQueueDescriptor &descriptor, const WorkloadInfo &info, std::shared_ptr< arm_compute::MemoryManagerOnDemand > &memoryManager, const bool isFastMathENabled=false)
Definition NeonConvolution3dWorkload.cpp:60

armnn::NeonConvolution3dWorkload::Execute
void Execute() const override
Definition NeonConvolution3dWorkload.cpp:111

armnn::OptionalBase::has_value
bool has_value() const noexcept
Definition Optional.hpp:53

armnn::Optional
Definition Optional.hpp:271

armnn::OptionalReferenceSwitch::value
const T & value() const
Definition Optional.hpp:146

armnn::TensorInfo
Definition Tensor.hpp:153

armnn
Copyright (c) 2021 ARM Limited and Contributors.
Definition 01_00_quick_start.dox:7

armnn::ComputeConv3DInfo
arm_compute::Conv3dInfo ComputeConv3DInfo(const armnn::Convolution3dDescriptor descriptor, bool isFastMathEnabled, const ActivationDescriptor *activationDescriptor)
Utility function used to setup an arm_compute::Conv3dInfo object from convolution3d descriptor.
Definition ArmComputeUtils.hpp:261

armnn::BoostLogSeverityMapping::info
@ info
Definition Logging.hpp:200

armnn::PolymorphicDowncast
DestType PolymorphicDowncast(SourceType *value)
Polymorphic downcast for build in pointers only.
Definition PolymorphicDowncast.hpp:74

armnn::NeonConvolution3dWorkloadValidate
arm_compute::Status NeonConvolution3dWorkloadValidate(const TensorInfo &input, const TensorInfo &output, const Convolution3dDescriptor &descriptor, const TensorInfo &weights, const Optional< TensorInfo > &biases, bool isFastMathEnabled, const ActivationDescriptor *activationDescriptor)
Definition NeonConvolution3dWorkload.cpp:24

armnn::IgnoreUnused
void IgnoreUnused(Ts &&...)
Definition IgnoreUnused.hpp:14

armnn::ActivationDescriptor
An ActivationDescriptor for the ActivationLayer.
Definition Descriptors.hpp:37

armnn::Convolution3dDescriptor
A Convolution3dDescriptor for the Convolution3dLayer.
Definition Descriptors.hpp:589

armnn::Convolution3dDescriptor::m_DataLayout
DataLayout m_DataLayout
The data layout to be used (NDHWC, NCDHW).
Definition Descriptors.hpp:655

armnn::Convolution3dDescriptor::m_BiasEnabled
bool m_BiasEnabled
Enable/disable bias.
Definition Descriptors.hpp:653

armnn::Convolution3dQueueDescriptor
Definition WorkloadData.hpp:217

armnn::QueueDescriptorWithParameters::m_Parameters
LayerDescriptor m_Parameters
Definition WorkloadData.hpp:66

armnn::WorkloadInfo
Contains information about TensorInfos of a layer.
Definition WorkloadInfo.hpp:17

armnn::WorkloadInfo::m_OutputTensorInfos
std::vector< TensorInfo > m_OutputTensorInfos
Definition WorkloadInfo.hpp:19

armnn::WorkloadInfo::m_InputTensorInfos
std::vector< TensorInfo > m_InputTensorInfos
Definition WorkloadInfo.hpp:18