armnn/latest/_neon_multiplication_workload_8cpp_source.html

//

// Copyright © 2017,2019-2023 Arm Ltd and Contributors. All rights reserved.

// SPDX-License-Identifier: MIT

//


#include "NeonMultiplicationWorkload.hpp"


#include "NeonWorkloadUtils.hpp"


#include <aclCommon/ArmComputeUtils.hpp>


#include <armnn/utility/PolymorphicDowncast.hpp>


#include <arm_compute/runtime/NEON/functions/NEPixelWiseMultiplication.h>


namespace armnn

{


arm_compute::Status NeonMultiplicationWorkloadValidate(const TensorInfo& input0,

                                                       const TensorInfo& input1,

                                                       const TensorInfo& output,

                                                       const ActivationDescriptor* activationDescriptor)

{

    const arm_compute::TensorInfo aclInput1 = armcomputetensorutils::BuildArmComputeTensorInfo(input0);

    const arm_compute::TensorInfo aclInput2 = armcomputetensorutils::BuildArmComputeTensorInfo(input1);

    const arm_compute::TensorInfo aclOutput = armcomputetensorutils::BuildArmComputeTensorInfo(output);


    auto convertPolicy = (IsQuantizedType(input0.GetDataType()) || IsQuantizedType(input1.GetDataType())) ?

                          arm_compute::ConvertPolicy::SATURATE :

                          arm_compute::ConvertPolicy::WRAP;


    const arm_compute::ActivationLayerInfo activationInfo = ConvertActivationDescriptorToAclActivationLayerInfo(

            activationDescriptor);


    // At the time of writing, configure() will fail if a rounding policy other than TO_ZERO is supplied to it,

    // when providing a scale of 1.0 for F32 tensors, even though the provided rounding policy appears to be

    // ignored for F32 tensors.

    return arm_compute::NEPixelWiseMultiplication::validate(&aclInput1,

                                                            &aclInput2,

                                                            &aclOutput,

                                                            1.0f,

                                                            convertPolicy,

                                                            arm_compute::RoundingPolicy::TO_ZERO,

                                                            activationInfo);

}


NeonMultiplicationWorkload::NeonMultiplicationWorkload(const MultiplicationQueueDescriptor& descriptor,

                                                       const WorkloadInfo& info)

    : NeonBaseWorkload<MultiplicationQueueDescriptor>(descriptor, info)

{

    m_Data.ValidateInputsOutputs("NeonMultiplicationWorkload", 2, 1);


    arm_compute::ITensor& input1 = PolymorphicDowncast<IAclTensorHandle*>(m_Data.m_Inputs[0])->GetTensor();

    arm_compute::ITensor& input2 = PolymorphicDowncast<IAclTensorHandle*>(m_Data.m_Inputs[1])->GetTensor();

    arm_compute::ITensor& output = PolymorphicDowncast<IAclTensorHandle*>(m_Data.m_Outputs[0])->GetTensor();


    auto convertPolicy = (IsQuantizedType(info.m_InputTensorInfos[0].GetDataType()) ||

                          IsQuantizedType(info.m_InputTensorInfos[1].GetDataType())) ?

                          arm_compute::ConvertPolicy::SATURATE :

                          arm_compute::ConvertPolicy::WRAP;


    const arm_compute::ActivationLayerInfo activationInfo = ConvertAdditionalInfoToAclActivationLayerInfo(descriptor);


    // At the time of writing, configure() will fail if a rounding policy other than TO_ZERO is supplied to it,

    // when providing a scale of 1.0 for F32 tensors, even though the provided rounding policy appears to be

    // ignored for F32 tensors.

    auto layer = std::make_unique<arm_compute::NEPixelWiseMultiplication>();

    layer->configure(&input1,

                     &input2,

                     &output,

                     1.0f,

                     convertPolicy,

                     arm_compute::RoundingPolicy::TO_ZERO,

                     activationInfo);

    m_PixelWiseMultiplication.reset(layer.release());

}


void NeonMultiplicationWorkload::Execute() const

{

    ARMNN_SCOPED_PROFILING_EVENT_NEON_NAME_GUID("NeonMultiplicationWorkload_Execute");

    m_PixelWiseMultiplication->run();

}


} //namespace armnn

ArmComputeUtils.hpp

NeonMultiplicationWorkload.hpp

NeonWorkloadUtils.hpp

ARMNN_SCOPED_PROFILING_EVENT_NEON_NAME_GUID
#define ARMNN_SCOPED_PROFILING_EVENT_NEON_NAME_GUID(label)
Creates a profiling event that uses GetGuid() and GetName() from the calling class.
Definition NeonWorkloadUtils.hpp:33

PolymorphicDowncast.hpp

armnn::BaseWorkload::m_Data
QueueDescriptor m_Data
Definition Workload.hpp:74

armnn::NeonBaseWorkload
Definition NeonBaseWorkload.hpp:14

armnn::NeonMultiplicationWorkload::NeonMultiplicationWorkload
NeonMultiplicationWorkload(const MultiplicationQueueDescriptor &descriptor, const WorkloadInfo &info)
Definition NeonMultiplicationWorkload.cpp:47

armnn::NeonMultiplicationWorkload::Execute
virtual void Execute() const override
Definition NeonMultiplicationWorkload.cpp:78

armnn::TensorInfo
Definition Tensor.hpp:153

armnn::TensorInfo::GetDataType
DataType GetDataType() const
Definition Tensor.hpp:200

armnn
Copyright (c) 2021 ARM Limited and Contributors.
Definition 01_00_quick_start.dox:7

armnn::BoostLogSeverityMapping::info
@ info

armnn::IsQuantizedType
constexpr bool IsQuantizedType()
Definition TypesUtils.hpp:312

armnn::ConvertAdditionalInfoToAclActivationLayerInfo
arm_compute::ActivationLayerInfo ConvertAdditionalInfoToAclActivationLayerInfo(const QueueDescriptor &queueDescriptor)
Definition ArmComputeUtils.hpp:105

armnn::ConvertActivationDescriptorToAclActivationLayerInfo
arm_compute::ActivationLayerInfo ConvertActivationDescriptorToAclActivationLayerInfo(const ActivationDescriptor &actDesc)
Definition ArmComputeUtils.hpp:87

armnn::NeonMultiplicationWorkloadValidate
arm_compute::Status NeonMultiplicationWorkloadValidate(const TensorInfo &input0, const TensorInfo &input1, const TensorInfo &output, const ActivationDescriptor *activationDescriptor)
Definition NeonMultiplicationWorkload.cpp:19

armnn::ActivationDescriptor
An ActivationDescriptor for the ActivationLayer.
Definition Descriptors.hpp:37

armnn::MultiplicationQueueDescriptor
Definition WorkloadData.hpp:265

armnn::QueueDescriptor::m_Inputs
std::vector< ITensorHandle * > m_Inputs
Definition WorkloadData.hpp:26

armnn::QueueDescriptor::m_Outputs
std::vector< ITensorHandle * > m_Outputs
Definition WorkloadData.hpp:27

armnn::QueueDescriptor::ValidateInputsOutputs
void ValidateInputsOutputs(const std::string &descName, unsigned int numExpectedIn, unsigned int numExpectedOut) const
Definition WorkloadData.cpp:447

armnn::WorkloadInfo
Contains information about TensorInfos of a layer.
Definition WorkloadInfo.hpp:17