armnn/latest/_cl_batch_mat_mul_workload_8cpp_source.html

 //

 // Copyright © 2022-2023 Arm Ltd and Contributors. All rights reserved.

 // SPDX-License-Identifier: MIT

 //


 #include "ClBatchMatMulWorkload.hpp"


 #include "ClWorkloadUtils.hpp"


 #include <aclCommon/ArmComputeTensorUtils.hpp>

 #include <aclCommon/ArmComputeUtils.hpp>


 #include <armnn/utility/PolymorphicDowncast.hpp>


 #include <backendsCommon/WorkloadUtils.hpp>


 #include <cl/ClTensorHandle.hpp>


 #include <arm_compute/function_info/MatMulInfo.h>


 namespace armnn

 {


 arm_compute::Status ClBatchMatMulValidate(const TensorInfo& inputInfoX,

                                           const TensorInfo& inputInfoY,

                                           const TensorInfo& outputInfo,

                                           const BatchMatMulDescriptor& descriptor,

                                           const ActivationDescriptor* activationDescriptor)

 {

     if (descriptor.m_AdjointX || descriptor.m_AdjointY )

     {

         throw Exception("Support for adjoint not implemented.");

     }

     if (descriptor.m_DataLayoutX != armnn::DataLayout::NCHW || descriptor.m_DataLayoutY != armnn::DataLayout::NCHW )

     {

         throw Exception("Only supported the MatMul in the last 2 dimensions");

     }


     arm_compute::TensorInfo aclInputInfoX = armcomputetensorutils::BuildArmComputeTensorInfo(inputInfoX);

     arm_compute::TensorInfo aclInputInfoY = armcomputetensorutils::BuildArmComputeTensorInfo(inputInfoY);

     const arm_compute::TensorInfo aclOutputInfo = armcomputetensorutils::BuildArmComputeTensorInfo(outputInfo);


     // GeMM dispatches kernel handles dynamic inputs differently to static so this flag needs to be set

     aclInputInfoX.set_are_values_constant(false);

     aclInputInfoY.set_are_values_constant(false);


     const arm_compute::ActivationLayerInfo activationInfo = ConvertActivationDescriptorToAclActivationLayerInfo(

             activationDescriptor);


     arm_compute::MatMulInfo matMulInfo;

     matMulInfo.adj_lhs(descriptor.m_TransposeX);

     matMulInfo.adj_rhs(descriptor.m_TransposeY);


     return arm_compute::CLMatMul::validate(&aclInputInfoX, &aclInputInfoY, &aclOutputInfo, matMulInfo, activationInfo);

 }


 ClBatchMatMulWorkload::ClBatchMatMulWorkload(const BatchMatMulQueueDescriptor& descriptor,

                                              const WorkloadInfo& info,

                                              const arm_compute::CLCompileContext& clCompileContext)

     : ClBaseWorkload<BatchMatMulQueueDescriptor>(descriptor, info)

 {

     // Report Profiling Details

     ARMNN_REPORT_PROFILING_WORKLOAD_DESC("ClBatchMatMulWorkload_Construct",

                                          descriptor.m_Parameters,

                                          info,

                                          this->GetGuid());


     if (descriptor.m_Parameters.m_AdjointX || descriptor.m_Parameters.m_AdjointY )

     {

         throw Exception("Support for adjoint not implemented.");

     }

     if (descriptor.m_Parameters.m_DataLayoutX != armnn::DataLayout::NCHW ||

         descriptor.m_Parameters.m_DataLayoutY != armnn::DataLayout::NCHW )

     {

         throw Exception("Only supported the MatMul in the last 2 dimensions");

     }


     m_Data.ValidateInputsOutputs("ClBatchMatMulWorkload", 2, 1);


     arm_compute::ICLTensor& inputX = PolymorphicDowncast<ClTensorHandle*>(m_Data.m_Inputs[0])->GetTensor();

     arm_compute::ICLTensor& inputY = PolymorphicDowncast<ClTensorHandle*>(m_Data.m_Inputs[1])->GetTensor();

     auto outputHandle = PolymorphicDowncast<ClTensorHandle*>(m_Data.m_Outputs[0]);

     arm_compute::ICLTensor& output = outputHandle->GetTensor();


     // GeMM dispatches kernel handles dynamic inputs differently to static so this flag needs to be set

     inputX.info()->set_are_values_constant(false);

     inputY.info()->set_are_values_constant(false);


     const arm_compute::ActivationLayerInfo activationInfo = ConvertAdditionalInfoToAclActivationLayerInfo(descriptor);


     arm_compute::MatMulInfo matMulInfo;

     matMulInfo.adj_lhs(descriptor.m_Parameters.m_TransposeX);

     matMulInfo.adj_rhs(descriptor.m_Parameters.m_TransposeY);


     arm_compute::GpuMatMulSettings settings;


     m_MatMulLayer.configure(clCompileContext, &inputX, &inputY, &output, matMulInfo, settings, activationInfo);


     // Report Profiling Details

     WorkloadInfo detailsInfo;

     detailsInfo.m_InputTensorInfos = info.m_InputTensorInfos;

     detailsInfo.m_OutputTensorInfos = info.m_OutputTensorInfos;

     ARMNN_REPORT_PROFILING_WORKLOAD_DESC("ClBatchMatMulWorkload_Construct",

                                          descriptor.m_Parameters,

                                          detailsInfo,

                                          GetGuid());

 }


 void ClBatchMatMulWorkload::Execute() const

 {

     ARMNN_SCOPED_PROFILING_EVENT_CL_NAME_GUID("ClBatchMatMulWorkload_Execute");

     RunClFunction(m_MatMulLayer, CHECK_LOCATION());

 }

 } //namespace armnn

ArmComputeTensorUtils.hpp

ArmComputeUtils.hpp

ClBatchMatMulWorkload.hpp

ClTensorHandle.hpp

ClWorkloadUtils.hpp

ARMNN_SCOPED_PROFILING_EVENT_CL_NAME_GUID
#define ARMNN_SCOPED_PROFILING_EVENT_CL_NAME_GUID(label)
Creates a profiling event that uses GetGuid() and GetName() from the calling class.
Definition: ClWorkloadUtils.hpp:36

CHECK_LOCATION
#define CHECK_LOCATION()
Definition: Exceptions.hpp:203

PolymorphicDowncast.hpp

ARMNN_REPORT_PROFILING_WORKLOAD_DESC
#define ARMNN_REPORT_PROFILING_WORKLOAD_DESC(name, desc, infos, guid)
Definition: Profiling.hpp:227

WorkloadUtils.hpp

armnn::BaseWorkload::GetGuid
arm::pipe::ProfilingGuid GetGuid() const final
Definition: Workload.hpp:52

armnn::BaseWorkload::m_Data
QueueDescriptor m_Data
Definition: Workload.hpp:74

armnn::ClBaseWorkload
Definition: ClBaseWorkload.hpp:14

armnn::ClBatchMatMulWorkload::ClBatchMatMulWorkload
ClBatchMatMulWorkload(const BatchMatMulQueueDescriptor &descriptor, const WorkloadInfo &info, const arm_compute::CLCompileContext &clCompileContext)
Definition: ClBatchMatMulWorkload.cpp:57

armnn::ClBatchMatMulWorkload::Execute
virtual void Execute() const override
Definition: ClBatchMatMulWorkload.cpp:109

armnn::Exception
Base class for all ArmNN exceptions so that users can filter to just those.
Definition: Exceptions.hpp:47

armnn::TensorInfo
Definition: Tensor.hpp:153

armnn
Copyright (c) 2021 ARM Limited and Contributors.
Definition: 01_00_quick_start.dox:7

armnn::ClBatchMatMulValidate
arm_compute::Status ClBatchMatMulValidate(const TensorInfo &inputInfoX, const TensorInfo &inputInfoY, const TensorInfo &outputInfo, const BatchMatMulDescriptor &descriptor, const ActivationDescriptor *activationDescriptor)
Definition: ClBatchMatMulWorkload.cpp:24

armnn::BoostLogSeverityMapping::info
@ info

armnn::Status
Status
enumeration
Definition: Types.hpp:43

armnn::ConvertAdditionalInfoToAclActivationLayerInfo
arm_compute::ActivationLayerInfo ConvertAdditionalInfoToAclActivationLayerInfo(const QueueDescriptor &queueDescriptor)
Definition: ArmComputeUtils.hpp:105

armnn::DataLayout::NCHW
@ NCHW

armnn::ConvertActivationDescriptorToAclActivationLayerInfo
arm_compute::ActivationLayerInfo ConvertActivationDescriptorToAclActivationLayerInfo(const ActivationDescriptor &actDesc)
Definition: ArmComputeUtils.hpp:87

armnn::RunClFunction
void RunClFunction(arm_compute::IFunction &function, const CheckLocation &location)
Definition: ClWorkloadUtils.hpp:167

armnn::ActivationDescriptor
An ActivationDescriptor for the ActivationLayer.
Definition: Descriptors.hpp:37

armnn::BatchMatMulDescriptor
A BatchMatMulDescriptor for the BatchMatMul operator.
Definition: Descriptors.hpp:1585

armnn::BatchMatMulDescriptor::m_AdjointX
bool m_AdjointX
Adjoint the slices of each input tensor Transpose and Adjoint can not both be set to true for the sam...
Definition: Descriptors.hpp:1617

armnn::BatchMatMulDescriptor::m_TransposeY
bool m_TransposeY
Definition: Descriptors.hpp:1613

armnn::BatchMatMulDescriptor::m_DataLayoutY
DataLayout m_DataLayoutY
Definition: Descriptors.hpp:1622

armnn::BatchMatMulDescriptor::m_TransposeX
bool m_TransposeX
Transpose the slices of each input tensor Transpose and Adjoint can not both be set to true for the s...
Definition: Descriptors.hpp:1612

armnn::BatchMatMulDescriptor::m_AdjointY
bool m_AdjointY
Definition: Descriptors.hpp:1618

armnn::BatchMatMulDescriptor::m_DataLayoutX
DataLayout m_DataLayoutX
Data layout of each input tensor, such as NHWC/NDHWC (leave as default for arbitrary layout)
Definition: Descriptors.hpp:1621

armnn::BatchMatMulQueueDescriptor
Definition: WorkloadData.hpp:754

armnn::QueueDescriptor::m_Inputs
std::vector< ITensorHandle * > m_Inputs
Definition: WorkloadData.hpp:26

armnn::QueueDescriptor::m_Outputs
std::vector< ITensorHandle * > m_Outputs
Definition: WorkloadData.hpp:27

armnn::QueueDescriptor::ValidateInputsOutputs
void ValidateInputsOutputs(const std::string &descName, unsigned int numExpectedIn, unsigned int numExpectedOut) const
Definition: WorkloadData.cpp:447

armnn::QueueDescriptorWithParameters::m_Parameters
LayerDescriptor m_Parameters
Definition: WorkloadData.hpp:66

armnn::WorkloadInfo
Contains information about TensorInfos of a layer.
Definition: WorkloadInfo.hpp:17

armnn::WorkloadInfo::m_OutputTensorInfos
std::vector< TensorInfo > m_OutputTensorInfos
Definition: WorkloadInfo.hpp:19

armnn::WorkloadInfo::m_InputTensorInfos
std::vector< TensorInfo > m_InputTensorInfos
Definition: WorkloadInfo.hpp:18