#include <ClFloorDivWorkload.hpp>

Inheritance diagram for ClFloorDivWorkload:

Collaboration diagram for ClFloorDivWorkload:

Public Member Functions
	ClFloorDivWorkload (const DivisionQueueDescriptor &descriptor, const WorkloadInfo &info, const arm_compute::CLCompileContext &clCompileContext)
virtual void	Execute () const override
Public Member Functions inherited from ClBaseWorkload< DivisionQueueDescriptor >
	ClBaseWorkload (const DivisionQueueDescriptor &descriptor, const WorkloadInfo &info)
void	ReplaceInputTensorHandle (ITensorHandle *tensorHandle, unsigned int slot) override
void	ReplaceOutputTensorHandle (ITensorHandle *tensorHandle, unsigned int slot) override
Public Member Functions inherited from BaseWorkload< DivisionQueueDescriptor >
	BaseWorkload (const DivisionQueueDescriptor &descriptor, const WorkloadInfo &info)
virtual const std::string &	GetName () const override
void	PostAllocationConfigure () override
const DivisionQueueDescriptor &	GetData () const
arm::pipe::ProfilingGuid	GetGuid () const final
virtual bool	SupportsTensorHandleReplacement () const override
Public Member Functions inherited from IWorkload
virtual	~IWorkload ()
virtual void	RegisterDebugCallback (const DebugCallbackFunction &)
virtual armnn::Optional< armnn::MemoryRequirements >	GetMemoryRequirements ()

Additional Inherited Members
Protected Member Functions inherited from ClBaseWorkload< DivisionQueueDescriptor >
virtual void	Reconfigure ()
Protected Attributes inherited from BaseWorkload< DivisionQueueDescriptor >
DivisionQueueDescriptor	m_Data
const arm::pipe::ProfilingGuid	m_Guid
const std::string	m_Name

Detailed Description

Definition at line 24 of file ClFloorDivWorkload.hpp.

Constructor & Destructor Documentation

◆ ClFloorDivWorkload()

ClFloorDivWorkload	(	const DivisionQueueDescriptor &	descriptor,
		const WorkloadInfo &	info,
		const arm_compute::CLCompileContext &	clCompileContext )

Definition at line 132 of file ClFloorDivWorkload.cpp.

        : ClBaseWorkload<DivisionQueueDescriptor>(descriptor, info)
{
    m_Data.ValidateInputsOutputs("ClFloorDivWorkload", 2, 1);
 
    TensorInfo input0Info = info.m_InputTensorInfos[0];
    TensorInfo input1Info = info.m_InputTensorInfos[1];
    TensorInfo outputInfo = info.m_OutputTensorInfos[0];
 
    arm_compute::ICLTensor& input0 = PolymorphicDowncast<ClTensorHandle*>(m_Data.m_Inputs[0])->GetTensor();
    arm_compute::ICLTensor& input1 = PolymorphicDowncast<ClTensorHandle*>(m_Data.m_Inputs[1])->GetTensor();
    arm_compute::ICLTensor& output = PolymorphicDowncast<ClTensorHandle*>(m_Data.m_Outputs[0])->GetTensor();
 
    // Get data type of input and output
    arm_compute::DataType inputDataType  = PolymorphicDowncast<ClTensorHandle*>(m_Data.m_Inputs[0])->GetDataType();
    arm_compute::DataType outputDataType = PolymorphicDowncast<ClTensorHandle*>(m_Data.m_Outputs[0])->GetDataType();
 
    const arm_compute::ActivationLayerInfo activationInfo =
        ConvertAdditionalInfoToAclActivationLayerInfo(descriptor);
 
    // If Tensors are Signed32 we need to Cast them to floats, this is to ensure we get the correct
    // output if the result is a negative number, as we should floor towards -(infinity)
    if(inputDataType == arm_compute::DataType::S32 && outputDataType == arm_compute::DataType::S32)
    {
        // Create new Cast layer pointers if type is S32
        m_CastLayer0.reset(new arm_compute::CLCast());
        m_CastLayer1.reset(new arm_compute::CLCast());
        m_CastLayer2.reset(new arm_compute::CLCast());
 
        // Cast Input 0 to type float32
        TensorInfo outputCast0_Info = ConvertTensorToFloat32(input0Info);
 
        // Initialise output tensor based on Float32 type
        BuildArmComputeTensor(m_OutputCast0, outputCast0_Info);
        armcomputetensorutils::InitialiseArmComputeTensorEmpty(m_OutputCast0);
 
        // Configure first Cast Layer
        m_CastLayer0->configure(clCompileContext, &input0, &m_OutputCast0, arm_compute::ConvertPolicy::WRAP);
 
        // Cast Input 1 to type Float32
        TensorInfo outputCast1_Info = ConvertTensorToFloat32(input1Info);
 
        // Initialise Output tensor based on Float32 type
        BuildArmComputeTensor(m_OutputCast1, outputCast1_Info);
        armcomputetensorutils::InitialiseArmComputeTensorEmpty(m_OutputCast1);
 
        // Configure second Cast Layer
        m_CastLayer1->configure(clCompileContext, &input1, &m_OutputCast1, arm_compute::ConvertPolicy::WRAP);
 
        // Create Div output tensor
        TensorInfo outputDiv_Info = ConvertTensorToFloat32(outputInfo);
        BuildArmComputeTensor(m_OutputDiv, outputDiv_Info);
        armcomputetensorutils::InitialiseArmComputeTensorEmpty(m_OutputDiv);
 
        // Configure Div Layer
        m_DivLayer.configure(clCompileContext, &m_OutputCast0, &m_OutputCast1, &m_OutputDiv, activationInfo);
 
        // Create Floor output tensor
        BuildArmComputeTensor(m_OutputFloor, outputDiv_Info);
        armcomputetensorutils::InitialiseArmComputeTensorEmpty(m_OutputFloor);
 
        // Configure Floor Layer
        m_FloorLayer.configure(clCompileContext, &m_OutputDiv, &m_OutputFloor);
 
        // Configure third Cast Layer
        m_CastLayer2->configure(clCompileContext, &m_OutputFloor, &output, arm_compute::ConvertPolicy::WRAP);
    }
    else
    {
        // Create Div output tensor
        BuildArmComputeTensor(m_OutputDiv, outputInfo);
        armcomputetensorutils::InitialiseArmComputeTensorEmpty(m_OutputDiv);
 
        // Configure Div Layer
        m_DivLayer.configure(clCompileContext, &input0, &input1, &m_OutputDiv, activationInfo);
 
        // Configure Floor Layer
        m_FloorLayer.configure(clCompileContext, &m_OutputDiv, &output);
    }
};

References ClBaseWorkload< DivisionQueueDescriptor >::ClBaseWorkload(), armnn::ConvertAdditionalInfoToAclActivationLayerInfo(), armnn::ConvertTensorToFloat32(), armnn::info, BaseWorkload< DivisionQueueDescriptor >::m_Data, and armnn::PolymorphicDowncast().

Member Function Documentation

◆ Execute()

void Execute ( ) const

overridevirtual

Implements IWorkload.

Definition at line 215 of file ClFloorDivWorkload.cpp.

{
    ARMNN_SCOPED_PROFILING_EVENT_CL_NAME_GUID("ClFloorDivWorkload_Execute");
    // Only run Cast Layers if needed. e.g. if it exists
    if(m_CastLayer0 && m_CastLayer1)
    {
        m_CastLayer0->run();
        m_CastLayer1->run();
 
        // Delete objects after running layer
        m_CastLayer0.reset();
        m_CastLayer1.reset();
    }
    RunClFunction(m_DivLayer, CHECK_LOCATION());
    RunClFunction(m_FloorLayer, CHECK_LOCATION());
    if(m_CastLayer2)
    {
        m_CastLayer2->run();
 
        // Delete object after running layer
        m_CastLayer2.reset();
    }
}

References ARMNN_SCOPED_PROFILING_EVENT_CL_NAME_GUID, CHECK_LOCATION, and armnn::RunClFunction().

The documentation for this class was generated from the following files:

src/backends/cl/workloads/ClFloorDivWorkload.hpp
src/backends/cl/workloads/ClFloorDivWorkload.cpp

Public Member Functions

Additional Inherited Members

Detailed Description

Constructor & Destructor Documentation

◆ ClFloorDivWorkload()

Member Function Documentation

◆ Execute()