armnn/latest/_cl_import_tensor_handle_8hpp_source.html

 //

 // Copyright © 2022-2024 Arm Ltd and Contributors. All rights reserved.

 // SPDX-License-Identifier: MIT

 //


 #pragma once


 #include <aclCommon/ArmComputeTensorHandle.hpp>

 #include <aclCommon/ArmComputeTensorUtils.hpp>


 #include <Half.hpp>


 #include <armnn/utility/PolymorphicDowncast.hpp>


 #include <arm_compute/runtime/CL/CLTensor.h>

 #include <arm_compute/runtime/CL/CLSubTensor.h>

 #include <arm_compute/runtime/IMemoryGroup.h>

 #include <arm_compute/runtime/MemoryGroup.h>

 #include <arm_compute/core/TensorShape.h>

 #include <arm_compute/core/Coordinates.h>


 #include <aclCommon/IClTensorHandle.hpp>


 #include <CL/cl_ext.h>

 #include <arm_compute/core/CL/CLKernelLibrary.h>


 namespace armnn

 {


 class ClImportTensorHandle : public IClTensorHandle

 {

 public:

     ClImportTensorHandle(const TensorInfo& tensorInfo, MemorySourceFlags importFlags)

         : m_ImportFlags(importFlags)

     {

         armnn::armcomputetensorutils::BuildArmComputeTensor(m_Tensor, tensorInfo);

     }


     ClImportTensorHandle(const TensorInfo& tensorInfo,

                          DataLayout dataLayout,

                          MemorySourceFlags importFlags)

         : m_ImportFlags(importFlags), m_Imported(false)

     {

         armnn::armcomputetensorutils::BuildArmComputeTensor(m_Tensor, tensorInfo, dataLayout);

     }


     arm_compute::CLTensor& GetTensor() override { return m_Tensor; }

     arm_compute::CLTensor const& GetTensor() const override { return m_Tensor; }

     virtual void Allocate() override {}

     virtual void Manage() override {}


     virtual const void* Map(bool blocking = true) const override

     {

         IgnoreUnused(blocking);

         return static_cast<const void*>(m_Tensor.buffer() + m_Tensor.info()->offset_first_element_in_bytes());

     }


     virtual void Unmap() const override {}


     virtual ITensorHandle* GetParent() const override { return nullptr; }


     virtual arm_compute::DataType GetDataType() const override

     {

         return m_Tensor.info()->data_type();

     }


     virtual void SetMemoryGroup(const std::shared_ptr<arm_compute::IMemoryGroup>& memoryGroup) override

     {

         IgnoreUnused(memoryGroup);

     }


     TensorShape GetStrides() const override

     {

         return armcomputetensorutils::GetStrides(m_Tensor.info()->strides_in_bytes());

     }


     TensorShape GetShape() const override

     {

         return armcomputetensorutils::GetShape(m_Tensor.info()->tensor_shape());

     }


     void SetImportFlags(MemorySourceFlags importFlags)

     {

         m_ImportFlags = importFlags;

     }


     MemorySourceFlags GetImportFlags() const override

     {

         return m_ImportFlags;

     }


     virtual bool Import(void* memory, MemorySource source) override

     {

         if (m_ImportFlags & static_cast<MemorySourceFlags>(source))

         {

             if (source == MemorySource::Malloc)

             {

                 const cl_import_properties_arm importProperties[] =

                 {

                     CL_IMPORT_TYPE_ARM,

                     CL_IMPORT_TYPE_HOST_ARM,

                     0

                 };

                 return ClImport(importProperties, memory);

             }

             if (source == MemorySource::DmaBuf)

             {

                 const cl_import_properties_arm importProperties[] =

                 {

                     CL_IMPORT_TYPE_ARM,

                     CL_IMPORT_TYPE_DMA_BUF_ARM,

                     CL_IMPORT_DMA_BUF_DATA_CONSISTENCY_WITH_HOST_ARM,

                     CL_TRUE,

                     0

                 };


                 return ClImport(importProperties, memory);


             }

             if (source == MemorySource::DmaBufProtected)

             {

                 const cl_import_properties_arm importProperties[] =

                 {

                     CL_IMPORT_TYPE_ARM,

                     CL_IMPORT_TYPE_DMA_BUF_ARM,

                     CL_IMPORT_TYPE_PROTECTED_ARM,

                     CL_TRUE,

                     0

                 };


                 return ClImport(importProperties, memory, true);


             }

             // Case for importing memory allocated by OpenCl externally directly into the tensor

             else if (source == MemorySource::Gralloc)

             {

                 // m_Tensor not yet Allocated

                 if (!m_Imported && !m_Tensor.buffer())

                 {

                     // Importing memory allocated by OpenCl into the tensor directly.

                     arm_compute::Status status =

                         m_Tensor.allocator()->import_memory(cl::Buffer(static_cast<cl_mem>(memory)));

                     m_Imported = bool(status);

                     if (!m_Imported)

                     {

                         throw MemoryImportException(status.error_description());

                     }

                     return m_Imported;

                 }


                 // m_Tensor.buffer() initially allocated with Allocate().

                 else if (!m_Imported && m_Tensor.buffer())

                 {

                     throw MemoryImportException(

                         "ClImportTensorHandle::Import Attempting to import on an already allocated tensor");

                 }


                 // m_Tensor.buffer() previously imported.

                 else if (m_Imported)

                 {

                     // Importing memory allocated by OpenCl into the tensor directly.

                     arm_compute::Status status =

                         m_Tensor.allocator()->import_memory(cl::Buffer(static_cast<cl_mem>(memory)));

                     m_Imported = bool(status);

                     if (!m_Imported)

                     {

                         throw MemoryImportException(status.error_description());

                     }

                     return m_Imported;

                 }

                 else

                 {

                     throw MemoryImportException("ClImportTensorHandle::Failed to Import Gralloc Memory");

                 }

             }

             else

             {

                 throw MemoryImportException("ClImportTensorHandle::Import flag is not supported");

             }

         }

         else

         {

             throw MemoryImportException("ClImportTensorHandle::Incorrect import flag");

         }

     }


     virtual bool CanBeImported(void* /*memory*/, MemorySource source) override

     {

         if (m_ImportFlags & static_cast<MemorySourceFlags>(source))

         {

             if (source == MemorySource::Malloc)

             {

                 // Returning true as ClImport() function will decide if memory can be imported or not

                 return true;

             }

         }

         else

         {

             throw MemoryImportException("ClImportTensorHandle::Incorrect import flag");

         }

         return false;

     }


 private:

     bool ClImport(const cl_import_properties_arm* importProperties, void* memory, bool isProtected = false)

     {

         size_t totalBytes = m_Tensor.info()->total_size();


         // Round the size of the mapping to match the CL_DEVICE_GLOBAL_MEM_CACHELINE_SIZE

         // This does not change the size of the buffer, only the size of the mapping the buffer is mapped to

         auto cachelineAlignment =

                 arm_compute::CLKernelLibrary::get().get_device().getInfo<CL_DEVICE_GLOBAL_MEM_CACHELINE_SIZE>();

         auto roundedSize = totalBytes;

         if (totalBytes % cachelineAlignment != 0)

         {

             roundedSize = cachelineAlignment + totalBytes - (totalBytes % cachelineAlignment);

         }


         cl_int error = CL_SUCCESS;

         cl_mem buffer;

         if (isProtected)

         {

             buffer = clImportMemoryARM(arm_compute::CLKernelLibrary::get().context().get(),

                                        CL_MEM_HOST_NO_ACCESS, importProperties, memory, roundedSize, &error);

         }

         else

         {

             buffer = clImportMemoryARM(arm_compute::CLKernelLibrary::get().context().get(),

                                        CL_MEM_READ_WRITE, importProperties, memory, roundedSize, &error);

         }


         if (error != CL_SUCCESS)

         {

             throw MemoryImportException("ClImportTensorHandle::Invalid imported memory: " + std::to_string(error));

         }


         cl::Buffer wrappedBuffer(buffer);

         arm_compute::Status status = m_Tensor.allocator()->import_memory(wrappedBuffer);


         // Use the overloaded bool operator of Status to check if it is success, if not throw an exception

         // with the Status error message

         bool imported = (status.error_code() == arm_compute::ErrorCode::OK);

         if (!imported)

         {

             throw MemoryImportException(status.error_description());

         }

         return imported;

     }

     // Only used for testing

     void CopyOutTo(void* memory) const override

     {

         const_cast<armnn::ClImportTensorHandle*>(this)->Map(true);

         switch(this->GetDataType())

         {

             case arm_compute::DataType::F32:

                 armcomputetensorutils::CopyArmComputeITensorData(this->GetTensor(),

                                                                  static_cast<float*>(memory));

                 break;

             case arm_compute::DataType::U8:

             case arm_compute::DataType::QASYMM8:

                 armcomputetensorutils::CopyArmComputeITensorData(this->GetTensor(),

                                                                  static_cast<uint8_t*>(memory));

                 break;

             case arm_compute::DataType::QSYMM8_PER_CHANNEL:

             case arm_compute::DataType::QASYMM8_SIGNED:

                 armcomputetensorutils::CopyArmComputeITensorData(this->GetTensor(),

                                                                  static_cast<int8_t*>(memory));

                 break;

             case arm_compute::DataType::F16:

                 armcomputetensorutils::CopyArmComputeITensorData(this->GetTensor(),

                                                                  static_cast<armnn::Half*>(memory));

                 break;

             case arm_compute::DataType::S16:

             case arm_compute::DataType::QSYMM16:

                 armcomputetensorutils::CopyArmComputeITensorData(this->GetTensor(),

                                                                  static_cast<int16_t*>(memory));

                 break;

             case arm_compute::DataType::S32:

                 armcomputetensorutils::CopyArmComputeITensorData(this->GetTensor(),

                                                                  static_cast<int32_t*>(memory));

                 break;

             default:

             {

                 throw armnn::UnimplementedException();

             }

         }

         const_cast<armnn::ClImportTensorHandle*>(this)->Unmap();

     }


     // Only used for testing

     void CopyInFrom(const void* memory) override

     {

         this->Map(true);

         switch(this->GetDataType())

         {

             case arm_compute::DataType::F32:

                 armcomputetensorutils::CopyArmComputeITensorData(static_cast<const float*>(memory),

                                                                  this->GetTensor());

                 break;

             case arm_compute::DataType::U8:

             case arm_compute::DataType::QASYMM8:

                 armcomputetensorutils::CopyArmComputeITensorData(static_cast<const uint8_t*>(memory),

                                                                  this->GetTensor());

                 break;

             case arm_compute::DataType::F16:

                 armcomputetensorutils::CopyArmComputeITensorData(static_cast<const armnn::Half*>(memory),

                                                                  this->GetTensor());

                 break;

             case arm_compute::DataType::S16:

             case arm_compute::DataType::QSYMM8_PER_CHANNEL:

             case arm_compute::DataType::QASYMM8_SIGNED:

                 armcomputetensorutils::CopyArmComputeITensorData(static_cast<const int8_t*>(memory),

                                                                  this->GetTensor());

                 break;

             case arm_compute::DataType::QSYMM16:

                 armcomputetensorutils::CopyArmComputeITensorData(static_cast<const int16_t*>(memory),

                                                                  this->GetTensor());

                 break;

             case arm_compute::DataType::S32:

                 armcomputetensorutils::CopyArmComputeITensorData(static_cast<const int32_t*>(memory),

                                                                  this->GetTensor());

                 break;

             default:

             {

                 throw armnn::UnimplementedException();

             }

         }

         this->Unmap();

     }


     arm_compute::CLTensor m_Tensor;

     MemorySourceFlags m_ImportFlags;

     bool m_Imported;

 };


 class ClImportSubTensorHandle : public IClTensorHandle

 {

 public:

     ClImportSubTensorHandle(IClTensorHandle* parent,

                             const arm_compute::TensorShape& shape,

                             const arm_compute::Coordinates& coords)

     : m_Tensor(&parent->GetTensor(), shape, coords)

     {

         parentHandle = parent;

     }


     arm_compute::CLSubTensor& GetTensor() override { return m_Tensor; }

     arm_compute::CLSubTensor const& GetTensor() const override { return m_Tensor; }


     virtual void Allocate() override {}

     virtual void Manage() override {}


     virtual const void* Map(bool blocking = true) const override

     {

         IgnoreUnused(blocking);

         return static_cast<const void*>(m_Tensor.buffer() + m_Tensor.info()->offset_first_element_in_bytes());

     }

     virtual void Unmap() const override {}


     virtual ITensorHandle* GetParent() const override { return parentHandle; }


     virtual arm_compute::DataType GetDataType() const override

     {

         return m_Tensor.info()->data_type();

     }


     virtual void SetMemoryGroup(const std::shared_ptr<arm_compute::IMemoryGroup>& memoryGroup) override

     {

         IgnoreUnused(memoryGroup);

     }


     TensorShape GetStrides() const override

     {

         return armcomputetensorutils::GetStrides(m_Tensor.info()->strides_in_bytes());

     }


     TensorShape GetShape() const override

     {

         return armcomputetensorutils::GetShape(m_Tensor.info()->tensor_shape());

     }


 private:

     // Only used for testing

     void CopyOutTo(void* memory) const override

     {

         const_cast<ClImportSubTensorHandle*>(this)->Map(true);

         switch(this->GetDataType())

         {

             case arm_compute::DataType::F32:

                 armcomputetensorutils::CopyArmComputeITensorData(this->GetTensor(),

                                                                  static_cast<float*>(memory));

                 break;

             case arm_compute::DataType::U8:

             case arm_compute::DataType::QASYMM8:

                 armcomputetensorutils::CopyArmComputeITensorData(this->GetTensor(),

                                                                  static_cast<uint8_t*>(memory));

                 break;

             case arm_compute::DataType::F16:

                 armcomputetensorutils::CopyArmComputeITensorData(this->GetTensor(),

                                                                  static_cast<armnn::Half*>(memory));

                 break;

             case arm_compute::DataType::QSYMM8_PER_CHANNEL:

             case arm_compute::DataType::QASYMM8_SIGNED:

             armcomputetensorutils::CopyArmComputeITensorData(this->GetTensor(),

                                                              static_cast<int8_t*>(memory));

                 break;

             case arm_compute::DataType::S16:

             case arm_compute::DataType::QSYMM16:

                 armcomputetensorutils::CopyArmComputeITensorData(this->GetTensor(),

                                                                  static_cast<int16_t*>(memory));

                 break;

             case arm_compute::DataType::S32:

                 armcomputetensorutils::CopyArmComputeITensorData(this->GetTensor(),

                                                                  static_cast<int32_t*>(memory));

                 break;

             default:

             {

                 throw armnn::UnimplementedException();

             }

         }

         const_cast<ClImportSubTensorHandle*>(this)->Unmap();

     }


     // Only used for testing

     void CopyInFrom(const void* memory) override

     {

         this->Map(true);

         switch(this->GetDataType())

         {

             case arm_compute::DataType::F32:

                 armcomputetensorutils::CopyArmComputeITensorData(static_cast<const float*>(memory),

                                                                  this->GetTensor());

                 break;

             case arm_compute::DataType::U8:

             case arm_compute::DataType::QASYMM8:

                 armcomputetensorutils::CopyArmComputeITensorData(static_cast<const uint8_t*>(memory),

                                                                  this->GetTensor());

                 break;

             case arm_compute::DataType::F16:

                 armcomputetensorutils::CopyArmComputeITensorData(static_cast<const armnn::Half*>(memory),

                                                                  this->GetTensor());

                 break;

             case arm_compute::DataType::QSYMM8_PER_CHANNEL:

             case arm_compute::DataType::QASYMM8_SIGNED:

                 armcomputetensorutils::CopyArmComputeITensorData(static_cast<const int8_t*>(memory),

                                                                  this->GetTensor());

                 break;

             case arm_compute::DataType::S16:

             case arm_compute::DataType::QSYMM16:

                 armcomputetensorutils::CopyArmComputeITensorData(static_cast<const int16_t*>(memory),

                                                                  this->GetTensor());

                 break;

             case arm_compute::DataType::S32:

                 armcomputetensorutils::CopyArmComputeITensorData(static_cast<const int32_t*>(memory),

                                                                  this->GetTensor());

                 break;

             default:

             {

                 throw armnn::UnimplementedException();

             }

         }

         this->Unmap();

     }


     mutable arm_compute::CLSubTensor m_Tensor;

     ITensorHandle* parentHandle = nullptr;

 };


 } // namespace armnn

ArmComputeTensorHandle.hpp

ArmComputeTensorUtils.hpp

Half.hpp

IClTensorHandle.hpp

PolymorphicDowncast.hpp

armnn::ClImportSubTensorHandle
Definition: ClImportTensorHandle.hpp:337

armnn::ClImportSubTensorHandle::Manage
virtual void Manage() override
Indicate to the memory manager that this resource is active.
Definition: ClImportTensorHandle.hpp:351

armnn::ClImportSubTensorHandle::Unmap
virtual void Unmap() const override
Unmap the tensor data.
Definition: ClImportTensorHandle.hpp:358

armnn::ClImportSubTensorHandle::GetShape
TensorShape GetShape() const override
Get the number of elements for each dimension ordered from slowest iterating dimension to fastest ite...
Definition: ClImportTensorHandle.hpp:377

armnn::ClImportSubTensorHandle::GetStrides
TensorShape GetStrides() const override
Get the strides for each dimension ordered from largest to smallest where the smallest value is the s...
Definition: ClImportTensorHandle.hpp:372

armnn::ClImportSubTensorHandle::GetTensor
arm_compute::CLSubTensor const  & GetTensor() const override
Definition: ClImportTensorHandle.hpp:348

armnn::ClImportSubTensorHandle::GetParent
virtual ITensorHandle * GetParent() const override
Get the parent tensor if this is a subtensor.
Definition: ClImportTensorHandle.hpp:360

armnn::ClImportSubTensorHandle::Map
virtual const void * Map(bool blocking=true) const override
Map the tensor data for access.
Definition: ClImportTensorHandle.hpp:353

armnn::ClImportSubTensorHandle::Allocate
virtual void Allocate() override
Indicate to the memory manager that this resource is no longer active.
Definition: ClImportTensorHandle.hpp:350

armnn::ClImportSubTensorHandle::GetTensor
arm_compute::CLSubTensor & GetTensor() override
Definition: ClImportTensorHandle.hpp:347

armnn::ClImportSubTensorHandle::GetDataType
virtual arm_compute::DataType GetDataType() const override
Definition: ClImportTensorHandle.hpp:362

armnn::ClImportSubTensorHandle::ClImportSubTensorHandle
ClImportSubTensorHandle(IClTensorHandle *parent, const arm_compute::TensorShape &shape, const arm_compute::Coordinates &coords)
Definition: ClImportTensorHandle.hpp:339

armnn::ClImportSubTensorHandle::SetMemoryGroup
virtual void SetMemoryGroup(const std::shared_ptr< arm_compute::IMemoryGroup > &memoryGroup) override
Definition: ClImportTensorHandle.hpp:367

armnn::ClImportTensorHandle
Definition: ClImportTensorHandle.hpp:31

armnn::ClImportTensorHandle::Manage
virtual void Manage() override
Indicate to the memory manager that this resource is active.
Definition: ClImportTensorHandle.hpp:50

armnn::ClImportTensorHandle::ClImportTensorHandle
ClImportTensorHandle(const TensorInfo &tensorInfo, MemorySourceFlags importFlags)
Definition: ClImportTensorHandle.hpp:33

armnn::ClImportTensorHandle::ClImportTensorHandle
ClImportTensorHandle(const TensorInfo &tensorInfo, DataLayout dataLayout, MemorySourceFlags importFlags)
Definition: ClImportTensorHandle.hpp:39

armnn::ClImportTensorHandle::Import
virtual bool Import(void *memory, MemorySource source) override
Import externally allocated memory.
Definition: ClImportTensorHandle.hpp:92

armnn::ClImportTensorHandle::Unmap
virtual void Unmap() const override
Unmap the tensor data.
Definition: ClImportTensorHandle.hpp:58

armnn::ClImportTensorHandle::GetShape
TensorShape GetShape() const override
Get the number of elements for each dimension ordered from slowest iterating dimension to fastest ite...
Definition: ClImportTensorHandle.hpp:77

armnn::ClImportTensorHandle::GetStrides
TensorShape GetStrides() const override
Get the strides for each dimension ordered from largest to smallest where the smallest value is the s...
Definition: ClImportTensorHandle.hpp:72

armnn::ClImportTensorHandle::GetImportFlags
MemorySourceFlags GetImportFlags() const override
Get flags describing supported import sources.
Definition: ClImportTensorHandle.hpp:87

armnn::ClImportTensorHandle::GetTensor
arm_compute::CLTensor & GetTensor() override
Definition: ClImportTensorHandle.hpp:47

armnn::ClImportTensorHandle::GetParent
virtual ITensorHandle * GetParent() const override
Get the parent tensor if this is a subtensor.
Definition: ClImportTensorHandle.hpp:60

armnn::ClImportTensorHandle::GetTensor
arm_compute::CLTensor const  & GetTensor() const override
Definition: ClImportTensorHandle.hpp:48

armnn::ClImportTensorHandle::Map
virtual const void * Map(bool blocking=true) const override
Map the tensor data for access.
Definition: ClImportTensorHandle.hpp:52

armnn::ClImportTensorHandle::Allocate
virtual void Allocate() override
Indicate to the memory manager that this resource is no longer active.
Definition: ClImportTensorHandle.hpp:49

armnn::ClImportTensorHandle::SetImportFlags
void SetImportFlags(MemorySourceFlags importFlags)
Definition: ClImportTensorHandle.hpp:82

armnn::ClImportTensorHandle::GetDataType
virtual arm_compute::DataType GetDataType() const override
Definition: ClImportTensorHandle.hpp:62

armnn::ClImportTensorHandle::CanBeImported
virtual bool CanBeImported(void *, MemorySource source) override
Implementations must determine if this memory block can be imported.
Definition: ClImportTensorHandle.hpp:187

armnn::ClImportTensorHandle::SetMemoryGroup
virtual void SetMemoryGroup(const std::shared_ptr< arm_compute::IMemoryGroup > &memoryGroup) override
Definition: ClImportTensorHandle.hpp:67

armnn::IClTensorHandle
Definition: IClTensorHandle.hpp:14

armnn::ITensorHandle
Definition: ITensorHandle.hpp:17

armnn::MemoryImportException
Definition: Exceptions.hpp:126

armnn::TensorInfo
Definition: Tensor.hpp:153

armnn::TensorShape
Definition: Tensor.hpp:21

armnn::UnimplementedException
Definition: Exceptions.hpp:99

armnn
Copyright (c) 2021 ARM Limited and Contributors.
Definition: 01_00_quick_start.dox:7

armnn::Half
half_float::half Half
Definition: Half.hpp:22

armnn::MemorySource
MemorySource
Define the Memory Source to reduce copies.
Definition: Types.hpp:246

armnn::MemorySource::Malloc
@ Malloc

armnn::MemorySource::Gralloc
@ Gralloc

armnn::MemorySource::DmaBufProtected
@ DmaBufProtected

armnn::MemorySource::DmaBuf
@ DmaBuf

armnn::IgnoreUnused
void IgnoreUnused(Ts &&...)
Definition: IgnoreUnused.hpp:14

armnn::MemorySourceFlags
unsigned int MemorySourceFlags
Definition: MemorySources.hpp:15

armnn::Status
Status
enumeration
Definition: Types.hpp:43

armnn::Coordinates
std::array< unsigned int, MaxNumOfTensorDimensions > Coordinates
Definition: InternalTypes.hpp:15

armnn::DataLayout
DataLayout
Definition: Types.hpp:63

armnn::DataType
DataType
Definition: Types.hpp:49