d1/dbb/GPUReconstructionDeviceBase_8cxx_source.html

// Copyright 2019-2020 CERN and copyright holders of ALICE O2.

// See https://alice-o2.web.cern.ch/copyright for details of the copyright holders.

// All rights not expressly granted are reserved.

//

// This software is distributed under the terms of the GNU General Public

// License v3 (GPL Version 3), copied verbatim in the file "COPYING".

//

// In applying this license CERN does not waive the privileges and immunities

// granted to it by virtue of its status as an Intergovernmental Organization

// or submit itself to any jurisdiction.


#include "GPUReconstructionDeviceBase.h"

#include "GPUReconstructionIncludes.h"


#include "GPUTPCTracker.h"


using namespace o2::gpu;


#if defined(_WIN32)

#include "../utils/pthread_mutex_win32_wrapper.h"

#else

#include <cerrno>

#include <unistd.h>

#endif

#include <cstring>


class GPUTPCRow;


#define SemLockName "AliceHLTTPCGPUTrackerInitLockSem"


GPUReconstructionDeviceBase::GPUReconstructionDeviceBase(const GPUSettingsDeviceBackend& cfg, size_t sizeCheck) : GPUReconstructionCPU(cfg)

{

  if (sizeCheck != sizeof(GPUReconstructionDeviceBase)) {

    GPUFatal("Mismatch of C++ object size between GPU compilers!");

  }

}


GPUReconstructionDeviceBase::~GPUReconstructionDeviceBase() = default;


int32_t GPUReconstructionDeviceBase::GetGlobalLock(void*& pLock)

{

#ifdef _WIN32

  HANDLE* semLock = new HANDLE;

  *semLock = CreateSemaphore(nullptr, 1, 1, SemLockName);

  if (*semLock == nullptr) {

    GPUError("Error creating GPUInit Semaphore");

    return (1);

  }

  WaitForSingleObject(*semLock, INFINITE);

#elif !defined(__APPLE__) // GPU not supported on MacOS anyway

  sem_t* semLock = sem_open(SemLockName, O_CREAT, 0x01B6, 1);

  if (semLock == SEM_FAILED) {

    GPUError("Error creating GPUInit Semaphore");

    return (1);

  }

  timespec semtime;

  clock_gettime(CLOCK_REALTIME, &semtime);

  semtime.tv_sec += 10;

  while (sem_timedwait(semLock, &semtime) != 0) {

    GPUError("Global Lock for GPU initialisation was not released for 10 seconds, assuming another thread died");

    GPUWarning("Resetting the global lock");

    sem_post(semLock);

  }

#else

  void* semLock = nullptr;

#endif

  pLock = semLock;

  return 0;

}


void GPUReconstructionDeviceBase::ReleaseGlobalLock(void* sem)

{

// Release the global named semaphore that locks GPU Initialization

#ifdef _WIN32

  HANDLE* h = (HANDLE*)sem;

  ReleaseSemaphore(*h, 1, nullptr);

  CloseHandle(*h);

  delete h;

#elif !defined(__APPLE__) // GPU not supported on MacOS anyway

  sem_t* pSem = (sem_t*)sem;

  sem_post(pSem);

  sem_unlink(SemLockName);

#endif

}


int32_t GPUReconstructionDeviceBase::InitDevice()

{

  // cpu_set_t mask;

  // CPU_ZERO(&mask);

  // CPU_SET(0, &mask);

  // sched_setaffinity(0, sizeof(mask), &mask);


  if (mProcessingSettings.memoryAllocationStrategy == GPUMemoryResource::ALLOCATION_INDIVIDUAL) {

    GPUError("Individual memory allocation strategy unsupported for device\n");

    return (1);

  }

  if (mProcessingSettings.nStreams > GPUCA_MAX_STREAMS) {

    GPUError("Too many straems requested %d > %d\n", mProcessingSettings.nStreams, GPUCA_MAX_STREAMS);

    return (1);

  }


  void* semLock = nullptr;

  if (mProcessingSettings.globalInitMutex && GetGlobalLock(semLock)) {

    return (1);

  }


  if (mProcessingSettings.deviceTimers) {

    AddGPUEvents(mDebugEvents);

  }


  int32_t retVal = InitDevice_Runtime();

  if (retVal) {

    GPUImportant("GPU Tracker initialization failed");

    return (1);

  }


  if (mProcessingSettings.globalInitMutex) {

    ReleaseGlobalLock(semLock);

  }


  mDeviceMemoryPermanent = mDeviceMemoryBase;

  mHostMemoryPermanent = mHostMemoryBase;

  ClearAllocatedMemory();


  mProcShadow.InitGPUProcessor(this, GPUProcessor::PROCESSOR_TYPE_SLAVE);

  mProcShadow.mMemoryResProcessors = RegisterMemoryAllocation(&mProcShadow, &GPUProcessorProcessors::SetPointersDeviceProcessor, GPUMemoryResource::MEMORY_PERMANENT | GPUMemoryResource::MEMORY_HOST, "Processors");

  AllocateRegisteredMemory(mProcShadow.mMemoryResProcessors);


  if (mMaster == nullptr || mProcessingSettings.debugLevel >= 2) {

    GPUInfo("GPU Tracker initialization successfull"); // Verbosity reduced because GPU backend will print GPUImportant message!

  }


  return (retVal);

}


void* GPUReconstructionDeviceBase::GPUProcessorProcessors::SetPointersDeviceProcessor(void* mem)

{

  // Don't run constructor / destructor here, this will be just local memcopy of Processors in GPU Memory

  computePointerWithAlignment(mem, mProcessorsProc, 1);

  return mem;

}


int32_t GPUReconstructionDeviceBase::ExitDevice()

{

  int32_t retVal = ExitDevice_Runtime();

  mProcessorsShadow = nullptr;

  mHostMemoryPool = mHostMemoryBase = mDeviceMemoryPool = mDeviceMemoryBase = mHostMemoryPoolEnd = mDeviceMemoryPoolEnd = mHostMemoryPermanent = mDeviceMemoryPermanent = nullptr;

  mHostMemorySize = mDeviceMemorySize = 0;


  return retVal;

}


int32_t GPUReconstructionDeviceBase::registerMemoryForGPU_internal(const void* ptr, size_t size)

{

  return IsGPU();

}


int32_t GPUReconstructionDeviceBase::unregisterMemoryForGPU_internal(const void* ptr)

{

  return IsGPU();

}


void GPUReconstructionDeviceBase::unregisterRemainingRegisteredMemory()

{

  for (auto& ptr : mRegisteredMemoryPtrs) {

    unregisterMemoryForGPU_internal(ptr);

  }

  mRegisteredMemoryPtrs.clear();

}


void GPUReconstructionDeviceBase::runConstantRegistrators()

{

  auto& list = getDeviceConstantMemRegistratorsVector();

  for (uint32_t i = 0; i < list.size(); i++) {

    auto* ptr = list[i]();

    if (ptr == nullptr) {

      GPUFatal("Error registering constant memory");

    }

    mDeviceConstantMemList.emplace_back(ptr);

  }

}


size_t GPUReconstructionDeviceBase::TransferMemoryInternal(GPUMemoryResource* res, int32_t stream, deviceEvent* ev, deviceEvent* evList, int32_t nEvents, bool toGPU, const void* src, void* dst)

{

  if (!(res->Type() & GPUMemoryResource::MEMORY_GPU)) {

    if (mProcessingSettings.debugLevel >= 4) {

      GPUInfo("Skipped transfer of non-GPU memory resource: %s", res->Name());

    }

    return 0;

  }

  if (mProcessingSettings.debugLevel >= 3 && (strcmp(res->Name(), "ErrorCodes") || mProcessingSettings.debugLevel >= 4)) {

    GPUInfo("Copying to %s: %s - %ld bytes", toGPU ? "GPU" : "Host", res->Name(), (int64_t)res->Size());

  }

  return GPUMemCpy(dst, src, res->Size(), stream, toGPU, ev, evList, nEvents);

}


i
int32_t i
Definition GPUCommonAlgorithm.h:431

GPUCA_MAX_STREAMS
#define GPUCA_MAX_STREAMS
Definition GPUDefParametersDefault.h:584

SemLockName
#define SemLockName
Definition GPUReconstructionDeviceBase.cxx:32

GPUReconstructionDeviceBase.h

GPUReconstructionIncludes.h

retVal
int32_t retVal
Definition GPUReconstruction.cxx:58

GPUTPCTracker.h

res
uint32_t res
Definition RawData.h:0

ptr
TBranch * ptr
Definition TTreePlugin.cxx:836

h
Class for time synchronization of RawReader instances.

o2::gpu::GPUMemoryResource
Definition GPUMemoryResource.h:53

o2::gpu::GPUMemoryResource::MEMORY_GPU
@ MEMORY_GPU
Definition GPUMemoryResource.h:60

o2::gpu::GPUMemoryResource::MEMORY_PERMANENT
@ MEMORY_PERMANENT
Definition GPUMemoryResource.h:69

o2::gpu::GPUMemoryResource::MEMORY_HOST
@ MEMORY_HOST
Definition GPUMemoryResource.h:59

o2::gpu::GPUMemoryResource::ALLOCATION_INDIVIDUAL
@ ALLOCATION_INDIVIDUAL
Definition GPUMemoryResource.h:75

o2::gpu::GPUProcessor::computePointerWithAlignment
static void computePointerWithAlignment(T *&basePtr, S *&objPtr, size_t nEntries=1)
Definition GPUProcessor.h:126

o2::gpu::GPUProcessor::InitGPUProcessor
void InitGPUProcessor(GPUReconstruction *rec, ProcessorType type=PROCESSOR_TYPE_CPU, GPUProcessor *slaveProcessor=nullptr)
Definition GPUProcessor.cxx:30

o2::gpu::GPUProcessor::PROCESSOR_TYPE_SLAVE
@ PROCESSOR_TYPE_SLAVE
Definition GPUProcessor.h:42

o2::gpu::GPUReconstructionCPU
Definition GPUReconstructionCPU.h:44

o2::gpu::GPUReconstructionCPU::mProcessorsShadow
GPUConstantMem *& mProcessorsShadow
Definition GPUReconstructionCPU.h:120

o2::gpu::GPUReconstructionCPU::GPUMemCpy
virtual size_t GPUMemCpy(void *dst, const void *src, size_t size, int32_t stream, int32_t toGPU, deviceEvent *ev=nullptr, deviceEvent *evList=nullptr, int32_t nEvents=1)
Definition GPUReconstructionCPU.cxx:148

o2::gpu::GPUReconstructionCPU::unregisterMemoryForGPU_internal
int32_t unregisterMemoryForGPU_internal(const void *ptr) override
Definition GPUReconstructionCPU.h:90

o2::gpu::GPUReconstructionCPU::mProcShadow
GPUProcessorProcessors mProcShadow
Definition GPUReconstructionCPU.h:119

o2::gpu::GPUReconstructionDeviceBase
Definition GPUReconstructionDeviceBase.h:30

o2::gpu::GPUReconstructionDeviceBase::InitDevice_Runtime
virtual int32_t InitDevice_Runtime()=0

o2::gpu::GPUReconstructionDeviceBase::ExitDevice
int32_t ExitDevice() override
Definition GPUReconstructionDeviceBase.cxx:146

o2::gpu::GPUReconstructionDeviceBase::TransferMemoryInternal
size_t TransferMemoryInternal(GPUMemoryResource *res, int32_t stream, deviceEvent *ev, deviceEvent *evList, int32_t nEvents, bool toGPU, const void *src, void *dst) override
Definition GPUReconstructionDeviceBase.cxx:186

o2::gpu::GPUReconstructionDeviceBase::ReleaseGlobalLock
void ReleaseGlobalLock(void *sem)
Definition GPUReconstructionDeviceBase.cxx:74

o2::gpu::GPUReconstructionDeviceBase::~GPUReconstructionDeviceBase
~GPUReconstructionDeviceBase() override

o2::gpu::GPUReconstructionDeviceBase::InitDevice
int32_t InitDevice() override
Definition GPUReconstructionDeviceBase.cxx:89

o2::gpu::GPUReconstructionDeviceBase::GetGlobalLock
int32_t GetGlobalLock(void *&pLock)
Definition GPUReconstructionDeviceBase.cxx:43

o2::gpu::GPUReconstructionDeviceBase::mDebugEvents
DebugEvents * mDebugEvents
Definition GPUReconstructionDeviceBase.h:70

o2::gpu::GPUReconstructionDeviceBase::GPUReconstructionDeviceBase
GPUReconstructionDeviceBase(const GPUSettingsDeviceBackend &cfg, size_t sizeCheck)
Definition GPUReconstructionDeviceBase.cxx:34

o2::gpu::GPUReconstructionDeviceBase::registerMemoryForGPU_internal
int32_t registerMemoryForGPU_internal(const void *ptr, size_t size) override
Definition GPUReconstructionDeviceBase.cxx:156

o2::gpu::GPUReconstructionDeviceBase::runConstantRegistrators
void runConstantRegistrators()
Definition GPUReconstructionDeviceBase.cxx:174

o2::gpu::GPUReconstructionDeviceBase::unregisterRemainingRegisteredMemory
void unregisterRemainingRegisteredMemory()
Definition GPUReconstructionDeviceBase.cxx:166

o2::gpu::GPUReconstructionDeviceBase::unregisterMemoryForGPU_internal
int32_t unregisterMemoryForGPU_internal(const void *ptr) override
Definition GPUReconstructionDeviceBase.cxx:161

o2::gpu::GPUReconstructionProcessing::AddGPUEvents
void AddGPUEvents(T *&events)
Definition GPUReconstructionProcessing.h:149

o2::gpu::GPUReconstruction::mRegisteredMemoryPtrs
std::unordered_set< const void * > mRegisteredMemoryPtrs
Definition GPUReconstruction.h:327

o2::gpu::GPUReconstruction::mHostMemoryPool
void * mHostMemoryPool
Definition GPUReconstruction.h:313

o2::gpu::GPUReconstruction::mMaster
GPUReconstruction * mMaster
Definition GPUReconstruction.h:329

o2::gpu::GPUReconstruction::mDeviceMemorySize
size_t mDeviceMemorySize
Definition GPUReconstruction.h:323

o2::gpu::GPUReconstruction::IsGPU
bool IsGPU() const
Definition GPUReconstruction.h:189

o2::gpu::GPUReconstruction::mDeviceMemoryBase
void * mDeviceMemoryBase
Definition GPUReconstruction.h:318

o2::gpu::GPUReconstruction::mProcessingSettings
GPUSettingsProcessing mProcessingSettings
Definition GPUReconstruction.h:301

o2::gpu::GPUReconstruction::RegisterMemoryAllocation
int16_t RegisterMemoryAllocation(T *proc, void *(T::*setPtr)(void *), int32_t type, const char *name="", const GPUMemoryReuse &re=GPUMemoryReuse())
Definition GPUReconstruction.h:431

o2::gpu::GPUReconstruction::ClearAllocatedMemory
void ClearAllocatedMemory(bool clearOutputs=true)
Definition GPUReconstruction.cxx:862

o2::gpu::GPUReconstruction::mDeviceMemoryPoolEnd
void * mDeviceMemoryPoolEnd
Definition GPUReconstruction.h:321

o2::gpu::GPUReconstruction::mDeviceMemoryPermanent
void * mDeviceMemoryPermanent
Definition GPUReconstruction.h:319

o2::gpu::GPUReconstruction::mDeviceMemoryPool
void * mDeviceMemoryPool
Definition GPUReconstruction.h:320

o2::gpu::GPUReconstruction::mHostMemoryPoolEnd
void * mHostMemoryPoolEnd
Definition GPUReconstruction.h:314

o2::gpu::GPUReconstruction::mHostMemoryBase
void * mHostMemoryBase
Definition GPUReconstruction.h:311

o2::gpu::GPUReconstruction::mHostMemorySize
size_t mHostMemorySize
Definition GPUReconstruction.h:316

o2::gpu::GPUReconstruction::mHostMemoryPermanent
void * mHostMemoryPermanent
Definition GPUReconstruction.h:312

o2::gpu::GPUReconstruction::AllocateRegisteredMemory
size_t AllocateRegisteredMemory(GPUProcessor *proc, bool resetCustom=false)
Definition GPUReconstruction.cxx:482

o2::gpu::GPUTPCRow
Definition GPUTPCRow.h:31

src
GLenum src
Definition glcorearb.h:1767

size
GLsizeiptr size
Definition glcorearb.h:659

dst
GLenum GLenum dst
Definition glcorearb.h:1767

stream
GLuint GLuint stream
Definition glcorearb.h:1806

o2::gpu
Definition TrackTRD.h:35

sem_t
HANDLE sem_t
Definition pthread_mutex_win32_wrapper.h:22

list
Definition list.h:40

o2::gpu::GPUReconstructionCPU::GPUProcessorProcessors::mProcessorsProc
GPUConstantMem * mProcessorsProc
Definition GPUReconstructionCPU.h:68

o2::gpu::GPUReconstructionCPU::GPUProcessorProcessors::mMemoryResProcessors
int16_t mMemoryResProcessors
Definition GPUReconstructionCPU.h:70

o2::gpu::GPUSettingsDeviceBackend
Definition GPUSettings.h:75

o2::gpu::gpu_reconstruction_kernels::deviceEvent
Definition GPUReconstructionProcessing.h:32

nEvents
const int nEvents
Definition test_Fifo.cxx:27