d2/de8/GPUReconstruction_8h_source.html

// Copyright 2019-2020 CERN and copyright holders of ALICE O2.

// See https://alice-o2.web.cern.ch/copyright for details of the copyright holders.

// All rights not expressly granted are reserved.

//

// This software is distributed under the terms of the GNU General Public

// License v3 (GPL Version 3), copied verbatim in the file "COPYING".

//

// In applying this license CERN does not waive the privileges and immunities

// granted to it by virtue of its status as an Intergovernmental Organization

// or submit itself to any jurisdiction.


#if !defined(GPURECONSTRUCTION_H) && !defined(__OPENCL__)

#define GPURECONSTRUCTION_H


#include <cstddef>

#include <cstdio>

#include <cstring>

#include <string>

#include <memory>

#include <iosfwd>

#include <vector>

#include <functional>

#include <unordered_map>

#include <unordered_set>

#include <atomic>


#include "GPUDataTypes.h"

#include "GPUMemoryResource.h"

#include "GPUOutputControl.h"


/*#include "GPUParam.h"

#include "GPUSettings.h"

#include "GPULogging.h"*/


namespace o2::its

{

template <int>

class TrackerTraits;

template <int>

class VertexerTraits;

template <int>

class TimeFrame;

} // namespace o2::its


namespace o2::gpu

{

class GPUChain;

struct GPUMemorySizeScalers;

struct GPUReconstructionPipelineContext;

struct GPUReconstructionThreading;

class GPUROOTDumpCore;

class ThrustVolatileAllocator;

struct GPUDefParameters;

class GPUMemoryResource;

struct GPUSettingsDeviceBackend;

struct GPUSettingsGRP;

struct GPUSettingsProcessing;

struct GPUSettingsRec;

struct GPUSettingsRecDynamic;

struct GPUMemoryReuse;


namespace gpu_reconstruction_kernels

{

struct deviceEvent;

class threadContext;

} // namespace gpu_reconstruction_kernels


class GPUReconstruction

{

 protected:

  class LibraryLoader; // These must be the first members to ensure correct destructor order!

  std::shared_ptr<LibraryLoader> mMyLib = nullptr;

  std::vector<GPUMemoryResource> mMemoryResources;

  std::vector<std::unique_ptr<GPUChain>> mChains;


 public:

  virtual ~GPUReconstruction();

  GPUReconstruction(const GPUReconstruction&) = delete;

  GPUReconstruction& operator=(const GPUReconstruction&) = delete;


  // General definitions

  constexpr static uint32_t NSECTORS = GPUCA_NSECTORS;


  using GeometryType = GPUDataTypes::GeometryType;

  using DeviceType = GPUDataTypes::DeviceType;

  using RecoStep = GPUDataTypes::RecoStep;

  using GeneralStep = GPUDataTypes::GeneralStep;

  using RecoStepField = GPUDataTypes::RecoStepField;

  using InOutTypeField = GPUDataTypes::InOutTypeField;


  static constexpr const char* const GEOMETRY_TYPE_NAMES[] = {"INVALID", "ALIROOT", "O2"};

#ifdef GPUCA_TPC_GEOMETRY_O2

  static constexpr GeometryType geometryType = GeometryType::O2;

#else

  static constexpr GeometryType geometryType = GeometryType::ALIROOT;

#endif


  static DeviceType GetDeviceType(const char* type);

  enum InOutPointerType : uint32_t { CLUSTER_DATA = 0,

                                     SECTOR_OUT_TRACK = 1,

                                     SECTOR_OUT_CLUSTER = 2,

                                     MC_LABEL_TPC = 3,

                                     MC_INFO_TPC = 4,

                                     MERGED_TRACK = 5,

                                     MERGED_TRACK_HIT = 6,

                                     TRD_TRACK = 7,

                                     TRD_TRACKLET = 8,

                                     RAW_CLUSTERS = 9,

                                     CLUSTERS_NATIVE = 10,

                                     TRD_TRACKLET_MC = 11,

                                     TPC_COMPRESSED_CL = 12,

                                     TPC_DIGIT = 13,

                                     TPC_ZS = 14,

                                     CLUSTER_NATIVE_MC = 15,

                                     TPC_DIGIT_MC = 16,

                                     TRD_SPACEPOINT = 17,

                                     TRD_TRIGGERRECORDS = 18,

                                     TF_SETTINGS = 19 };


  static constexpr const char* const IOTYPENAMES[] = {"TPC HLT Clusters", "TPC Sector Tracks", "TPC Sector Track Clusters", "TPC Cluster MC Labels", "TPC Track MC Informations", "TPC Tracks", "TPC Track Clusters", "TRD Tracks", "TRD Tracklets",

                                                      "TPC Raw Clusters", "TPC Native Clusters", "TRD Tracklet MC Labels", "TPC Compressed Clusters", "TPC Digit", "TPC ZS Page", "TPC Native Clusters MC Labels", "TPC Digit MC Labeels",

                                                      "TRD Spacepoints", "TRD Triggerrecords", "TF Settings"};


  static uint32_t getNIOTypeMultiplicity(InOutPointerType type) { return (type == CLUSTER_DATA || type == SECTOR_OUT_TRACK || type == SECTOR_OUT_CLUSTER || type == RAW_CLUSTERS || type == TPC_DIGIT || type == TPC_DIGIT_MC) ? NSECTORS : 1; }


  // Functionality to create an instance of GPUReconstruction for the desired device

  static GPUReconstruction* CreateInstance(const GPUSettingsDeviceBackend& cfg);

  static GPUReconstruction* CreateInstance(DeviceType type = DeviceType::CPU, bool forceType = true, GPUReconstruction* master = nullptr);

  static GPUReconstruction* CreateInstance(int32_t type, bool forceType, GPUReconstruction* master = nullptr) { return CreateInstance((DeviceType)type, forceType, master); }

  static GPUReconstruction* CreateInstance(const char* type, bool forceType, GPUReconstruction* master = nullptr);

  static bool CheckInstanceAvailable(DeviceType type, bool verbose);


  enum class krnlDeviceType : int32_t { CPU = 0,

                                        Device = 1,

                                        Auto = -1 };


  // Global steering functions

  template <class T, typename... Args>

  T* AddChain(Args... args);


  int32_t Init();

  int32_t Finalize();

  int32_t Exit();


  void DumpSettings(const char* dir = "");

  int32_t ReadSettings(const char* dir = "");


  void PrepareEvent();

  virtual int32_t RunChains() = 0;

  uint32_t getNEventsProcessed() { return mNEventsProcessed; }

  uint32_t getNEventsProcessedInStat() { return mStatNEvents; }

  int32_t registerMemoryForGPU(const void* ptr, size_t size);

  int32_t unregisterMemoryForGPU(const void* ptr);

  virtual void* getGPUPointer(void* ptr) { return ptr; }

  virtual void startGPUProfiling() {}

  virtual void endGPUProfiling() {}

  int32_t GPUChkErrA(const int64_t error, const char* file, int32_t line, bool failOnError);

  int32_t CheckErrorCodes(bool cpuOnly = false, bool forceShowErrors = false, std::vector<std::array<uint32_t, 4>>* fillErrors = nullptr);

  void RunPipelineWorker();

  void TerminatePipelineWorker();


  // Helpers for memory allocation

  GPUMemoryResource& Res(int16_t num) { return mMemoryResources[num]; }

  template <class T>

  int16_t RegisterMemoryAllocation(T* proc, void* (T::*setPtr)(void*), int32_t type, const char* name = "", const GPUMemoryReuse& re = GPUMemoryReuse());

  size_t AllocateMemoryResources();

  size_t AllocateRegisteredMemory(GPUProcessor* proc, bool resetCustom = false);


  size_t AllocateRegisteredMemory(int16_t res, GPUOutputControl* control = nullptr);

  void AllocateRegisteredForeignMemory(int16_t res, GPUReconstruction* rec, GPUOutputControl* control = nullptr);

  void* AllocateDirectMemory(size_t size, int32_t type);

  void* AllocateVolatileDeviceMemory(size_t size);

  void* AllocateVolatileMemory(size_t size, bool device);

  void MakeFutureDeviceMemoryAllocationsVolatile();

  void FreeRegisteredMemory(GPUProcessor* proc, bool freeCustom = false, bool freePermanent = false);

  void FreeRegisteredMemory(int16_t res);

  void ClearAllocatedMemory(bool clearOutputs = true);

  void ReturnVolatileDeviceMemory();

  void ReturnVolatileMemory();

  ThrustVolatileAllocator getThrustVolatileDeviceAllocator();

  void PushNonPersistentMemory(uint64_t tag);

  void PopNonPersistentMemory(RecoStep step, uint64_t tag, const GPUProcessor* proc = nullptr);

  void BlockStackedMemory(GPUReconstruction* rec);

  void UnblockStackedMemory();

  void ResetRegisteredMemoryPointers(GPUProcessor* proc);

  void ResetRegisteredMemoryPointers(int16_t res);

  void ComputeReuseMax(GPUProcessor* proc);

  void PrintMemoryStatistics();

  void PrintMemoryOverview();

  void PrintMemoryMax();

  void SetMemoryExternalInput(int16_t res, void* ptr);

  GPUMemorySizeScalers* MemoryScalers() { return mMemoryScalers.get(); }


  // Helpers to fetch processors from other shared libraries

  virtual void GetITSTraits(std::unique_ptr<o2::its::TrackerTraits<7>>* trackerTraits, std::unique_ptr<o2::its::VertexerTraits<7>>* vertexerTraits, std::unique_ptr<o2::its::TimeFrame<7>>* timeFrame);

  bool slavesExist() { return mSlaves.size() || mMaster; }

  int slaveId() { return mSlaveId; }


  // Getters / setters for parameters

  DeviceType GetDeviceType() const;

  bool IsGPU() const { return GetDeviceType() != DeviceType::INVALID_DEVICE && GetDeviceType() != DeviceType::CPU; }

  const GPUParam& GetParam() const;

  const GPUConstantMem& GetConstantMem() const { return *mHostConstantMem; }

  const GPUTrackingInOutPointers GetIOPtrs() const;

  const GPUSettingsGRP& GetGRPSettings() const { return *mGRPSettings; }

  const GPUSettingsDeviceBackend& GetDeviceBackendSettings() const { return *mDeviceBackendSettings; }

  const GPUSettingsProcessing& GetProcessingSettings() const { return *mProcessingSettings; }

  const GPUCalibObjectsConst& GetCalib() const;

  bool IsInitialized() const { return mInitialized; }

  void SetSettings(float solenoidBzNominalGPU, const GPURecoStepConfiguration* workflow = nullptr);

  void SetSettings(const GPUSettingsGRP* grp, const GPUSettingsRec* rec = nullptr, const GPUSettingsProcessing* proc = nullptr, const GPURecoStepConfiguration* workflow = nullptr);

  void SetResetTimers(bool reset);      // May update also after Init()

  void SetDebugLevelTmp(int32_t level); // Temporarily, before calling SetSettings()

  void UpdateSettings(const GPUSettingsGRP* g, const GPUSettingsProcessing* p = nullptr, const GPUSettingsRecDynamic* d = nullptr);

  void UpdateDynamicSettings(const GPUSettingsRecDynamic* d);

  void SetOutputControl(const GPUOutputControl& v) { mOutputControl = v; }

  void SetOutputControl(void* ptr, size_t size);

  void SetInputControl(void* ptr, size_t size);

  GPUOutputControl& OutputControl() { return mOutputControl; }

  uint32_t NStreams() const { return mNStreams; }

  const void* DeviceMemoryBase() const { return mDeviceMemoryBase; }

  virtual const GPUDefParameters& getGPUParameters(bool doGPU) const = 0;


  RecoStepField GetRecoSteps() const { return mRecoSteps.steps; }

  RecoStepField GetRecoStepsGPU() const { return mRecoSteps.stepsGPUMask; }

  InOutTypeField GetRecoStepsInputs() const { return mRecoSteps.inputs; }

  InOutTypeField GetRecoStepsOutputs() const { return mRecoSteps.outputs; }

  int32_t getRecoStepNum(RecoStep step, bool validCheck = true);

  int32_t getGeneralStepNum(GeneralStep step, bool validCheck = true);


  void setErrorCodeOutput(std::vector<std::array<uint32_t, 4>>* v) { mOutputErrorCodes = v; }

  std::vector<std::array<uint32_t, 4>>* getErrorCodeOutput() { return mOutputErrorCodes; }


  // Registration of GPU Processors

  template <class T>

  void RegisterGPUProcessor(T* proc, bool deviceSlave);

  template <class T>

  void SetupGPUProcessor(T* proc, bool allocate);

  void RegisterGPUDeviceProcessor(GPUProcessor* proc, GPUProcessor* slaveProcessor);

  void ConstructGPUProcessor(GPUProcessor* proc);


  // Support / Debugging

  virtual void PrintKernelOccupancies() {}

  double GetStatKernelTime() { return mStatKernelTime; }

  double GetStatWallTime() { return mStatWallTime; }

  void setDebugDumpCallback(std::function<void()>&& callback = std::function<void()>(nullptr));

  bool triggerDebugDump();

  std::string getDebugFolder(const std::string& prefix = ""); // empty string = no debug


  // Threading

  std::shared_ptr<GPUReconstructionThreading> mThreading;

  static int32_t getHostThreadIndex();

  int32_t GetMaxBackendThreads() const { return mMaxBackendThreads; }


 protected:

  void AllocateRegisteredMemoryInternal(GPUMemoryResource* res, GPUOutputControl* control, GPUReconstruction* recPool);

  void FreeRegisteredMemory(GPUMemoryResource* res);

  GPUReconstruction(const GPUSettingsDeviceBackend& cfg); // Constructor

  int32_t InitPhaseBeforeDevice();

  virtual int32_t InitDevice() = 0;

  int32_t InitPhasePermanentMemory();

  int32_t InitPhaseAfterDevice();

  void WriteConstantParams();

  virtual int32_t ExitDevice() = 0;

  virtual size_t WriteToConstantMemory(size_t offset, const void* src, size_t size, int32_t stream = -1, gpu_reconstruction_kernels::deviceEvent* ev = nullptr) = 0;

  void UpdateMaxMemoryUsed();

  int32_t EnqueuePipeline(bool terminate = false);

  GPUChain* GetNextChainInQueue();

  virtual int32_t GPUChkErrInternal(const int64_t error, const char* file, int32_t line) const { return 0; }


  virtual int32_t registerMemoryForGPU_internal(const void* ptr, size_t size) = 0;

  virtual int32_t unregisterMemoryForGPU_internal(const void* ptr) = 0;


  // Management for GPU thread contexts

  virtual std::unique_ptr<gpu_reconstruction_kernels::threadContext> GetThreadContext() = 0;


  // Private helpers for library loading

  static std::shared_ptr<LibraryLoader>* GetLibraryInstance(DeviceType type, bool verbose);

  static std::string getBackendVersions();


  // Private helper functions for memory management

  size_t AllocateRegisteredMemoryHelper(GPUMemoryResource* res, void*& ptr, void*& memorypool, void* memorybase, size_t memorysize, void* (GPUMemoryResource::*SetPointers)(void*), void*& memorypoolend, const char* device);

  size_t AllocateRegisteredPermanentMemory();


  // Private helper functions for reading / writing / allocating IO buffer from/to file

  template <class T, class S>

  uint32_t DumpData(FILE* fp, const T* const* entries, const S* num, InOutPointerType type);

  template <class T, class S>

  size_t ReadData(FILE* fp, const T** entries, S* num, std::unique_ptr<T[]>* mem, InOutPointerType type, T** nonConstPtrs = nullptr);

  template <class T>

  T* AllocateIOMemoryHelper(size_t n, const T*& ptr, std::unique_ptr<T[]>& u);

  int16_t RegisterMemoryAllocationHelper(GPUProcessor* proc, void* (GPUProcessor::*setPtr)(void*), int32_t type, const char* name, const GPUMemoryReuse& re);


  // Private helper functions to dump / load flat objects

  template <class T>

  void DumpFlatObjectToFile(const T* obj, const char* file);

  template <class T>

  std::unique_ptr<T> ReadFlatObjectFromFile(const char* file);

  template <class T>

  void DumpStructToFile(const T* obj, const char* file);

  template <class T>

  std::unique_ptr<T> ReadStructFromFile(const char* file);

  template <class T>

  int32_t ReadStructFromFile(const char* file, T* obj);


  // Others

  virtual RecoStepField AvailableGPURecoSteps() { return RecoStep::AllRecoSteps; }

  virtual bool CanQueryMaxMemory() { return false; }


  // Pointers to tracker classes

  GPUConstantMem* processors() { return mHostConstantMem.get(); }

  const GPUConstantMem* processors() const { return mHostConstantMem.get(); }

  GPUParam& param();

  std::unique_ptr<GPUConstantMem> mHostConstantMem;

  GPUConstantMem* mDeviceConstantMem = nullptr;


  // Settings

  std::unique_ptr<GPUSettingsGRP> mGRPSettings;                     // Global Run Parameters

  std::unique_ptr<GPUSettingsDeviceBackend> mDeviceBackendSettings; // Processing Parameters (at constructor level)

  std::unique_ptr<GPUSettingsProcessing> mProcessingSettings;       // Processing Parameters (at init level)

  GPUOutputControl mOutputControl;                                  // Controls the output of the individual components

  GPUOutputControl mInputControl;                                   // Prefefined input memory location for reading standalone dumps

  std::unique_ptr<GPUMemorySizeScalers> mMemoryScalers;             // Scalers how much memory will be needed


  GPURecoStepConfiguration mRecoSteps;


  std::string mDeviceName = "CPU";


  // Ptrs to host and device memory;

  void* mHostMemoryBase = nullptr;          // Ptr to begin of large host memory buffer

  void* mHostMemoryPermanent = nullptr;     // Ptr to large host memory buffer offset by permanently allocated memory

  void* mHostMemoryPool = nullptr;          // Ptr to next free location in host memory buffer

  void* mHostMemoryPoolEnd = nullptr;       // Ptr to end of pool

  void* mHostMemoryPoolBlocked = nullptr;   // Ptr to end of pool

  size_t mHostMemorySize = 0;               // Size of host memory buffer

  size_t mHostMemoryUsedMax = 0;            // Maximum host memory size used over time

  void* mDeviceMemoryBase = nullptr;        // Same for device ...

  void* mDeviceMemoryPermanent = nullptr;   // ...

  void* mDeviceMemoryPool = nullptr;        // ...

  void* mDeviceMemoryPoolEnd = nullptr;     // ...

  void* mDeviceMemoryPoolBlocked = nullptr; // ...

  size_t mDeviceMemorySize = 0;             // ...

  size_t mDeviceMemoryUsedMax = 0;          // ...

  void* mVolatileMemoryStart = nullptr;     // Ptr to beginning of temporary volatile memory allocation, nullptr if uninitialized

  bool mDeviceMemoryAsVolatile = false;     // Make device memory allocations volatile


  std::unordered_set<const void*> mRegisteredMemoryPtrs; // List of pointers registered for GPU


  GPUReconstruction* mMaster = nullptr;    // Ptr to a GPUReconstruction object serving as master, sharing GPU memory, events, etc.

  std::vector<GPUReconstruction*> mSlaves; // Ptr to slave GPUReconstructions

  int mSlaveId = -1;                       // Id of this slave (-1 for master)


  // Others

  bool mInitialized = false;

  bool mInErrorHandling = false;

  uint32_t mStatNEvents = 0;

  uint32_t mNEventsProcessed = 0;

  double mStatKernelTime = 0.;

  double mStatWallTime = 0.;

  double mStatCPUTime = 0.;

  std::shared_ptr<GPUROOTDumpCore> mROOTDump;

  std::vector<std::array<uint32_t, 4>>* mOutputErrorCodes = nullptr;


  int32_t mMaxBackendThreads = 0; // Maximum number of threads that may be running, on CPU or GPU

  int32_t mGPUStuck = 0;          // Marks that the GPU is stuck, skip future events

  int32_t mNStreams = 1;          // Number of parallel GPU streams

  int32_t mMaxHostThreads = 0;    // Maximum number of OMP threads


  // Management for GPUProcessors


  struct ProcessorData {

    ProcessorData(GPUProcessor* p, void (GPUProcessor::*r)(), void (GPUProcessor::*i)(), void (GPUProcessor::*d)(const GPUTrackingInOutPointers&)) : proc(p), RegisterMemoryAllocation(r), InitializeProcessor(i), SetMaxData(d) {}

    GPUProcessor* proc;

    void (GPUProcessor::*RegisterMemoryAllocation)();

    void (GPUProcessor::*InitializeProcessor)();

    void (GPUProcessor::*SetMaxData)(const GPUTrackingInOutPointers&);

  };


  std::vector<ProcessorData> mProcessors;


  struct MemoryReuseMeta {

    MemoryReuseMeta() = default;

    MemoryReuseMeta(GPUProcessor* p, uint16_t r) : proc(p), res{r} {}

    GPUProcessor* proc = nullptr;

    std::vector<uint16_t> res;

  };


  struct alignedDeleter {

    void operator()(void* ptr) { ::operator delete[](ptr, std::align_val_t(GPUCA_BUFFER_ALIGNMENT)); };

  };


  std::unordered_map<GPUMemoryReuse::ID, MemoryReuseMeta> mMemoryReuse1to1;

  std::vector<std::tuple<void*, void*, size_t, size_t, uint64_t>> mNonPersistentMemoryStack; // hostPoolAddress, devicePoolAddress, individualAllocationCount, directIndividualAllocationCound, tag

  std::vector<GPUMemoryResource*> mNonPersistentIndividualAllocations;

  std::vector<std::unique_ptr<char[], alignedDeleter>> mNonPersistentIndividualDirectAllocations;

  std::vector<std::unique_ptr<char[], alignedDeleter>> mDirectMemoryChunks;

  std::vector<std::unique_ptr<char[], alignedDeleter>> mVolatileChunks;

  std::atomic_flag mMemoryMutex = ATOMIC_FLAG_INIT;


  std::unique_ptr<GPUReconstructionPipelineContext> mPipelineContext;


  // Helpers for loading device library via dlopen


  class LibraryLoader

  {

   public:

    ~LibraryLoader();

    LibraryLoader(const LibraryLoader&) = delete;

    const LibraryLoader& operator=(const LibraryLoader&) = delete;


   private:

    friend class GPUReconstruction;

    LibraryLoader(const char* lib, const char* func);

    int32_t LoadLibrary();

    int32_t CloseLibrary();

    GPUReconstruction* GetPtr(const GPUSettingsDeviceBackend& cfg);


    const char* mLibName;

    const char* mFuncName;

    void* mGPULib;

    void* mGPUEntry;

  };


  static std::shared_ptr<LibraryLoader> sLibCUDA, sLibHIP, sLibOCL;


  // Debugging

  struct debugInternal;

  static std::unique_ptr<debugInternal> mDebugData;

  bool mDebugEnabled = false;

  void debugInit();

  void debugExit();


  static GPUReconstruction* GPUReconstruction_Create_CPU(const GPUSettingsDeviceBackend& cfg);

};


template <class T, typename... Args>


inline T* GPUReconstruction::AddChain(Args... args)

{

  mChains.emplace_back(new T(this, args...));

  return (T*)mChains.back().get();

}


template <class T>


inline int16_t GPUReconstruction::RegisterMemoryAllocation(T* proc, void* (T::*setPtr)(void*), int32_t type, const char* name, const GPUMemoryReuse& re)

{

  return RegisterMemoryAllocationHelper(proc, static_cast<void* (GPUProcessor::*)(void*)>(setPtr), type, name, re);

}


template <class T>


inline void GPUReconstruction::RegisterGPUProcessor(T* proc, bool deviceSlave)

{

  mProcessors.emplace_back(proc, static_cast<void (GPUProcessor::*)()>(&T::RegisterMemoryAllocation), static_cast<void (GPUProcessor::*)()>(&T::InitializeProcessor), static_cast<void (GPUProcessor::*)(const GPUTrackingInOutPointers& io)>(&T::SetMaxData));

  GPUProcessor::ProcessorType processorType = deviceSlave ? GPUProcessor::PROCESSOR_TYPE_SLAVE : GPUProcessor::PROCESSOR_TYPE_CPU;

  proc->InitGPUProcessor(this, processorType);

}


template <class T>


inline void GPUReconstruction::SetupGPUProcessor(T* proc, bool allocate)

{

  static_assert(sizeof(T) > sizeof(GPUProcessor), "Need to setup derived class");

  if (allocate) {

    proc->SetMaxData(GetIOPtrs());

  }

  if (proc->mGPUProcessorType != GPUProcessor::PROCESSOR_TYPE_DEVICE && proc->mLinkedProcessor) {

    std::memcpy((void*)proc->mLinkedProcessor, (const void*)proc, sizeof(*proc));

    proc->mLinkedProcessor->InitGPUProcessor((GPUReconstruction*)this, GPUProcessor::PROCESSOR_TYPE_DEVICE, proc);

  }

  if (allocate) {

    AllocateRegisteredMemory(proc, true);

  } else {

    ResetRegisteredMemoryPointers(proc);

  }

}


} // namespace o2::gpu


#endif

i
int32_t i
Definition GPUCommonAlgorithm.h:436

GPUDataTypes.h

GPUCA_BUFFER_ALIGNMENT
#define GPUCA_BUFFER_ALIGNMENT
Definition GPUDefParametersConstants.h:29

GPUMemoryResource.h

GPUOutputControl.h

GPUCA_NSECTORS
#define GPUCA_NSECTORS
Definition GPUTPCGeometry.h:22

res
uint32_t res
Definition RawData.h:0

ptr
TBranch * ptr
Definition TTreePlugin.cxx:841

num
double num
Definition bench_Clusterizer.cxx:122

GPUSettingsRec

bitfield< RecoStep, uint32_t >

char

int

o2::gpu::GPUChain
Definition GPUChain.h:29

o2::gpu::GPUDataTypes::RecoStep
RecoStep
Definition GPUDataTypes.h:122

o2::gpu::GPUDataTypes::GeometryType
GeometryType
Definition GPUDataTypes.h:117

o2::gpu::GPUDataTypes::RecoStepField
bitfield< RecoStep, uint32_t > RecoStepField
Definition GPUDataTypes.h:150

o2::gpu::GPUDataTypes::GeneralStep
GeneralStep
Definition GPUDataTypes.h:119

o2::gpu::GPUDataTypes::DeviceType
DeviceType
Definition GPUDataTypes.h:118

o2::gpu::GPUDataTypes::InOutTypeField
bitfield< InOutType, uint32_t > InOutTypeField
Definition GPUDataTypes.h:151

o2::gpu::GPUMemoryResource
Definition GPUMemoryResource.h:53

o2::gpu::GPUProcessor
Definition GPUProcessor.h:34

o2::gpu::GPUProcessor::ProcessorType
ProcessorType
Definition GPUProcessor.h:40

o2::gpu::GPUProcessor::PROCESSOR_TYPE_CPU
@ PROCESSOR_TYPE_CPU
Definition GPUProcessor.h:40

o2::gpu::GPUProcessor::PROCESSOR_TYPE_DEVICE
@ PROCESSOR_TYPE_DEVICE
Definition GPUProcessor.h:41

o2::gpu::GPUProcessor::PROCESSOR_TYPE_SLAVE
@ PROCESSOR_TYPE_SLAVE
Definition GPUProcessor.h:42

o2::gpu::GPUReconstruction::LibraryLoader
Definition GPUReconstruction.h:400

o2::gpu::GPUReconstruction::LibraryLoader::operator=
const LibraryLoader & operator=(const LibraryLoader &)=delete

o2::gpu::GPUReconstruction::LibraryLoader::~LibraryLoader
~LibraryLoader()
Definition GPUReconstructionLibrary.cxx:131

o2::gpu::GPUReconstruction::LibraryLoader::LibraryLoader
LibraryLoader(const LibraryLoader &)=delete

o2::gpu::GPUReconstruction
Definition GPUReconstruction.h:72

o2::gpu::GPUReconstruction::mRecoSteps
GPURecoStepConfiguration mRecoSteps
Definition GPUReconstruction.h:326

o2::gpu::GPUReconstruction::getErrorCodeOutput
std::vector< std::array< uint32_t, 4 > > * getErrorCodeOutput()
Definition GPUReconstruction.h:233

o2::gpu::GPUReconstruction::getBackendVersions
static std::string getBackendVersions()
Definition GPUReconstructionLibrary.cxx:188

o2::gpu::GPUReconstruction::InitPhaseBeforeDevice
int32_t InitPhaseBeforeDevice()
Definition GPUReconstruction.cxx:219

o2::gpu::GPUReconstruction::SetupGPUProcessor
void SetupGPUProcessor(T *proc, bool allocate)
Definition GPUReconstruction.h:452

o2::gpu::GPUReconstruction::GetDeviceType
static DeviceType GetDeviceType(const char *type)

o2::gpu::GPUReconstruction::mRegisteredMemoryPtrs
std::unordered_set< const void * > mRegisteredMemoryPtrs
Definition GPUReconstruction.h:348

o2::gpu::GPUReconstruction::InitPhasePermanentMemory
int32_t InitPhasePermanentMemory()
Definition GPUReconstruction.cxx:401

o2::gpu::GPUReconstruction::RegisterMemoryAllocationHelper
int16_t RegisterMemoryAllocationHelper(GPUProcessor *proc, void *(GPUProcessor::*setPtr)(void *), int32_t type, const char *name, const GPUMemoryReuse &re)
Definition GPUReconstruction.cxx:497

o2::gpu::GPUReconstruction::mChains
std::vector< std::unique_ptr< GPUChain > > mChains
Definition GPUReconstruction.h:77

o2::gpu::GPUReconstruction::mHostMemoryPool
void * mHostMemoryPool
Definition GPUReconstruction.h:333

o2::gpu::GPUReconstruction::RecoStep
GPUDataTypes::RecoStep RecoStep
Definition GPUReconstruction.h:89

o2::gpu::GPUReconstruction::mMaster
GPUReconstruction * mMaster
Definition GPUReconstruction.h:350

o2::gpu::GPUReconstruction::mMaxHostThreads
int32_t mMaxHostThreads
Definition GPUReconstruction.h:368

o2::gpu::GPUReconstruction::AllocateVolatileMemory
void * AllocateVolatileMemory(size_t size, bool device)
Definition GPUReconstruction.cxx:790

o2::gpu::GPUReconstruction::getThrustVolatileDeviceAllocator
ThrustVolatileAllocator getThrustVolatileDeviceAllocator()
Definition GPUReconstruction.cxx:1302

o2::gpu::GPUReconstruction::mMemoryScalers
std::unique_ptr< GPUMemorySizeScalers > mMemoryScalers
Definition GPUReconstruction.h:324

o2::gpu::GPUReconstruction::mDeviceMemorySize
size_t mDeviceMemorySize
Definition GPUReconstruction.h:343

o2::gpu::GPUReconstruction::AllocateRegisteredForeignMemory
void AllocateRegisteredForeignMemory(int16_t res, GPUReconstruction *rec, GPUOutputControl *control=nullptr)
Definition GPUReconstruction.cxx:710

o2::gpu::GPUReconstruction::SetInputControl
void SetInputControl(void *ptr, size_t size)
Definition GPUReconstruction.cxx:1289

o2::gpu::GPUReconstruction::mDeviceConstantMem
GPUConstantMem * mDeviceConstantMem
Definition GPUReconstruction.h:316

o2::gpu::GPUReconstruction::ConstructGPUProcessor
void ConstructGPUProcessor(GPUProcessor *proc)
Definition GPUReconstruction.cxx:480

o2::gpu::GPUReconstruction::TerminatePipelineWorker
void TerminatePipelineWorker()
Definition GPUReconstruction.cxx:1112

o2::gpu::GPUReconstruction::getGPUPointer
virtual void * getGPUPointer(void *ptr)
Definition GPUReconstruction.h:155

o2::gpu::GPUReconstruction::mROOTDump
std::shared_ptr< GPUROOTDumpCore > mROOTDump
Definition GPUReconstruction.h:362

o2::gpu::GPUReconstruction::getNIOTypeMultiplicity
static uint32_t getNIOTypeMultiplicity(InOutPointerType type)
Definition GPUReconstruction.h:125

o2::gpu::GPUReconstruction::AllocateRegisteredMemoryHelper
size_t AllocateRegisteredMemoryHelper(GPUMemoryResource *res, void *&ptr, void *&memorypool, void *memorybase, size_t memorysize, void *(GPUMemoryResource::*SetPointers)(void *), void *&memorypoolend, const char *device)
Definition GPUReconstruction.cxx:570

o2::gpu::GPUReconstruction::GetMaxBackendThreads
int32_t GetMaxBackendThreads() const
Definition GPUReconstruction.h:254

o2::gpu::GPUReconstruction::processors
GPUConstantMem * processors()
Definition GPUReconstruction.h:312

o2::gpu::GPUReconstruction::PrepareEvent
void PrepareEvent()
Definition GPUReconstruction.cxx:1153

o2::gpu::GPUReconstruction::ReturnVolatileMemory
void ReturnVolatileMemory()
Definition GPUReconstruction.cxx:819

o2::gpu::GPUReconstruction::GetDeviceBackendSettings
const GPUSettingsDeviceBackend & GetDeviceBackendSettings() const
Definition GPUReconstruction.h:207

o2::gpu::GPUReconstruction::startGPUProfiling
virtual void startGPUProfiling()
Definition GPUReconstruction.h:156

o2::gpu::GPUReconstruction::ComputeReuseMax
void ComputeReuseMax(GPUProcessor *proc)
Definition GPUReconstruction.cxx:482

o2::gpu::GPUReconstruction::SetMemoryExternalInput
void SetMemoryExternalInput(int16_t res, void *ptr)
Definition GPUReconstruction.cxx:950

o2::gpu::GPUReconstruction::getGeneralStepNum
int32_t getGeneralStepNum(GeneralStep step, bool validCheck=true)
Definition GPUReconstruction.cxx:1074

o2::gpu::GPUReconstruction::debugInit
void debugInit()
Definition GPUReconstructionDebug.cxx:43

o2::gpu::GPUReconstruction::mStatKernelTime
double mStatKernelTime
Definition GPUReconstruction.h:359

o2::gpu::GPUReconstruction::getDebugFolder
std::string getDebugFolder(const std::string &prefix="")
Definition GPUReconstructionDebug.cxx:119

o2::gpu::GPUReconstruction::NSECTORS
static constexpr uint32_t NSECTORS
Definition GPUReconstruction.h:85

o2::gpu::GPUReconstruction::MakeFutureDeviceMemoryAllocationsVolatile
void MakeFutureDeviceMemoryAllocationsVolatile()
Definition GPUReconstruction.cxx:801

o2::gpu::GPUReconstruction::mInputControl
GPUOutputControl mInputControl
Definition GPUReconstruction.h:323

o2::gpu::GPUReconstruction::GetRecoStepsGPU
RecoStepField GetRecoStepsGPU() const
Definition GPUReconstruction.h:226

o2::gpu::GPUReconstruction::SetResetTimers
void SetResetTimers(bool reset)
Definition GPUReconstruction.cxx:1292

o2::gpu::GPUReconstruction::RunPipelineWorker
void RunPipelineWorker()
Definition GPUReconstruction.cxx:1076

o2::gpu::GPUReconstruction::RegisterGPUDeviceProcessor
void RegisterGPUDeviceProcessor(GPUProcessor *proc, GPUProcessor *slaveProcessor)
Definition GPUReconstruction.cxx:479

o2::gpu::GPUReconstruction::mNEventsProcessed
uint32_t mNEventsProcessed
Definition GPUReconstruction.h:358

o2::gpu::GPUReconstruction::PrintMemoryMax
void PrintMemoryMax()
Definition GPUReconstruction.cxx:984

o2::gpu::GPUReconstruction::slavesExist
bool slavesExist()
Definition GPUReconstruction.h:197

o2::gpu::GPUReconstruction::DumpData
uint32_t DumpData(FILE *fp, const T *const *entries, const S *num, InOutPointerType type)
Definition GPUReconstructionIO.h:54

o2::gpu::GPUReconstruction::mDebugEnabled
bool mDebugEnabled
Definition GPUReconstruction.h:423

o2::gpu::GPUReconstruction::mSlaves
std::vector< GPUReconstruction * > mSlaves
Definition GPUReconstruction.h:351

o2::gpu::GPUReconstruction::slaveId
int slaveId()
Definition GPUReconstruction.h:198

o2::gpu::GPUReconstruction::IsGPU
bool IsGPU() const
Definition GPUReconstruction.h:202

o2::gpu::GPUReconstruction::sLibHIP
static std::shared_ptr< LibraryLoader > sLibHIP
Definition GPUReconstruction.h:418

o2::gpu::GPUReconstruction::mNStreams
int32_t mNStreams
Definition GPUReconstruction.h:367

o2::gpu::GPUReconstruction::mNonPersistentMemoryStack
std::vector< std::tuple< void *, void *, size_t, size_t, uint64_t > > mNonPersistentMemoryStack
Definition GPUReconstruction.h:389

o2::gpu::GPUReconstruction::ReadStructFromFile
std::unique_ptr< T > ReadStructFromFile(const char *file)
Definition GPUReconstructionIO.h:168

o2::gpu::GPUReconstruction::DeviceType
GPUDataTypes::DeviceType DeviceType
Definition GPUReconstruction.h:88

o2::gpu::GPUReconstruction::ReadFlatObjectFromFile
std::unique_ptr< T > ReadFlatObjectFromFile(const char *file)
Definition GPUReconstructionIO.h:126

o2::gpu::GPUReconstruction::UpdateDynamicSettings
void UpdateDynamicSettings(const GPUSettingsRecDynamic *d)
Definition GPUReconstruction.cxx:1209

o2::gpu::GPUReconstruction::mDeviceBackendSettings
std::unique_ptr< GPUSettingsDeviceBackend > mDeviceBackendSettings
Definition GPUReconstruction.h:320

o2::gpu::GPUReconstruction::mMemoryResources
std::vector< GPUMemoryResource > mMemoryResources
Definition GPUReconstruction.h:76

o2::gpu::GPUReconstruction::RegisterGPUProcessor
void RegisterGPUProcessor(T *proc, bool deviceSlave)
Definition GPUReconstruction.h:444

o2::gpu::GPUReconstruction::setDebugDumpCallback
void setDebugDumpCallback(std::function< void()> &&callback=std::function< void()>(nullptr))
Definition GPUReconstructionDebug.cxx:106

o2::gpu::GPUReconstruction::GetStatWallTime
double GetStatWallTime()
Definition GPUReconstruction.h:246

o2::gpu::GPUReconstruction::GetLibraryInstance
static std::shared_ptr< LibraryLoader > * GetLibraryInstance(DeviceType type, bool verbose)
Definition GPUReconstructionLibrary.cxx:89

o2::gpu::GPUReconstruction::mPipelineContext
std::unique_ptr< GPUReconstructionPipelineContext > mPipelineContext
Definition GPUReconstruction.h:396

o2::gpu::GPUReconstruction::mHostConstantMem
std::unique_ptr< GPUConstantMem > mHostConstantMem
Definition GPUReconstruction.h:315

o2::gpu::GPUReconstruction::AllocateRegisteredPermanentMemory
size_t AllocateRegisteredPermanentMemory()
Definition GPUReconstruction.cxx:547

o2::gpu::GPUReconstruction::ResetRegisteredMemoryPointers
void ResetRegisteredMemoryPointers(GPUProcessor *proc)
Definition GPUReconstruction.cxx:825

o2::gpu::GPUReconstruction::DumpStructToFile
void DumpStructToFile(const T *obj, const char *file)
Definition GPUReconstructionIO.h:155

o2::gpu::GPUReconstruction::AllocateRegisteredMemoryInternal
void AllocateRegisteredMemoryInternal(GPUMemoryResource *res, GPUOutputControl *control, GPUReconstruction *recPool)
Definition GPUReconstruction.cxx:624

o2::gpu::GPUReconstruction::GetRecoStepsInputs
InOutTypeField GetRecoStepsInputs() const
Definition GPUReconstruction.h:227

o2::gpu::GPUReconstruction::CheckInstanceAvailable
static bool CheckInstanceAvailable(DeviceType type, bool verbose)
Definition GPUReconstructionLibrary.cxx:79

o2::gpu::GPUReconstruction::registerMemoryForGPU_internal
virtual int32_t registerMemoryForGPU_internal(const void *ptr, size_t size)=0

o2::gpu::GPUReconstruction::IsInitialized
bool IsInitialized() const
Definition GPUReconstruction.h:210

o2::gpu::GPUReconstruction::WriteToConstantMemory
virtual size_t WriteToConstantMemory(size_t offset, const void *src, size_t size, int32_t stream=-1, gpu_reconstruction_kernels::deviceEvent *ev=nullptr)=0

o2::gpu::GPUReconstruction::mMemoryReuse1to1
std::unordered_map< GPUMemoryReuse::ID, MemoryReuseMeta > mMemoryReuse1to1
Definition GPUReconstruction.h:388

o2::gpu::GPUReconstruction::mMyLib
std::shared_ptr< LibraryLoader > mMyLib
Definition GPUReconstruction.h:75

o2::gpu::GPUReconstruction::mDeviceMemoryUsedMax
size_t mDeviceMemoryUsedMax
Definition GPUReconstruction.h:344

o2::gpu::GPUReconstruction::mGPUStuck
int32_t mGPUStuck
Definition GPUReconstruction.h:366

o2::gpu::GPUReconstruction::mStatNEvents
uint32_t mStatNEvents
Definition GPUReconstruction.h:357

o2::gpu::GPUReconstruction::mStatWallTime
double mStatWallTime
Definition GPUReconstruction.h:360

o2::gpu::GPUReconstruction::mProcessors
std::vector< ProcessorData > mProcessors
Definition GPUReconstruction.h:378

o2::gpu::GPUReconstruction::ReturnVolatileDeviceMemory
void ReturnVolatileDeviceMemory()
Definition GPUReconstruction.cxx:807

o2::gpu::GPUReconstruction::AllocateVolatileDeviceMemory
void * AllocateVolatileDeviceMemory(size_t size)
Definition GPUReconstruction.cxx:768

o2::gpu::GPUReconstruction::mDeviceMemoryAsVolatile
bool mDeviceMemoryAsVolatile
Definition GPUReconstruction.h:346

o2::gpu::GPUReconstruction::InitDevice
virtual int32_t InitDevice()=0

o2::gpu::GPUReconstruction::SetSettings
void SetSettings(float solenoidBzNominalGPU, const GPURecoStepConfiguration *workflow=nullptr)
Definition GPUReconstruction.cxx:1249

o2::gpu::GPUReconstruction::~GPUReconstruction
virtual ~GPUReconstruction()
Definition GPUReconstruction.cxx:108

o2::gpu::GPUReconstruction::mMaxBackendThreads
int32_t mMaxBackendThreads
Definition GPUReconstruction.h:365

o2::gpu::GPUReconstruction::GetCalib
const GPUCalibObjectsConst & GetCalib() const
Definition GPUReconstruction.cxx:1296

o2::gpu::GPUReconstruction::GetIOPtrs
const GPUTrackingInOutPointers GetIOPtrs() const
Definition GPUReconstruction.cxx:1295

o2::gpu::GPUReconstruction::processors
const GPUConstantMem * processors() const
Definition GPUReconstruction.h:313

o2::gpu::GPUReconstruction::GetThreadContext
virtual std::unique_ptr< gpu_reconstruction_kernels::threadContext > GetThreadContext()=0

o2::gpu::GPUReconstruction::mDeviceMemoryBase
void * mDeviceMemoryBase
Definition GPUReconstruction.h:338

o2::gpu::GPUReconstruction::UnblockStackedMemory
void UnblockStackedMemory()
Definition GPUReconstruction.cxx:939

o2::gpu::GPUReconstruction::GPUReconstruction
GPUReconstruction(const GPUReconstruction &)=delete

o2::gpu::GPUReconstruction::AddChain
T * AddChain(Args... args)
Definition GPUReconstruction.h:431

o2::gpu::GPUReconstruction::geometryType
static constexpr GeometryType geometryType
Definition GPUReconstruction.h:98

o2::gpu::GPUReconstruction::Exit
int32_t Exit()
Definition GPUReconstruction.cxx:448

o2::gpu::GPUReconstruction::krnlDeviceType
krnlDeviceType
Definition GPUReconstruction.h:134

o2::gpu::GPUReconstruction::krnlDeviceType::Auto
@ Auto

o2::gpu::GPUReconstruction::krnlDeviceType::CPU
@ CPU

o2::gpu::GPUReconstruction::krnlDeviceType::Device
@ Device

o2::gpu::GPUReconstruction::sLibOCL
static std::shared_ptr< LibraryLoader > sLibOCL
Definition GPUReconstruction.h:418

o2::gpu::GPUReconstruction::mNonPersistentIndividualDirectAllocations
std::vector< std::unique_ptr< char[], alignedDeleter > > mNonPersistentIndividualDirectAllocations
Definition GPUReconstruction.h:391

o2::gpu::GPUReconstruction::AllocateIOMemoryHelper
T * AllocateIOMemoryHelper(size_t n, const T *&ptr, std::unique_ptr< T[]> &u)
Definition GPUReconstructionIO.h:25

o2::gpu::GPUReconstruction::GeometryType
GPUDataTypes::GeometryType GeometryType
Definition GPUReconstruction.h:87

o2::gpu::GPUReconstruction::RegisterMemoryAllocation
int16_t RegisterMemoryAllocation(T *proc, void *(T::*setPtr)(void *), int32_t type, const char *name="", const GPUMemoryReuse &re=GPUMemoryReuse())
Definition GPUReconstruction.h:438

o2::gpu::GPUReconstruction::setErrorCodeOutput
void setErrorCodeOutput(std::vector< std::array< uint32_t, 4 > > *v)
Definition GPUReconstruction.h:232

o2::gpu::GPUReconstruction::WriteConstantParams
void WriteConstantParams()
Definition GPUReconstruction.cxx:432

o2::gpu::GPUReconstruction::mMemoryMutex
std::atomic_flag mMemoryMutex
Definition GPUReconstruction.h:394

o2::gpu::GPUReconstruction::FreeRegisteredMemory
void FreeRegisteredMemory(GPUProcessor *proc, bool freeCustom=false, bool freePermanent=false)
Definition GPUReconstruction.cxx:855

o2::gpu::GPUReconstruction::mVolatileChunks
std::vector< std::unique_ptr< char[], alignedDeleter > > mVolatileChunks
Definition GPUReconstruction.h:393

o2::gpu::GPUReconstruction::mStatCPUTime
double mStatCPUTime
Definition GPUReconstruction.h:361

o2::gpu::GPUReconstruction::CreateInstance
static GPUReconstruction * CreateInstance(const GPUSettingsDeviceBackend &cfg)
Definition GPUReconstructionLibrary.cxx:44

o2::gpu::GPUReconstruction::Finalize
int32_t Finalize()
Definition GPUReconstruction.cxx:440

o2::gpu::GPUReconstruction::UpdateMaxMemoryUsed
void UpdateMaxMemoryUsed()
Definition GPUReconstruction.cxx:978

o2::gpu::GPUReconstruction::Res
GPUMemoryResource & Res(int16_t num)
Definition GPUReconstruction.h:164

o2::gpu::GPUReconstruction::AvailableGPURecoSteps
virtual RecoStepField AvailableGPURecoSteps()
Definition GPUReconstruction.h:308

o2::gpu::GPUReconstruction::getNEventsProcessed
uint32_t getNEventsProcessed()
Definition GPUReconstruction.h:151

o2::gpu::GPUReconstruction::IOTYPENAMES
static constexpr const char *const IOTYPENAMES[]
Definition GPUReconstruction.h:122

o2::gpu::GPUReconstruction::operator=
GPUReconstruction & operator=(const GPUReconstruction &)=delete

o2::gpu::GPUReconstruction::GPUReconstruction_Create_CPU
static GPUReconstruction * GPUReconstruction_Create_CPU(const GPUSettingsDeviceBackend &cfg)
Definition GPUReconstructionCPU.cxx:47

o2::gpu::GPUReconstruction::PopNonPersistentMemory
void PopNonPersistentMemory(RecoStep step, uint64_t tag, const GPUProcessor *proc=nullptr)
Definition GPUReconstruction.cxx:886

o2::gpu::GPUReconstruction::mDirectMemoryChunks
std::vector< std::unique_ptr< char[], alignedDeleter > > mDirectMemoryChunks
Definition GPUReconstruction.h:392

o2::gpu::GPUReconstruction::UpdateSettings
void UpdateSettings(const GPUSettingsGRP *g, const GPUSettingsProcessing *p=nullptr, const GPUSettingsRecDynamic *d=nullptr)
Definition GPUReconstruction.cxx:1214

o2::gpu::GPUReconstruction::GetRecoSteps
RecoStepField GetRecoSteps() const
Definition GPUReconstruction.h:225

o2::gpu::GPUReconstruction::NStreams
uint32_t NStreams() const
Definition GPUReconstruction.h:221

o2::gpu::GPUReconstruction::RunChains
virtual int32_t RunChains()=0

o2::gpu::GPUReconstruction::GetDeviceType
DeviceType GetDeviceType() const
Definition GPUReconstruction.cxx:1290

o2::gpu::GPUReconstruction::CheckErrorCodes
int32_t CheckErrorCodes(bool cpuOnly=false, bool forceShowErrors=false, std::vector< std::array< uint32_t, 4 > > *fillErrors=nullptr)
Definition GPUReconstruction.cxx:1172

o2::gpu::GPUReconstruction::GetParam
const GPUParam & GetParam() const
Definition GPUReconstruction.cxx:1291

o2::gpu::GPUReconstruction::ClearAllocatedMemory
void ClearAllocatedMemory(bool clearOutputs=true)
Definition GPUReconstruction.cxx:955

o2::gpu::GPUReconstruction::GEOMETRY_TYPE_NAMES
static constexpr const char *const GEOMETRY_TYPE_NAMES[]
Definition GPUReconstruction.h:94

o2::gpu::GPUReconstruction::mOutputControl
GPUOutputControl mOutputControl
Definition GPUReconstruction.h:322

o2::gpu::GPUReconstruction::GetConstantMem
const GPUConstantMem & GetConstantMem() const
Definition GPUReconstruction.h:204

o2::gpu::GPUReconstruction::mHostMemoryUsedMax
size_t mHostMemoryUsedMax
Definition GPUReconstruction.h:337

o2::gpu::GPUReconstruction::mDeviceMemoryPoolEnd
void * mDeviceMemoryPoolEnd
Definition GPUReconstruction.h:341

o2::gpu::GPUReconstruction::ExitDevice
virtual int32_t ExitDevice()=0

o2::gpu::GPUReconstruction::PrintMemoryOverview
void PrintMemoryOverview()
Definition GPUReconstruction.cxx:989

o2::gpu::GPUReconstruction::mGRPSettings
std::unique_ptr< GPUSettingsGRP > mGRPSettings
Definition GPUReconstruction.h:319

o2::gpu::GPUReconstruction::getNEventsProcessedInStat
uint32_t getNEventsProcessedInStat()
Definition GPUReconstruction.h:152

o2::gpu::GPUReconstruction::mProcessingSettings
std::unique_ptr< GPUSettingsProcessing > mProcessingSettings
Definition GPUReconstruction.h:321

o2::gpu::GPUReconstruction::DeviceMemoryBase
const void * DeviceMemoryBase() const
Definition GPUReconstruction.h:222

o2::gpu::GPUReconstruction::triggerDebugDump
bool triggerDebugDump()
Definition GPUReconstructionDebug.cxx:176

o2::gpu::GPUReconstruction::CanQueryMaxMemory
virtual bool CanQueryMaxMemory()
Definition GPUReconstruction.h:309

o2::gpu::GPUReconstruction::PrintMemoryStatistics
void PrintMemoryStatistics()
Definition GPUReconstruction.cxx:999

o2::gpu::GPUReconstruction::debugExit
void debugExit()
Definition GPUReconstructionDebug.cxx:91

o2::gpu::GPUReconstruction::PushNonPersistentMemory
void PushNonPersistentMemory(uint64_t tag)
Definition GPUReconstruction.cxx:881

o2::gpu::GPUReconstruction::GetStatKernelTime
double GetStatKernelTime()
Definition GPUReconstruction.h:245

o2::gpu::GPUReconstruction::GetRecoStepsOutputs
InOutTypeField GetRecoStepsOutputs() const
Definition GPUReconstruction.h:228

o2::gpu::GPUReconstruction::ReadData
size_t ReadData(FILE *fp, const T **entries, S *num, std::unique_ptr< T[]> *mem, InOutPointerType type, T **nonConstPtrs=nullptr)
Definition GPUReconstructionIO.h:78

o2::gpu::GPUReconstruction::Init
int32_t Init()
Definition GPUReconstruction.cxx:133

o2::gpu::GPUReconstruction::getRecoStepNum
int32_t getRecoStepNum(RecoStep step, bool validCheck=true)
Definition GPUReconstruction.cxx:1073

o2::gpu::GPUReconstruction::mDebugData
static std::unique_ptr< debugInternal > mDebugData
Definition GPUReconstruction.h:422

o2::gpu::GPUReconstruction::unregisterMemoryForGPU_internal
virtual int32_t unregisterMemoryForGPU_internal(const void *ptr)=0

o2::gpu::GPUReconstruction::MemoryScalers
GPUMemorySizeScalers * MemoryScalers()
Definition GPUReconstruction.h:193

o2::gpu::GPUReconstruction::InitPhaseAfterDevice
int32_t InitPhaseAfterDevice()
Definition GPUReconstruction.cxx:412

o2::gpu::GPUReconstruction::mDeviceName
std::string mDeviceName
Definition GPUReconstruction.h:328

o2::gpu::GPUReconstruction::getHostThreadIndex
static int32_t getHostThreadIndex()
Definition GPUReconstruction.cxx:128

o2::gpu::GPUReconstruction::GeneralStep
GPUDataTypes::GeneralStep GeneralStep
Definition GPUReconstruction.h:90

o2::gpu::GPUReconstruction::InOutPointerType
InOutPointerType
Definition GPUReconstruction.h:102

o2::gpu::GPUReconstruction::SECTOR_OUT_TRACK
@ SECTOR_OUT_TRACK
Definition GPUReconstruction.h:103

o2::gpu::GPUReconstruction::TRD_TRACKLET_MC
@ TRD_TRACKLET_MC
Definition GPUReconstruction.h:113

o2::gpu::GPUReconstruction::TPC_DIGIT
@ TPC_DIGIT
Definition GPUReconstruction.h:115

o2::gpu::GPUReconstruction::CLUSTERS_NATIVE
@ CLUSTERS_NATIVE
Definition GPUReconstruction.h:112

o2::gpu::GPUReconstruction::MERGED_TRACK
@ MERGED_TRACK
Definition GPUReconstruction.h:107

o2::gpu::GPUReconstruction::CLUSTER_DATA
@ CLUSTER_DATA
Definition GPUReconstruction.h:102

o2::gpu::GPUReconstruction::MC_LABEL_TPC
@ MC_LABEL_TPC
Definition GPUReconstruction.h:105

o2::gpu::GPUReconstruction::TRD_TRACKLET
@ TRD_TRACKLET
Definition GPUReconstruction.h:110

o2::gpu::GPUReconstruction::CLUSTER_NATIVE_MC
@ CLUSTER_NATIVE_MC
Definition GPUReconstruction.h:117

o2::gpu::GPUReconstruction::RAW_CLUSTERS
@ RAW_CLUSTERS
Definition GPUReconstruction.h:111

o2::gpu::GPUReconstruction::SECTOR_OUT_CLUSTER
@ SECTOR_OUT_CLUSTER
Definition GPUReconstruction.h:104

o2::gpu::GPUReconstruction::TPC_COMPRESSED_CL
@ TPC_COMPRESSED_CL
Definition GPUReconstruction.h:114

o2::gpu::GPUReconstruction::TF_SETTINGS
@ TF_SETTINGS
Definition GPUReconstruction.h:121

o2::gpu::GPUReconstruction::MC_INFO_TPC
@ MC_INFO_TPC
Definition GPUReconstruction.h:106

o2::gpu::GPUReconstruction::TRD_TRACK
@ TRD_TRACK
Definition GPUReconstruction.h:109

o2::gpu::GPUReconstruction::TPC_ZS
@ TPC_ZS
Definition GPUReconstruction.h:116

o2::gpu::GPUReconstruction::MERGED_TRACK_HIT
@ MERGED_TRACK_HIT
Definition GPUReconstruction.h:108

o2::gpu::GPUReconstruction::TPC_DIGIT_MC
@ TPC_DIGIT_MC
Definition GPUReconstruction.h:118

o2::gpu::GPUReconstruction::TRD_TRIGGERRECORDS
@ TRD_TRIGGERRECORDS
Definition GPUReconstruction.h:120

o2::gpu::GPUReconstruction::TRD_SPACEPOINT
@ TRD_SPACEPOINT
Definition GPUReconstruction.h:119

o2::gpu::GPUReconstruction::mDeviceMemoryPermanent
void * mDeviceMemoryPermanent
Definition GPUReconstruction.h:339

o2::gpu::GPUReconstruction::BlockStackedMemory
void BlockStackedMemory(GPUReconstruction *rec)
Definition GPUReconstruction.cxx:930

o2::gpu::GPUReconstruction::mInitialized
bool mInitialized
Definition GPUReconstruction.h:355

o2::gpu::GPUReconstruction::GetProcessingSettings
const GPUSettingsProcessing & GetProcessingSettings() const
Definition GPUReconstruction.h:208

o2::gpu::GPUReconstruction::DumpSettings
void DumpSettings(const char *dir="")
Definition GPUReconstruction.cxx:1198

o2::gpu::GPUReconstruction::AllocateDirectMemory
void * AllocateDirectMemory(size_t size, int32_t type)
Definition GPUReconstruction.cxx:726

o2::gpu::GPUReconstruction::mHostMemoryPoolBlocked
void * mHostMemoryPoolBlocked
Definition GPUReconstruction.h:335

o2::gpu::GPUReconstruction::AllocateMemoryResources
size_t AllocateMemoryResources()

o2::gpu::GPUReconstruction::DumpFlatObjectToFile
void DumpFlatObjectToFile(const T *obj, const char *file)
Definition GPUReconstructionIO.h:112

o2::gpu::GPUReconstruction::GetITSTraits
virtual void GetITSTraits(std::unique_ptr< o2::its::TrackerTraits< 7 > > *trackerTraits, std::unique_ptr< o2::its::VertexerTraits< 7 > > *vertexerTraits, std::unique_ptr< o2::its::TimeFrame< 7 > > *timeFrame)
Definition GPUReconstruction.cxx:115

o2::gpu::GPUReconstruction::mDeviceMemoryPool
void * mDeviceMemoryPool
Definition GPUReconstruction.h:340

o2::gpu::GPUReconstruction::unregisterMemoryForGPU
int32_t unregisterMemoryForGPU(const void *ptr)
Definition GPUReconstruction.cxx:1040

o2::gpu::GPUReconstruction::getGPUParameters
virtual const GPUDefParameters & getGPUParameters(bool doGPU) const =0

o2::gpu::GPUReconstruction::CreateInstance
static GPUReconstruction * CreateInstance(int32_t type, bool forceType, GPUReconstruction *master=nullptr)
Definition GPUReconstruction.h:130

o2::gpu::GPUReconstruction::registerMemoryForGPU
int32_t registerMemoryForGPU(const void *ptr, size_t size)
Definition GPUReconstruction.cxx:1028

o2::gpu::GPUReconstruction::sLibCUDA
static std::shared_ptr< LibraryLoader > sLibCUDA
Definition GPUReconstruction.h:418

o2::gpu::GPUReconstruction::GetGRPSettings
const GPUSettingsGRP & GetGRPSettings() const
Definition GPUReconstruction.h:206

o2::gpu::GPUReconstruction::SetDebugLevelTmp
void SetDebugLevelTmp(int32_t level)
Definition GPUReconstruction.cxx:1293

o2::gpu::GPUReconstruction::EnqueuePipeline
int32_t EnqueuePipeline(bool terminate=false)
Definition GPUReconstruction.cxx:1117

o2::gpu::GPUReconstruction::mInErrorHandling
bool mInErrorHandling
Definition GPUReconstruction.h:356

o2::gpu::GPUReconstruction::PrintKernelOccupancies
virtual void PrintKernelOccupancies()
Definition GPUReconstruction.h:244

o2::gpu::GPUReconstruction::mThreading
std::shared_ptr< GPUReconstructionThreading > mThreading
Definition GPUReconstruction.h:252

o2::gpu::GPUReconstruction::mNonPersistentIndividualAllocations
std::vector< GPUMemoryResource * > mNonPersistentIndividualAllocations
Definition GPUReconstruction.h:390

o2::gpu::GPUReconstruction::mSlaveId
int mSlaveId
Definition GPUReconstruction.h:352

o2::gpu::GPUReconstruction::param
GPUParam & param()
Definition GPUReconstruction.cxx:1294

o2::gpu::GPUReconstruction::mHostMemoryPoolEnd
void * mHostMemoryPoolEnd
Definition GPUReconstruction.h:334

o2::gpu::GPUReconstruction::mHostMemoryBase
void * mHostMemoryBase
Definition GPUReconstruction.h:331

o2::gpu::GPUReconstruction::mHostMemorySize
size_t mHostMemorySize
Definition GPUReconstruction.h:336

o2::gpu::GPUReconstruction::mDeviceMemoryPoolBlocked
void * mDeviceMemoryPoolBlocked
Definition GPUReconstruction.h:342

o2::gpu::GPUReconstruction::mVolatileMemoryStart
void * mVolatileMemoryStart
Definition GPUReconstruction.h:345

o2::gpu::GPUReconstruction::GPUChkErrInternal
virtual int32_t GPUChkErrInternal(const int64_t error, const char *file, int32_t line) const
Definition GPUReconstruction.h:270

o2::gpu::GPUReconstruction::GetNextChainInQueue
GPUChain * GetNextChainInQueue()
Definition GPUReconstruction.cxx:1146

o2::gpu::GPUReconstruction::mHostMemoryPermanent
void * mHostMemoryPermanent
Definition GPUReconstruction.h:332

o2::gpu::GPUReconstruction::endGPUProfiling
virtual void endGPUProfiling()
Definition GPUReconstruction.h:157

o2::gpu::GPUReconstruction::GPUChkErrA
int32_t GPUChkErrA(const int64_t error, const char *file, int32_t line, bool failOnError)
Definition GPUReconstruction.cxx:1183

o2::gpu::GPUReconstruction::OutputControl
GPUOutputControl & OutputControl()
Definition GPUReconstruction.h:220

o2::gpu::GPUReconstruction::AllocateRegisteredMemory
size_t AllocateRegisteredMemory(GPUProcessor *proc, bool resetCustom=false)
Definition GPUReconstruction.cxx:526

o2::gpu::GPUReconstruction::ReadSettings
int32_t ReadSettings(const char *dir="")
Definition GPUReconstruction.cxx:1233

o2::gpu::GPUReconstruction::SetOutputControl
void SetOutputControl(const GPUOutputControl &v)
Definition GPUReconstruction.h:217

o2::gpu::GPUReconstruction::mOutputErrorCodes
std::vector< std::array< uint32_t, 4 > > * mOutputErrorCodes
Definition GPUReconstruction.h:363

o2::gpu::ThrustVolatileAllocator
Definition GPUCommonHelpers.h:69

o2::gpu::gpu_reconstruction_kernels::threadContext
Definition GPUReconstructionProcessing.h:61

o2::its::TrackerTraits
Definition TrackerTraits.h:43

o2::its::VertexerTraits
Definition VertexerTraits.h:48

n
GLdouble n
Definition glcorearb.h:1982

func
GLenum func
Definition glcorearb.h:778

src
GLenum src
Definition glcorearb.h:1767

size
GLsizeiptr size
Definition glcorearb.h:659

v
const GLdouble * v
Definition glcorearb.h:832

name
GLuint const GLchar * name
Definition glcorearb.h:781

type
GLint GLint GLsizei GLint GLenum GLenum type
Definition glcorearb.h:275

offset
GLintptr offset
Definition glcorearb.h:660

void
typedef void(APIENTRYP PFNGLCULLFACEPROC)(GLenum mode)

g
GLboolean GLboolean g
Definition glcorearb.h:1233

r
GLboolean r
Definition glcorearb.h:1233

stream
GLuint GLuint stream
Definition glcorearb.h:1806

o2::gpu
Definition TrackTRD.h:35

o2::its
Definition RecoContainer.h:64

file
const char * file
Definition standalone-cluster-dump-entropy-analysed.cxx:52

rec
GPUReconstruction * rec
Definition standalone.cxx:74

o2::gpu::GPUReconstruction::debugInternal
Definition GPUReconstructionDebug.cxx:29

S
Definition cxx14-test-aggregate-initialization.cxx:18

o2::gpu::GPUCalibObjectsTemplate< ConstPtr >

o2::gpu::GPUConstantMem
Definition GPUConstantMem.h:41

o2::gpu::GPUDefParameters
Definition GPUDefParametersRuntime.template.h:20

o2::gpu::GPUMemoryReuse
Definition GPUMemoryResource.h:24

o2::gpu::GPUMemorySizeScalers
Definition GPUMemorySizeScalers.h:23

o2::gpu::GPUOutputControl
Definition GPUOutputControl.h:34

o2::gpu::GPUParam
Definition GPUParam.h:79

o2::gpu::GPURecoStepConfiguration
Definition GPUDataTypes.h:156

o2::gpu::GPURecoStepConfiguration::stepsGPUMask
GPUDataTypes::RecoStepField stepsGPUMask
Definition GPUDataTypes.h:158

o2::gpu::GPURecoStepConfiguration::outputs
GPUDataTypes::InOutTypeField outputs
Definition GPUDataTypes.h:160

o2::gpu::GPURecoStepConfiguration::steps
GPUDataTypes::RecoStepField steps
Definition GPUDataTypes.h:157

o2::gpu::GPURecoStepConfiguration::inputs
GPUDataTypes::InOutTypeField inputs
Definition GPUDataTypes.h:159

o2::gpu::GPUReconstruction::MemoryReuseMeta
Definition GPUReconstruction.h:379

o2::gpu::GPUReconstruction::MemoryReuseMeta::MemoryReuseMeta
MemoryReuseMeta()=default

o2::gpu::GPUReconstruction::MemoryReuseMeta::res
std::vector< uint16_t > res
Definition GPUReconstruction.h:383

o2::gpu::GPUReconstruction::MemoryReuseMeta::proc
GPUProcessor * proc
Definition GPUReconstruction.h:382

o2::gpu::GPUReconstruction::MemoryReuseMeta::MemoryReuseMeta
MemoryReuseMeta(GPUProcessor *p, uint16_t r)
Definition GPUReconstruction.h:381

o2::gpu::GPUReconstruction::ProcessorData
Definition GPUReconstruction.h:371

o2::gpu::GPUReconstruction::ProcessorData::InitializeProcessor
void(GPUProcessor::* InitializeProcessor)()
Definition GPUReconstruction.h:375

o2::gpu::GPUReconstruction::ProcessorData::RegisterMemoryAllocation
void(GPUProcessor::* RegisterMemoryAllocation)()
Definition GPUReconstruction.h:374

o2::gpu::GPUReconstruction::ProcessorData::proc
GPUProcessor * proc
Definition GPUReconstruction.h:373

o2::gpu::GPUReconstruction::ProcessorData::ProcessorData
ProcessorData(GPUProcessor *p, void(GPUProcessor::*r)(), void(GPUProcessor::*i)(), void(GPUProcessor::*d)(const GPUTrackingInOutPointers &))
Definition GPUReconstruction.h:372

o2::gpu::GPUReconstruction::ProcessorData::SetMaxData
void(GPUProcessor::* SetMaxData)(const GPUTrackingInOutPointers &)
Definition GPUReconstruction.h:376

o2::gpu::GPUReconstruction::alignedDeleter
Definition GPUReconstruction.h:385

o2::gpu::GPUReconstruction::alignedDeleter::operator()
void operator()(void *ptr)
Definition GPUReconstruction.h:386

o2::gpu::GPUSettingsDeviceBackend
Definition GPUSettings.h:75

o2::gpu::GPUSettingsGRP
Definition GPUSettings.h:51

o2::gpu::GPUTrackingInOutPointers
Definition GPUDataTypes.h:214

o2::gpu::gpu_reconstruction_kernels::deviceEvent
Definition GPUReconstructionProcessing.h:36

o2::its::TimeFrame
Definition TimeFrame.h:67