dc/d68/GPUReconstructionProcessing_8h_source.html

// Copyright 2019-2020 CERN and copyright holders of ALICE O2.

// See https://alice-o2.web.cern.ch/copyright for details of the copyright holders.

// All rights not expressly granted are reserved.

//

// This software is distributed under the terms of the GNU General Public

// License v3 (GPL Version 3), copied verbatim in the file "COPYING".

//

// In applying this license CERN does not waive the privileges and immunities

// granted to it by virtue of its status as an Intergovernmental Organization

// or submit itself to any jurisdiction.


#if !defined(GPURECONSTRUCTIONPROCESSING_H)

#define GPURECONSTRUCTIONPROCESSING_H


#include "GPUReconstruction.h"


#include "utils/timer.h"

#include <functional>

#include <atomic>


namespace Ort

{

struct SessionOptions;

}


namespace o2::gpu

{


struct GPUDefParameters;


namespace gpu_reconstruction_kernels // TODO: Get rid of this namespace

{


struct deviceEvent {

  constexpr deviceEvent() = default;

  constexpr deviceEvent(std::nullptr_t p) : v(nullptr) {};

  template <class T>


  void set(T val)

  {

    v = reinterpret_cast<void*&>(val);

  }


  template <class T>


  T& get()

  {

    return reinterpret_cast<T&>(v);

  }


  template <class T>


  T* getEventList()

  {

    return reinterpret_cast<T*>(this);

  }


  bool isSet() const { return v; }


 private:

  void* v = nullptr; // We use only pointers anyway, and since cl_event and cudaEvent_t and hipEvent_t are actually pointers, we can cast them to deviceEvent (void*) this way.

};


class threadContext

{

 public:

  threadContext();

  virtual ~threadContext();

};


} // namespace gpu_reconstruction_kernels


class GPUReconstructionProcessing : public GPUReconstruction

{

 public:

  ~GPUReconstructionProcessing() override;


  using deviceEvent = gpu_reconstruction_kernels::deviceEvent;

  using threadContext = gpu_reconstruction_kernels::threadContext;


  struct RecoStepTimerMeta {

    HighResTimer timerToGPU;

    HighResTimer timerToHost;

    HighResTimer timerTotal;

    double timerCPU = 0.;

    size_t bytesToGPU = 0;

    size_t bytesToHost = 0;

    uint32_t countToGPU = 0;

    uint32_t countToHost = 0;

  };


  template <class T, int32_t I = 0>


  struct kernelInterfaceArguments {

    using t = T;

    static constexpr int32_t i = I;

  };


  struct krnlExec {

    constexpr krnlExec(uint32_t b, uint32_t t, int32_t s, GPUReconstruction::krnlDeviceType d = GPUReconstruction::krnlDeviceType::Auto) : nBlocks(b), nThreads(t), stream(s), device(d), step(GPUDataTypes::RecoStep::NoRecoStep) {}

    constexpr krnlExec(uint32_t b, uint32_t t, int32_t s, GPUDataTypes::RecoStep st) : nBlocks(b), nThreads(t), stream(s), device(GPUReconstruction::krnlDeviceType::Auto), step(st) {}

    constexpr krnlExec(uint32_t b, uint32_t t, int32_t s, GPUReconstruction::krnlDeviceType d, GPUDataTypes::RecoStep st) : nBlocks(b), nThreads(t), stream(s), device(d), step(st) {}

    uint32_t nBlocks;

    uint32_t nThreads;

    int32_t stream;

    GPUReconstruction::krnlDeviceType device;

    GPUDataTypes::RecoStep step;

  };


  struct krnlRunRange {

    constexpr krnlRunRange() = default;

    constexpr krnlRunRange(uint32_t v) : index(v) {}

    uint32_t index = 0;

  };


  struct krnlEvent {

    constexpr krnlEvent(deviceEvent* e = nullptr, deviceEvent* el = nullptr, int32_t n = 1) : ev(e), evList(el), nEvents(n) {}

    deviceEvent* ev;

    deviceEvent* evList;

    int32_t nEvents;

  };


  struct krnlProperties {

    krnlProperties(int32_t t = 0, int32_t b = 1, int32_t b2 = 0) : nThreads(t), minBlocks(b), forceBlocks(b2) {}

    uint32_t nThreads;

    uint32_t minBlocks;

    uint32_t forceBlocks;

    uint32_t total() { return forceBlocks ? forceBlocks : (nThreads * minBlocks); }

  };


  struct krnlSetup {

    krnlSetup(const krnlExec& xx, const krnlRunRange& yy = {0}, const krnlEvent& zz = {nullptr, nullptr, 0}) : x(xx), y(yy), z(zz) {}

    krnlExec x;

    krnlRunRange y;

    krnlEvent z;

  };


  struct krnlSetupTime : public krnlSetup {

    double& t;

  };


  template <class T, int32_t I = 0, typename... Args>


  struct krnlSetupArgs : public kernelInterfaceArguments<T, I> {

    const krnlSetupTime s;

    std::tuple<typename std::conditional<(sizeof(Args) > sizeof(void*)), const Args&, const Args>::type...> v;

  };


  template <class T, class S>


  class KernelInterface : public S

  {

   public:

    template <typename... Args>


    KernelInterface(const Args&... args) : S(args...)

    {

    }


   protected:

    virtual void runKernelVirtual(const int num, const void* args);

  };


  // Threading

  int32_t getNKernelHostThreads(bool splitCores);

  uint32_t getNActiveThreadsOuterLoop() const { return mNActiveThreadsOuterLoop; }

  void SetNActiveThreadsOuterLoop(uint32_t f) { mNActiveThreadsOuterLoop = f; }

  uint32_t SetAndGetNActiveThreadsOuterLoop(bool condition, uint32_t max);

  void runParallelOuterLoop(bool doGPU, uint32_t nThreads, std::function<void(uint32_t)> lambda);

  void SetNActiveThreads(int32_t n);


  // Interface to query name of a kernel

  template <class T, int32_t I>

  static const char* GetKernelName();

  const std::string& GetKernelName(int32_t i) const { return mKernelNames[i]; }

  template <class T, int32_t I = 0>

  static uint32_t GetKernelNum();


  // Public queries for timers

  auto& getRecoStepTimer(RecoStep step) { return mTimersRecoSteps[getRecoStepNum(step)]; }

  HighResTimer& getGeneralStepTimer(GeneralStep step) { return mTimersGeneralSteps[getGeneralStepNum(step)]; }


  template <class T>

  void AddGPUEvents(T*& events);


  virtual std::unique_ptr<threadContext> GetThreadContext() override;


  const GPUDefParameters& getGPUParameters(bool doGPU) const override { return *(doGPU ? mParDevice : mParCPU); }


 protected:

  GPUReconstructionProcessing(const GPUSettingsDeviceBackend& cfg);


  static const std::vector<std::string> mKernelNames;


  int32_t mActiveHostKernelThreads = 0;  // Number of currently active threads on the host for kernels

  uint32_t mNActiveThreadsOuterLoop = 1; // Number of threads currently running an outer loop


  std::vector<std::vector<deviceEvent>> mEvents;


  // Timer related stuff


  struct timerMeta {

    std::unique_ptr<HighResTimer[]> timer;

    std::string name;

    int32_t num;    // How many parallel instances to sum up (CPU threads / GPU streams)

    int32_t type;   // 0 = kernel, 1 = CPU step, 2 = DMA transfer

    uint32_t count; // How often was the timer queried

    RecoStep step;  // Which RecoStep is this

    size_t memSize; // Memory size for memory bandwidth computation

  };


  HighResTimer mTimersGeneralSteps[GPUDataTypes::N_GENERAL_STEPS];


  std::vector<std::unique_ptr<timerMeta>> mTimers;

  RecoStepTimerMeta mTimersRecoSteps[GPUDataTypes::N_RECO_STEPS];

  HighResTimer mTimerTotal;

  template <class T, int32_t I = 0>

  HighResTimer& getKernelTimer(RecoStep step, int32_t num = 0, size_t addMemorySize = 0, bool increment = true);

  template <class T, int32_t J = -1>

  HighResTimer& getTimer(const char* name, int32_t num = -1);


  GPUDefParameters* mParCPU = nullptr;

  GPUDefParameters* mParDevice = nullptr;


 private:

  uint32_t getNextTimerId();

  timerMeta* getTimerById(uint32_t id, bool increment = true);

  timerMeta* insertTimer(uint32_t id, std::string&& name, int32_t J, int32_t num, int32_t type, RecoStep step);


  static std::atomic_flag mTimerFlag;

};


template <class T>


inline void GPUReconstructionProcessing::AddGPUEvents(T*& events)

{

  mEvents.emplace_back(std::vector<deviceEvent>(sizeof(T) / sizeof(deviceEvent)));

  events = (T*)mEvents.back().data();

}


template <class T, int32_t I>


HighResTimer& GPUReconstructionProcessing::getKernelTimer(RecoStep step, int32_t num, size_t addMemorySize, bool increment)

{

  static int32_t id = getNextTimerId();

  timerMeta* timer = getTimerById(id, increment);

  if (timer == nullptr) {

    timer = insertTimer(id, GetKernelName<T, I>(), -1, NSECTORS, 0, step);

  }

  if (addMemorySize) {

    timer->memSize += addMemorySize;

  }

  if (num < 0 || num >= timer->num) {

    throw std::runtime_error("Invalid timer requested");

  }

  return timer->timer[num];

}


template <class T, int32_t J>


HighResTimer& GPUReconstructionProcessing::getTimer(const char* name, int32_t num)

{

  static int32_t id = getNextTimerId();

  timerMeta* timer = getTimerById(id);

  if (timer == nullptr) {

    int32_t max = std::max<int32_t>({mMaxHostThreads, GPUCA_MAX_STREAMS});

    timer = insertTimer(id, name, J, max, 1, RecoStep::NoRecoStep);

  }

  if (num == -1) {

    num = getHostThreadIndex();

  }

  if (num < 0 || num >= timer->num) {

    throw std::runtime_error("Invalid timer requested");

  }

  return timer->timer[num];

}


} // namespace o2::gpu


#endif

i
int32_t i
Definition GPUCommonAlgorithm.h:436

GPUCA_MAX_STREAMS
#define GPUCA_MAX_STREAMS
Definition GPUDefParametersConstants.h:26

GPUReconstruction.h

num
double num
Definition bench_Clusterizer.cxx:122

st
benchmark::State & st
Definition bench_ransEncodeImpl.cxx:288

HighResTimer
Definition timer.h:21

int

o2::gpu::GPUDataTypes
Definition GPUDataTypes.h:115

o2::gpu::GPUDataTypes::RecoStep
RecoStep
Definition GPUDataTypes.h:123

o2::gpu::GPUDataTypes::N_RECO_STEPS
static constexpr int32_t N_RECO_STEPS
Definition GPUDataTypes.h:148

o2::gpu::GPUDataTypes::N_GENERAL_STEPS
static constexpr int32_t N_GENERAL_STEPS
Definition GPUDataTypes.h:149

o2::gpu::GPUDataTypes::GeneralStep
GeneralStep
Definition GPUDataTypes.h:120

o2::gpu::GPUReconstructionProcessing::KernelInterface
Definition GPUReconstructionProcessing.h:143

o2::gpu::GPUReconstructionProcessing::KernelInterface::KernelInterface
KernelInterface(const Args &... args)
Definition GPUReconstructionProcessing.h:146

o2::gpu::GPUReconstructionProcessing::KernelInterface::runKernelVirtual
virtual void runKernelVirtual(const int num, const void *args)

o2::gpu::GPUReconstructionProcessing
Definition GPUReconstructionProcessing.h:70

o2::gpu::GPUReconstructionProcessing::getRecoStepTimer
auto & getRecoStepTimer(RecoStep step)
Definition GPUReconstructionProcessing.h:170

o2::gpu::GPUReconstructionProcessing::getGeneralStepTimer
HighResTimer & getGeneralStepTimer(GeneralStep step)
Definition GPUReconstructionProcessing.h:171

o2::gpu::GPUReconstructionProcessing::mTimersRecoSteps
RecoStepTimerMeta mTimersRecoSteps[GPUDataTypes::N_RECO_STEPS]
Definition GPUReconstructionProcessing.h:204

o2::gpu::GPUReconstructionProcessing::GetKernelName
static const char * GetKernelName()

o2::gpu::GPUReconstructionProcessing::runParallelOuterLoop
void runParallelOuterLoop(bool doGPU, uint32_t nThreads, std::function< void(uint32_t)> lambda)
Definition GPUReconstructionProcessing.cxx:70

o2::gpu::GPUReconstructionProcessing::mEvents
std::vector< std::vector< deviceEvent > > mEvents
Definition GPUReconstructionProcessing.h:188

o2::gpu::GPUReconstructionProcessing::GetKernelNum
static uint32_t GetKernelNum()

o2::gpu::GPUReconstructionProcessing::mActiveHostKernelThreads
int32_t mActiveHostKernelThreads
Definition GPUReconstructionProcessing.h:185

o2::gpu::GPUReconstructionProcessing::mTimers
std::vector< std::unique_ptr< timerMeta > > mTimers
Definition GPUReconstructionProcessing.h:203

o2::gpu::GPUReconstructionProcessing::SetNActiveThreads
void SetNActiveThreads(int32_t n)
Definition GPUReconstructionProcessing.cxx:61

o2::gpu::GPUReconstructionProcessing::mParCPU
GPUDefParameters * mParCPU
Definition GPUReconstructionProcessing.h:211

o2::gpu::GPUReconstructionProcessing::mTimersGeneralSteps
HighResTimer mTimersGeneralSteps[GPUDataTypes::N_GENERAL_STEPS]
Definition GPUReconstructionProcessing.h:201

o2::gpu::GPUReconstructionProcessing::getNActiveThreadsOuterLoop
uint32_t getNActiveThreadsOuterLoop() const
Definition GPUReconstructionProcessing.h:156

o2::gpu::GPUReconstructionProcessing::getKernelTimer
HighResTimer & getKernelTimer(RecoStep step, int32_t num=0, size_t addMemorySize=0, bool increment=true)
Definition GPUReconstructionProcessing.h:230

o2::gpu::GPUReconstructionProcessing::getNKernelHostThreads
int32_t getNKernelHostThreads(bool splitCores)
Definition GPUReconstructionProcessing.cxx:44

o2::gpu::GPUReconstructionProcessing::GetKernelName
const std::string & GetKernelName(int32_t i) const
Definition GPUReconstructionProcessing.h:165

o2::gpu::GPUReconstructionProcessing::mKernelNames
static const std::vector< std::string > mKernelNames
Definition GPUReconstructionProcessing.h:183

o2::gpu::GPUReconstructionProcessing::mTimerTotal
HighResTimer mTimerTotal
Definition GPUReconstructionProcessing.h:205

o2::gpu::GPUReconstructionProcessing::mNActiveThreadsOuterLoop
uint32_t mNActiveThreadsOuterLoop
Definition GPUReconstructionProcessing.h:186

o2::gpu::GPUReconstructionProcessing::GetThreadContext
virtual std::unique_ptr< threadContext > GetThreadContext() override
Definition GPUReconstructionProcessing.cxx:138

o2::gpu::GPUReconstructionProcessing::mParDevice
GPUDefParameters * mParDevice
Definition GPUReconstructionProcessing.h:212

o2::gpu::GPUReconstructionProcessing::getGPUParameters
const GPUDefParameters & getGPUParameters(bool doGPU) const override
Definition GPUReconstructionProcessing.h:178

o2::gpu::GPUReconstructionProcessing::SetAndGetNActiveThreadsOuterLoop
uint32_t SetAndGetNActiveThreadsOuterLoop(bool condition, uint32_t max)
Definition GPUReconstructionProcessing.cxx:84

o2::gpu::GPUReconstructionProcessing::getTimer
HighResTimer & getTimer(const char *name, int32_t num=-1)
Definition GPUReconstructionProcessing.h:247

o2::gpu::GPUReconstructionProcessing::~GPUReconstructionProcessing
~GPUReconstructionProcessing() override
Definition GPUReconstructionProcessing.cxx:36

o2::gpu::GPUReconstructionProcessing::SetNActiveThreadsOuterLoop
void SetNActiveThreadsOuterLoop(uint32_t f)
Definition GPUReconstructionProcessing.h:157

o2::gpu::GPUReconstructionProcessing::AddGPUEvents
void AddGPUEvents(T *&events)
Definition GPUReconstructionProcessing.h:223

o2::gpu::GPUReconstruction
Definition GPUReconstruction.h:70

o2::gpu::GPUReconstruction::mMaxHostThreads
int32_t mMaxHostThreads
Definition GPUReconstruction.h:366

o2::gpu::GPUReconstruction::getGeneralStepNum
int32_t getGeneralStepNum(GeneralStep step, bool validCheck=true)
Definition GPUReconstruction.cxx:1056

o2::gpu::GPUReconstruction::NSECTORS
static constexpr uint32_t NSECTORS
Definition GPUReconstruction.h:83

o2::gpu::GPUReconstruction::krnlDeviceType
krnlDeviceType
Definition GPUReconstruction.h:132

o2::gpu::GPUReconstruction::krnlDeviceType::Auto
@ Auto

o2::gpu::GPUReconstruction::getRecoStepNum
int32_t getRecoStepNum(RecoStep step, bool validCheck=true)
Definition GPUReconstruction.cxx:1055

o2::gpu::GPUReconstruction::getHostThreadIndex
static int32_t getHostThreadIndex()
Definition GPUReconstruction.cxx:127

o2::gpu::gpu_reconstruction_kernels::threadContext
Definition GPUReconstructionProcessing.h:61

o2::gpu::gpu_reconstruction_kernels::threadContext::threadContext
threadContext()

o2::gpu::gpu_reconstruction_kernels::threadContext::~threadContext
virtual ~threadContext()

n
GLdouble n
Definition glcorearb.h:1982

x
GLint GLenum GLint x
Definition glcorearb.h:403

v
const GLdouble * v
Definition glcorearb.h:832

index
GLuint index
Definition glcorearb.h:781

name
GLuint const GLchar * name
Definition glcorearb.h:781

f
GLdouble f
Definition glcorearb.h:310

b
GLboolean GLboolean GLboolean b
Definition glcorearb.h:1233

type
GLint GLint GLsizei GLint GLenum GLenum type
Definition glcorearb.h:275

val
GLuint GLfloat * val
Definition glcorearb.h:1582

stream
GLuint GLuint stream
Definition glcorearb.h:1806

z
GLdouble GLdouble GLdouble z
Definition glcorearb.h:843

Ort
Definition OrtInterface.h:31

o2::gpu
Definition TrackTRD.h:35

S
Definition cxx14-test-aggregate-initialization.cxx:18

o2::gpu::GPUDefParameters
Definition GPUDefParametersRuntime.template.h:20

o2::gpu::GPUReconstructionProcessing::RecoStepTimerMeta
Definition GPUReconstructionProcessing.h:77

o2::gpu::GPUReconstructionProcessing::RecoStepTimerMeta::countToHost
uint32_t countToHost
Definition GPUReconstructionProcessing.h:85

o2::gpu::GPUReconstructionProcessing::RecoStepTimerMeta::countToGPU
uint32_t countToGPU
Definition GPUReconstructionProcessing.h:84

o2::gpu::GPUReconstructionProcessing::RecoStepTimerMeta::timerTotal
HighResTimer timerTotal
Definition GPUReconstructionProcessing.h:80

o2::gpu::GPUReconstructionProcessing::RecoStepTimerMeta::bytesToGPU
size_t bytesToGPU
Definition GPUReconstructionProcessing.h:82

o2::gpu::GPUReconstructionProcessing::RecoStepTimerMeta::timerToHost
HighResTimer timerToHost
Definition GPUReconstructionProcessing.h:79

o2::gpu::GPUReconstructionProcessing::RecoStepTimerMeta::timerCPU
double timerCPU
Definition GPUReconstructionProcessing.h:81

o2::gpu::GPUReconstructionProcessing::RecoStepTimerMeta::bytesToHost
size_t bytesToHost
Definition GPUReconstructionProcessing.h:83

o2::gpu::GPUReconstructionProcessing::RecoStepTimerMeta::timerToGPU
HighResTimer timerToGPU
Definition GPUReconstructionProcessing.h:78

o2::gpu::GPUReconstructionProcessing::kernelInterfaceArguments
Definition GPUReconstructionProcessing.h:89

o2::gpu::GPUReconstructionProcessing::kernelInterfaceArguments::t
T t
Definition GPUReconstructionProcessing.h:90

o2::gpu::GPUReconstructionProcessing::kernelInterfaceArguments::i
static constexpr int32_t i
Definition GPUReconstructionProcessing.h:91

o2::gpu::GPUReconstructionProcessing::krnlEvent
Definition GPUReconstructionProcessing.h:109

o2::gpu::GPUReconstructionProcessing::krnlEvent::evList
deviceEvent * evList
Definition GPUReconstructionProcessing.h:112

o2::gpu::GPUReconstructionProcessing::krnlEvent::nEvents
int32_t nEvents
Definition GPUReconstructionProcessing.h:113

o2::gpu::GPUReconstructionProcessing::krnlEvent::ev
deviceEvent * ev
Definition GPUReconstructionProcessing.h:111

o2::gpu::GPUReconstructionProcessing::krnlEvent::krnlEvent
constexpr krnlEvent(deviceEvent *e=nullptr, deviceEvent *el=nullptr, int32_t n=1)
Definition GPUReconstructionProcessing.h:110

o2::gpu::GPUReconstructionProcessing::krnlExec
Definition GPUReconstructionProcessing.h:94

o2::gpu::GPUReconstructionProcessing::krnlExec::device
GPUReconstruction::krnlDeviceType device
Definition GPUReconstructionProcessing.h:101

o2::gpu::GPUReconstructionProcessing::krnlExec::step
GPUDataTypes::RecoStep step
Definition GPUReconstructionProcessing.h:102

o2::gpu::GPUReconstructionProcessing::krnlExec::stream
int32_t stream
Definition GPUReconstructionProcessing.h:100

o2::gpu::GPUReconstructionProcessing::krnlExec::krnlExec
constexpr krnlExec(uint32_t b, uint32_t t, int32_t s, GPUDataTypes::RecoStep st)
Definition GPUReconstructionProcessing.h:96

o2::gpu::GPUReconstructionProcessing::krnlExec::krnlExec
constexpr krnlExec(uint32_t b, uint32_t t, int32_t s, GPUReconstruction::krnlDeviceType d=GPUReconstruction::krnlDeviceType::Auto)
Definition GPUReconstructionProcessing.h:95

o2::gpu::GPUReconstructionProcessing::krnlExec::nBlocks
uint32_t nBlocks
Definition GPUReconstructionProcessing.h:98

o2::gpu::GPUReconstructionProcessing::krnlExec::krnlExec
constexpr krnlExec(uint32_t b, uint32_t t, int32_t s, GPUReconstruction::krnlDeviceType d, GPUDataTypes::RecoStep st)
Definition GPUReconstructionProcessing.h:97

o2::gpu::GPUReconstructionProcessing::krnlExec::nThreads
uint32_t nThreads
Definition GPUReconstructionProcessing.h:99

o2::gpu::GPUReconstructionProcessing::krnlProperties
Definition GPUReconstructionProcessing.h:116

o2::gpu::GPUReconstructionProcessing::krnlProperties::forceBlocks
uint32_t forceBlocks
Definition GPUReconstructionProcessing.h:120

o2::gpu::GPUReconstructionProcessing::krnlProperties::total
uint32_t total()
Definition GPUReconstructionProcessing.h:121

o2::gpu::GPUReconstructionProcessing::krnlProperties::nThreads
uint32_t nThreads
Definition GPUReconstructionProcessing.h:118

o2::gpu::GPUReconstructionProcessing::krnlProperties::minBlocks
uint32_t minBlocks
Definition GPUReconstructionProcessing.h:119

o2::gpu::GPUReconstructionProcessing::krnlProperties::krnlProperties
krnlProperties(int32_t t=0, int32_t b=1, int32_t b2=0)
Definition GPUReconstructionProcessing.h:117

o2::gpu::GPUReconstructionProcessing::krnlRunRange
Definition GPUReconstructionProcessing.h:104

o2::gpu::GPUReconstructionProcessing::krnlRunRange::krnlRunRange
constexpr krnlRunRange(uint32_t v)
Definition GPUReconstructionProcessing.h:106

o2::gpu::GPUReconstructionProcessing::krnlRunRange::krnlRunRange
constexpr krnlRunRange()=default

o2::gpu::GPUReconstructionProcessing::krnlSetupArgs
Definition GPUReconstructionProcessing.h:136

o2::gpu::GPUReconstructionProcessing::krnlSetupArgs::s
const krnlSetupTime s
Definition GPUReconstructionProcessing.h:137

o2::gpu::GPUReconstructionProcessing::krnlSetupTime
Definition GPUReconstructionProcessing.h:131

o2::gpu::GPUReconstructionProcessing::krnlSetupTime::t
double & t
Definition GPUReconstructionProcessing.h:132

o2::gpu::GPUReconstructionProcessing::krnlSetup
Definition GPUReconstructionProcessing.h:124

o2::gpu::GPUReconstructionProcessing::krnlSetup::z
krnlEvent z
Definition GPUReconstructionProcessing.h:128

o2::gpu::GPUReconstructionProcessing::krnlSetup::x
krnlExec x
Definition GPUReconstructionProcessing.h:126

o2::gpu::GPUReconstructionProcessing::krnlSetup::y
krnlRunRange y
Definition GPUReconstructionProcessing.h:127

o2::gpu::GPUReconstructionProcessing::krnlSetup::krnlSetup
krnlSetup(const krnlExec &xx, const krnlRunRange &yy={0}, const krnlEvent &zz={nullptr, nullptr, 0})
Definition GPUReconstructionProcessing.h:125

o2::gpu::GPUReconstructionProcessing::timerMeta
Definition GPUReconstructionProcessing.h:191

o2::gpu::GPUReconstructionProcessing::timerMeta::count
uint32_t count
Definition GPUReconstructionProcessing.h:196

o2::gpu::GPUReconstructionProcessing::timerMeta::type
int32_t type
Definition GPUReconstructionProcessing.h:195

o2::gpu::GPUReconstructionProcessing::timerMeta::timer
std::unique_ptr< HighResTimer[]> timer
Definition GPUReconstructionProcessing.h:192

o2::gpu::GPUReconstructionProcessing::timerMeta::name
std::string name
Definition GPUReconstructionProcessing.h:193

o2::gpu::GPUReconstructionProcessing::timerMeta::memSize
size_t memSize
Definition GPUReconstructionProcessing.h:198

o2::gpu::GPUReconstructionProcessing::timerMeta::step
RecoStep step
Definition GPUReconstructionProcessing.h:197

o2::gpu::GPUReconstructionProcessing::timerMeta::num
int32_t num
Definition GPUReconstructionProcessing.h:194

o2::gpu::GPUSettingsDeviceBackend
Definition GPUSettings.h:75

o2::gpu::gpu_reconstruction_kernels::deviceEvent
Definition GPUReconstructionProcessing.h:36

o2::gpu::gpu_reconstruction_kernels::deviceEvent::get
T & get()
Definition GPUReconstructionProcessing.h:45

o2::gpu::gpu_reconstruction_kernels::deviceEvent::getEventList
T * getEventList()
Definition GPUReconstructionProcessing.h:50

o2::gpu::gpu_reconstruction_kernels::deviceEvent::deviceEvent
constexpr deviceEvent()=default

o2::gpu::gpu_reconstruction_kernels::deviceEvent::set
void set(T val)
Definition GPUReconstructionProcessing.h:40

o2::gpu::gpu_reconstruction_kernels::deviceEvent::isSet
bool isSet() const
Definition GPUReconstructionProcessing.h:54

o2::gpu::gpu_reconstruction_kernels::deviceEvent::deviceEvent
constexpr deviceEvent(std::nullptr_t p)
Definition GPUReconstructionProcessing.h:38

max
constexpr size_t max
Definition test_Algorithm.cxx:49

timer.h