d1/d4a/GPUChainTrackingSectorTracker_8cxx_source.html

// Copyright 2019-2020 CERN and copyright holders of ALICE O2.

// See https://alice-o2.web.cern.ch/copyright for details of the copyright holders.

// All rights not expressly granted are reserved.

//

// This software is distributed under the terms of the GNU General Public

// License v3 (GPL Version 3), copied verbatim in the file "COPYING".

//

// In applying this license CERN does not waive the privileges and immunities

// granted to it by virtue of its status as an Intergovernmental Organization

// or submit itself to any jurisdiction.


#include "GPUChainTracking.h"

#include "GPUChainTrackingDebug.h"

#include "GPULogging.h"

#include "GPUO2DataTypes.h"

#include "GPUMemorySizeScalers.h"

#include "GPUTrackingInputProvider.h"

#include "GPUTPCClusterOccupancyMap.h"

#include "GPUDefParametersRuntime.h"

#include "GPUTPCExtrapolationTracking.h"

#include "GPUTPCCreateOccupancyMap.h"

#include "GPUTPCCreateTrackingData.h"

#include "GPUTPCNeighboursFinder.h"

#include "GPUTPCNeighboursCleaner.h"

#include "GPUTPCStartHitsFinder.h"

#include "GPUTPCStartHitsSorter.h"

#include "GPUTPCTrackletConstructor.h"

#include "GPUTPCTrackletSelector.h"

#include "GPUTPCSectorDebugSortKernels.h"

#include "utils/strtag.h"

#include <fstream>


using namespace o2::gpu;


uint32_t GPUChainTracking::StreamForSector(uint32_t sector) const

{

  return sector % mRec->NStreams();

}


int32_t GPUChainTracking::ExtrapolationTracking(uint32_t iSector, bool blocking)

{

  const uint32_t stream = StreamForSector(iSector);

  runKernel<GPUTPCExtrapolationTracking>({GetGridBlk(256, stream), {iSector}});

  TransferMemoryResourceLinkToHost(RecoStep::TPCSectorTracking, processors()->tpcTrackers[iSector].MemoryResCommon(), stream);

  if (blocking) {

    SynchronizeStream(stream);

  }

  return (0);

}


int32_t GPUChainTracking::RunTPCTrackingSectors()

{

  if (mRec->GPUStuck()) {

    GPUWarning("This GPU is stuck, processing of tracking for this event is skipped!");

    return (1);

  }


  const auto& threadContext = GetThreadContext();


  int32_t retVal = RunTPCTrackingSectors_internal();

  if (retVal) {

    SynchronizeGPU();

  }

  return (retVal != 0);

}


int32_t GPUChainTracking::RunTPCTrackingSectors_internal()

{

  if (GetProcessingSettings().debugLevel >= 2) {

    GPUInfo("Running TPC Sector Tracker");

  }

  bool doGPU = GetRecoStepsGPU() & RecoStep::TPCSectorTracking;

  for (uint32_t i = 0; i < NSECTORS; i++) {

    processors()->tpcTrackers[i].Data().SetClusterData(mIOPtrs.clustersNative->nClustersSector[i], mIOPtrs.clustersNative->clusterOffset[i][0]);

    if (doGPU) {

      processorsShadow()->tpcTrackers[i].Data().SetClusterData(mIOPtrs.clustersNative->nClustersSector[i], mIOPtrs.clustersNative->clusterOffset[i][0]); // TODO: not needed I think, anyway copied in SetupGPUProcessor

    }

  }

  mRec->MemoryScalers()->nTPCHits = mIOPtrs.clustersNative->nClustersTotal;

  GPUInfo("Event has %u TPC Clusters, %d TRD Tracklets", (uint32_t)mRec->MemoryScalers()->nTPCHits, mIOPtrs.nTRDTracklets);


  for (uint32_t iSector = 0; iSector < NSECTORS; iSector++) {

    processors()->tpcTrackers[iSector].SetMaxData(mIOPtrs); // First iteration to set data sizes

  }

  mRec->ComputeReuseMax(nullptr); // Resolve maximums for shared buffers

  for (uint32_t iSector = 0; iSector < NSECTORS; iSector++) {

    SetupGPUProcessor(&processors()->tpcTrackers[iSector], false); // Prepare custom allocation for 1st stack level

    mRec->AllocateRegisteredMemory(processors()->tpcTrackers[iSector].MemoryResSectorScratch());

  }

  mRec->PushNonPersistentMemory(qStr2Tag("TPCSLTRK"));

  for (uint32_t iSector = 0; iSector < NSECTORS; iSector++) {

    SetupGPUProcessor(&processors()->tpcTrackers[iSector], true);             // Now we allocate

    mRec->ResetRegisteredMemoryPointers(&processors()->tpcTrackers[iSector]); // TODO: The above call breaks the GPU ptrs to already allocated memory. This fixes them. Should actually be cleaned up at the source.

    processors()->tpcTrackers[iSector].SetupCommonMemory();

  }


  bool streamInit[GPUCA_MAX_STREAMS] = {false};

  int32_t streamInitAndOccMap = mRec->NStreams() - 1;


  if (doGPU) {

    // Copy Tracker Object to GPU Memory

    if (GetProcessingSettings().debugLevel >= 3) {

      GPUInfo("Copying Tracker objects to GPU");

    }

    if (PrepareProfile()) {

      return 2;

    }


    WriteToConstantMemory(RecoStep::TPCSectorTracking, (char*)processors()->tpcTrackers - (char*)processors(), processorsShadow()->tpcTrackers, sizeof(GPUTPCTracker) * NSECTORS, streamInitAndOccMap, &mEvents->init);


    std::fill(streamInit, streamInit + mRec->NStreams(), false);

    streamInit[streamInitAndOccMap] = true;

  }


  if (param().rec.tpc.occupancyMapTimeBins || param().rec.tpc.sysClusErrorC12Norm) {

    AllocateRegisteredMemory(mInputsHost->mResourceOccupancyMap, mSubOutputControls[GPUTrackingOutputs::getIndex(&GPUTrackingOutputs::tpcOccupancyMap)]);

  }

  if (param().rec.tpc.occupancyMapTimeBins) {

    if (doGPU) {

      ReleaseEvent(mEvents->init);

    }

    uint32_t* ptr = doGPU ? mInputsShadow->mTPCClusterOccupancyMap : mInputsHost->mTPCClusterOccupancyMap;

    auto* ptrTmp = (GPUTPCClusterOccupancyMapBin*)mRec->AllocateVolatileMemory(GPUTPCClusterOccupancyMapBin::getTotalSize(param()), doGPU);

    runKernel<GPUMemClean16>(GetGridAutoStep(streamInitAndOccMap, RecoStep::TPCSectorTracking), ptrTmp, GPUTPCClusterOccupancyMapBin::getTotalSize(param()));

    runKernel<GPUTPCCreateOccupancyMap, GPUTPCCreateOccupancyMap::fill>(GetGridBlk(GPUCA_NSECTORS * GPUCA_ROW_COUNT, streamInitAndOccMap), ptrTmp);

    runKernel<GPUTPCCreateOccupancyMap, GPUTPCCreateOccupancyMap::fold>(GetGridBlk(GPUTPCClusterOccupancyMapBin::getNBins(param()), streamInitAndOccMap), ptrTmp, ptr + 2);

    mRec->ReturnVolatileMemory();

    mInputsHost->mTPCClusterOccupancyMap[1] = param().rec.tpc.occupancyMapTimeBins * 0x10000 + param().rec.tpc.occupancyMapTimeBinsAverage;

    if (doGPU) {

      GPUMemCpy(RecoStep::TPCSectorTracking, mInputsHost->mTPCClusterOccupancyMap + 2, mInputsShadow->mTPCClusterOccupancyMap + 2, sizeof(*ptr) * GPUTPCClusterOccupancyMapBin::getNBins(mRec->GetParam()), streamInitAndOccMap, false, &mEvents->init);

    } else {

      TransferMemoryResourceLinkToGPU(RecoStep::TPCSectorTracking, mInputsHost->mResourceOccupancyMap, streamInitAndOccMap, &mEvents->init);

    }

  }

  if (param().rec.tpc.occupancyMapTimeBins || param().rec.tpc.sysClusErrorC12Norm) {

    uint32_t& occupancyTotal = *mInputsHost->mTPCClusterOccupancyMap;

    occupancyTotal = CAMath::Float2UIntRn(mRec->MemoryScalers()->nTPCHits / (mIOPtrs.settingsTF && mIOPtrs.settingsTF->hasNHBFPerTF ? mIOPtrs.settingsTF->nHBFPerTF : 128));

    mRec->UpdateParamOccupancyMap(param().rec.tpc.occupancyMapTimeBins ? mInputsHost->mTPCClusterOccupancyMap + 2 : nullptr, doGPU && param().rec.tpc.occupancyMapTimeBins ? mInputsShadow->mTPCClusterOccupancyMap + 2 : nullptr, occupancyTotal, streamInitAndOccMap);

  }


  int32_t streamMap[NSECTORS];


  bool error = false;

  mRec->runParallelOuterLoop(doGPU, NSECTORS, [&](uint32_t iSector) {

    GPUTPCTracker& trk = processors()->tpcTrackers[iSector];

    GPUTPCTracker& trkShadow = doGPU ? processorsShadow()->tpcTrackers[iSector] : trk;

    int32_t useStream = StreamForSector(iSector);

    if (GetProcessingSettings().amdMI100SerializationWorkaround) {

      SynchronizeStream(useStream); // TODO: Remove this workaround once fixed on MI100

    }


    if (GetProcessingSettings().debugLevel >= 3) {

      GPUInfo("Creating Sector Data (Sector %d)", iSector);

    }

    TransferMemoryResourcesToGPU(RecoStep::TPCSectorTracking, &trk, useStream);

    runKernel<GPUTPCCreateTrackingData>({doGPU ? GetGridBlk(GPUCA_ROW_COUNT, useStream) : GetGridAuto(0), {iSector}, {nullptr, streamInit[useStream] ? nullptr : &mEvents->init}}); // TODO: Check why GetGridAuto(0) is much fast on CPU

    streamInit[useStream] = true;

    if (GetProcessingSettings().deterministicGPUReconstruction) {

      runKernel<GPUTPCSectorDebugSortKernels, GPUTPCSectorDebugSortKernels::hitData>({GetGridBlk(GPUCA_ROW_COUNT, useStream), {iSector}});

    }

    if (!doGPU && trk.CheckEmptySector() && GetProcessingSettings().debugLevel == 0) {

      return;

    }


    if (GetProcessingSettings().debugLevel >= 6) {

      if ((GetProcessingSettings().debugMask & 63)) {

        *mDebugFile << "\n\nReconstruction: Sector " << iSector << "/" << NSECTORS << std::endl;

      }

      if (GetProcessingSettings().debugMask & GPUChainTrackingDebugFlags::TPCSectorTrackingData) {

        if (doGPU) {

          TransferMemoryResourcesToHost(RecoStep::TPCSectorTracking, &trk, -1, true);

        }

        trk.DumpTrackingData(*mDebugFile);

      }

    }


    runKernel<GPUMemClean16>(GetGridAutoStep(useStream, RecoStep::TPCSectorTracking), trkShadow.Data().HitWeights(), trkShadow.Data().NumberOfHitsPlusAlign() * sizeof(*trkShadow.Data().HitWeights()));

    runKernel<GPUTPCNeighboursFinder>({GetGridBlk(GPUCA_ROW_COUNT, useStream), {iSector}, {nullptr, streamInit[useStream] ? nullptr : &mEvents->init}});

    streamInit[useStream] = true;


    if (GetProcessingSettings().keepDisplayMemory) {

      TransferMemoryResourcesToHost(RecoStep::TPCSectorTracking, &trk, -1, true);

      memcpy(trk.LinkTmpMemory(), mRec->Res(trk.MemoryResLinks()).Ptr(), mRec->Res(trk.MemoryResLinks()).Size());

      if (GetProcessingSettings().debugMask & GPUChainTrackingDebugFlags::TPCPreLinks) {

        trk.DumpLinks(*mDebugFile, 0);

      }

    }


    runKernel<GPUTPCNeighboursCleaner>({GetGridBlk(GPUCA_ROW_COUNT - 2, useStream), {iSector}});

    DoDebugAndDump(RecoStep::TPCSectorTracking, GPUChainTrackingDebugFlags::TPCLinks, trk, &GPUTPCTracker::DumpLinks, *mDebugFile, 1);


    runKernel<GPUTPCStartHitsFinder>({GetGridBlk(GPUCA_ROW_COUNT - 6, useStream), {iSector}});

    if (mRec->getGPUParameters(doGPU).par_SORT_STARTHITS) {

      runKernel<GPUTPCStartHitsSorter>({GetGridAuto(useStream), {iSector}});

    }

    if (GetProcessingSettings().deterministicGPUReconstruction) {

      runKernel<GPUTPCSectorDebugSortKernels, GPUTPCSectorDebugSortKernels::startHits>({GetGrid(1, 1, useStream), {iSector}});

    }

    DoDebugAndDump(RecoStep::TPCSectorTracking, GPUChainTrackingDebugFlags::TPCStartHits, trk, &GPUTPCTracker::DumpStartHits, *mDebugFile);


    if (GetProcessingSettings().memoryAllocationStrategy == GPUMemoryResource::ALLOCATION_INDIVIDUAL) {

      trk.UpdateMaxData();

      AllocateRegisteredMemory(trk.MemoryResTracklets());

      AllocateRegisteredMemory(trk.MemoryResOutput());

    }


    runKernel<GPUTPCTrackletConstructor>({GetGridAuto(useStream), {iSector}});

    DoDebugAndDump(RecoStep::TPCSectorTracking, GPUChainTrackingDebugFlags::TPCTracklets, trk, &GPUTPCTracker::DumpTrackletHits, *mDebugFile);

    if (GetProcessingSettings().debugMask & GPUChainTrackingDebugFlags::TPCHitWeights && GetProcessingSettings().deterministicGPUReconstruction < 2) {

      trk.DumpHitWeights(*mDebugFile);

    }


    runKernel<GPUTPCTrackletSelector>({GetGridAuto(useStream), {iSector}});

    runKernel<GPUTPCExtrapolationTrackingCopyNumbers>({{1, -ThreadCount(), useStream}, {iSector}}, 1);

    if (GetProcessingSettings().deterministicGPUReconstruction) {

      runKernel<GPUTPCSectorDebugSortKernels, GPUTPCSectorDebugSortKernels::sectorTracks>({GetGrid(1, 1, useStream), {iSector}});

    }

    TransferMemoryResourceLinkToHost(RecoStep::TPCSectorTracking, trk.MemoryResCommon(), useStream, &mEvents->sector[iSector]);

    streamMap[iSector] = useStream;

    if (GetProcessingSettings().debugLevel >= 3) {

      GPUInfo("Sector %u, Number of tracks: %d", iSector, *trk.NTracks());

    }

    DoDebugAndDump(RecoStep::TPCSectorTracking, GPUChainTrackingDebugFlags::TPCSectorTracks, trk, &GPUTPCTracker::DumpTrackHits, *mDebugFile);

    if (GetProcessingSettings().memoryAllocationStrategy == GPUMemoryResource::ALLOCATION_INDIVIDUAL && !trk.MemoryReuseAllowed()) {

      mRec->PopNonPersistentMemory(RecoStep::TPCSectorTracking, qStr2Tag("TPCSLTRK"), &trk);

    }

  });

  mRec->SetNActiveThreadsOuterLoop(1);

  if (error) {

    return (3);

  }


  if (doGPU || GetProcessingSettings().debugLevel >= 1) {

    if (param().rec.tpc.extrapolationTracking) {

      std::vector<bool> blocking(NSECTORS * mRec->NStreams());

      for (uint32_t iSector = 0; iSector < NSECTORS; iSector++) {

        for (uint32_t iStream = 0; iStream < mRec->NStreams(); iStream++) {

          blocking[iSector * mRec->NStreams() + iStream] = StreamForSector(iSector) == iStream;

        }

      }

      for (uint32_t iSector = 0; iSector < NSECTORS; iSector++) {

        uint32_t tmpSector = GPUTPCExtrapolationTracking::ExtrapolationTrackingSectorOrder(iSector);

        uint32_t sectorLeft, sectorRight;

        GPUTPCExtrapolationTracking::ExtrapolationTrackingSectorLeftRight(tmpSector, sectorLeft, sectorRight);

        if (doGPU && !blocking[tmpSector * mRec->NStreams() + StreamForSector(sectorLeft)]) {

          StreamWaitForEvents(StreamForSector(tmpSector), &mEvents->sector[sectorLeft]);

          blocking[tmpSector * mRec->NStreams() + StreamForSector(sectorLeft)] = true;

        }

        if (doGPU && !blocking[tmpSector * mRec->NStreams() + StreamForSector(sectorRight)]) {

          StreamWaitForEvents(StreamForSector(tmpSector), &mEvents->sector[sectorRight]);

          blocking[tmpSector * mRec->NStreams() + StreamForSector(sectorRight)] = true;

        }

        ExtrapolationTracking(tmpSector, false);

      }

    }

    if (doGPU) {

      ReleaseEvent(mEvents->init);

      for (uint32_t iSector = 0; iSector < NSECTORS; iSector++) {

        ReleaseEvent(mEvents->sector[iSector]);

      }

    }

  } else {

    mRec->runParallelOuterLoop(doGPU, NSECTORS, [&](uint32_t iSector) {

      if (param().rec.tpc.extrapolationTracking) {

        ExtrapolationTracking(iSector, true);

      }

    });

    mRec->SetNActiveThreadsOuterLoop(1);

  }


  if (param().rec.tpc.extrapolationTracking && GetProcessingSettings().debugLevel >= 3) {

    for (uint32_t iSector = 0; iSector < NSECTORS; iSector++) {

      GPUInfo("Sector %d - Tracks: Local %d Extrapolated %d - Hits: Local %d Extrapolated %d", iSector,

              processors()->tpcTrackers[iSector].CommonMemory()->nLocalTracks, processors()->tpcTrackers[iSector].CommonMemory()->nTracks, processors()->tpcTrackers[iSector].CommonMemory()->nLocalTrackHits, processors()->tpcTrackers[iSector].CommonMemory()->nTrackHits);

    }

  }


  if (DoProfile()) {

    return (1);

  }

  for (uint32_t i = 0; i < NSECTORS; i++) {

    mIOPtrs.nSectorTracks[i] = *processors()->tpcTrackers[i].NTracks();

    mIOPtrs.sectorTracks[i] = processors()->tpcTrackers[i].Tracks();

    mIOPtrs.nSectorClusters[i] = *processors()->tpcTrackers[i].NTrackHits();

    mIOPtrs.sectorClusters[i] = processors()->tpcTrackers[i].TrackHits();

    if (GetProcessingSettings().keepDisplayMemory && !GetProcessingSettings().keepAllMemory) {

      TransferMemoryResourcesToHost(RecoStep::TPCSectorTracking, &processors()->tpcTrackers[i], -1, true);

    }

  }

  if (GetProcessingSettings().debugLevel >= 2) {

    GPUInfo("TPC Sector Tracker finished");

  }

  mRec->PopNonPersistentMemory(RecoStep::TPCSectorTracking, qStr2Tag("TPCSLTRK"));

  return 0;

}

GPUChainTrackingDebug.h

GPUChainTracking.h

i
int32_t i
Definition GPUCommonAlgorithm.h:436

GPUCA_MAX_STREAMS
#define GPUCA_MAX_STREAMS
Definition GPUDefParametersConstants.h:26

GPULogging.h

GPUMemorySizeScalers.h

GPUO2DataTypes.h

retVal
int32_t retVal
Definition GPUReconstruction.cxx:61

GPUTPCClusterOccupancyMap.h

GPUTPCCreateOccupancyMap.h

GPUTPCCreateTrackingData.h

GPUTPCExtrapolationTracking.h

GPUCA_NSECTORS
#define GPUCA_NSECTORS
Definition GPUTPCGeometry.h:22

GPUCA_ROW_COUNT
#define GPUCA_ROW_COUNT
Definition GPUTPCGeometry.h:23

GPUTPCNeighboursCleaner.h

GPUTPCNeighboursFinder.h

GPUTPCSectorDebugSortKernels.h

GPUTPCStartHitsFinder.h

GPUTPCStartHitsSorter.h

GPUTPCTrackletConstructor.h

GPUTPCTrackletSelector.h

GPUTrackingInputProvider.h

ptr
TBranch * ptr
Definition TTreePlugin.cxx:841

o2::gpu::GPUChainTracking::mEvents
eventStruct * mEvents
Definition GPUChainTracking.h:287

o2::gpu::GPUChainTracking::RunTPCTrackingSectors
int32_t RunTPCTrackingSectors()
Definition GPUChainTrackingSectorTracker.cxx:54

o2::gpu::GPUChainTracking::mInputsHost
std::unique_ptr< GPUTrackingInputProvider > mInputsHost
Definition GPUChainTracking.h:246

o2::gpu::GPUChainTracking::mSubOutputControls
std::array< GPUOutputControl *, GPUTrackingOutputs::count()> mSubOutputControls
Definition GPUChainTracking.h:269

o2::gpu::GPUChainTracking::mDebugFile
std::unique_ptr< std::ofstream > mDebugFile
Definition GPUChainTracking.h:284

o2::gpu::GPUChainTracking::PrepareProfile
int32_t PrepareProfile()
Definition GPUChainTrackingDebugAndProfiling.cxx:35

o2::gpu::GPUChainTracking::DoProfile
int32_t DoProfile()
Definition GPUChainTrackingDebugAndProfiling.cxx:45

o2::gpu::GPUChainTracking::mIOPtrs
GPUTrackingInOutPointers & mIOPtrs
Definition GPUChainTracking.h:91

o2::gpu::GPUChainTracking::mInputsShadow
std::unique_ptr< GPUTrackingInputProvider > mInputsShadow
Definition GPUChainTracking.h:247

o2::gpu::GPUChainTracking::ExtrapolationTracking
int32_t ExtrapolationTracking(uint32_t iSector, bool blocking)
Definition GPUChainTrackingSectorTracker.cxx:43

o2::gpu::GPUChain::TransferMemoryResourceLinkToGPU
void TransferMemoryResourceLinkToGPU(RecoStep step, int16_t res, int32_t stream=-1, deviceEvent *ev=nullptr, deviceEvent *evList=nullptr, int32_t nEvents=1)
Definition GPUChain.h:124

o2::gpu::GPUChain::GPUMemCpy
void GPUMemCpy(RecoStep step, void *dst, const void *src, size_t size, int32_t stream, int32_t toGPU, deviceEvent *ev=nullptr, deviceEvent *evList=nullptr, int32_t nEvents=1)
Definition GPUChain.h:128

o2::gpu::GPUChain::DoDebugAndDump
bool DoDebugAndDump(RecoStep step, uint32_t mask, T &processor, S T::*func, Args &&... args)
Definition GPUChain.h:230

o2::gpu::GPUChain::SynchronizeGPU
void SynchronizeGPU()
Definition GPUChain.h:110

o2::gpu::GPUChain::GetRecoStepsGPU
GPUReconstruction::RecoStepField GetRecoStepsGPU() const
Definition GPUChain.h:72

o2::gpu::GPUChain::WriteToConstantMemory
void WriteToConstantMemory(RecoStep step, size_t offset, const void *src, size_t size, int32_t stream=-1, deviceEvent *ev=nullptr)
Definition GPUChain.h:127

o2::gpu::GPUChain::ReleaseEvent
void ReleaseEvent(deviceEvent ev, bool doGPU=true)
Definition GPUChain.h:111

o2::gpu::GPUChain::ThreadCount
uint32_t ThreadCount() const
Definition GPUChain.h:215

o2::gpu::GPUChain::AllocateRegisteredMemory
size_t AllocateRegisteredMemory(GPUProcessor *proc)
Definition GPUChain.h:217

o2::gpu::GPUChain::GetThreadContext
virtual std::unique_ptr< GPUReconstructionProcessing::threadContext > GetThreadContext()
Definition GPUChain.h:109

o2::gpu::GPUChain::processors
GPUConstantMem * processors()
Definition GPUChain.h:84

o2::gpu::GPUChain::StreamWaitForEvents
void StreamWaitForEvents(int32_t stream, deviceEvent *evList, int32_t nEvents=1)
Definition GPUChain.h:117

o2::gpu::GPUChain::param
GPUParam & param()
Definition GPUChain.h:87

o2::gpu::GPUChain::SetupGPUProcessor
void SetupGPUProcessor(T *proc, bool allocate)
Definition GPUChain.h:220

o2::gpu::GPUChain::GetProcessingSettings
const GPUSettingsProcessing & GetProcessingSettings() const
Definition GPUChain.h:76

o2::gpu::GPUChain::SynchronizeStream
void SynchronizeStream(int32_t stream)
Definition GPUChain.h:89

o2::gpu::GPUChain::mRec
GPUReconstructionCPU * mRec
Definition GPUChain.h:79

o2::gpu::GPUChain::processorsShadow
GPUConstantMem * processorsShadow()
Definition GPUChain.h:85

o2::gpu::GPUChain::GetGridAutoStep
krnlExec GetGridAutoStep(int32_t stream, GPUDataTypes::RecoStep st=GPUDataTypes::RecoStep::NoRecoStep)
Definition GPUChain.cxx:47

o2::gpu::GPUChain::NSECTORS
static constexpr int32_t NSECTORS
Definition GPUChain.h:58

o2::gpu::GPUChain::TransferMemoryResourceLinkToHost
void TransferMemoryResourceLinkToHost(RecoStep step, int16_t res, int32_t stream=-1, deviceEvent *ev=nullptr, deviceEvent *evList=nullptr, int32_t nEvents=1)
Definition GPUChain.h:125

o2::gpu::GPUChain::TransferMemoryResourcesToHost
void TransferMemoryResourcesToHost(RecoStep step, GPUProcessor *proc, int32_t stream=-1, bool all=false)
Definition GPUChain.h:123

o2::gpu::GPUChain::GetGrid
krnlExec GetGrid(uint32_t totalItems, uint32_t nThreads, int32_t stream, GPUReconstruction::krnlDeviceType d=GPUReconstruction::krnlDeviceType::Auto, GPUDataTypes::RecoStep st=GPUDataTypes::RecoStep::NoRecoStep)
Definition GPUChain.cxx:21

o2::gpu::GPUChain::GetGridAuto
krnlExec GetGridAuto(int32_t stream, GPUReconstruction::krnlDeviceType d=GPUReconstruction::krnlDeviceType::Auto, GPUDataTypes::RecoStep st=GPUDataTypes::RecoStep::NoRecoStep)
Definition GPUChain.cxx:42

o2::gpu::GPUChain::GetGridBlk
krnlExec GetGridBlk(uint32_t nBlocks, int32_t stream, GPUReconstruction::krnlDeviceType d=GPUReconstruction::krnlDeviceType::Auto, GPUDataTypes::RecoStep st=GPUDataTypes::RecoStep::NoRecoStep)
Definition GPUChain.cxx:32

o2::gpu::GPUChain::rec
GPUReconstruction * rec()
Definition GPUChain.h:66

o2::gpu::GPUChain::TransferMemoryResourcesToGPU
void TransferMemoryResourcesToGPU(RecoStep step, GPUProcessor *proc, int32_t stream=-1, bool all=false)
Definition GPUChain.h:122

o2::gpu::GPUMemoryResource::Size
size_t Size() const
Definition GPUMemoryResource.h:90

o2::gpu::GPUMemoryResource::Ptr
void * Ptr()
Definition GPUMemoryResource.h:88

o2::gpu::GPUMemoryResource::ALLOCATION_INDIVIDUAL
@ ALLOCATION_INDIVIDUAL
Definition GPUMemoryResource.h:75

o2::gpu::GPUReconstructionCPU::GPUStuck
int32_t GPUStuck()
Definition GPUReconstructionCPU.h:46

o2::gpu::GPUReconstructionCPU::UpdateParamOccupancyMap
void UpdateParamOccupancyMap(const uint32_t *mapHost, const uint32_t *mapGPU, uint32_t occupancyTotal, int32_t stream=-1)
Definition GPUReconstructionCPU.cxx:358

o2::gpu::GPUReconstructionProcessing::runParallelOuterLoop
void runParallelOuterLoop(bool doGPU, uint32_t nThreads, std::function< void(uint32_t)> lambda)
Definition GPUReconstructionProcessing.cxx:70

o2::gpu::GPUReconstructionProcessing::getGPUParameters
const GPUDefParameters & getGPUParameters(bool doGPU) const override
Definition GPUReconstructionProcessing.h:178

o2::gpu::GPUReconstructionProcessing::SetNActiveThreadsOuterLoop
void SetNActiveThreadsOuterLoop(uint32_t f)
Definition GPUReconstructionProcessing.h:157

o2::gpu::GPUReconstruction::AllocateVolatileMemory
void * AllocateVolatileMemory(size_t size, bool device)
Definition GPUReconstruction.cxx:790

o2::gpu::GPUReconstruction::ReturnVolatileMemory
void ReturnVolatileMemory()
Definition GPUReconstruction.cxx:819

o2::gpu::GPUReconstruction::ComputeReuseMax
void ComputeReuseMax(GPUProcessor *proc)
Definition GPUReconstruction.cxx:482

o2::gpu::GPUReconstruction::ResetRegisteredMemoryPointers
void ResetRegisteredMemoryPointers(GPUProcessor *proc)
Definition GPUReconstruction.cxx:825

o2::gpu::GPUReconstruction::Res
GPUMemoryResource & Res(int16_t num)
Definition GPUReconstruction.h:164

o2::gpu::GPUReconstruction::PopNonPersistentMemory
void PopNonPersistentMemory(RecoStep step, uint64_t tag, const GPUProcessor *proc=nullptr)
Definition GPUReconstruction.cxx:886

o2::gpu::GPUReconstruction::NStreams
uint32_t NStreams() const
Definition GPUReconstruction.h:221

o2::gpu::GPUReconstruction::GetParam
const GPUParam & GetParam() const
Definition GPUReconstruction.cxx:1291

o2::gpu::GPUReconstruction::PushNonPersistentMemory
void PushNonPersistentMemory(uint64_t tag)
Definition GPUReconstruction.cxx:881

o2::gpu::GPUReconstruction::MemoryScalers
GPUMemorySizeScalers * MemoryScalers()
Definition GPUReconstruction.h:193

o2::gpu::GPUReconstruction::AllocateRegisteredMemory
size_t AllocateRegisteredMemory(GPUProcessor *proc, bool resetCustom=false)
Definition GPUReconstruction.cxx:526

o2::gpu::GPUTPCTracker
Definition GPUTPCTracker.h:39

o2::gpu::GPUTPCTracker::MemoryResTracklets
int16_t MemoryResTracklets() const
Definition GPUTPCTracker.h:111

o2::gpu::GPUTPCTracker::MemoryResLinks
int16_t MemoryResLinks() const
Definition GPUTPCTracker.h:108

o2::gpu::GPUTPCTracker::SetMaxData
void SetMaxData(const GPUTrackingInOutPointers &io)
Definition GPUTPCTracker.cxx:129

o2::gpu::GPUTPCTracker::MemoryResOutput
int16_t MemoryResOutput() const
Definition GPUTPCTracker.h:112

o2::gpu::GPUTPCTracker::DumpTrackHits
void DumpTrackHits(std::ostream &out)
Definition GPUTPCTrackerDump.cxx:96

o2::gpu::GPUTPCTracker::LinkTmpMemory
void * LinkTmpMemory()
Definition GPUTPCTracker.h:199

o2::gpu::GPUTPCTracker::SetupCommonMemory
void SetupCommonMemory()
Definition GPUTPCTracker.cxx:176

o2::gpu::GPUTPCTracker::DumpLinks
void DumpLinks(std::ostream &out, int32_t phase)
Definition GPUTPCTrackerDump.cxx:48

o2::gpu::GPUTPCTracker::DumpStartHits
void DumpStartHits(std::ostream &out)
Definition GPUTPCTrackerDump.cxx:86

o2::gpu::GPUTPCTracker::DumpHitWeights
void DumpHitWeights(std::ostream &out)
Definition GPUTPCTrackerDump.cxx:67

o2::gpu::GPUTPCTracker::MemoryResCommon
int16_t MemoryResCommon() const
Definition GPUTPCTracker.h:110

o2::gpu::GPUTPCTracker::CheckEmptySector
int32_t CheckEmptySector()

o2::gpu::GPUTPCTracker::MemoryReuseAllowed
bool MemoryReuseAllowed()
Definition GPUTPCTracker.cxx:87

o2::gpu::GPUTPCTracker::DumpTrackingData
void DumpTrackingData(std::ostream &out)
Definition GPUTPCTrackerDump.cxx:29

o2::gpu::GPUTPCTracker::DumpTrackletHits
void DumpTrackletHits(std::ostream &out)
Definition GPUTPCTrackerDump.cxx:120

o2::gpu::GPUTPCTracker::UpdateMaxData
void UpdateMaxData()
Definition GPUTPCTracker.cxx:169

param
GLenum GLfloat param
Definition glcorearb.h:271

stream
GLuint GLuint stream
Definition glcorearb.h:1806

o2::gpu
Definition TrackTRD.h:35

o2::gpu::TPCSectorTracks
@ TPCSectorTracks
Definition GPUChainTrackingDebug.h:32

o2::gpu::TPCLinks
@ TPCLinks
Definition GPUChainTrackingDebug.h:28

o2::gpu::TPCSectorTrackingData
@ TPCSectorTrackingData
Definition GPUChainTrackingDebug.h:26

o2::gpu::TPCPreLinks
@ TPCPreLinks
Definition GPUChainTrackingDebug.h:27

o2::gpu::TPCHitWeights
@ TPCHitWeights
Definition GPUChainTrackingDebug.h:31

o2::gpu::TPCTracklets
@ TPCTracklets
Definition GPUChainTrackingDebug.h:30

o2::gpu::TPCStartHits
@ TPCStartHits
Definition GPUChainTrackingDebug.h:29

strtag.h

qStr2Tag
constexpr T qStr2Tag(const char *str)
Definition strtag.h:22

o2::gpu::GPUChainTracking::eventStruct::sector
deviceEvent sector[NSECTORS]
Definition GPUChainTracking.h:212

o2::gpu::GPUChainTracking::eventStruct::init
deviceEvent init
Definition GPUChainTracking.h:214

o2::gpu::GPUConstantMem::tpcTrackers
GPUTPCTracker tpcTrackers[GPUCA_NSECTORS]
Definition GPUConstantMem.h:43

o2::gpu::GPUMemorySizeScalers::nTPCHits
size_t nTPCHits
Definition GPUMemorySizeScalers.h:26

o2::gpu::GPUSettingsTF::nHBFPerTF
int32_t nHBFPerTF
Definition GPUSettings.h:71

o2::gpu::GPUSettingsTF::hasNHBFPerTF
int32_t hasNHBFPerTF
Definition GPUSettings.h:70

o2::gpu::GPUTPCClusterOccupancyMapBin
Definition GPUTPCClusterOccupancyMap.h:24

o2::gpu::GPUTrackingInOutPointers::sectorClusters
const GPUTPCHitId * sectorClusters[NSECTORS]
Definition GPUDataTypes.h:228

o2::gpu::GPUTrackingInOutPointers::clustersNative
const o2::tpc::ClusterNativeAccess * clustersNative
Definition GPUDataTypes.h:225

o2::gpu::GPUTrackingInOutPointers::nTRDTracklets
uint32_t nTRDTracklets
Definition GPUDataTypes.h:261

o2::gpu::GPUTrackingInOutPointers::nSectorClusters
uint32_t nSectorClusters[NSECTORS]
Definition GPUDataTypes.h:229

o2::gpu::GPUTrackingInOutPointers::sectorTracks
const GPUTPCTrack * sectorTracks[NSECTORS]
Definition GPUDataTypes.h:226

o2::gpu::GPUTrackingInOutPointers::settingsTF
const GPUSettingsTF * settingsTF
Definition GPUDataTypes.h:305

o2::gpu::GPUTrackingInOutPointers::nSectorTracks
uint32_t nSectorTracks[NSECTORS]
Definition GPUDataTypes.h:227

o2::gpu::GPUTrackingOutputs::tpcOccupancyMap
GPUOutputControl tpcOccupancyMap
Definition GPUOutputControl.h:72

o2::gpu::GPUTrackingOutputs::getIndex
size_t getIndex(const GPUOutputControl &v)
Definition GPUOutputControl.h:80

o2::gpu::internal::GPUParam_t::rec
T rec
Definition GPUParam.h:52

o2::tpc::ClusterNativeAccess::nClustersSector
unsigned int nClustersSector[constants::MAXSECTOR]
Definition ClusterNative.h:179

o2::tpc::ClusterNativeAccess::nClustersTotal
unsigned int nClustersTotal
Definition ClusterNative.h:181

o2::tpc::ClusterNativeAccess::clusterOffset
unsigned int clusterOffset[constants::MAXSECTOR][constants::MAXGLOBALPADROW]
Definition ClusterNative.h:180