dd/dc6/GPUChainTrackingDebugAndProfiling_8cxx_source.html

// Copyright 2019-2020 CERN and copyright holders of ALICE O2.

// See https://alice-o2.web.cern.ch/copyright for details of the copyright holders.

// All rights not expressly granted are reserved.

//

// This software is distributed under the terms of the GNU General Public

// License v3 (GPL Version 3), copied verbatim in the file "COPYING".

//

// In applying this license CERN does not waive the privileges and immunities

// granted to it by virtue of its status as an Intergovernmental Organization

// or submit itself to any jurisdiction.


#include "GPUChainTracking.h"

#include "GPUTrackingInputProvider.h"

#include "GPUMemorySizeScalers.h"

#include "GPUConstantMem.h"

#include "GPUTPCClusterFilter.h"

#include <map>

#include <memory>

#include <string>

#include <numeric>


#ifdef GPUCA_TRACKLET_CONSTRUCTOR_DO_PROFILE

#include "bitmapfile.h"

#endif


#define PROFILE_MAX_SIZE (100 * 1024 * 1024)


using namespace o2::gpu;


static inline uint32_t RGB(uint8_t r, uint8_t g, uint8_t b) { return (uint32_t)r | ((uint32_t)g << 8) | ((uint32_t)b << 16); }


int32_t GPUChainTracking::PrepareProfile()

{

#ifdef GPUCA_TRACKLET_CONSTRUCTOR_DO_PROFILE

  char* tmpMem = (char*)mRec->AllocateDirectMemory(PROFILE_MAX_SIZE, GPUMemoryResource::MEMORY_GPU);

  processorsShadow()->tpcTrackers[0].mStageAtSync = tmpMem;

  runKernel<GPUMemClean16>({{BlockCount(), ThreadCount(), -1}}, tmpMem, PROFILE_MAX_SIZE);

#endif

  return 0;

}


int32_t GPUChainTracking::DoProfile()

{

#ifdef GPUCA_TRACKLET_CONSTRUCTOR_DO_PROFILE

  std::unique_ptr<char[]> stageAtSync{new char[PROFILE_MAX_SIZE]};

  mRec->GPUMemCpy(stageAtSync.get(), processorsShadow()->tpcTrackers[0].mStageAtSync, PROFILE_MAX_SIZE, -1, false);


  FILE* fp = fopen("profile.txt", "w+");

  FILE* fp2 = fopen("profile.bmp", "w+b");


  const int32_t bmpheight = 8192;

  BITMAPFILEHEADER bmpFH;

  BITMAPINFOHEADER bmpIH;

  memset(&bmpFH, 0, sizeof(bmpFH));

  memset(&bmpIH, 0, sizeof(bmpIH));


  bmpFH.bfType = 19778; //"BM"

  bmpFH.bfSize = sizeof(bmpFH) + sizeof(bmpIH) + (ConstructorBlockCount() * ConstructorThreadCount() / 32 * 33 - 1) * bmpheight;

  bmpFH.bfOffBits = sizeof(bmpFH) + sizeof(bmpIH);


  bmpIH.biSize = sizeof(bmpIH);

  bmpIH.biWidth = ConstructorBlockCount() * ConstructorThreadCount() / 32 * 33 - 1;

  bmpIH.biHeight = bmpheight;

  bmpIH.biPlanes = 1;

  bmpIH.biBitCount = 32;


  fwrite(&bmpFH, 1, sizeof(bmpFH), fp2);

  fwrite(&bmpIH, 1, sizeof(bmpIH), fp2);


  int32_t nEmptySync = 0;

  for (uint32_t i = 0; i < bmpheight * ConstructorBlockCount() * ConstructorThreadCount(); i += ConstructorBlockCount() * ConstructorThreadCount()) {

    int32_t fEmpty = 1;

    for (uint32_t j = 0; j < ConstructorBlockCount() * ConstructorThreadCount(); j++) {

      fprintf(fp, "%d\t", stageAtSync[i + j]);

      int32_t color = 0;

      if (stageAtSync[i + j] == 1) {

        color = RGB(255, 0, 0);

      }

      if (stageAtSync[i + j] == 2) {

        color = RGB(0, 255, 0);

      }

      if (stageAtSync[i + j] == 3) {

        color = RGB(0, 0, 255);

      }

      if (stageAtSync[i + j] == 4) {

        color = RGB(255, 255, 0);

      }

      fwrite(&color, 1, sizeof(int32_t), fp2);

      if (j > 0 && j % 32 == 0) {

        color = RGB(255, 255, 255);

        fwrite(&color, 1, 4, fp2);

      }

      if (stageAtSync[i + j]) {

        fEmpty = 0;

      }

    }

    fprintf(fp, "\n");

    if (fEmpty) {

      nEmptySync++;

    } else {

      nEmptySync = 0;

    }

    (void)nEmptySync;

    // if (nEmptySync == GPUCA_SCHED_ROW_STEP + 2) break;

  }


  fclose(fp);

  fclose(fp2);

#endif

  return 0;

}


namespace

{

struct GPUChainTrackingMemUsage {

  void add(size_t n, size_t bound)

  {

    nMax = std::max(nMax, n);

    maxUse = std::max(n / std::max<double>(bound, 1.), maxUse);

    nSum += n;

    nBoundSum += bound;

    count++;

  }

  size_t nMax;

  size_t nSum = 0;

  size_t nBoundSum = 0;

  double maxUse = 0.;

  uint32_t count = 0;

};


void addToMap(std::string name, std::map<std::string, GPUChainTrackingMemUsage>& map, uint64_t n, uint64_t bound)

{

  GPUChainTrackingMemUsage& obj = map.insert({name, {}}).first->second;

  obj.add(n, bound);

}

} // namespace


void GPUChainTracking::PrintMemoryStatistics()

{

  std::map<std::string, GPUChainTrackingMemUsage> usageMap;

  for (int32_t i = 0; i < NSECTORS; i++) {

#ifdef GPUCA_TPC_GEOMETRY_O2

    addToMap("TPC Clusterer Sector Peaks", usageMap, processors()->tpcClusterer[i].mPmemory->counters.nPeaks, processors()->tpcClusterer[i].mNMaxPeaks);

    addToMap("TPC Clusterer Sector Clusters", usageMap, processors()->tpcClusterer[i].mPmemory->counters.nClusters, processors()->tpcClusterer[i].mNMaxClusters);

#endif

    addToMap("TPC Sector Start Hits", usageMap, *processors()->tpcTrackers[i].NStartHits(), processors()->tpcTrackers[i].NMaxStartHits());

    addToMap("TPC Sector Tracklets", usageMap, *processors()->tpcTrackers[i].NTracklets(), processors()->tpcTrackers[i].NMaxTracklets());

    addToMap("TPC Sector TrackletHits", usageMap, *processors()->tpcTrackers[i].NRowHits(), processors()->tpcTrackers[i].NMaxRowHits());

    addToMap("TPC Sector Tracks", usageMap, *processors()->tpcTrackers[i].NTracks(), processors()->tpcTrackers[i].NMaxTracks());

    addToMap("TPC Sector TrackHits", usageMap, *processors()->tpcTrackers[i].NTrackHits(), processors()->tpcTrackers[i].NMaxTrackHits());

  }

  addToMap("TPC Clusterer Clusters", usageMap, mRec->MemoryScalers()->nTPCHits, mRec->MemoryScalers()->NTPCClusters(mRec->MemoryScalers()->nTPCdigits));

  addToMap("TPC Tracks", usageMap, processors()->tpcMerger.NMergedTracks(), processors()->tpcMerger.NMaxTracks());

  addToMap("TPC TrackHits", usageMap, processors()->tpcMerger.NMergedTrackClusters(), processors()->tpcMerger.NMaxMergedTrackClusters());


  if (mRec->GetProcessingSettings().createO2Output) {

    addToMap("TPC O2 Tracks", usageMap, processors()->tpcMerger.NOutputTracksTPCO2(), processors()->tpcMerger.NOutputTracksTPCO2());

    addToMap("TPC O2 ClusRefs", usageMap, processors()->tpcMerger.NOutputClusRefsTPCO2(), processors()->tpcMerger.NOutputClusRefsTPCO2());

  }


#ifdef GPUCA_TPC_GEOMETRY_O2

  addToMap("TPC ComprCache HitsAttached", usageMap, processors()->tpcCompressor.mOutput->nAttachedClusters, processors()->tpcCompressor.mMaxTrackClusters);

  addToMap("TPC ComprCache HitsUnattached", usageMap, processors()->tpcCompressor.mOutput->nUnattachedClusters, processors()->tpcCompressor.mMaxClustersInCache);

  addToMap("TPC ComprCache Tracks", usageMap, processors()->tpcCompressor.mOutput->nTracks, processors()->tpcCompressor.mMaxTracks);

#endif


  for (auto& elem : usageMap) {

    printf("Mem Usage %-30s : %'14zu / %'14zu (%3.0f%% / %3.0f%% / count %3u / max %'14zu)\n", elem.first.c_str(), elem.second.nSum, elem.second.nBoundSum, 100. * elem.second.nSum / std::max<size_t>(1, elem.second.nBoundSum), 100. * elem.second.maxUse, elem.second.count, elem.second.nMax);

  }

}


void GPUChainTracking::PrintMemoryRelations()

{

  for (int32_t i = 0; i < NSECTORS; i++) {

    GPUInfo("MEMREL StartHits NCl %d NTrkl %d", processors()->tpcTrackers[i].NHitsTotal(), *processors()->tpcTrackers[i].NStartHits());

    GPUInfo("MEMREL Tracklets NCl %d NTrkl %d", processors()->tpcTrackers[i].NHitsTotal(), *processors()->tpcTrackers[i].NTracklets());

    GPUInfo("MEMREL Tracklets NCl %d NTrkl %d", processors()->tpcTrackers[i].NHitsTotal(), *processors()->tpcTrackers[i].NRowHits());

    GPUInfo("MEMREL SectorTracks NCl %d NTrk %d", processors()->tpcTrackers[i].NHitsTotal(), *processors()->tpcTrackers[i].NTracks());

    GPUInfo("MEMREL SectorTrackHits NCl %d NTrkH %d", processors()->tpcTrackers[i].NHitsTotal(), *processors()->tpcTrackers[i].NTrackHits());

  }

  GPUInfo("MEMREL Tracks NCl %d NTrk %d", processors()->tpcMerger.NMaxClusters(), processors()->tpcMerger.NMergedTracks());

  GPUInfo("MEMREL TrackHitss NCl %d NTrkH %d", processors()->tpcMerger.NMaxClusters(), processors()->tpcMerger.NMergedTrackClusters());

}


void GPUChainTracking::PrepareKernelDebugOutput()

{

#ifdef GPUCA_KERNEL_DEBUGGER_OUTPUT

  const auto& threadContext = GetThreadContext();

  if (mRec->IsGPU()) {

    SetupGPUProcessor(&processors()->debugOutput, false);

    WriteToConstantMemory(RecoStep::NoRecoStep, (char*)&processors()->debugOutput - (char*)processors(), &processorsShadow()->debugOutput, sizeof(processors()->debugOutput), -1);

    memset(processors()->debugOutput.memory(), 0, processors()->debugOutput.memorySize() * sizeof(processors()->debugOutput.memory()[0]));

  }

  runKernel<GPUMemClean16>({{BlockCount(), ThreadCount(), 0, RecoStep::TPCSectorTracking}}, (mRec->IsGPU() ? processorsShadow() : processors())->debugOutput.memory(), processorsShadow()->debugOutput.memorySize() * sizeof(processors()->debugOutput.memory()[0]));

#endif

}


void GPUChainTracking::PrintKernelDebugOutput()

{

#ifdef GPUCA_KERNEL_DEBUGGER_OUTPUT

  const auto& threadContext = GetThreadContext();

  TransferMemoryResourcesToHost(RecoStep::NoRecoStep, &processors()->debugOutput, -1);

  processors()->debugOutput.Print();

#endif

}


void GPUChainTracking::PrintOutputStat()

{

  int32_t nTracks = 0, nAttachedClusters = 0, nAttachedClustersFitted = 0, nAdjacentClusters = 0;

  uint32_t nCls = GetProcessingSettings().doublePipeline ? mIOPtrs.clustersNative->nClustersTotal : processors()->tpcMerger.NMaxClusters();

  if (GetProcessingSettings().createO2Output > 1) {

    nTracks = mIOPtrs.nOutputTracksTPCO2;

    nAttachedClusters = mIOPtrs.nMergedTrackHits;

  } else {

    for (uint32_t k = 0; k < mIOPtrs.nMergedTracks; k++) {

      if (mIOPtrs.mergedTracks[k].OK()) {

        nTracks++;

        nAttachedClusters += mIOPtrs.mergedTracks[k].NClusters();

        nAttachedClustersFitted += mIOPtrs.mergedTracks[k].NClustersFitted();

      }

    }

    for (uint32_t k = 0; k < nCls; k++) {

      int32_t attach = mIOPtrs.mergedTrackHitAttachment[k];

      if (attach & gputpcgmmergertypes::attachFlagMask) {

        nAdjacentClusters++;

      }

    }

  }


  char trdText[1024] = "";

  if (GetRecoSteps() & GPUDataTypes::RecoStep::TRDTracking) {

    int32_t nTRDTracks = 0;

    int32_t nTRDTracklets = 0;

    for (uint32_t k = 0; k < mIOPtrs.nTRDTracks; k++) {

      if (mIOPtrs.trdTracksO2) {

        auto& trk = mIOPtrs.trdTracksO2[k];

        nTRDTracklets += trk.getNtracklets();

        nTRDTracks += trk.getNtracklets() != 0;

      } else {

        auto& trk = mIOPtrs.trdTracks[k];

        nTRDTracklets += trk.getNtracklets();

        nTRDTracks += trk.getNtracklets() != 0;

      }

    }

    snprintf(trdText, 1024, " - TRD Tracker reconstructed %d tracks (%d tracklets)", nTRDTracks, nTRDTracklets);

  }

  GPUInfo("Output Tracks: %d (%d / %d / %d / %d clusters (fitted / attached / adjacent / total) - %s format)%s", nTracks, nAttachedClustersFitted, nAttachedClusters, nAdjacentClusters, nCls, GetProcessingSettings().createO2Output > 1 ? "O2" : "GPU", trdText);

}


void GPUChainTracking::SanityCheck()

{

  size_t nErrors = 0;


  for (uint32_t i = 0; i < mIOPtrs.nOutputTracksTPCO2; i++) {

    const auto& trk = mIOPtrs.outputTracksTPCO2[i];

    const auto& ref = trk.getClusterRef();

    if (ref.getFirstEntry() > mIOPtrs.nOutputClusRefsTPCO2) {

      if (nErrors++ < 1000) {

        GPUError("Invalid getFirst() entry in cluster reference: %u > %u", ref.getFirstEntry(), mIOPtrs.nOutputClusRefsTPCO2);

        continue;

      }

    }

    if (ref.getFirstEntry() + (ref.getEntries() * 3 + 1) / 2 > mIOPtrs.nOutputClusRefsTPCO2) {

      if (nErrors++ < 1000) {

        GPUError("Invalid getEntries() entry in cluster reference: %u > %u", ref.getFirstEntry() + (ref.getEntries() * 3 + 1) / 2, mIOPtrs.nOutputClusRefsTPCO2);

        continue;

      }

    }

    for (int32_t j = 0; j < trk.getNClusters(); j++) {

      uint8_t sector, row;

      uint32_t cl;

      trk.getClusterReference(mIOPtrs.outputClusRefsTPCO2, j, sector, row, cl);

      if (sector >= GPUCA_NSECTORS || row >= GPUCA_ROW_COUNT) {

        if (nErrors++ < 1000) {

          GPUError("Invalid sector / row %d / %d", (int32_t)sector, (int32_t)row);

          continue;

        }

      }

      if (cl >= mIOPtrs.clustersNative->nClusters[sector][row]) {

        if (nErrors++ < 1000) {

          GPUError("Invalid cluster index %d >= %d", cl, mIOPtrs.clustersNative->nClusters[sector][row]);

        }

      }

    }

  }


  if (nErrors == 0) {

    GPUInfo("Sanity check passed");

  } else {

    GPUError("Sanity check found %lu errors", nErrors);

  }

}


void GPUChainTracking::RunTPCClusterFilter(o2::tpc::ClusterNativeAccess* clusters, std::function<o2::tpc::ClusterNative*(size_t)> allocator, bool applyClusterCuts)

{

  const uint8_t filterType = GetProcessingSettings().tpcApplyClusterFilterOnCPU;

  GPUTPCClusterFilter clusterFilter(*clusters, filterType);

  o2::tpc::ClusterNative* outputBuffer = nullptr;

  for (int32_t iPhase = 0; iPhase < 2; iPhase++) {

    uint32_t countTotal = 0;

    for (uint32_t iSector = 0; iSector < GPUCA_NSECTORS; iSector++) {

      for (uint32_t iRow = 0; iRow < GPUCA_ROW_COUNT; iRow++) {

        uint32_t count = 0;

        for (uint32_t k = 0; k < clusters->nClusters[iSector][iRow]; k++) {

          o2::tpc::ClusterNative cl = clusters->clusters[iSector][iRow][k];

          bool keep = true;

          if (applyClusterCuts) {

            keep = keep && cl.qTot > param().rec.tpc.cfQTotCutoff && cl.qMax > param().rec.tpc.cfQMaxCutoff;

            keep = keep && (!(cl.getFlags() & o2::tpc::ClusterNative::flagSingle) || ((cl.sigmaPadPacked || cl.qMax > param().rec.tpc.cfQMaxCutoffSinglePad) && (cl.sigmaTimePacked || cl.qMax > param().rec.tpc.cfQMaxCutoffSingleTime)));

          }

          if (param().tpcCutTimeBin > 0) {

            keep = keep && cl.getTime() < param().tpcCutTimeBin;

          }

          keep = keep && (!filterType || clusterFilter.filter(iSector, iRow, cl));

          if (iPhase && keep) {

            outputBuffer[countTotal] = cl;

          }

          count += keep;

          countTotal += keep;

        }

        if (iPhase) {

          clusters->nClusters[iSector][iRow] = count;

        }

      }

    }

    if (iPhase) {

      clusters->clustersLinear = outputBuffer;

      clusters->setOffsetPtrs();

    } else {

      outputBuffer = allocator(countTotal);

    }

  }

}


void GPUChainTracking::DumpClusters(std::ostream& out, const o2::tpc::ClusterNativeAccess* clusters)

{

  out << "\nTPC Clusters:\n";

  for (uint32_t iSec = 0; iSec < GPUCA_NSECTORS; iSec++) {

    out << "TPCClusters - Sector " << iSec << "\n";

    for (uint32_t i = 0; i < GPUCA_ROW_COUNT; i++) {

      out << "  Row: " << i << ": " << clusters->nClusters[iSec][i] << " clusters:\n";

      for (uint32_t j = 0; j < clusters->nClusters[iSec][i]; j++) {

        const auto& cl = clusters->clusters[iSec][i][j];

        out << "    " << std::hex << cl.timeFlagsPacked << std::dec << " " << cl.padPacked << " " << int32_t{cl.sigmaTimePacked} << " " << int32_t{cl.sigmaPadPacked} << " " << cl.qMax << " " << cl.qTot << "\n";

      }

    }

  }

}


void GPUChainTracking::DebugSortCompressedClusters(o2::tpc::CompressedClustersFlat* cls)

{

  o2::tpc::CompressedClusters c = *cls;

  std::vector<uint32_t> sorted(c.nTracks), offsets(c.nTracks);

  std::iota(sorted.begin(), sorted.end(), 0);

  auto sorter = [&c](const auto a, const auto b) {

    return std::tie(c.sliceA[a], c.rowA[a], c.timeA[a], c.padA[a], c.qPtA[a]) <

           std::tie(c.sliceA[b], c.rowA[b], c.timeA[b], c.padA[b], c.qPtA[b]);

  };

  std::sort(sorted.begin(), sorted.end(), sorter);

  uint32_t offset = 0;

  for (uint32_t i = 0; i < c.nTracks; i++) {

    offsets[i] = offset;

    offset += c.nTrackClusters[i];

  }


  auto sortArray = [&c, &sorted, &offsets](auto* src, size_t totalSize, auto getOffset, auto getSize) {

    auto buf = std::make_unique<std::remove_reference_t<decltype(src[0])>[]>(totalSize);

    memcpy(buf.get(), src, totalSize * sizeof(*src));

    uint32_t targetOffset = 0;

    for (uint32_t i = 0; i < c.nTracks; i++) {

      const uint32_t j = sorted[i];

      memcpy(src + targetOffset, buf.get() + getOffset(offsets[j], j), getSize(j) * sizeof(*src));

      targetOffset += getSize(j);

    }

  };

  auto sortMultiple = [&sortArray](size_t totalSize, auto getOffset, auto getSize, auto&&... arrays) {

    (..., sortArray(std::forward<decltype(arrays)>(arrays), totalSize, getOffset, getSize));

  };

  auto getFullOffset = [](uint32_t off, uint32_t ind) { return off; };

  auto getReducedOffset = [](uint32_t off, uint32_t ind) { return off - ind; };

  auto getIndex = [](uint32_t off, uint32_t ind) { return ind; };

  auto getN = [&c](uint32_t j) { return c.nTrackClusters[j]; };

  auto getN1 = [&c](uint32_t j) { return c.nTrackClusters[j] - 1; };

  auto get1 = [](uint32_t j) { return 1; };


  sortMultiple(c.nAttachedClusters, getFullOffset, getN, c.qTotA, c.qMaxA, c.flagsA, c.sigmaPadA, c.sigmaTimeA);

  sortMultiple(c.nAttachedClustersReduced, getReducedOffset, getN1, c.rowDiffA, c.sliceLegDiffA, c.padResA, c.timeResA);

  sortMultiple(c.nTracks, getIndex, get1, c.qPtA, c.rowA, c.sliceA, c.timeA, c.padA, c.nTrackClusters); // NOTE: This must be last, since nTrackClusters is used for handling the arrays above!

}


void GPUChainTracking::DoDebugRawDump()

{

  std::string dirName = mRec->getDebugFolder("tpc_raw");

  if (dirName == "") {

    return;

  }

  GPUTrackingInOutPointers ioPtrs;

  if (mIOPtrs.tpcZS) {

    ioPtrs.tpcZS = mIOPtrs.tpcZS;

  } else if (mIOPtrs.tpcPackedDigits) {

    ioPtrs.tpcPackedDigits = mIOPtrs.tpcPackedDigits;

  } else if (mIOPtrs.clustersNative) {

    ioPtrs.clustersNative = mIOPtrs.clustersNative;

  }


  GPUInfo("Doing debug raw dump");

  mRec->DumpSettings((dirName + "/").c_str());

  DumpData((dirName + "/event.0.dump").c_str(), &ioPtrs);

}


PROFILE_MAX_SIZE
#define PROFILE_MAX_SIZE
Definition GPUChainTrackingDebugAndProfiling.cxx:29

GPUChainTracking.h

i
int32_t i
Definition GPUCommonAlgorithm.h:436

GPUConstantMem.h

GPUMemorySizeScalers.h

GPUTPCClusterFilter.h

GPUCA_NSECTORS
#define GPUCA_NSECTORS
Definition GPUTPCGeometry.h:22

GPUCA_ROW_COUNT
#define GPUCA_ROW_COUNT
Definition GPUTPCGeometry.h:23

GPUTrackingInputProvider.h

j
uint32_t j
Definition RawData.h:0

c
uint32_t c
Definition RawData.h:2

bitmapfile.h

int

o2::gpu::GPUChainTracking::DebugSortCompressedClusters
static void DebugSortCompressedClusters(o2::tpc::CompressedClustersFlat *cls)
Definition GPUChainTrackingDebugAndProfiling.cxx:353

o2::gpu::GPUChainTracking::PrintOutputStat
void PrintOutputStat()
Definition GPUChainTrackingDebugAndProfiling.cxx:210

o2::gpu::GPUChainTracking::PrintKernelDebugOutput
void PrintKernelDebugOutput()
Definition GPUChainTrackingDebugAndProfiling.cxx:201

o2::gpu::GPUChainTracking::PrintMemoryStatistics
void PrintMemoryStatistics() override
Definition GPUChainTrackingDebugAndProfiling.cxx:141

o2::gpu::GPUChainTracking::DumpClusters
static void DumpClusters(std::ostream &out, const o2::tpc::ClusterNativeAccess *clusters)
Definition GPUChainTrackingDebugAndProfiling.cxx:338

o2::gpu::GPUChainTracking::PrintMemoryRelations
void PrintMemoryRelations()
Definition GPUChainTrackingDebugAndProfiling.cxx:175

o2::gpu::GPUChainTracking::PrepareProfile
int32_t PrepareProfile()
Definition GPUChainTrackingDebugAndProfiling.cxx:35

o2::gpu::GPUChainTracking::DoProfile
int32_t DoProfile()
Definition GPUChainTrackingDebugAndProfiling.cxx:45

o2::gpu::GPUChainTracking::DumpData
void DumpData(const char *filename, const GPUTrackingInOutPointers *ioPtrs=nullptr)
Definition GPUChainTrackingIO.cxx:65

o2::gpu::GPUChainTracking::PrepareKernelDebugOutput
void PrepareKernelDebugOutput()
Definition GPUChainTrackingDebugAndProfiling.cxx:188

o2::gpu::GPUChainTracking::mIOPtrs
GPUTrackingInOutPointers & mIOPtrs
Definition GPUChainTracking.h:91

o2::gpu::GPUChainTracking::DoDebugRawDump
void DoDebugRawDump()
Definition GPUChainTrackingDebugAndProfiling.cxx:394

o2::gpu::GPUChain::GetRecoSteps
GPUReconstruction::RecoStepField GetRecoSteps() const
Definition GPUChain.h:71

o2::gpu::GPUChain::WriteToConstantMemory
void WriteToConstantMemory(RecoStep step, size_t offset, const void *src, size_t size, int32_t stream=-1, deviceEvent *ev=nullptr)
Definition GPUChain.h:127

o2::gpu::GPUChain::ThreadCount
uint32_t ThreadCount() const
Definition GPUChain.h:215

o2::gpu::GPUChain::GetThreadContext
virtual std::unique_ptr< GPUReconstructionProcessing::threadContext > GetThreadContext()
Definition GPUChain.h:109

o2::gpu::GPUChain::processors
GPUConstantMem * processors()
Definition GPUChain.h:84

o2::gpu::GPUChain::param
GPUParam & param()
Definition GPUChain.h:87

o2::gpu::GPUChain::SetupGPUProcessor
void SetupGPUProcessor(T *proc, bool allocate)
Definition GPUChain.h:220

o2::gpu::GPUChain::GetProcessingSettings
const GPUSettingsProcessing & GetProcessingSettings() const
Definition GPUChain.h:76

o2::gpu::GPUChain::mRec
GPUReconstructionCPU * mRec
Definition GPUChain.h:79

o2::gpu::GPUChain::processorsShadow
GPUConstantMem * processorsShadow()
Definition GPUChain.h:85

o2::gpu::GPUChain::NSECTORS
static constexpr int32_t NSECTORS
Definition GPUChain.h:58

o2::gpu::GPUChain::TransferMemoryResourcesToHost
void TransferMemoryResourcesToHost(RecoStep step, GPUProcessor *proc, int32_t stream=-1, bool all=false)
Definition GPUChain.h:123

o2::gpu::GPUChain::BlockCount
uint32_t BlockCount() const
Definition GPUChain.h:213

o2::gpu::GPUChain::rec
GPUReconstruction * rec()
Definition GPUChain.h:66

o2::gpu::GPUDataTypes::RecoStep::TRDTracking
@ TRDTracking

o2::gpu::GPUMemoryResource::MEMORY_GPU
@ MEMORY_GPU
Definition GPUMemoryResource.h:60

o2::gpu::GPUReconstructionCPU::GPUMemCpy
virtual size_t GPUMemCpy(void *dst, const void *src, size_t size, int32_t stream, int32_t toGPU, deviceEvent *ev=nullptr, deviceEvent *evList=nullptr, int32_t nEvents=1)
Definition GPUReconstructionCPU.cxx:134

o2::gpu::GPUReconstruction::getDebugFolder
std::string getDebugFolder(const std::string &prefix="")
Definition GPUReconstructionDebug.cxx:119

o2::gpu::GPUReconstruction::IsGPU
bool IsGPU() const
Definition GPUReconstruction.h:200

o2::gpu::GPUReconstruction::MemoryScalers
GPUMemorySizeScalers * MemoryScalers()
Definition GPUReconstruction.h:191

o2::gpu::GPUReconstruction::GetProcessingSettings
const GPUSettingsProcessing & GetProcessingSettings() const
Definition GPUReconstruction.h:206

o2::gpu::GPUReconstruction::DumpSettings
void DumpSettings(const char *dir="")
Definition GPUReconstruction.cxx:1180

o2::gpu::GPUReconstruction::AllocateDirectMemory
void * AllocateDirectMemory(size_t size, int32_t type)
Definition GPUReconstruction.cxx:723

o2::gpu::GPUTPCClusterFilter
Definition GPUTPCClusterFilter.h:32

n
GLdouble n
Definition glcorearb.h:1982

src
GLenum src
Definition glcorearb.h:1767

count
GLint GLsizei count
Definition glcorearb.h:399

color
GLuint color
Definition glcorearb.h:1272

offsets
GLuint GLsizei const GLuint const GLintptr * offsets
Definition glcorearb.h:2595

name
GLuint const GLchar * name
Definition glcorearb.h:781

b
GLboolean GLboolean GLboolean b
Definition glcorearb.h:1233

offset
GLintptr offset
Definition glcorearb.h:660

void
typedef void(APIENTRYP PFNGLCULLFACEPROC)(GLenum mode)

g
GLboolean GLboolean g
Definition glcorearb.h:1233

arrays
const GLuint * arrays
Definition glcorearb.h:1314

r
GLboolean r
Definition glcorearb.h:1233

param
GLenum GLfloat param
Definition glcorearb.h:271

a
GLboolean GLboolean GLboolean GLboolean a
Definition glcorearb.h:1233

buf
GLenum GLuint GLenum GLsizei const GLchar * buf
Definition glcorearb.h:2514

o2::aod::track::uint8_t
uint8_t itsSharedClusterMap uint8_t
Definition AnalysisDataModel.h:436

o2::gpu::gputpcgmmergertypes::attachFlagMask
@ attachFlagMask
Definition GPUTPCGMMergerTypes.h:30

o2::gpu
Definition TrackTRD.h:35

BITMAPFILEHEADER
Definition bitmapfile.h:15

BITMAPFILEHEADER::bfSize
uint32_t bfSize
Definition bitmapfile.h:17

BITMAPFILEHEADER::bfOffBits
uint32_t bfOffBits
Definition bitmapfile.h:19

BITMAPFILEHEADER::bfType
uint16_t bfType
Definition bitmapfile.h:16

BITMAPINFOHEADER
Definition bitmapfile.h:22

BITMAPINFOHEADER::biWidth
uint32_t biWidth
Definition bitmapfile.h:24

BITMAPINFOHEADER::biSize
uint32_t biSize
Definition bitmapfile.h:23

BITMAPINFOHEADER::biBitCount
uint16_t biBitCount
Definition bitmapfile.h:27

BITMAPINFOHEADER::biPlanes
uint16_t biPlanes
Definition bitmapfile.h:26

BITMAPINFOHEADER::biHeight
uint32_t biHeight
Definition bitmapfile.h:25

o2::gpu::GPUConstantMem::tpcTrackers
GPUTPCTracker tpcTrackers[GPUCA_NSECTORS]
Definition GPUConstantMem.h:44

o2::gpu::GPUConstantMem::tpcMerger
GPUTPCGMMerger tpcMerger
Definition GPUConstantMem.h:48

o2::gpu::GPUMemorySizeScalers::nTPCdigits
size_t nTPCdigits
Definition GPUMemorySizeScalers.h:25

o2::gpu::GPUMemorySizeScalers::NTPCClusters
size_t NTPCClusters(size_t tpcDigits, bool perSector=false)
Definition GPUMemorySizeScalers.h:80

o2::gpu::GPUMemorySizeScalers::nTPCHits
size_t nTPCHits
Definition GPUMemorySizeScalers.h:26

o2::gpu::GPUTrackingInOutPointers
Definition GPUDataTypes.h:215

o2::gpu::GPUTrackingInOutPointers::clustersNative
const o2::tpc::ClusterNativeAccess * clustersNative
Definition GPUDataTypes.h:226

o2::gpu::GPUTrackingInOutPointers::outputClusRefsTPCO2
const uint32_t * outputClusRefsTPCO2
Definition GPUDataTypes.h:246

o2::gpu::GPUTrackingInOutPointers::nMergedTracks
uint32_t nMergedTracks
Definition GPUDataTypes.h:238

o2::gpu::GPUTrackingInOutPointers::mergedTrackHitAttachment
const uint32_t * mergedTrackHitAttachment
Definition GPUDataTypes.h:242

o2::gpu::GPUTrackingInOutPointers::trdTracks
const GPUTRDTrackGPU * trdTracks
Definition GPUDataTypes.h:263

o2::gpu::GPUTrackingInOutPointers::tpcZS
const GPUTrackingInOutZS * tpcZS
Definition GPUDataTypes.h:220

o2::gpu::GPUTrackingInOutPointers::trdTracksO2
const GPUTRDTrack * trdTracksO2
Definition GPUDataTypes.h:264

o2::gpu::GPUTrackingInOutPointers::nOutputTracksTPCO2
uint32_t nOutputTracksTPCO2
Definition GPUDataTypes.h:245

o2::gpu::GPUTrackingInOutPointers::nMergedTrackHits
uint32_t nMergedTrackHits
Definition GPUDataTypes.h:241

o2::gpu::GPUTrackingInOutPointers::nOutputClusRefsTPCO2
uint32_t nOutputClusRefsTPCO2
Definition GPUDataTypes.h:247

o2::gpu::GPUTrackingInOutPointers::outputTracksTPCO2
const o2::tpc::TrackTPC * outputTracksTPCO2
Definition GPUDataTypes.h:244

o2::gpu::GPUTrackingInOutPointers::tpcPackedDigits
const GPUTrackingInOutDigits * tpcPackedDigits
Definition GPUDataTypes.h:221

o2::gpu::GPUTrackingInOutPointers::nTRDTracks
uint32_t nTRDTracks
Definition GPUDataTypes.h:265

o2::gpu::GPUTrackingInOutPointers::mergedTracks
const GPUTPCGMMergedTrack * mergedTracks
Definition GPUDataTypes.h:237

o2::gpu::internal::GPUParam_t::rec
T rec
Definition GPUParam.h:52

o2::gpu::internal::GPUParam_t::tpcCutTimeBin
int32_t tpcCutTimeBin
Definition GPUParam.h:61

o2::tpc::ClusterNativeAccess
Definition ClusterNative.h:174

o2::tpc::ClusterNativeAccess::nClusters
unsigned int nClusters[constants::MAXSECTOR][constants::MAXGLOBALPADROW]
Definition ClusterNative.h:178

o2::tpc::ClusterNativeAccess::nClustersTotal
unsigned int nClustersTotal
Definition ClusterNative.h:181

o2::tpc::ClusterNative
Definition ClusterNative.h:54

o2::tpc::ClusterNative::qMax
uint16_t qMax
Definition ClusterNative.h:71

o2::tpc::ClusterNative::flagSingle
@ flagSingle
Definition ClusterNative.h:59

o2::tpc::ClusterNative::timeFlagsPacked
uint32_t timeFlagsPacked
Definition ClusterNative.h:66

o2::tpc::ClusterNative::qTot
uint16_t qTot
Definition ClusterNative.h:72

o2::tpc::ClusterNative::sigmaPadPacked
uint8_t sigmaPadPacked
Definition ClusterNative.h:70

o2::tpc::ClusterNative::sigmaTimePacked
uint8_t sigmaTimePacked
Definition ClusterNative.h:69

o2::tpc::ClusterNative::padPacked
uint16_t padPacked
Definition ClusterNative.h:68

o2::tpc::CompressedClustersFlat
Definition CompressedClusters.h:100

o2::tpc::CompressedClusters
Definition CompressedClusters.h:79

clusters
std::vector< Cluster > clusters
Definition test_ctf_io_cpv.cxx:41

row
std::vector< int > row
Definition test_ctf_io_itsmft.cxx:48

getOffset
auto getOffset(const map_T &resultsMap) -> typename map_T::key_type
Definition test_ransHistograms.cxx:114