d1/d39/GPUTPCGMO2Output_8cxx_source.html

// Copyright 2019-2020 CERN and copyright holders of ALICE O2.

// See https://alice-o2.web.cern.ch/copyright for details of the copyright holders.

// All rights not expressly granted are reserved.

//

// This software is distributed under the terms of the GNU General Public

// License v3 (GPL Version 3), copied verbatim in the file "COPYING".

//

// In applying this license CERN does not waive the privileges and immunities

// granted to it by virtue of its status as an Intergovernmental Organization

// or submit itself to any jurisdiction.


#include "GPUTPCDef.h"

#include "GPUTPCGMO2Output.h"

#include "GPUCommonAlgorithm.h"

#include "DataFormatsTPC/TrackTPC.h"

#include "DataFormatsTPC/Constants.h"

#include "DataFormatsTPC/PIDResponse.h"

#include "TPCFastTransform.h"

#include "CorrectionMapsHelper.h"

#include "GPUGetConstexpr.h"


#ifndef GPUCA_GPUCODE

#include "SimulationDataFormat/ConstMCTruthContainer.h"

#include "SimulationDataFormat/MCCompLabel.h"

#include "GPUQAHelper.h"

#endif


using namespace o2::gpu;

using namespace o2::tpc;

using namespace o2::tpc::constants;


GPUdi() static constexpr uint8_t getFlagsReject() { return GPUTPCGMMergedTrackHit::flagReject | GPUTPCGMMergedTrackHit::flagHighIncl; }


namespace o2::gpu::internal

{


struct GPUTPCGMO2OutputSort_comp {


  GPUd() bool operator()(const GPUTPCGMMerger::tmpSort& a, const GPUTPCGMMerger::tmpSort& b)

  {

    return GPUCA_DETERMINISTIC_CODE(a.y != b.y ? a.y > b.y : a.x > b.x, a.y > b.y);

  }


};


} // namespace o2::gpu::internal


template <>


GPUdii() void GPUTPCGMO2Output::Thread<GPUTPCGMO2Output::prepare>(int32_t nBlocks, int32_t nThreads, int32_t iBlock, int32_t iThread, GPUsharedref() GPUSharedMemory& smem, processorType& GPUrestrict() merger)

{

  const GPUTPCGMMergedTrack* tracks = merger.MergedTracks();

  const uint32_t nTracks = merger.NMergedTracks();

  const GPUTPCGMMergedTrackHit* trackClusters = merger.Clusters();

  const GPUdEdxInfo* tracksdEdx = merger.MergedTracksdEdx();


  constexpr uint8_t flagsReject = getFlagsReject();

  bool cutOnTrackdEdx = merger.Param().par.dodEdx && merger.Param().dodEdxEnabled && merger.Param().rec.tpc.minTrackdEdxMax2Tot > 0.f;


  GPUTPCGMMerger::tmpSort* GPUrestrict() trackSort = merger.TrackSortO2();

  uint2* GPUrestrict() tmpData = merger.ClusRefTmp();

  for (uint32_t i = get_global_id(0); i < nTracks; i += get_global_size(0)) {

    if (!tracks[i].OK()) {

      continue;

    }

    if (tracks[i].MergedLooper()) {

      continue;

    }


    uint32_t nCl = 0;

    for (uint32_t j = 0; j < tracks[i].NClusters(); j++) {

      if ((trackClusters[tracks[i].FirstClusterRef() + j].state & flagsReject)) {

        continue;

      }

      nCl++;

    }

    if (nCl == 0) {

      continue;

    }

    if (nCl + 2 < GPUCA_TRACKLET_SELECTOR_MIN_HITS_B5(tracks[i].GetParam().GetQPt() * merger.Param().qptB5Scaler)) { // Give 2 hits tolerance in the primary leg, compared to the full fit of the looper

      continue;

    }

    if (merger.Param().rec.tpc.minNClustersFinalTrack != -1 && nCl < (uint32_t)merger.Param().rec.tpc.minNClustersFinalTrack) {

      continue;

    }

    if (cutOnTrackdEdx && (tracksdEdx[i].dEdxMaxTPC < merger.Param().rec.tpc.minTrackdEdxMax || tracksdEdx[i].dEdxMaxTPC < tracksdEdx[i].dEdxTotTPC * merger.Param().rec.tpc.minTrackdEdxMax2Tot) && !(tracksdEdx[i].dEdxMaxTPC == 0 && CAMath::Abs(tracks[i].GetParam().GetDzDs()) > 0.03f)) {

      continue;

    }

    uint32_t myId = CAMath::AtomicAdd(&merger.Memory()->nO2Tracks, 1u);

    tmpData[i] = {nCl, CAMath::AtomicAdd(&merger.Memory()->nO2ClusRefs, nCl + (nCl + 1) / 2)};

    trackSort[myId] = {i, tracks[i].CSide() ? tracks[i].GetParam().GetTOffset() : -tracks[i].GetParam().GetTOffset()};

  }

}


template <>


GPUdii() void GPUTPCGMO2Output::Thread<GPUTPCGMO2Output::sort>(int32_t nBlocks, int32_t nThreads, int32_t iBlock, int32_t iThread, GPUsharedref() GPUSharedMemory& smem, processorType& GPUrestrict() merger)

{

#ifndef GPUCA_SPECIALIZE_THRUST_SORTS

  if (iThread == 0 && iBlock == 0) {

    GPUTPCGMMerger::tmpSort* GPUrestrict() trackSort = merger.TrackSortO2();

    GPUCommonAlgorithm::sortDeviceDynamic(trackSort, trackSort + merger.Memory()->nO2Tracks, internal::GPUTPCGMO2OutputSort_comp());

  }

#endif

}


template <>


GPUdii() void GPUTPCGMO2Output::Thread<GPUTPCGMO2Output::output>(int32_t nBlocks, int32_t nThreads, int32_t iBlock, int32_t iThread, GPUsharedref() GPUSharedMemory& smem, processorType& GPUrestrict() merger)

{

  constexpr float MinDelta = 0.1f;

  const GPUTPCGMMergedTrack* tracks = merger.MergedTracks();

  GPUdEdxInfo* tracksdEdx = merger.MergedTracksdEdx();

  GPUdEdxInfo* tracksdEdxAlt = merger.MergedTracksdEdxAlt();

  const int32_t nTracks = merger.NOutputTracksTPCO2();

  const GPUTPCGMMergedTrackHit* trackClusters = merger.Clusters();

  constexpr uint8_t flagsReject = getFlagsReject();

  TrackTPC* outputTracks = merger.OutputTracksTPCO2();

  uint32_t* clusRefs = merger.OutputClusRefsTPCO2();

  const auto& param = merger.Param();


  GPUTPCGMMerger::tmpSort* GPUrestrict() trackSort = merger.TrackSortO2();

  uint2* GPUrestrict() tmpData = merger.ClusRefTmp();

  float const SNPThresh = 0.999990f;


  for (int32_t iTmp = get_global_id(0); iTmp < nTracks; iTmp += get_global_size(0)) {

    TrackTPC oTrack;

    const int32_t i = trackSort[iTmp].x;

    const auto& track = tracks[i];

    auto snpIn = track.GetParam().GetSinPhi();

    if (snpIn > SNPThresh) {

      snpIn = SNPThresh;

    } else if (snpIn < -SNPThresh) {

      snpIn = -SNPThresh;

    }

    oTrack.set(track.GetParam().GetX(), track.GetAlpha(),

               {track.GetParam().GetY(), track.GetParam().GetZ(), snpIn, track.GetParam().GetDzDs(), track.GetParam().GetQPt()},

               {track.GetParam().GetCov(0),

                track.GetParam().GetCov(1), track.GetParam().GetCov(2),

                track.GetParam().GetCov(3), track.GetParam().GetCov(4), track.GetParam().GetCov(5),

                track.GetParam().GetCov(6), track.GetParam().GetCov(7), track.GetParam().GetCov(8), track.GetParam().GetCov(9),

                track.GetParam().GetCov(10), track.GetParam().GetCov(11), track.GetParam().GetCov(12), track.GetParam().GetCov(13), track.GetParam().GetCov(14)});


    oTrack.setChi2(track.GetParam().GetChi2());

    auto& outerPar = track.OuterParam();

    if GPUCA_RTC_CONSTEXPR (GPUCA_GET_CONSTEXPR(param.par, dodEdx)) {

      if (param.dodEdxEnabled) {

        oTrack.setdEdx(tracksdEdx[i]);

        if GPUCA_RTC_CONSTEXPR (GPUCA_GET_CONSTEXPR(param.rec.tpc, dEdxClusterRejectionFlagMask) != GPUCA_GET_CONSTEXPR(param.rec.tpc, dEdxClusterRejectionFlagMaskAlt)) {

          oTrack.setdEdxAlt(tracksdEdxAlt[i]);

        } else {

          oTrack.setdEdxAlt(tracksdEdx[i]);

        }

      }

    }


    auto snpOut = outerPar.P[2];

    if (snpOut > SNPThresh) {

      snpOut = SNPThresh;

    } else if (snpOut < -SNPThresh) {

      snpOut = -SNPThresh;

    }

    oTrack.setOuterParam(o2::track::TrackParCov(

      outerPar.X, outerPar.alpha,

      {outerPar.P[0], outerPar.P[1], snpOut, outerPar.P[3], outerPar.P[4]},

      {outerPar.C[0], outerPar.C[1], outerPar.C[2], outerPar.C[3], outerPar.C[4], outerPar.C[5],

       outerPar.C[6], outerPar.C[7], outerPar.C[8], outerPar.C[9], outerPar.C[10], outerPar.C[11],

       outerPar.C[12], outerPar.C[13], outerPar.C[14]}));


    if (param.par.dodEdx && param.dodEdxEnabled && param.rec.tpc.enablePID) {

      PIDResponse pidResponse{};

      auto pid = pidResponse.getMostProbablePID(oTrack, param.rec.tpc.PID_EKrangeMin, param.rec.tpc.PID_EKrangeMax, param.rec.tpc.PID_EPrangeMin, param.rec.tpc.PID_EPrangeMax, param.rec.tpc.PID_EDrangeMin, param.rec.tpc.PID_EDrangeMax, param.rec.tpc.PID_ETrangeMin, merger.Param().rec.tpc.PID_ETrangeMax, merger.Param().rec.tpc.PID_useNsigma, merger.Param().rec.tpc.PID_sigma);

      auto pidRemap = merger.Param().rec.tpc.PID_remap[pid];

      if (pidRemap >= 0) {

        pid = pidRemap;

      }

      oTrack.setPID(pid, true);

      oTrack.getParamOut().setPID(pid, true);

    }


    uint32_t nOutCl = tmpData[i].x;

    uint32_t clBuff = tmpData[i].y;

    oTrack.setClusterRef(clBuff, nOutCl);

    uint32_t* clIndArr = &clusRefs[clBuff];

    uint8_t* sectorIndexArr = reinterpret_cast<uint8_t*>(clIndArr + nOutCl);

    uint8_t* rowIndexArr = sectorIndexArr + nOutCl;


    uint32_t nOutCl2 = 0;

    float t1 = 0, t2 = 0;

    int32_t sector1 = 0, sector2 = 0;

    const o2::tpc::ClusterNativeAccess* GPUrestrict() clusters = merger.GetConstantMem()->ioPtrs.clustersNative;

    for (uint32_t j = 0; j < track.NClusters(); j++) {

      if ((trackClusters[track.FirstClusterRef() + j].state & flagsReject)) {

        continue;

      }

      int32_t clusterIdGlobal = trackClusters[track.FirstClusterRef() + j].num;

      int32_t sector = trackClusters[track.FirstClusterRef() + j].sector;

      int32_t globalRow = trackClusters[track.FirstClusterRef() + j].row;

      int32_t clusterIdInRow = clusterIdGlobal - clusters->clusterOffset[sector][globalRow];

      clIndArr[nOutCl2] = clusterIdInRow;

      sectorIndexArr[nOutCl2] = sector;

      rowIndexArr[nOutCl2] = globalRow;

      if (nOutCl2 == 0) {

        t1 = clusters->clustersLinear[clusterIdGlobal].getTime();

        sector1 = sector;

      }

      if (++nOutCl2 == nOutCl) {

        t2 = clusters->clustersLinear[clusterIdGlobal].getTime();

        sector2 = sector;

      }

    }


    if (track.PrevSegment() >= 0) {

      const GPUTPCGMMergedTrack* chkTrk = track.GetFirstSegment(tracks, merger.Param().rec.enableCyclicGraphWorkarounds);

      const auto& firstPrevCluster = trackClusters[chkTrk->FirstClusterRef()];

      t1 = clusters->clustersLinear[firstPrevCluster.num].getTime();

      sector1 = firstPrevCluster.sector;

    }


    bool cce = track.CCE() && ((sector1 < MAXSECTOR / 2) ^ (sector2 < MAXSECTOR / 2));

    float time0 = 0.f, tFwd = 0.f, tBwd = 0.f;

    if (merger.Param().par.continuousTracking) {

      time0 = track.GetParam().GetTOffset();

      if (cce) {

        bool lastSide = trackClusters[track.FirstClusterRef()].sector < MAXSECTOR / 2;

        float delta = 0.f;

        for (uint32_t iCl = 1; iCl < track.NClusters(); iCl++) {

          auto& cacl1 = trackClusters[track.FirstClusterRef() + iCl];

          if (lastSide ^ (cacl1.sector < MAXSECTOR / 2)) {

            auto& cl1 = clusters->clustersLinear[cacl1.num];

            auto& cl2 = clusters->clustersLinear[trackClusters[track.FirstClusterRef() + iCl - 1].num];

            delta = CAMath::Abs(cl1.getTime() - cl2.getTime()) * 0.5f;

            break;

          }

        }

        if (delta < MinDelta) {

          delta = MinDelta;

        }

        tFwd = tBwd = delta;

      } else {

        // estimate max/min time increments which still keep track in the physical limits of the TPC

        const float tmin = CAMath::Min(t1, t2);

        const float maxDriftTime = merger.GetConstantMem()->calibObjects.fastTransformHelper->getCorrMap()->getMaxDriftTime(t1 > t2 ? sector1 : sector2);

        const float clusterT0 = merger.GetConstantMem()->calibObjects.fastTransformHelper->getCorrMap()->getT0();

        const float tmax = CAMath::Min(tmin + maxDriftTime, CAMath::Max(t1, t2));

        float delta = 0.f;

        if (time0 + maxDriftTime < tmax) {

          delta = tmax - time0 - maxDriftTime;

        }

        if (tmin - clusterT0 < time0 + delta) {

          delta = tmin - clusterT0 - time0;

        }

        if (delta != 0.f) {

          time0 += delta;

          const float deltaZ = merger.GetConstantMem()->calibObjects.fastTransformHelper->getCorrMap()->convDeltaTimeToDeltaZinTimeFrame(sector2, delta);

          oTrack.setZ(oTrack.getZ() + deltaZ);

        }

        tFwd = tmin - clusterT0 - time0;

        tBwd = time0 - tmax + maxDriftTime;

      }

    }

    if (tBwd < 0.f) {

      tBwd = 0.f;

    }

    oTrack.setTime0(time0);

    oTrack.setDeltaTBwd(tBwd);

    oTrack.setDeltaTFwd(tFwd);

    if (cce) {

      oTrack.setHasCSideClusters();

      oTrack.setHasASideClusters();

    } else if (track.CSide()) {

      oTrack.setHasCSideClusters();

    } else {

      oTrack.setHasASideClusters();

    }

    outputTracks[iTmp] = oTrack;

  }

}


template <>


GPUdii() void GPUTPCGMO2Output::Thread<GPUTPCGMO2Output::mc>(int32_t nBlocks, int32_t nThreads, int32_t iBlock, int32_t iThread, GPUsharedref() GPUSharedMemory& smem, processorType& GPUrestrict() merger)

{

#ifndef GPUCA_GPUCODE

  const o2::tpc::ClusterNativeAccess* GPUrestrict() clusters = merger.GetConstantMem()->ioPtrs.clustersNative;

  if (clusters == nullptr || clusters->clustersMCTruth == nullptr) {

    return;

  }

  if (merger.OutputTracksTPCO2MC() == nullptr) {

    return;

  }


  auto labelAssigner = GPUTPCTrkLbl(clusters->clustersMCTruth, 0.1f);

  uint32_t* clusRefs = merger.OutputClusRefsTPCO2();

  for (uint32_t i = get_global_id(0); i < merger.NOutputTracksTPCO2(); i += get_global_size(0)) {

    labelAssigner.reset();

    const auto& trk = merger.OutputTracksTPCO2()[i];

    for (int32_t j = 0; j < trk.getNClusters(); j++) {

      uint8_t sectorIndex, rowIndex;

      uint32_t clusterIndex;

      trk.getClusterReference(clusRefs, j, sectorIndex, rowIndex, clusterIndex);

      uint32_t clusterIdGlobal = clusters->clusterOffset[sectorIndex][rowIndex] + clusterIndex;

      labelAssigner.addLabel(clusterIdGlobal);

    }

    merger.OutputTracksTPCO2MC()[i] = labelAssigner.computeLabel();

  }

#endif

}


state
benchmark::State & state
Definition BenchCathodeSegmentation.cxx:58

ConstMCTruthContainer.h
A const (ready only) version of MCTruthContainer.

CorrectionMapsHelper.h
Helper class to access correction maps.

Constants.h

GPUCommonAlgorithm.h

i
int32_t i
Definition GPUCommonAlgorithm.h:436

GPUsharedref
#define GPUsharedref()
Definition GPUCommonDefAPI.h:56

get_global_size
#define get_global_size(dim)
Definition GPUCommonDefAPI.h:226

GPUrestrict
#define GPUrestrict()
Definition GPUCommonDefAPI.h:212

get_global_id
#define get_global_id(dim)
Definition GPUCommonDefAPI.h:225

GPUCA_RTC_CONSTEXPR
#define GPUCA_RTC_CONSTEXPR
Definition GPUCommonDef.h:76

GPUCA_DETERMINISTIC_CODE
#define GPUCA_DETERMINISTIC_CODE(det, indet)
Definition GPUCommonDef.h:83

GPUCA_TRACKLET_SELECTOR_MIN_HITS_B5
#define GPUCA_TRACKLET_SELECTOR_MIN_HITS_B5(QPTB5)
Definition GPUDefConstantsAndSettings.h:33

GPUGetConstexpr.h

GPUCA_GET_CONSTEXPR
#define GPUCA_GET_CONSTEXPR(obj, val)
Definition GPUGetConstexpr.h:65

GPUQAHelper.h

GPUTPCDef.h

GPUdii
GPUdii() void GPUTPCGMO2Output
Definition GPUTPCGMO2Output.cxx:50

GPUTPCGMO2Output.h

MCCompLabel.h

output
void output(const std::map< std::string, ChannelStat > &channels)
Definition rawdump.cxx:197

PIDResponse.h

j
uint32_t j
Definition RawData.h:0

pid
uint16_t pid
Definition RawData.h:2

TPCFastTransform.h
Definition of TPCFastTransform class.

TrackTPC.h

o2::gpu::GPUTPCGMMergedTrack
Definition GPUTPCGMMergedTrack.h:29

o2::gpu::GPUTPCGMMerger
Definition GPUTPCGMMerger.h:60

o2::gpu::GPUTPCGMO2Output
Definition GPUTPCGMO2Output.h:25

o2::tpc::PIDResponse
PID response class.
Definition PIDResponse.h:39

o2::tpc::TrackTPC
Definition TrackTPC.h:31

b
GLboolean GLboolean GLboolean b
Definition glcorearb.h:1233

void
typedef void(APIENTRYP PFNGLCULLFACEPROC)(GLenum mode)

param
GLenum GLfloat param
Definition glcorearb.h:271

a
GLboolean GLboolean GLboolean GLboolean a
Definition glcorearb.h:1233

t1
GLuint GLfloat GLfloat GLfloat GLfloat GLfloat GLfloat GLfloat GLfloat GLfloat t1
Definition glcorearb.h:5034

o2::gpu::internal
Definition GPUCommonHelpers.h:42

o2::gpu
Definition TrackTRD.h:35

o2::tpc::constants
Definition Constants.h:25

o2::tpc::constants::MAXSECTOR
constexpr int MAXSECTOR
Definition Constants.h:28

o2::tpc
Global TPC definitions and constants.
Definition SimTraits.h:168

o2::tpc::GPUdi
GPUdi() T BetheBlochAleph(T bg
Definition GPUTPCCompressionKernels.cxx:510

o2::track::TrackParCov
TrackParCovF TrackParCov
Definition Track.h:33

o2::gpu::GPUTPCGMMergedTrackHit
Definition GPUTPCGMMergedTrackHit.h:22

o2::gpu::GPUTPCGMMergedTrackHit::state
uint8_t state
Definition GPUTPCGMMergedTrackHit.h:24

o2::gpu::GPUTPCGMMergedTrackHit::row
uint8_t row
Definition GPUTPCGMMergedTrackHit.h:24

o2::gpu::GPUTPCGMMergedTrackHit::num
uint32_t num
Definition GPUTPCGMMergedTrackHit.h:23

o2::gpu::GPUTPCGMMergedTrackHit::sector
uint8_t sector
Definition GPUTPCGMMergedTrackHit.h:24

o2::gpu::GPUTPCGMMergedTrackHit::flagHighIncl
@ flagHighIncl
Definition GPUTPCGMMergedTrackHit.h:38

o2::gpu::GPUTPCGMMergedTrackHit::flagReject
@ flagReject
Definition GPUTPCGMMergedTrackHit.h:37

o2::gpu::GPUTPCGMMerger::tmpSort
Definition GPUTPCGMMerger.h:87

o2::gpu::GPUTPCGMMerger::tmpSort::x
uint32_t x
Definition GPUTPCGMMerger.h:88

o2::gpu::internal::GPUTPCGMO2OutputSort_comp
Definition GPUTPCGMO2Output.cxx:40

o2::gpu::internal::GPUTPCGMO2OutputSort_comp::GPUd
GPUd() bool operator()(const GPUTPCGMMerger
Definition GPUTPCGMO2Output.cxx:41

o2::tpc::ClusterNativeAccess
Definition ClusterNative.h:174

o2::tpc::dEdxInfo
Definition dEdxInfo.h:24

o2::tpc::dEdxInfo::dEdxTotTPC
float dEdxTotTPC
Definition dEdxInfo.h:29

o2::tpc::dEdxInfo::dEdxMaxTPC
float dEdxMaxTPC
Definition dEdxInfo.h:34

uint2
Definition GPUCommonDefAPI.h:72

uint2::x
uint32_t x
Definition GPUCommonDefAPI.h:72

uint2::y
uint32_t y
Definition GPUCommonDefAPI.h:72

clusters
std::vector< Cluster > clusters
Definition test_ctf_io_cpv.cxx:42