d9/df3/OrtInterface_8cxx_source.html

// Copyright 2019-2020 CERN and copyright holders of ALICE O2.

// See https://alice-o2.web.cern.ch/copyright for details of the copyright holders.

// All rights not expressly granted are reserved.

//

// This software is distributed under the terms of the GNU General Public

// License v3 (GPL Version 3), copied verbatim in the file "COPYING".

//

// In applying this license CERN does not waive the privileges and immunities

// granted to it by virtue of its status as an Intergovernmental Organization

// or submit itself to any jurisdiction.


#include "ML/OrtInterface.h"

#include "ML/3rdparty/GPUORTFloat16.h"


// ONNX includes

#include <onnxruntime_cxx_api.h>


#include <sstream>


namespace o2

{


namespace ml

{


OrtModel::OrtModel() = default;

OrtModel::OrtModel(std::unordered_map<std::string, std::string> optionsMap) { init(optionsMap); }

OrtModel::~OrtModel() = default;


void OrtModel::init(std::unordered_map<std::string, std::string> optionsMap)

{

  initOptions(optionsMap);

  initEnvironment();

}


struct OrtModel::OrtVariables { // The actual implementation is hidden in the .cxx file

  // ORT runtime objects

  Ort::RunOptions runOptions;

  std::unique_ptr<Ort::Env> env = nullptr;

  std::unique_ptr<Ort::Session> session = nullptr;

  Ort::SessionOptions sessionOptions;

  Ort::AllocatorWithDefaultOptions allocator;

  Ort::MemoryInfo memoryInfo = Ort::MemoryInfo("Cpu", OrtAllocatorType::OrtDeviceAllocator, 0, OrtMemType::OrtMemTypeDefault);

  std::unique_ptr<Ort::IoBinding> ioBinding = nullptr;

};


// General purpose


void OrtModel::initOptions(std::unordered_map<std::string, std::string> optionsMap)

{

  mPImplOrt = std::make_unique<OrtVariables>();


  // Load from options map

  if (!optionsMap.contains("model-path")) {

    LOG(fatal) << "(ORT) Model path must be contained in options map!";

  }


  if (!optionsMap["model-path"].empty()) {

    mModelPath = optionsMap["model-path"];

    mDeviceType = (optionsMap.contains("device-type") ? optionsMap["device-type"] : "CPU");

    mDeviceId = (optionsMap.contains("device-id") ? std::stoi(optionsMap["device-id"]) : -1);

    mAllocateDeviceMemory = (optionsMap.contains("allocate-device-memory") ? std::stoi(optionsMap["allocate-device-memory"]) : 0);

    mIntraOpNumThreads = (optionsMap.contains("intra-op-num-threads") ? std::stoi(optionsMap["intra-op-num-threads"]) : 0);

    mInterOpNumThreads = (optionsMap.contains("inter-op-num-threads") ? std::stoi(optionsMap["inter-op-num-threads"]) : 0);

    mLoggingLevel = (optionsMap.contains("logging-level") ? std::stoi(optionsMap["logging-level"]) : 0);

    mEnableProfiling = (optionsMap.contains("enable-profiling") ? std::stoi(optionsMap["enable-profiling"]) : 0);

    mEnableOptimizations = (optionsMap.contains("enable-optimizations") ? std::stoi(optionsMap["enable-optimizations"]) : 0);

    mEnvName = (optionsMap.contains("onnx-environment-name") ? optionsMap["onnx-environment-name"] : "onnx_model_inference");

    mDeterministicMode = (optionsMap.contains("deterministic-compute") ? std::stoi(optionsMap["deterministic-compute"]) : 0);


    if (mDeviceType == "CPU") {

      (mPImplOrt->sessionOptions).SetIntraOpNumThreads(mIntraOpNumThreads);

      (mPImplOrt->sessionOptions).SetInterOpNumThreads(mInterOpNumThreads);

      if (mIntraOpNumThreads > 1 || mInterOpNumThreads > 1) {

        (mPImplOrt->sessionOptions).SetExecutionMode(ExecutionMode::ORT_PARALLEL);

      } else if (mIntraOpNumThreads == 1) {

        (mPImplOrt->sessionOptions).SetExecutionMode(ExecutionMode::ORT_SEQUENTIAL);

      }

      if (mLoggingLevel < 2) {

        LOG(info) << "(ORT) CPU execution provider set with " << mIntraOpNumThreads << " (mIntraOpNumThreads) and " << mInterOpNumThreads << " (mInterOpNumThreads) threads";

      }

    }


    // OrtROCMProviderOptions rocm_options{};

    // (mPImplOrt->sessionOptions).AppendExecutionProvider_ROCM(rocm_options);


    (mPImplOrt->sessionOptions).DisableMemPattern();

    (mPImplOrt->sessionOptions).DisableCpuMemArena();


    if (mEnableProfiling) {

      if (optionsMap.contains("profiling-output-path")) {

        (mPImplOrt->sessionOptions).EnableProfiling((optionsMap["profiling-output-path"] + "/ORT_LOG_").c_str());

      } else {

        LOG(warning) << "(ORT) If profiling is enabled, optionsMap[\"profiling-output-path\"] should be set. Disabling profiling for now.";

        (mPImplOrt->sessionOptions).DisableProfiling();

      }

    } else {

      (mPImplOrt->sessionOptions).DisableProfiling();

    }


    if (mDeterministicMode > 0) {

      (mPImplOrt->sessionOptions).AddConfigEntry("session_options.use_deterministic_compute", "1");

    }


    (mPImplOrt->sessionOptions).SetGraphOptimizationLevel(GraphOptimizationLevel(mEnableOptimizations));

    (mPImplOrt->sessionOptions).SetLogSeverityLevel(OrtLoggingLevel(mLoggingLevel));


    mInitialized = true;

  } else {

    LOG(fatal) << "(ORT) Model path cannot be empty!";

  }

}


void OrtModel::initEnvironment()

{

  mPImplOrt->env = std::make_unique<Ort::Env>(

    OrtLoggingLevel(mLoggingLevel),

    (mEnvName.empty() ? "ORT" : mEnvName.c_str()),

    // Integrate ORT logging into Fairlogger

    [](void* param, OrtLoggingLevel severity, const char* category, const char* logid, const char* code_location, const char* message) {

      if (severity == ORT_LOGGING_LEVEL_VERBOSE) {

        LOG(debug) << "(ORT) [" << logid << "|" << category << "|" << code_location << "]: " << message;

      } else if (severity == ORT_LOGGING_LEVEL_INFO) {

        LOG(info) << "(ORT) [" << logid << "|" << category << "|" << code_location << "]: " << message;

      } else if (severity == ORT_LOGGING_LEVEL_WARNING) {

        LOG(warning) << "(ORT) [" << logid << "|" << category << "|" << code_location << "]: " << message;

      } else if (severity == ORT_LOGGING_LEVEL_ERROR) {

        LOG(error) << "(ORT) [" << logid << "|" << category << "|" << code_location << "]: " << message;

      } else if (severity == ORT_LOGGING_LEVEL_FATAL) {

        LOG(fatal) << "(ORT) [" << logid << "|" << category << "|" << code_location << "]: " << message;

      } else {

        LOG(info) << "(ORT) [" << logid << "|" << category << "|" << code_location << "]: " << message;

      }

    },

    (void*)3);

  (mPImplOrt->env)->DisableTelemetryEvents(); // Disable telemetry events

}


void OrtModel::initSessionFromBuffer(const char* buffer, size_t bufferSize)

{

  mPImplOrt->sessionOptions.AddConfigEntry("session.load_model_format", "ONNX");

  mPImplOrt->sessionOptions.AddConfigEntry("session.use_ort_model_bytes_directly", "1");


  mPImplOrt->session = std::make_unique<Ort::Session>(*mPImplOrt->env,

                                                      buffer,

                                                      bufferSize,

                                                      mPImplOrt->sessionOptions);

  mPImplOrt->ioBinding = std::make_unique<Ort::IoBinding>(*mPImplOrt->session);


  setIO();


  if (mLoggingLevel < 2) {

    LOG(info) << "(ORT) Model loaded successfully from buffer! (inputs: " << printShape(mInputShapes, mInputNames) << ", outputs: " << printShape(mOutputShapes, mInputNames) << ")";

  }

}


void OrtModel::initSession()

{

  if (mAllocateDeviceMemory) {

    memoryOnDevice(mDeviceId);

  }

  mPImplOrt->session = std::make_unique<Ort::Session>(*mPImplOrt->env, mModelPath.c_str(), mPImplOrt->sessionOptions);

  mPImplOrt->ioBinding = std::make_unique<Ort::IoBinding>(*mPImplOrt->session);


  setIO();


  if (mLoggingLevel < 2) {

    LOG(info) << "(ORT) Model loaded successfully! (inputs: " << printShape(mInputShapes, mInputNames) << ", outputs: " << printShape(mOutputShapes, mInputNames) << ")";

  }

}


void OrtModel::memoryOnDevice(int32_t deviceIndex)

{

  if (deviceIndex >= 0) {

    (mPImplOrt->runOptions).AddConfigEntry("disable_synchronize_execution_providers", "1");

    (mPImplOrt->sessionOptions).AddConfigEntry("session.use_device_allocator_for_initializers", "1"); // See kOrtSessionOptionsUseDeviceAllocatorForInitializers, https://github.com/microsoft/onnxruntime/blob/main/include/onnxruntime/core/session/onnxruntime_session_options_config_keys.h

    (mPImplOrt->sessionOptions).AddConfigEntry("session.use_env_allocators", "1");                    // This should enable to use the volatile memory allocation defined in O2/GPU/GPUTracking/TPCClusterFinder/GPUTPCNNClusterizerHost.cxx; not working yet: ONNX still assigns new memory at init time

    (mPImplOrt->sessionOptions).AddConfigEntry("session_options.enable_cpu_mem_arena", "0");          // This should enable to use the volatile memory allocation defined in O2/GPU/GPUTracking/TPCClusterFinder/GPUTPCNNClusterizerHost.cxx; not working yet: ONNX still assigns new memory at init time

    // Arena memory shrinkage comes at performance cost

    // For now prefer to use single allocation, enabled by O2/GPU/GPUTracking/Base/cuda/GPUReconstructionCUDA.cu -> SetONNXGPUStream -> rocm_options.arena_extend_strategy = 0;

    (mPImplOrt->runOptions).AddConfigEntry("memory.enable_memory_arena_shrinkage", ("gpu:" + std::to_string(deviceIndex)).c_str()); // See kOrtRunOptionsConfigEnableMemoryArenaShrinkage, https://github.com/microsoft/onnxruntime/blob/90c263f471bbce724e77d8e62831d3a9fa838b2f/include/onnxruntime/core/session/onnxruntime_run_options_config_keys.h#L27


    std::string dev_mem_str = "";

    if (mDeviceType == "ROCM") {

      dev_mem_str = "HipPinned";

    }

    if (mDeviceType == "CUDA") {

      dev_mem_str = "Cuda";

    }

    mPImplOrt->memoryInfo = Ort::MemoryInfo(dev_mem_str.c_str(), OrtAllocatorType::OrtDeviceAllocator, deviceIndex, OrtMemType::OrtMemTypeDefault);

    if (mLoggingLevel < 2) {

      LOG(info) << "(ORT) Memory info set to on-device memory for device type " << mDeviceType << " with ID " << deviceIndex << " and mPImplOrt pointer " << mPImplOrt;

    }

  }

}


void OrtModel::resetSession()

{

  mPImplOrt->session = std::make_unique<Ort::Session>(*(mPImplOrt->env), mModelPath.c_str(), mPImplOrt->sessionOptions);

}


// Getters


Ort::SessionOptions* OrtModel::getSessionOptions()

{

  return &mPImplOrt->sessionOptions;

}


Ort::MemoryInfo* OrtModel::getMemoryInfo()

{

  return &mPImplOrt->memoryInfo;

}


Ort::Env* OrtModel::getEnv()

{

  return (mPImplOrt->env).get();

}


template <class I, class O>


std::vector<O> OrtModel::v2v(std::vector<I>& input, bool clearInput)

{

  if constexpr (std::is_same_v<I, O>) {

    return input;

  } else {

    std::vector<O> output(input.size());

    std::transform(std::begin(input), std::end(input), std::begin(output), [](I f) { return O(f); });

    if (clearInput) {

      input.clear();

    }

    return output;

  }

}


void OrtModel::setIO()

{

  for (size_t i = 0; i < (mPImplOrt->session)->GetInputCount(); ++i) {

    mInputNames.push_back((mPImplOrt->session)->GetInputNameAllocated(i, mPImplOrt->allocator).get());

  }

  for (size_t i = 0; i < (mPImplOrt->session)->GetInputCount(); ++i) {

    mInputShapes.emplace_back((mPImplOrt->session)->GetInputTypeInfo(i).GetTensorTypeAndShapeInfo().GetShape());

  }

  for (size_t i = 0; i < (mPImplOrt->session)->GetOutputCount(); ++i) {

    mOutputNames.push_back((mPImplOrt->session)->GetOutputNameAllocated(i, mPImplOrt->allocator).get());

  }

  for (size_t i = 0; i < (mPImplOrt->session)->GetOutputCount(); ++i) {

    mOutputShapes.emplace_back((mPImplOrt->session)->GetOutputTypeInfo(i).GetTensorTypeAndShapeInfo().GetShape());

  }


  mInputNamesChar.resize(mInputNames.size(), nullptr);

  std::transform(std::begin(mInputNames), std::end(mInputNames), std::begin(mInputNamesChar),

                 [&](const std::string& str) { return str.c_str(); });

  mOutputNamesChar.resize(mOutputNames.size(), nullptr);

  std::transform(std::begin(mOutputNames), std::end(mOutputNames), std::begin(mOutputNamesChar),

                 [&](const std::string& str) { return str.c_str(); });


  mInputShapesCopy = mInputShapes;

  mOutputShapesCopy = mOutputShapes;

  mInputSizePerNode.resize(mInputShapes.size(), 1);

  mOutputSizePerNode.resize(mOutputShapes.size(), 1);

  mInputsTotal = 1;

  for (size_t i = 0; i < mInputShapes.size(); ++i) {

    if (mInputShapes[i].size() > 0) {

      for (size_t j = 1; j < mInputShapes[i].size(); ++j) {

        if (mInputShapes[i][j] > 0) {

          mInputsTotal *= mInputShapes[i][j];

          mInputSizePerNode[i] *= mInputShapes[i][j];

        }

      }

    }

  }

  mOutputsTotal = 1;

  for (size_t i = 0; i < mOutputShapes.size(); ++i) {

    if (mOutputShapes[i].size() > 0) {

      for (size_t j = 1; j < mOutputShapes[i].size(); ++j) {

        if (mOutputShapes[i][j] > 0) {

          mOutputsTotal *= mOutputShapes[i][j];

          mOutputSizePerNode[i] *= mOutputShapes[i][j];

        }

      }

    }

  }

}


void OrtModel::setEnv(Ort::Env* env)

{

  mPImplOrt->env.reset(env);

}


// Inference

template <class I, class O>


std::vector<O> OrtModel::inference(std::vector<I>& input)

{

  std::vector<int64_t> inputShape = mInputShapes[0];

  inputShape[0] = input.size();

  for (size_t i = 1; i < mInputShapes[0].size(); ++i) {

    inputShape[0] /= mInputShapes[0][i];

  }

  std::vector<Ort::Value> inputTensor;

  if constexpr (std::is_same_v<I, OrtDataType::Float16_t>) {

    inputTensor.emplace_back(Ort::Value::CreateTensor<Ort::Float16_t>(mPImplOrt->memoryInfo, reinterpret_cast<Ort::Float16_t*>(input.data()), input.size(), inputShape.data(), inputShape.size()));

  } else {

    inputTensor.emplace_back(Ort::Value::CreateTensor<I>(mPImplOrt->memoryInfo, input.data(), input.size(), inputShape.data(), inputShape.size()));

  }

  // input.clear();

  auto outputTensors = (mPImplOrt->session)->Run(mPImplOrt->runOptions, mInputNamesChar.data(), inputTensor.data(), inputTensor.size(), mOutputNamesChar.data(), mOutputNamesChar.size());

  O* outputValues = outputTensors[0].template GetTensorMutableData<O>();

  std::vector<O> outputValuesVec{outputValues, outputValues + inputShape[0] * mOutputShapes[0][1]};

  outputTensors.clear();

  return outputValuesVec;

}


template std::vector<float> o2::ml::OrtModel::inference<float, float>(std::vector<float>&);

template std::vector<float> o2::ml::OrtModel::inference<OrtDataType::Float16_t, float>(std::vector<OrtDataType::Float16_t>&);

template std::vector<OrtDataType::Float16_t> o2::ml::OrtModel::inference<OrtDataType::Float16_t, OrtDataType::Float16_t>(std::vector<OrtDataType::Float16_t>&);


template <class I, class O>


void OrtModel::inference(I* input, int64_t input_size, O* output)

{

  // std::vector<std::string> providers = Ort::GetAvailableProviders();

  // for (const auto& provider : providers) {

  //     LOG(info) << "Available Execution Provider: " << provider;

  // }

  std::vector<int64_t> inputShape{input_size, (int64_t)mInputShapes[0][1]};

  Ort::Value inputTensor = Ort::Value(nullptr);

  if constexpr (std::is_same_v<I, OrtDataType::Float16_t>) {

    inputTensor = Ort::Value::CreateTensor<Ort::Float16_t>(mPImplOrt->memoryInfo, reinterpret_cast<Ort::Float16_t*>(input), input_size * mInputShapes[0][1], inputShape.data(), inputShape.size());

  } else {

    inputTensor = Ort::Value::CreateTensor<I>(mPImplOrt->memoryInfo, input, input_size * mInputShapes[0][1], inputShape.data(), inputShape.size());

  }

  (mPImplOrt->ioBinding)->BindInput(mInputNames[0].c_str(), inputTensor);


  std::vector<int64_t> outputShape{input_size, mOutputShapes[0][1]};

  Ort::Value outputTensor = Ort::Value(nullptr);

  if constexpr (std::is_same_v<O, OrtDataType::Float16_t>) {

    outputTensor = Ort::Value::CreateTensor<Ort::Float16_t>(mPImplOrt->memoryInfo, reinterpret_cast<Ort::Float16_t*>(output), input_size * mOutputShapes[0][1], outputShape.data(), outputShape.size());

  } else {

    outputTensor = Ort::Value::CreateTensor<O>(mPImplOrt->memoryInfo, output, input_size * mOutputShapes[0][1], outputShape.data(), outputShape.size());

  }

  (mPImplOrt->ioBinding)->BindOutput(mOutputNames[0].c_str(), outputTensor);


  (mPImplOrt->session)->Run(mPImplOrt->runOptions, *mPImplOrt->ioBinding);

  // mPImplOrt->session->Run(

  //   mPImplOrt->runOptions,

  //   mInputNamesChar.data(),

  //   &inputTensor,

  //   mInputNamesChar.size(),

  //   mOutputNamesChar.data(),

  //   &outputTensor,

  //   mOutputNamesChar.size());

}


template void OrtModel::inference<OrtDataType::Float16_t, OrtDataType::Float16_t>(OrtDataType::Float16_t*, int64_t, OrtDataType::Float16_t*);

template void OrtModel::inference<OrtDataType::Float16_t, float>(OrtDataType::Float16_t*, int64_t, float*);

template void OrtModel::inference<float, OrtDataType::Float16_t>(float*, int64_t, OrtDataType::Float16_t*);

template void OrtModel::inference<float, float>(float*, int64_t, float*);


template <class I, class O>


void OrtModel::inference(I** input, int64_t input_size, O* output)

{

  std::vector<Ort::Value> inputTensors(mInputShapesCopy.size());


  for (size_t i = 0; i < mInputShapesCopy.size(); ++i) {


    mInputShapesCopy[i][0] = input_size;  // batch-size

    mOutputShapesCopy[i][0] = input_size; // batch-size


    if constexpr (std::is_same_v<I, OrtDataType::Float16_t>) {

      inputTensors[i] = Ort::Value::CreateTensor<Ort::Float16_t>(

        mPImplOrt->memoryInfo,

        reinterpret_cast<Ort::Float16_t*>(input[i]),

        mInputSizePerNode[i] * input_size,

        mInputShapesCopy[i].data(),

        mInputShapesCopy[i].size());

    } else {

      inputTensors[i] = Ort::Value::CreateTensor<I>(

        mPImplOrt->memoryInfo,

        input[i],

        mInputSizePerNode[i] * input_size,

        mInputShapesCopy[i].data(),

        mInputShapesCopy[i].size());

    }

  }


  Ort::Value outputTensor = Ort::Value(nullptr);

  if constexpr (std::is_same_v<O, OrtDataType::Float16_t>) {

    outputTensor = Ort::Value::CreateTensor<Ort::Float16_t>(

      mPImplOrt->memoryInfo,

      reinterpret_cast<Ort::Float16_t*>(output),

      mOutputSizePerNode[0] * input_size, // assumes that there is only one output node

      mOutputShapesCopy[0].data(),

      mOutputShapesCopy[0].size());

  } else {

    outputTensor = Ort::Value::CreateTensor<O>(

      mPImplOrt->memoryInfo,

      output,

      mOutputSizePerNode[0] * input_size, // assumes that there is only one output node

      mOutputShapesCopy[0].data(),

      mOutputShapesCopy[0].size());

  }


  // === Run inference ===

  mPImplOrt->session->Run(

    mPImplOrt->runOptions,

    mInputNamesChar.data(),

    inputTensors.data(),

    mInputNamesChar.size(),

    mOutputNamesChar.data(),

    &outputTensor,

    mOutputNamesChar.size());

}


template void OrtModel::inference<OrtDataType::Float16_t, OrtDataType::Float16_t>(OrtDataType::Float16_t**, int64_t, OrtDataType::Float16_t*);

template void OrtModel::inference<OrtDataType::Float16_t, float>(OrtDataType::Float16_t**, int64_t, float*);

template void OrtModel::inference<float, OrtDataType::Float16_t>(float**, int64_t, OrtDataType::Float16_t*);

template void OrtModel::inference<float, float>(float**, int64_t, float*);


template <class I, class O>


std::vector<O> OrtModel::inference(std::vector<std::vector<I>>& inputs)

{

  std::vector<Ort::Value> input_tensors;


  for (size_t i = 0; i < inputs.size(); ++i) {


    mInputShapesCopy[i][0] = inputs[i].size() / mInputSizePerNode[i]; // batch-size


    if constexpr (std::is_same_v<I, OrtDataType::Float16_t>) {

      input_tensors.emplace_back(

        Ort::Value::CreateTensor<Ort::Float16_t>(

          mPImplOrt->memoryInfo,

          reinterpret_cast<Ort::Float16_t*>(inputs[i].data()),

          mInputSizePerNode[i] * mInputShapesCopy[i][0],

          mInputShapesCopy[i].data(),

          mInputShapesCopy[i].size()));

    } else {

      input_tensors.emplace_back(

        Ort::Value::CreateTensor<I>(

          mPImplOrt->memoryInfo,

          inputs[i].data(),

          mInputSizePerNode[i] * mInputShapesCopy[i][0],

          mInputShapesCopy[i].data(),

          mInputShapesCopy[i].size()));

    }

  }


  int32_t totalOutputSize = mOutputsTotal * mInputShapesCopy[0][0];


  // === Run inference ===

  auto output_tensors = mPImplOrt->session->Run(

    mPImplOrt->runOptions,

    mInputNamesChar.data(),

    input_tensors.data(),

    input_tensors.size(),

    mOutputNamesChar.data(),

    mOutputNamesChar.size());


  // === Extract output values ===

  O* output_data = output_tensors[0].template GetTensorMutableData<O>();

  std::vector<O> output_vec(output_data, output_data + totalOutputSize);

  output_tensors.clear();

  return output_vec;

}


template std::vector<float> OrtModel::inference<float, float>(std::vector<std::vector<float>>&);

template std::vector<OrtDataType::Float16_t> OrtModel::inference<OrtDataType::Float16_t, OrtDataType::Float16_t>(std::vector<std::vector<OrtDataType::Float16_t>>&);


// Release session


void OrtModel::release(bool profilingEnabled)

{

  mPImplOrt.reset();

}


// private

std::string OrtModel::printShape(const std::vector<int64_t>& v)

{

  std::stringstream ss("");

  for (size_t i = 0; i < v.size() - 1; i++) {

    ss << v[i] << "x";

  }

  ss << v[v.size() - 1];

  return ss.str();

}


std::string OrtModel::printShape(const std::vector<std::vector<int64_t>>& v, std::vector<std::string>& n)

{

  std::stringstream ss("");

  for (size_t i = 0; i < v.size(); i++) {

    ss << n[i] << " -> (";

    for (size_t j = 0; j < v[i].size() - 1; j++) {

      ss << v[i][j] << "x";

    }

    ss << v[i][v[i].size() - 1] << "); ";

  }

  return ss.str();

}


} // namespace ml


} // namespace o2

debug
std::ostringstream debug
Definition ExpressionJSONHelpers.cxx:83

i
int32_t i
Definition GPUCommonAlgorithm.h:436

GPUORTFloat16.h

output
void output(const std::map< std::string, ChannelStat > &channels)
Definition rawdump.cxx:197

OrtInterface.h
A header library for loading ONNX models and inferencing them on CPU and GPU.

j
uint32_t j
Definition RawData.h:0

o2::ml::OrtModel::initOptions
void initOptions(std::unordered_map< std::string, std::string > optionsMap)
Definition OrtInterface.cxx:51

o2::ml::OrtModel::memoryOnDevice
void memoryOnDevice(int32_t=0)
Definition OrtInterface.cxx:174

o2::ml::OrtModel::OrtModel
OrtModel()

o2::ml::OrtModel::getEnv
Ort::Env * getEnv()
Definition OrtInterface.cxx:215

o2::ml::OrtModel::release
void release(bool=false)
Definition OrtInterface.cxx:468

o2::ml::OrtModel::setEnv
void setEnv(Ort::Env *)
Definition OrtInterface.cxx:285

o2::ml::OrtModel::v2v
std::vector< O > v2v(std::vector< I > &, bool=true)
Definition OrtInterface.cxx:221

o2::ml::OrtModel::initEnvironment
void initEnvironment()
Definition OrtInterface.cxx:116

o2::ml::OrtModel::initSessionFromBuffer
void initSessionFromBuffer(const char *buffer, size_t bufferSize)
Definition OrtInterface.cxx:141

o2::ml::OrtModel::initSession
void initSession()
Definition OrtInterface.cxx:159

o2::ml::OrtModel::resetSession
void resetSession()
Definition OrtInterface.cxx:199

o2::ml::OrtModel::getMemoryInfo
Ort::MemoryInfo * getMemoryInfo()
Definition OrtInterface.cxx:210

o2::ml::OrtModel::inference
std::vector< O > inference(std::vector< I > &)
Definition OrtInterface.cxx:292

o2::ml::OrtModel::setIO
void setIO()
Definition OrtInterface.cxx:235

o2::ml::OrtModel::~OrtModel
virtual ~OrtModel()

o2::ml::OrtModel::init
void init(std::unordered_map< std::string, std::string > optionsMap)
Definition OrtInterface.cxx:33

o2::ml::OrtModel::getSessionOptions
Ort::SessionOptions * getSessionOptions()
Definition OrtInterface.cxx:205

n
GLdouble n
Definition glcorearb.h:1982

buffer
GLuint buffer
Definition glcorearb.h:655

size
GLsizeiptr size
Definition glcorearb.h:659

v
const GLdouble * v
Definition glcorearb.h:832

f
GLdouble f
Definition glcorearb.h:310

message
GLuint GLsizei const GLchar * message
Definition glcorearb.h:2517

param
GLenum GLfloat param
Definition glcorearb.h:271

severity
GLenum GLenum severity
Definition glcorearb.h:2513

o2
a couple of static helper functions to create timestamp values for CCDB queries or override obsolete ...
Definition BitstreamReader.h:24

std::to_string
std::string to_string(gsl::span< T, Size > span)
Definition common.h:52

empty
void empty(int)
Definition o2sim_parallel.cxx:364

o2::ml::OrtModel::OrtVariables
Definition OrtInterface.cxx:39

o2::ml::OrtModel::OrtVariables::runOptions
Ort::RunOptions runOptions
Definition OrtInterface.cxx:41

o2::ml::OrtModel::OrtVariables::allocator
Ort::AllocatorWithDefaultOptions allocator
Definition OrtInterface.cxx:45

o2::ml::OrtModel::OrtVariables::memoryInfo
Ort::MemoryInfo memoryInfo
Definition OrtInterface.cxx:46

o2::ml::OrtModel::OrtVariables::session
std::unique_ptr< Ort::Session > session
ONNX session.
Definition OrtInterface.cxx:43

o2::ml::OrtModel::OrtVariables::sessionOptions
Ort::SessionOptions sessionOptions
Definition OrtInterface.cxx:44

o2::ml::OrtModel::OrtVariables::ioBinding
std::unique_ptr< Ort::IoBinding > ioBinding
Definition OrtInterface.cxx:47

o2::ml::OrtModel::OrtVariables::env
std::unique_ptr< Ort::Env > env
Definition OrtInterface.cxx:42

LOG
LOG(info)<< "Compressed in "<< sw.CpuTime()<< " s"

str
const std::string str
Definition test_ransEncodeDecode.cxx:37