Blame - ArmnnPreparedModel_1_2.cpp - platform/external/android-nn-driver

2019-06-11 16:35:25 +0100

[diff] [blame]

1

//

2

3

// SPDX-License-Identifier: MIT

4

//

5

6

#define LOG_TAG "ArmnnDriver"

7

8

#include "ArmnnPreparedModel_1_2.hpp"

9

#include "Utils.hpp"

10

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

11

#include <log/log.h>

12

#include <OperationsUtils.h>

13

#include <ExecutionBurstServer.h>

14

#include <ValidateHal.h>

#include <cassert>

#include <cinttypes>

using namespace android;

20

using namespace android::hardware;

21

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

22

namespace {

23

Kevin DuBois

2020-08-26 13:53:41 -0700

[diff] [blame]

24

static const V1_2::Timing g_NoTiming = {.timeOnDevice = UINT64_MAX, .timeInDriver = UINT64_MAX};

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

25

using namespace armnn_driver;

Mike Kelly

2019-07-08 17:37:35 +0100

[diff] [blame]

26

using TimePoint = std::chrono::steady_clock::time_point;

TimePoint Now()

{

return std::chrono::steady_clock::now();

31

}

32

33

unsigned long MicrosecondsDuration(TimePoint endPoint, TimePoint startPoint)

34

{

35

return static_cast<unsigned long>(std::chrono::duration_cast<std::chrono::microseconds>(

36

endPoint - startPoint).count());

37

}

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

38

Mike Kelly

2019-07-22 14:06:00 +0100

[diff] [blame]

39

void NotifyCallbackAndCheck(const ::android::sp<V1_0::IExecutionCallback>& callback,

Kevin DuBois

2020-08-26 13:53:41 -0700

[diff] [blame]

40

V1_0::ErrorStatus errorStatus,

Kevin DuBois

2020-11-20 14:54:05 -0800

[diff] [blame]

41

std::vector<V1_2::OutputShape>,

42

const V1_2::Timing,

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

43

std::string callingFunction)

44

{

45

Return<void> returned = callback->notify(errorStatus);

46

// This check is required, if the callback fails and it isn't checked it will bring down the service

47

if (!returned.isOk())

48

{

49

ALOGE("ArmnnDriver::%s: hidl callback failed to return properly: %s",

50

callingFunction.c_str(), returned.description().c_str());

}

}

Mike Kelly

2019-07-22 14:06:00 +0100

[diff] [blame]

54

void NotifyCallbackAndCheck(const ::android::sp<V1_2::IExecutionCallback>& callback,

Kevin DuBois

2020-08-26 13:53:41 -0700

[diff] [blame]

55

V1_0::ErrorStatus errorStatus,

Kevin DuBois

2020-11-20 14:54:05 -0800

[diff] [blame]

56

std::vector<V1_2::OutputShape> outputShapes,

57

const V1_2::Timing timing,

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

58

std::string callingFunction)

59

{

Mike Kelly

2019-07-22 14:06:00 +0100

[diff] [blame]

60

Return<void> returned = callback->notify_1_2(errorStatus, outputShapes, timing);

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

61

// This check is required, if the callback fails and it isn't checked it will bring down the service

62

if (!returned.isOk())

63

{

64

ALOGE("ArmnnDriver::%s: hidl callback failed to return properly: %s",

65

callingFunction.c_str(), returned.description().c_str());

}

}

Kevin DuBois

2020-08-26 13:53:41 -0700

[diff] [blame]

69

bool ValidateRequestArgument(const V1_0::RequestArgument& requestArg, const armnn::TensorInfo& tensorInfo)

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

70

{

71

if (requestArg.dimensions.size() != 0)

72

{

73

if (requestArg.dimensions.size() != tensorInfo.GetNumDimensions())

74

{

75

ALOGE("Mismatched dimensions (request argument: %zu, expected: %u)",

76

requestArg.dimensions.size(), tensorInfo.GetNumDimensions());

return false;

}

for (unsigned int d = 0; d < tensorInfo.GetNumDimensions(); ++d)

81

{

Finn Williams

a4983ce

2020-07-23 12:55:12 +0100

[diff] [blame]

82

if (requestArg.dimensions[d] != 0 && requestArg.dimensions[d] != tensorInfo.GetShape()[d])

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

83

{

84

ALOGE("Mismatched size for dimension %d (request argument: %u, expected %u)",

85

d, requestArg.dimensions[d], tensorInfo.GetShape()[d]);

return false;

}

}

}

return true;

}

Kevin DuBois

2020-08-26 13:53:41 -0700

[diff] [blame]

94

armnn::Tensor GetTensorForRequestArgument(const V1_0::RequestArgument& requestArg,

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

95

const armnn::TensorInfo& tensorInfo,

96

const std::vector<::android::nn::RunTimePoolInfo>& requestPools)

97

{

98

if (!ValidateRequestArgument(requestArg, tensorInfo))

99

{

100

return armnn::Tensor();

101

}

102

103

return armnn::Tensor(tensorInfo, GetMemoryFromPool(requestArg.location, requestPools));

104

}

105

106

inline std::string BuildTensorName(const char* tensorNamePrefix, std::size_t index)

107

{

108

return tensorNamePrefix + std::to_string(index);

109

}

110

111

} // anonymous namespace

112

113

using namespace android::hardware;

114

115

namespace armnn_driver

116

{

117

118

template<typename HalVersion>

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

119

RequestThread<ArmnnPreparedModel_1_2, HalVersion, CallbackContext_1_2>

Mike Kelly

2019-07-22 14:06:00 +0100

[diff] [blame]

120

ArmnnPreparedModel_1_2<HalVersion>::m_RequestThread;

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

121

122

template<typename HalVersion>

123

template<typename TensorBindingCollection>

124

void ArmnnPreparedModel_1_2<HalVersion>::DumpTensorsIfRequired(char const* tensorNamePrefix,

125

const TensorBindingCollection& tensorBindings)

126

{

127

if (!m_RequestInputsAndOutputsDumpDir.empty())

128

{

Colm Donelan

08d9a1c

2020-09-09 17:56:55 +0100

[diff] [blame]

129

const std::string requestName = std::to_string(m_NetworkId) + "_" + std::to_string(m_RequestCount) + ".dump";

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

130

for (std::size_t i = 0u; i < tensorBindings.size(); ++i)

131

{

132

DumpTensor(m_RequestInputsAndOutputsDumpDir,

133

requestName,

134

BuildTensorName(tensorNamePrefix, i),

135

tensorBindings[i].second);

}

}

}

template<typename HalVersion>

141

ArmnnPreparedModel_1_2<HalVersion>::ArmnnPreparedModel_1_2(armnn::NetworkId networkId,

142

armnn::IRuntime* runtime,

143

const V1_2::Model& model,

144

const std::string& requestInputsAndOutputsDumpDir,

145

const bool gpuProfilingEnabled)

146

: m_NetworkId(networkId)

, m_Runtime(runtime)

, m_Model(model)

, m_RequestCount(0)

, m_RequestInputsAndOutputsDumpDir(requestInputsAndOutputsDumpDir)

151

, m_GpuProfilingEnabled(gpuProfilingEnabled)

152

{

153

// Enable profiling if required.

154

m_Runtime->GetProfiler(m_NetworkId)->EnableProfiling(m_GpuProfilingEnabled);

155

}

156

157

template<typename HalVersion>

158

ArmnnPreparedModel_1_2<HalVersion>::~ArmnnPreparedModel_1_2()

159

{

160

// Get a hold of the profiler used by this model.

161

std::shared_ptr<armnn::IProfiler> profiler = m_Runtime->GetProfiler(m_NetworkId);

162

163

// Unload the network associated with this model.

164

m_Runtime->UnloadNetwork(m_NetworkId);

165

166

// Dump the profiling info to a file if required.

167

DumpJsonProfilingIfRequired(m_GpuProfilingEnabled, m_RequestInputsAndOutputsDumpDir, m_NetworkId, profiler.get());

168

}

169

170

template<typename HalVersion>

Kevin DuBois

2020-08-26 13:53:41 -0700

[diff] [blame]

171

Return <V1_0::ErrorStatus> ArmnnPreparedModel_1_2<HalVersion>::execute(const V1_0::Request& request,

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

172

const ::android::sp<V1_0::IExecutionCallback>& callback)

173

{

Mike Kelly

2019-07-22 14:06:00 +0100

[diff] [blame]

174

if (callback.get() == nullptr)

175

{

176

ALOGE("ArmnnPreparedModel_1_2::execute invalid callback passed");

Kevin DuBois

2020-08-26 13:53:41 -0700

[diff] [blame]

177

return V1_0::ErrorStatus::INVALID_ARGUMENT;

Mike Kelly

2019-07-22 14:06:00 +0100

[diff] [blame]

178

}

179

Kevin DuBois

2020-08-26 13:53:41 -0700

[diff] [blame]

180

auto cb = [callback](V1_0::ErrorStatus errorStatus,

Kevin DuBois

2020-11-20 14:54:05 -0800

[diff] [blame]

181

std::vector<V1_2::OutputShape> outputShapes,

182

const V1_2::Timing& timing,

Mike Kelly

2019-07-22 14:06:00 +0100

[diff] [blame]

183

std::string callingFunction)

184

{

185

NotifyCallbackAndCheck(callback, errorStatus, outputShapes, timing, callingFunction);

186

};

187

Kevin DuBois

2020-08-26 13:53:41 -0700

[diff] [blame]

188

return Execute(request, V1_2::MeasureTiming::NO, cb);

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

189

}

190

191

template<typename HalVersion>

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame]

192

Return <V1_0::ErrorStatus> ArmnnPreparedModel_1_2<HalVersion>::execute_1_2(

193

const V1_0::Request& request,

Kevin DuBois

2020-11-20 14:54:05 -0800

[diff] [blame]

194

V1_2::MeasureTiming measureTiming,

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame]

195

const sp<V1_2::IExecutionCallback>& callback)

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

196

{

Mike Kelly

2019-07-22 14:06:00 +0100

[diff] [blame]

197

if (callback.get() == nullptr)

198

{

199

ALOGE("ArmnnPreparedModel_1_2::execute_1_2 invalid callback passed");

Kevin DuBois

2020-08-26 13:53:41 -0700

[diff] [blame]

200

return V1_0::ErrorStatus::INVALID_ARGUMENT;

Mike Kelly

2019-07-22 14:06:00 +0100

[diff] [blame]

201

}

202

Kevin DuBois

2020-08-26 13:53:41 -0700

[diff] [blame]

203

auto cb = [callback](V1_0::ErrorStatus errorStatus,

Kevin DuBois

2020-11-20 14:54:05 -0800

[diff] [blame]

204

std::vector<V1_2::OutputShape> outputShapes,

205

const V1_2::Timing& timing,

Mike Kelly

2019-07-22 14:06:00 +0100

[diff] [blame]

206

std::string callingFunction)

207

{

208

NotifyCallbackAndCheck(callback, errorStatus, outputShapes, timing, callingFunction);

209

};

210

211

return Execute(request, measureTiming, cb);

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

212

}

213

214

template<typename HalVersion>

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

215

Return<V1_0::ErrorStatus> ArmnnPreparedModel_1_2<HalVersion>::PrepareMemoryForInputs(

216

armnn::InputTensors& inputs,

217

const V1_0::Request& request,

218

const std::vector<android::nn::RunTimePoolInfo>& memPools)

219

{

220

inputs.reserve(request.inputs.size());

221

for (unsigned int i = 0; i < request.inputs.size(); i++)

222

{

223

const auto& inputArg = request.inputs[i];

224

225

const armnn::TensorInfo inputTensorInfo = m_Runtime->GetInputTensorInfo(m_NetworkId, i);

226

const armnn::Tensor inputTensor = GetTensorForRequestArgument(inputArg, inputTensorInfo, memPools);

227

Renato Grottesi

2022-12-14 17:04:16 +0000

[diff] [blame]

228

uint32_t poolIndex = inputArg.location.poolIndex;

229

if (poolIndex >= memPools.size())

230

{

231

ALOGE("Cannot execute request. Error converting request input %u to tensor: wrong poolIndex", i);

232

return V1_0::ErrorStatus::GENERAL_FAILURE;

233

}

234

235

uint8_t* inputTensorBegin = static_cast<uint8_t*>(inputTensor.GetMemoryArea());

236

if (inputTensorBegin == nullptr)

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

237

{

238

ALOGE("Cannot execute request. Error converting request input %u to tensor", i);

239

return V1_0::ErrorStatus::GENERAL_FAILURE;

240

}

241

Renato Grottesi

2022-12-14 17:04:16 +0000

[diff] [blame]

242

const size_t inputTensorSize = inputTensorInfo.GetNumBytes();

243

uint8_t* memoryPoolBegin = memPools[poolIndex].getBuffer();

244

uint32_t memoryPoolSize = memPools[poolIndex].getSize();

245

bool inputTensorIsOutOfMemoryRage = (inputTensorBegin + inputTensorSize) > (memoryPoolBegin + memoryPoolSize);

246

247

if (inputTensorIsOutOfMemoryRage)

248

{

249

ALOGE("Cannot execute request. Error converting request input %u to tensor: out of Memory Pool", i);

250

return V1_0::ErrorStatus::GENERAL_FAILURE;

251

}

252

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

253

inputs.emplace_back(i, inputTensor);

254

}

255

256

return V1_0::ErrorStatus::NONE;

257

}

258

259

template<typename HalVersion>

260

Return<V1_0::ErrorStatus> ArmnnPreparedModel_1_2<HalVersion>::PrepareMemoryForOutputs(

261

armnn::OutputTensors& outputs,

Kevin DuBois

2020-11-20 14:54:05 -0800

[diff] [blame]

262

std::vector<V1_2::OutputShape> &outputShapes,

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

263

const V1_0::Request& request,

264

const std::vector<android::nn::RunTimePoolInfo>& memPools)

265

{

266

outputs.reserve(request.outputs.size());

267

for (unsigned int i = 0; i < request.outputs.size(); i++)

268

{

269

const auto& outputArg = request.outputs[i];

270

271

const armnn::TensorInfo outputTensorInfo = m_Runtime->GetOutputTensorInfo(m_NetworkId, i);

272

const armnn::Tensor outputTensor = GetTensorForRequestArgument(outputArg, outputTensorInfo, memPools);

Renato Grottesi

2022-12-14 17:04:16 +0000

[diff] [blame]

273

uint8_t* outputTensorBegin = static_cast<uint8_t*>(outputTensor.GetMemoryArea());

274

if (outputTensorBegin == nullptr)

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

275

{

276

ALOGE("Cannot execute request. Error converting request output %u to tensor", i);

277

return V1_0::ErrorStatus::GENERAL_FAILURE;

278

}

279

280

const size_t outputSize = outputTensorInfo.GetNumBytes();

Finn Williams

a4983ce

2020-07-23 12:55:12 +0100

[diff] [blame]

281

282

if (outputArg.location.length < outputSize)

283

{

284

ALOGW("ArmnnPreparedModel_1_2::Execute failed: outputArg.location.length < outputSize");

285

return V1_0::ErrorStatus::OUTPUT_INSUFFICIENT_SIZE;

286

}

287

Kevin DuBois

bbcff19

2020-11-20 14:36:59 -0800

[diff] [blame]

288

const size_t bufferSize = memPools.at(outputArg.location.poolIndex).getSize();

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

289

if (bufferSize < outputSize)

290

{

Finn Williams

a4983ce

2020-07-23 12:55:12 +0100

[diff] [blame]

291

ALOGW("ArmnnPreparedModel_1_2::Execute failed: bufferSize < outputSize");

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

292

return V1_0::ErrorStatus::OUTPUT_INSUFFICIENT_SIZE;

293

}

294

Renato Grottesi

2022-12-14 17:04:16 +0000

[diff] [blame]

295

uint32_t poolIndex = outputArg.location.poolIndex;

296

if (poolIndex >= memPools.size())

297

{

298

ALOGE("Cannot execute request. Error converting request output %u to tensor: wrong poolIndex", i);

299

return V1_0::ErrorStatus::GENERAL_FAILURE;

300

}

301

302

uint8_t* memoryPoolBegin = memPools[poolIndex].getBuffer();

303

uint32_t memoryPoolSize = memPools[poolIndex].getSize();

304

bool outputTensorIsOutOfMemoryRage = (outputTensorBegin + outputSize) > (memoryPoolBegin + memoryPoolSize);

305

if (outputTensorIsOutOfMemoryRage)

306

{

307

ALOGE("Cannot execute request. Error converting request output %u to tensor: out of Memory Pool", i);

308

return V1_0::ErrorStatus::GENERAL_FAILURE;

309

}

310

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

311

outputs.emplace_back(i, outputTensor);

312

outputShapes[i] = ComputeShape(outputTensorInfo);

313

}

314

315

return V1_0::ErrorStatus::NONE;

316

}

317

318

template<typename HalVersion>

319

Return<V1_0::ErrorStatus> ArmnnPreparedModel_1_2<HalVersion>::PrepareMemoryForIO(

320

armnn::InputTensors& inputs,

321

armnn::OutputTensors& outputs,

322

std::vector<android::nn::RunTimePoolInfo>& memPools,

323

const V1_0::Request& request,

324

CallbackAsync_1_2 callback)

325

{

326

if (!setRunTimePoolInfosFromHidlMemories(&memPools, request.pools))

327

{

328

callback(V1_0::ErrorStatus::GENERAL_FAILURE, {}, g_NoTiming, "ArmnnPreparedModel_1_2::execute");

329

return V1_0::ErrorStatus::GENERAL_FAILURE;

330

}

331

332

// add the inputs and outputs with their data

333

try

334

{

335

if (PrepareMemoryForInputs(inputs, request, memPools) != V1_0::ErrorStatus::NONE)

336

{

337

callback(V1_0::ErrorStatus::GENERAL_FAILURE, {}, g_NoTiming, "ArmnnPreparedModel_1_2::execute");

338

return V1_0::ErrorStatus::GENERAL_FAILURE;

339

}

340

Kevin DuBois

2020-11-20 14:54:05 -0800

[diff] [blame]

341

std::vector<V1_2::OutputShape> outputShapes(request.outputs.size());

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

342

343

auto errorStatus = PrepareMemoryForOutputs(outputs, outputShapes, request, memPools);

344

if (errorStatus != V1_0::ErrorStatus::NONE)

345

{

346

callback(errorStatus,

347

outputShapes,

348

g_NoTiming,

349

"ArmnnPreparedModel_1_2::Execute");

return errorStatus;

}

}

catch (armnn::Exception& e)

354

{

355

ALOGW("armnn::Exception caught while preparing for EnqueueWorkload: %s", e.what());

356

callback(V1_0::ErrorStatus::GENERAL_FAILURE, {}, g_NoTiming, "ArmnnPreparedModel_1_2::execute");

357

return V1_0::ErrorStatus::GENERAL_FAILURE;

358

}

359

catch (std::exception& e)

360

{

361

ALOGE("std::exception caught while preparing for EnqueueWorkload: %s", e.what());

362

callback(V1_0::ErrorStatus::GENERAL_FAILURE, {}, g_NoTiming, "ArmnnPreparedModel_1_2::execute");

363

return V1_0::ErrorStatus::GENERAL_FAILURE;

364

}

365

366

return V1_0::ErrorStatus::NONE;

367

}

368

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

369

template<typename HalVersion>

Kevin DuBois

2020-08-26 13:53:41 -0700

[diff] [blame]

370

Return<void> ArmnnPreparedModel_1_2<HalVersion>::executeSynchronously(const V1_0::Request& request,

Kevin DuBois

2020-11-20 14:54:05 -0800

[diff] [blame]

371

V1_2::MeasureTiming measureTiming,

372

V1_2::IPreparedModel::executeSynchronously_cb cb)

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

373

{

374

ALOGV("ArmnnPreparedModel_1_2::executeSynchronously(): %s", GetModelSummary(m_Model).c_str());

m_RequestCount++;

if (cb == nullptr)

{

ALOGE("ArmnnPreparedModel_1_2::executeSynchronously invalid callback passed");

return Void();

}

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

383

TimePoint driverStart;

Mike Kelly

2019-07-08 17:37:35 +0100

[diff] [blame]

384

Kevin DuBois

2020-11-20 14:54:05 -0800

[diff] [blame]

385

if (measureTiming == V1_2::MeasureTiming::YES)

Mike Kelly

2019-07-08 17:37:35 +0100

[diff] [blame]

{

driverStart = Now();

}

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

390

if (!android::nn::validateRequest(request, m_Model))

391

{

Mike Kelly

2019-07-08 17:37:35 +0100

[diff] [blame]

392

ALOGE("ArmnnPreparedModel_1_2::executeSynchronously invalid request model");

Kevin DuBois

2020-08-26 13:53:41 -0700

[diff] [blame]

393

cb(V1_0::ErrorStatus::INVALID_ARGUMENT, {}, g_NoTiming);

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

return Void();

}

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

397

auto cbWrapper = [cb](V1_0::ErrorStatus errorStatus,

Kevin DuBois

2020-11-20 14:54:05 -0800

[diff] [blame]

398

std::vector<V1_2::OutputShape> outputShapes,

399

const V1_2::Timing& timing,

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

400

std::string)

401

{

402

cb(errorStatus, outputShapes, timing);

403

};

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

404

405

// map the memory pool into shared pointers

406

// use a shared memory pools vector on the heap, as it is passed to the request thread

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

407

auto memPools = std::make_shared<std::vector<android::nn::RunTimePoolInfo>>();

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

408

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

409

// allocate the tensors on the heap, as they are passed to the request thread

410

auto inputs = std::make_shared<armnn::InputTensors>();

411

auto outputs = std::make_shared<armnn::OutputTensors>();

412

413

auto prepareStatus = PrepareMemoryForIO(*inputs, *outputs, *memPools, request, cbWrapper);

414

if (prepareStatus != V1_0::ErrorStatus::NONE)

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

415

{

Kevin May

2020-02-10 12:10:07 +0000

[diff] [blame]

return Void();

}

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

419

ALOGV("ArmnnPreparedModel_1_2::executeSynchronously() before Execution");

420

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

421

CallbackContext_1_2 cbCtx;

422

cbCtx.callback = cbWrapper;

423

cbCtx.ctx.measureTimings = measureTiming;

424

cbCtx.ctx.driverStart = driverStart;

425

ExecuteGraph(memPools, *inputs, *outputs, cbCtx);

Mike Kelly

2019-07-08 17:37:35 +0100

[diff] [blame]

426

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

return Void();

}

template<typename HalVersion>

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

431

template<typename CallbackContext>

432

bool ArmnnPreparedModel_1_2<HalVersion>::ExecuteGraph(

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

433

std::shared_ptr<std::vector<::android::nn::RunTimePoolInfo>>& pMemPools,

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

434

armnn::InputTensors& inputTensors,

435

armnn::OutputTensors& outputTensors,

436

CallbackContext cb)

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

437

{

438

ALOGV("ArmnnPreparedModel_1_2::ExecuteGraph(...)");

439

Mike Kelly

2019-07-22 14:06:00 +0100

[diff] [blame]

440

TimePoint driverEnd, deviceStart, deviceEnd;

441

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

442

DumpTensorsIfRequired("Input", inputTensors);

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

443

Kevin DuBois

2020-11-20 14:54:05 -0800

[diff] [blame]

444

std::vector<V1_2::OutputShape> outputShapes(outputTensors.size());

Mike Kelly

2019-07-22 14:06:00 +0100

[diff] [blame]

445

for (unsigned int i = 0; i < outputTensors.size(); i++)

446

{

447

std::pair<int, armnn::Tensor> outputTensorPair = outputTensors[i];

448

const armnn::Tensor outputTensor = outputTensorPair.second;

449

const armnn::TensorInfo outputTensorInfo = outputTensor.GetInfo();

450

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

451

outputShapes[i] = ComputeShape(outputTensorInfo);

Mike Kelly

2019-07-22 14:06:00 +0100

[diff] [blame]

452

}

453

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

454

// run it

455

try

456

{

Kevin DuBois

2020-11-20 14:54:05 -0800

[diff] [blame]

457

if (cb.ctx.measureTimings == V1_2::MeasureTiming::YES)

Mike Kelly

2019-07-22 14:06:00 +0100

[diff] [blame]

{

deviceStart = Now();

}

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

462

armnn::Status status = m_Runtime->EnqueueWorkload(m_NetworkId, inputTensors, outputTensors);

Mike Kelly

2019-07-22 14:06:00 +0100

[diff] [blame]

463

Kevin DuBois

2020-11-20 14:54:05 -0800

[diff] [blame]

464

if (cb.ctx.measureTimings == V1_2::MeasureTiming::YES)

Mike Kelly

2019-07-22 14:06:00 +0100

[diff] [blame]

465

{

466

deviceEnd = Now();

467

}

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

468

if (status != armnn::Status::Success)

469

{

470

ALOGW("EnqueueWorkload failed");

Kevin DuBois

2020-08-26 13:53:41 -0700

[diff] [blame]

471

cb.callback(V1_0::ErrorStatus::GENERAL_FAILURE, {}, g_NoTiming,

Mike Kelly

2019-07-22 14:06:00 +0100

[diff] [blame]

472

"ArmnnPreparedModel_1_2::ExecuteGraph");

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

473

return false;

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

474

}

475

}

Kevin May

2020-02-10 12:10:07 +0000

[diff] [blame]

476

catch (armnn::Exception& e)

477

{

478

ALOGW("armnn:Exception caught from EnqueueWorkload: %s", e.what());

Kevin DuBois

2020-08-26 13:53:41 -0700

[diff] [blame]

479

cb.callback(V1_0::ErrorStatus::GENERAL_FAILURE, {}, g_NoTiming, "ArmnnPreparedModel_1_2::ExecuteGraph");

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

480

return false;

Kevin May

2020-02-10 12:10:07 +0000

[diff] [blame]

481

}

Derek Lamberti

b9cb844

2019-11-28 13:34:48 +0000

[diff] [blame]

482

catch (std::exception& e)

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

483

{

Kevin May

2020-02-10 12:10:07 +0000

[diff] [blame]

484

ALOGE("std::exception caught from EnqueueWorkload: %s", e.what());

Kevin DuBois

2020-08-26 13:53:41 -0700

[diff] [blame]

485

cb.callback(V1_0::ErrorStatus::GENERAL_FAILURE, {}, g_NoTiming, "ArmnnPreparedModel_1_2::ExecuteGraph");

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

486

return false;

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

487

}

488

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

489

CommitPools(*pMemPools);

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

490

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

491

DumpTensorsIfRequired("Output", outputTensors);

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

492

Kevin DuBois

17c424b

2020-11-20 14:18:03 -0800

[diff] [blame]

493

if (cb.ctx.measureTimings == V1_2::MeasureTiming::YES)

Mike Kelly

2019-07-22 14:06:00 +0100

[diff] [blame]

494

{

495

driverEnd = Now();

Kevin DuBois

2020-08-26 13:53:41 -0700

[diff] [blame]

496

V1_2::Timing timing;

Mike Kelly

2019-07-22 14:06:00 +0100

[diff] [blame]

497

timing.timeOnDevice = MicrosecondsDuration(deviceEnd, deviceStart);

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

498

timing.timeInDriver = MicrosecondsDuration(driverEnd, cb.ctx.driverStart);

Kevin DuBois

17c424b

2020-11-20 14:18:03 -0800

[diff] [blame]

499

ALOGV("ArmnnPreparedModel_1_2::execute timing - Device = %" PRIu64 " Driver = %" PRIu64, timing.timeOnDevice,

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

500

timing.timeInDriver);

501

cb.callback(V1_0::ErrorStatus::NONE, outputShapes, timing, "ArmnnPreparedModel_1_2::ExecuteGraph");

Mike Kelly

2019-07-22 14:06:00 +0100

[diff] [blame]

502

} else {

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

503

cb.callback(V1_0::ErrorStatus::NONE, outputShapes, g_NoTiming, "ArmnnPreparedModel_1_2::ExecuteGraph");

Mike Kelly

2019-07-22 14:06:00 +0100

[diff] [blame]

504

}

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

505

506

return true;

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

507

}

508

509

template<typename HalVersion>

510

bool ArmnnPreparedModel_1_2<HalVersion>::ExecuteWithDummyInputs()

511

{

512

std::vector<std::vector<char>> storage;

513

armnn::InputTensors inputTensors;

Kevin May

42477c1

2020-03-26 13:34:14 +0000

[diff] [blame]

514

for (unsigned int i = 0; i < getMainModel(m_Model).inputIndexes.size(); i++)

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

515

{

516

const armnn::TensorInfo inputTensorInfo = m_Runtime->GetInputTensorInfo(m_NetworkId, i);

517

storage.emplace_back(inputTensorInfo.GetNumBytes());

518

const armnn::ConstTensor inputTensor(inputTensorInfo, storage.back().data());

519

520

inputTensors.emplace_back(i, inputTensor);

521

}

522

523

armnn::OutputTensors outputTensors;

Kevin May

42477c1

2020-03-26 13:34:14 +0000

[diff] [blame]

524

for (unsigned int i = 0; i < getMainModel(m_Model).outputIndexes.size(); i++)

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

525

{

526

const armnn::TensorInfo outputTensorInfo = m_Runtime->GetOutputTensorInfo(m_NetworkId, i);

527

storage.emplace_back(outputTensorInfo.GetNumBytes());

528

const armnn::Tensor outputTensor(outputTensorInfo, storage.back().data());

529

530

outputTensors.emplace_back(i, outputTensor);

531

}

532

Kevin DuBois

2020-11-20 14:54:05 -0800

[diff] [blame]

533

auto nullCallback = [](V1_0::ErrorStatus, std::vector<V1_2::OutputShape>, const V1_2::Timing&, std::string) {};

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

534

CallbackContext_1_2 callbackContext;

535

callbackContext.callback = nullCallback;

Kevin DuBois

2020-11-20 14:54:05 -0800

[diff] [blame]

536

callbackContext.ctx.measureTimings = V1_2::MeasureTiming::NO;

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

537

auto memPools = std::make_shared<std::vector<::android::nn::RunTimePoolInfo>>();

538

return ExecuteGraph(memPools,

539

inputTensors,

540

outputTensors,

541

callbackContext);

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

542

}

543

544

template<typename HalVersion>

Kevin DuBois

2020-08-26 13:53:41 -0700

[diff] [blame]

545

Return <V1_0::ErrorStatus> ArmnnPreparedModel_1_2<HalVersion>::Execute(const V1_0::Request& request,

Kevin DuBois

2020-11-20 14:54:05 -0800

[diff] [blame]

546

V1_2::MeasureTiming measureTiming,

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

547

CallbackAsync_1_2 callback)

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

548

{

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

549

ExecutionContext_1_2 ctx;

Kevin DuBois

2020-11-20 14:54:05 -0800

[diff] [blame]

550

if (measureTiming == V1_2::MeasureTiming::YES)

Mike Kelly

2019-07-22 14:06:00 +0100

[diff] [blame]

551

{

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

552

ctx.measureTimings = measureTiming;

553

ctx.driverStart = Now();

Mike Kelly

2019-07-22 14:06:00 +0100

[diff] [blame]

554

}

555

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

556

ALOGV("ArmnnPreparedModel_1_2::execute(): %s", GetModelSummary(m_Model).c_str());

557

m_RequestCount++;

558

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

559

if (!android::nn::validateRequest(request, m_Model))

560

{

Kevin DuBois

2020-08-26 13:53:41 -0700

[diff] [blame]

561

callback(V1_0::ErrorStatus::INVALID_ARGUMENT, {}, g_NoTiming, "ArmnnPreparedModel_1_2::execute");

562

return V1_0::ErrorStatus::INVALID_ARGUMENT;

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

563

}

564

565

if (!m_RequestInputsAndOutputsDumpDir.empty())

566

{

Mike Kelly

2019-07-22 14:06:00 +0100

[diff] [blame]

567

ALOGD("Dumping inputs and outputs for request %" PRIuPTR, reinterpret_cast<std::uintptr_t>(&callback));

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

568

}

569

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

570

// map the memory pool into shared pointers

571

// use a shared memory pools vector on the heap, as it is passed to the request thread

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

572

auto memPools = std::make_shared<std::vector<android::nn::RunTimePoolInfo>>();

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

573

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

574

// allocate the tensors on the heap, as they are passed to the request thread

575

auto inputTensors = std::make_shared<armnn::InputTensors>();

576

auto outputTensors = std::make_shared<armnn::OutputTensors>();

577

578

auto prepareStatus = PrepareMemoryForIO(*inputTensors, *outputTensors, *memPools, request, callback);

579

switch(prepareStatus)

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

580

{

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

581

case V1_0::ErrorStatus::OUTPUT_INSUFFICIENT_SIZE:

582

return V1_0::ErrorStatus::NONE;

583

case V1_0::ErrorStatus::GENERAL_FAILURE:

584

return V1_0::ErrorStatus::GENERAL_FAILURE;

585

default:

586

{}

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

587

}

588

589

ALOGV("ArmnnPreparedModel_1_2::execute(...) before PostMsg");

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

590

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

591

// post the request for asynchronous execution

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

592

CallbackContext_1_2 cb;

593

cb.callback = callback;

594

cb.ctx = ctx;

595

m_RequestThread.PostMsg(this, memPools, inputTensors, outputTensors, cb);

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

596

ALOGV("ArmnnPreparedModel_1_2::execute(...) after PostMsg");

Kevin DuBois

2020-08-26 13:53:41 -0700

[diff] [blame]

597

return V1_0::ErrorStatus::NONE;

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

598

}

599

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

600

template<typename HalVersion>

601

Return<void> ArmnnPreparedModel_1_2<HalVersion>::configureExecutionBurst(

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

602

const sp<V1_2::IBurstCallback>& callback,

603

const MQDescriptorSync<V1_2::FmqRequestDatum>& requestChannel,

604

const MQDescriptorSync<V1_2::FmqResultDatum>& resultChannel,

605

V1_2::IPreparedModel::configureExecutionBurst_cb cb)

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

606

{

607

ALOGV("ArmnnPreparedModel_1_2::configureExecutionBurst");

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

608

const sp<V1_2::IBurstContext> burst = ExecutionBurstServer::create(callback,

609

requestChannel,

610

resultChannel,

Kevin May

42477c1

2020-03-26 13:34:14 +0000

[diff] [blame]

611

this);

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

612

613

if (burst == nullptr)

614

{

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame]

615

cb(V1_0::ErrorStatus::GENERAL_FAILURE, {});

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

616

}

617

else

618

{

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame]

619

cb(V1_0::ErrorStatus::NONE, burst);

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

}

return Void();

}

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

624

#if defined(ARMNN_ANDROID_NN_V1_2) || defined(ARMNN_ANDROID_NN_V1_3)

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

625

template class ArmnnPreparedModel_1_2<hal_1_2::HalPolicy>;

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

626

template bool ArmnnPreparedModel_1_2<hal_1_2::HalPolicy>::ExecuteGraph<CallbackContext_1_2>(

627

std::shared_ptr<std::vector<::android::nn::RunTimePoolInfo>>& pMemPools,

628

armnn::InputTensors& pInputTensors,

629

armnn::OutputTensors& pOutputTensors,

630

CallbackContext_1_2 cb);

Mike Kelly