Blame - poky/scripts/lib/resulttool/regression.py - mdmillerii/openbmc

2023-08-11 09:48:11 -0500

[diff] [blame]

180

def get_status_str(raw_status):

181

raw_status_lower = raw_status.lower() if raw_status else "None"

182

return STATUS_STRINGS.get(raw_status_lower, raw_status)

Andrew Geissler

6aa7eec

2023-03-03 12:41:14 -0600

[diff] [blame]

183

Brad Bishop

2019-03-26 16:08:25 -0400

[diff] [blame]

184

def compare_result(logger, base_name, target_name, base_result, target_result):

185

base_result = base_result.get('result')

186

target_result = target_result.get('result')

187

result = {}

Patrick Williams

2023-08-11 09:48:11 -0500

[diff] [blame]

188

new_tests = 0

189

Brad Bishop

2019-03-26 16:08:25 -0400

[diff] [blame]

190

if base_result and target_result:

191

for k in base_result:

192

base_testcase = base_result[k]

193

base_status = base_testcase.get('status')

194

if base_status:

195

target_testcase = target_result.get(k, {})

196

target_status = target_testcase.get('status')

197

if base_status != target_status:

198

result[k] = {'base': base_status, 'target': target_status}

199

else:

200

logger.error('Failed to retrieved base test case status: %s' % k)

Patrick Williams

2023-08-11 09:48:11 -0500

[diff] [blame]

201

202

# Also count new tests that were not present in base results: it

203

# could be newly added tests, but it could also highlights some tests

204

# renames or fixed faulty ptests

205

for k in target_result:

206

if k not in base_result:

207

new_tests += 1

Brad Bishop

2019-03-26 16:08:25 -0400

[diff] [blame]

208

if result:

Andrew Geissler

2023-03-31 09:59:46 -0500

[diff] [blame]

209

new_pass_count = sum(test['target'] is not None and test['target'].startswith("PASS") for test in result.values())

210

# Print a regression report only if at least one test has a regression status (FAIL, SKIPPED, absent...)

211

if new_pass_count < len(result):

212

resultstring = "Regression: %s\n %s\n" % (base_name, target_name)

213

for k in sorted(result):

214

if not result[k]['target'] or not result[k]['target'].startswith("PASS"):

Patrick Williams

2023-08-11 09:48:11 -0500

[diff] [blame]

215

resultstring += ' %s: %s -> %s\n' % (k, get_status_str(result[k]['base']), get_status_str(result[k]['target']))

Andrew Geissler

2023-03-31 09:59:46 -0500

[diff] [blame]

216

if new_pass_count > 0:

217

resultstring += f' Additionally, {new_pass_count} previously failing test(s) is/are now passing\n'

218

else:

Patrick Williams

2023-08-11 09:48:11 -0500

[diff] [blame]

219

resultstring = "Improvement: %s\n %s\n (+%d test(s) passing)\n" % (base_name, target_name, new_pass_count)

Andrew Geissler

2023-03-31 09:59:46 -0500

[diff] [blame]

220

result = None

Brad Bishop

2019-03-26 16:08:25 -0400

[diff] [blame]

221

else:

Patrick Williams

2023-08-11 09:48:11 -0500

[diff] [blame]

222

resultstring = "Match: %s\n %s\n" % (base_name, target_name)

223

224

if new_tests > 0:

225

resultstring += f' Additionally, {new_tests} new test(s) is/are present\n'

Brad Bishop

2019-03-26 16:08:25 -0400

[diff] [blame]

226

return result, resultstring

227

228

def get_results(logger, source):

229

return resultutils.load_resultsdata(source, configmap=resultutils.regression_map)

230

231

def regression(args, logger):

232

base_results = get_results(logger, args.base_result)

233

target_results = get_results(logger, args.target_result)

234

235

regression_common(args, logger, base_results, target_results)

236

Andrew Geissler

2023-03-31 09:59:46 -0500

[diff] [blame]

237

# Some test case naming is poor and contains random strings, particularly lttng/babeltrace.

238

# Truncating the test names works since they contain file and line number identifiers

239

# which allows us to match them without the random components.

240

def fixup_ptest_names(results, logger):

241

for r in results:

242

for i in results[r]:

243

tests = list(results[r][i]['result'].keys())

244

for test in tests:

245

new = None

246

if test.startswith(("ptestresult.lttng-tools.", "ptestresult.babeltrace.", "ptestresult.babeltrace2")) and "_-_" in test:

247

new = test.split("_-_")[0]

248

elif test.startswith(("ptestresult.curl.")) and "__" in test:

249

new = test.split("__")[0]

250

elif test.startswith(("ptestresult.dbus.")) and "__" in test:

251

new = test.split("__")[0]

252

elif test.startswith("ptestresult.binutils") and "build-st-" in test:

253

new = test.split(" ")[0]

254

elif test.startswith("ptestresult.gcc") and "/tmp/runtest." in test:

255

new = ".".join(test.split(".")[:2])

256

if new:

257

results[r][i]['result'][new] = results[r][i]['result'][test]

258

del results[r][i]['result'][test]

259

Brad Bishop

2019-03-26 16:08:25 -0400

[diff] [blame]

260

def regression_common(args, logger, base_results, target_results):

261

if args.base_result_id:

262

base_results = resultutils.filter_resultsdata(base_results, args.base_result_id)

263

if args.target_result_id:

264

target_results = resultutils.filter_resultsdata(target_results, args.target_result_id)

265

Andrew Geissler

2023-03-31 09:59:46 -0500

[diff] [blame]

266

fixup_ptest_names(base_results, logger)

267

fixup_ptest_names(target_results, logger)

268

Brad Bishop

2019-03-26 16:08:25 -0400

[diff] [blame]

matches = []

regressions = []

notfound = []

for a in base_results:

274

if a in target_results:

275

base = list(base_results[a].keys())

276

target = list(target_results[a].keys())

Brad Bishop

c342db3

2019-05-15 21:57:59 -0400

[diff] [blame]

277

# We may have multiple base/targets which are for different configurations. Start by

Brad Bishop

2019-03-26 16:08:25 -0400

[diff] [blame]

278

# removing any pairs which match

279

for c in base.copy():

280

for b in target.copy():

Andrew Geissler

6aa7eec

2023-03-03 12:41:14 -0600

[diff] [blame]

281

if not can_be_compared(logger, base_results[a][c], target_results[a][b]):

282

continue

Brad Bishop

2019-03-26 16:08:25 -0400

[diff] [blame]

283

res, resstr = compare_result(logger, c, b, base_results[a][c], target_results[a][b])

284

if not res:

285

matches.append(resstr)

base.remove(c)

target.remove(b)

break

# Should only now see regressions, we may not be able to match multiple pairs directly

290

for c in base:

291

for b in target:

Andrew Geissler

6aa7eec

2023-03-03 12:41:14 -0600

[diff] [blame]

292

if not can_be_compared(logger, base_results[a][c], target_results[a][b]):

293

continue

Brad Bishop

2019-03-26 16:08:25 -0400

[diff] [blame]

294

res, resstr = compare_result(logger, c, b, base_results[a][c], target_results[a][b])

295

if res:

296

regressions.append(resstr)

297

else:

298

notfound.append("%s not found in target" % a)

299

print("\n".join(sorted(matches)))

Andrew Geissler

2023-03-31 09:59:46 -0500

[diff] [blame]

300

print("\n")

Brad Bishop

2019-03-26 16:08:25 -0400

[diff] [blame]

301

print("\n".join(sorted(regressions)))

302

print("\n".join(sorted(notfound)))

Brad Bishop

2019-03-26 16:08:25 -0400

[diff] [blame]

303

return 0

304

305

def regression_git(args, logger):

base_results = {}

target_results = {}

tag_name = "{branch}/{commit_number}-g{commit}/{tag_number}"

310

repo = GitRepo(args.repo)

311

312

revs = gitarchive.get_test_revs(logger, repo, tag_name, branch=args.branch)

313

314

if args.branch2:

315

revs2 = gitarchive.get_test_revs(logger, repo, tag_name, branch=args.branch2)

316

if not len(revs2):

317

logger.error("No revisions found to compare against")

318

return 1

319

if not len(revs):

320

logger.error("No revision to report on found")

return 1

else:

if len(revs) < 2:

logger.error("Only %d tester revisions found, unable to generate report" % len(revs))

return 1

# Pick revisions

if args.commit:

if args.commit_number:

330

logger.warning("Ignoring --commit-number as --commit was specified")

331

index1 = gitarchive.rev_find(revs, 'commit', args.commit)

332

elif args.commit_number:

333

index1 = gitarchive.rev_find(revs, 'commit_number', args.commit_number)

334

else:

335

index1 = len(revs) - 1

336

337

if args.branch2:

338

revs2.append(revs[index1])

339

index1 = len(revs2) - 1

revs = revs2

if args.commit2:

if args.commit_number2:

344

logger.warning("Ignoring --commit-number2 as --commit2 was specified")

345

index2 = gitarchive.rev_find(revs, 'commit', args.commit2)

346

elif args.commit_number2:

347

index2 = gitarchive.rev_find(revs, 'commit_number', args.commit_number2)

else:

if index1 > 0:

index2 = index1 - 1

# Find the closest matching commit number for comparision

352

# In future we could check the commit is a common ancestor and

353

# continue back if not but this good enough for now

354

while index2 > 0 and revs[index2].commit_number > revs[index1].commit_number:

355

index2 = index2 - 1

356

else:

357

logger.error("Unable to determine the other commit, use "

358

"--commit2 or --commit-number2 to specify it")

359

return 1

360

361

logger.info("Comparing:\n%s\nto\n%s\n" % (revs[index1], revs[index2]))

362

363

base_results = resultutils.git_get_result(repo, revs[index1][2])

364

target_results = resultutils.git_get_result(repo, revs[index2][2])

365

366

regression_common(args, logger, base_results, target_results)

return 0

def register_commands(subparsers):

371

"""Register subcommands from this plugin"""

372

373

parser_build = subparsers.add_parser('regression', help='regression file/directory analysis',

374

description='regression analysis comparing the base set of results to the target results',

375

group='analysis')

376

parser_build.set_defaults(func=regression)

377

parser_build.add_argument('base_result',

Brad Bishop

c342db3

2019-05-15 21:57:59 -0400

[diff] [blame]

378

help='base result file/directory/URL for the comparison')

Brad Bishop

2019-03-26 16:08:25 -0400

[diff] [blame]

379

parser_build.add_argument('target_result',

Brad Bishop

c342db3

2019-05-15 21:57:59 -0400

[diff] [blame]

380

help='target result file/directory/URL to compare with')

Brad Bishop