Blame - client/bin/job.py - platform/external/autotest

2006-07-28 17:35:28 +0000

[diff] [blame]

1

"""The main job wrapper

mbligh

a250805

2006-05-28 21:29:53 +0000

[diff] [blame]

2

mbligh

2006-07-28 17:35:28 +0000

[diff] [blame]

3

This is the core infrastructure.

4

"""

5

6

__author__ = """Copyright Andy Whitcroft, Martin J. Bligh 2006"""

mbligh

a250805

2006-05-28 21:29:53 +0000

[diff] [blame]

7

mbligh

8f243ec

2006-10-10 05:55:49 +0000

[diff] [blame]

8

# standard stuff

mbligh

2008-04-25 16:07:56 +0000

[diff] [blame]

9

import os, sys, re, pickle, shutil, time, traceback, types, copy

mbligh

302482e

2008-05-01 20:06:16 +0000

[diff] [blame]

10

mbligh

8f243ec

2006-10-10 05:55:49 +0000

[diff] [blame]

11

# autotest stuff

mbligh

c61fb36

2008-06-05 16:22:15 +0000

[diff] [blame]

12

from autotest_lib.client.bin import autotest_utils, parallel, kernel, xen

13

from autotest_lib.client.bin import profilers, fd_stack, boottool, harness

14

from autotest_lib.client.bin import config, sysinfo, cpuset, test, filesystem

mbligh

e829ba5

2008-06-03 15:04:08 +0000

[diff] [blame]

15

from autotest_lib.client.common_lib import error, barrier, logging, utils

mbligh

302482e

2008-05-01 20:06:16 +0000

[diff] [blame]

16

mbligh

2008-04-25 16:07:56 +0000

[diff] [blame]

17

JOB_PREAMBLE = """

18

from common.error import *

19

from autotest_utils import *

20

"""

21

mbligh

302482e

2008-05-01 20:06:16 +0000

[diff] [blame]

22

class StepError(error.AutotestError):

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

23

pass

mbligh

12a04cb

2008-04-25 16:07:20 +0000

[diff] [blame]

24

25

mbligh

2008-04-07 21:51:17 +0000

[diff] [blame]

26

class base_job:

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

27

"""The actual job against which we do everything.

mbligh

2006-07-28 17:35:28 +0000

[diff] [blame]

28

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

29

Properties:

30

autodir

31

The top level autotest directory (/usr/local/autotest).

32

Comes from os.environ['AUTODIR'].

bindir

<autodir>/bin/

libdir

<autodir>/lib/

testdir

<autodir>/tests/

site_testdir

<autodir>/site_tests/

profdir

<autodir>/profilers/

tmpdir

<autodir>/tmp/

resultdir

<autodir>/results/<jobtag>

47

stdout

48

fd_stack object for stdout

49

stderr

50

fd_stack object for stderr

51

profilers

52

the profilers object for this job

53

harness

54

the server harness object for this job

55

config

56

the job configuration for this job

57

"""

mbligh

2006-07-28 17:35:28 +0000

[diff] [blame]

58

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

59

DEFAULT_LOG_FILENAME = "status"

mbligh

2007-12-19 16:19:05 +0000

[diff] [blame]

60

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

61

def __init__(self, control, jobtag, cont, harness_type=None,

62

use_external_logging = False):

63

"""

64

control

65

The control file (pathname of)

66

jobtag

67

The job tag string (eg "default")

68

cont

69

If this is the continuation of this job

70

harness_type

71

An alternative server harness

72

"""

73

self.autodir = os.environ['AUTODIR']

74

self.bindir = os.path.join(self.autodir, 'bin')

75

self.libdir = os.path.join(self.autodir, 'lib')

76

self.testdir = os.path.join(self.autodir, 'tests')

77

self.site_testdir = os.path.join(self.autodir, 'site_tests')

78

self.profdir = os.path.join(self.autodir, 'profilers')

79

self.tmpdir = os.path.join(self.autodir, 'tmp')

80

self.resultdir = os.path.join(self.autodir, 'results', jobtag)

81

self.sysinfodir = os.path.join(self.resultdir, 'sysinfo')

82

self.control = os.path.abspath(control)

83

self.state_file = self.control + '.state'

84

self.current_step_ancestry = []

85

self.next_step_index = 0

86

self.__load_state()

mbligh

a250805

2006-05-28 21:29:53 +0000

[diff] [blame]

87

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

88

if not cont:

89

"""

90

Don't cleanup the tmp dir (which contains the lockfile)

91

in the constructor, this would be a problem for multiple

92

jobs starting at the same time on the same client. Instead

93

do the delete at the server side. We simply create the tmp

94

directory here if it does not already exist.

95

"""

96

if not os.path.exists(self.tmpdir):

97

os.mkdir(self.tmpdir)

apw

96da1a4

2006-11-02 00:23:18 +0000

[diff] [blame]

98

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

99

results = os.path.join(self.autodir, 'results')

100

if not os.path.exists(results):

101

os.mkdir(results)

mbligh

c1cbc99

2008-05-27 20:01:45 +0000

[diff] [blame]

102

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

103

download = os.path.join(self.testdir, 'download')

104

if not os.path.exists(download):

105

os.mkdir(download)

apw

96da1a4

2006-11-02 00:23:18 +0000

[diff] [blame]

106

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

107

if os.path.exists(self.resultdir):

mbligh

2008-06-06 22:48:19 +0000

[diff] [blame]

108

utils.system('rm -rf ' + self.resultdir)

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

109

os.mkdir(self.resultdir)

110

os.mkdir(self.sysinfodir)

apw

870988b

2007-09-25 16:50:53 +0000

[diff] [blame]

111

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

112

os.mkdir(os.path.join(self.resultdir, 'debug'))

113

os.mkdir(os.path.join(self.resultdir, 'analysis'))

mbligh

f4ca14f

2008-03-03 16:03:05 +0000

[diff] [blame]

114

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

115

shutil.copyfile(self.control,

116

os.path.join(self.resultdir, 'control'))

mbligh

4b08966

2006-06-14 22:34:58 +0000

[diff] [blame]

117

mbligh

f4c3532

2006-03-13 01:01:10 +0000

[diff] [blame]

118

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

119

self.control = control

120

self.jobtag = jobtag

121

self.log_filename = self.DEFAULT_LOG_FILENAME

122

self.container = None

jadmanski

2008-05-01 22:05:31 +0000

[diff] [blame]

123

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

124

self.stdout = fd_stack.fd_stack(1, sys.stdout)

125

self.stderr = fd_stack.fd_stack(2, sys.stderr)

mbligh

f4c3532

2006-03-13 01:01:10 +0000

[diff] [blame]

126

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

127

self._init_group_level()

apw

059e1b1

2006-10-12 17:18:26 +0000

[diff] [blame]

128

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

129

self.config = config.config(self)

apw

d27e55f

2006-12-01 11:22:08 +0000

[diff] [blame]

130

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

131

self.harness = harness.select(harness_type, self)

mbligh

7290556

2006-05-25 01:30:49 +0000

[diff] [blame]

132

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

133

self.profilers = profilers.profilers(self)

mbligh

2006-10-02 00:37:35 +0000

[diff] [blame]

134

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

135

try:

136

tool = self.config_get('boottool.executable')

137

self.bootloader = boottool.boottool(tool)

138

except:

139

pass

mbligh

3a6d6ca

2006-04-23 15:50:24 +0000

[diff] [blame]

140

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

141

sysinfo.log_per_reboot_data(self.sysinfodir)

apw

357f50f

2006-12-01 11:22:39 +0000

[diff] [blame]

142

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

143

if not cont:

144

self.record('START', None, None)

145

self._increment_group_level()

apw

f91efaf

2007-11-24 17:32:13 +0000

[diff] [blame]

146

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

147

self.harness.run_start()

jadmanski

2008-05-06 20:38:53 +0000

[diff] [blame]

148

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

149

if use_external_logging:

150

self.enable_external_logging()

jadmanski

2008-05-06 20:38:53 +0000

[diff] [blame]

151

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

152

# load the max disk usage rate - default to no monitoring

mbligh

2008-06-06 22:48:19 +0000

[diff] [blame]

153

self.max_disk_usage_rate = self.get_state('__monitor_disk', default=0.0)

jadmanski

2008-05-06 20:38:53 +0000

[diff] [blame]

154

jadmanski

2008-05-06 20:38:53 +0000

[diff] [blame]

155

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

156

def monitor_disk_usage(self, max_rate):

157

"""\

158

Signal that the job should monitor disk space usage on /

159

and generate a warning if a test uses up disk space at a

160

rate exceeding 'max_rate'.

mbligh

0692e47

2007-08-30 16:07:53 +0000

[diff] [blame]

161

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

162

Parameters:

163

max_rate - the maximium allowed rate of disk consumption

164

during a test, in MB/hour, or 0 to indicate

165

no limit.

166

"""

167

self.set_state('__monitor_disk', max_rate)

168

self.max_disk_usage_rate = max_rate

mbligh

0692e47

2007-08-30 16:07:53 +0000

[diff] [blame]

169

170

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

171

def relative_path(self, path):

172

"""\

173

Return a patch relative to the job results directory

174

"""

175

head = len(self.resultdir) + 1 # remove the / inbetween

176

return path[head:]

mbligh

362ab3d

2007-08-30 11:24:04 +0000

[diff] [blame]

177

mbligh

2006-10-02 00:37:35 +0000

[diff] [blame]

178

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

179

def control_get(self):

180

return self.control

mbligh

8d83cdc

2007-12-03 18:09:18 +0000

[diff] [blame]

181

182

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

183

def control_set(self, control):

184

self.control = os.path.abspath(control)

apw

de1503a

2006-10-10 08:34:21 +0000

[diff] [blame]

185

186

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

187

def harness_select(self, which):

188

self.harness = harness.select(which, self)

apw

059e1b1

2006-10-12 17:18:26 +0000

[diff] [blame]

189

190

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

191

def config_set(self, name, value):

192

self.config.set(name, value)

apw

059e1b1

2006-10-12 17:18:26 +0000

[diff] [blame]

193

mbligh

1e8858e

2006-11-24 22:18:35 +0000

[diff] [blame]

194

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

195

def config_get(self, name):

196

return self.config.get(name)

mbligh

72b88fc

2006-12-16 18:41:35 +0000

[diff] [blame]

197

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

198

def setup_dirs(self, results_dir, tmp_dir):

199

if not tmp_dir:

200

tmp_dir = os.path.join(self.tmpdir, 'build')

201

if not os.path.exists(tmp_dir):

202

os.mkdir(tmp_dir)

203

if not os.path.isdir(tmp_dir):

204

e_msg = "Temp dir (%s) is not a dir - args backwards?" % self.tmpdir

205

raise ValueError(e_msg)

mbligh

8baa2ea

2006-12-17 23:01:24 +0000

[diff] [blame]

206

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

207

# We label the first build "build" and then subsequent ones

208

# as "build.2", "build.3", etc. Whilst this is a little bit

209

# inconsistent, 99.9% of jobs will only have one build

210

# (that's not done as kernbench, sparse, or buildtest),

211

# so it works out much cleaner. One of life's comprimises.

212

if not results_dir:

213

results_dir = os.path.join(self.resultdir, 'build')

214

i = 2

215

while os.path.exists(results_dir):

216

results_dir = os.path.join(self.resultdir, 'build.%d' % i)

217

i += 1

218

if not os.path.exists(results_dir):

219

os.mkdir(results_dir)

mbligh

8baa2ea

2006-12-17 23:01:24 +0000

[diff] [blame]

220

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

221

return (results_dir, tmp_dir)

mbligh

8baa2ea

2006-12-17 23:01:24 +0000

[diff] [blame]

222

223

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

224

def xen(self, base_tree, results_dir = '', tmp_dir = '', leave = False, \

225

kjob = None ):

226

"""Summon a xen object"""

227

(results_dir, tmp_dir) = self.setup_dirs(results_dir, tmp_dir)

228

build_dir = 'xen'

229

return xen.xen(self, base_tree, results_dir, tmp_dir, build_dir, leave, kjob)

mbligh

f4c3532

2006-03-13 01:01:10 +0000

[diff] [blame]

230

mbligh

2006-10-02 00:37:35 +0000

[diff] [blame]

231

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

232

def kernel(self, base_tree, results_dir = '', tmp_dir = '', leave = False):

233

"""Summon a kernel object"""

234

(results_dir, tmp_dir) = self.setup_dirs(results_dir, tmp_dir)

235

build_dir = 'linux'

mbligh

2008-06-06 22:48:19 +0000

[diff] [blame]

236

return kernel.auto_kernel(self, base_tree, results_dir, tmp_dir,

237

build_dir, leave)

mbligh

fadca20

2006-09-23 04:40:01 +0000

[diff] [blame]

238

mbligh

2006-10-02 00:37:35 +0000

[diff] [blame]

239

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

240

def barrier(self, *args, **kwds):

241

"""Create a barrier object"""

242

return barrier.barrier(*args, **kwds)

mbligh

4b08966

2006-06-14 22:34:58 +0000

[diff] [blame]

243

244

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

245

def setup_dep(self, deps):

246

"""Set up the dependencies for this test.

apw

f1a8116

2006-04-25 10:10:29 +0000

[diff] [blame]

247

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

248

deps is a list of libraries required for this test.

"""

for dep in deps:

try:

os.chdir(os.path.join(self.autodir, 'deps', dep))

253

utils.system('./' + dep + '.py')

254

except:

255

err = "setting up dependency " + dep + "\n"

256

raise error.UnhandledError(err)

mbligh

2006-10-02 00:37:35 +0000

[diff] [blame]

257

mbligh

12a7df7

2006-10-06 03:54:33 +0000

[diff] [blame]

258

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

259

def __runtest(self, url, tag, args, dargs):

260

try:

261

l = lambda : test.runtest(self, url, tag, args, dargs)

262

pid = parallel.fork_start(self.resultdir, l)

263

parallel.fork_waitfor(self.resultdir, pid)

264

except error.AutotestError:

265

raise

266

except Exception, e:

267

msg = "Unhandled %s error occured during test\n"

268

msg %= str(e.__class__.__name__)

269

raise error.UnhandledError(msg)

mbligh

2007-11-13 17:11:22 +0000

[diff] [blame]

270

mbligh

65938a2

2007-12-10 16:58:52 +0000

[diff] [blame]

271

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

272

def run_test(self, url, *args, **dargs):

273

"""Summon a test object and run it.

jadmanski

2008-05-06 20:38:53 +0000

[diff] [blame]

274

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

275

tag

276

tag to add to testname

277

url

278

url of the test to run

279

"""

mbligh

2007-11-13 17:11:22 +0000

[diff] [blame]

280

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

281

if not url:

282

raise TypeError("Test name is invalid. "

283

"Switched arguments?")

284

(group, testname) = test.testname(url)

285

namelen = len(testname)

286

dargs = dargs.copy()

287

tntag = dargs.pop('tag', None)

288

if tntag: # testname tag is included in reported test name

289

testname += '.' + tntag

290

subdir = testname

291

sdtag = dargs.pop('subdir_tag', None)

292

if sdtag: # subdir-only tag is not included in reports

293

subdir = subdir + '.' + sdtag

294

tag = subdir[namelen+1:] # '' if none

mbligh

2007-11-13 17:11:22 +0000

[diff] [blame]

295

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

296

outputdir = os.path.join(self.resultdir, subdir)

297

if os.path.exists(outputdir):

298

msg = ("%s already exists, test <%s> may have"

299

" already run with tag <%s>"

300

% (outputdir, testname, tag) )

301

raise error.TestError(msg)

302

os.mkdir(outputdir)

mbligh

2007-11-13 17:11:22 +0000

[diff] [blame]

303

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

304

container = dargs.pop('container', None)

305

if container:

306

cname = container.get('name', None)

307

if not cname: # get old name

308

cname = container.get('container_name', None)

309

mbytes = container.get('mbytes', None)

310

if not mbytes: # get old name

311

mbytes = container.get('mem', None)

312

cpus = container.get('cpus', None)

313

if not cpus: # get old name

314

cpus = container.get('cpu', None)

315

root = container.get('root', None)

316

self.new_container(mbytes=mbytes, cpus=cpus,

317

root=root, name=cname)

318

# We are running in a container now...

mbligh

2007-11-13 17:11:22 +0000

[diff] [blame]

319

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

320

def log_warning(reason):

321

self.record("WARN", subdir, testname, reason)

mbligh

2008-06-06 22:48:19 +0000

[diff] [blame]

322

@disk_usage_monitor.watch(log_warning, "/", self.max_disk_usage_rate)

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

323

def group_func():

324

try:

325

self.__runtest(url, tag, args, dargs)

326

except error.TestNAError, detail:

327

self.record('TEST_NA', subdir, testname,

328

str(detail))

329

raise

330

except Exception, detail:

331

self.record('FAIL', subdir, testname,

str(detail))

raise

else:

self.record('GOOD', subdir, testname,

336

'completed successfully')

mbligh

2007-11-13 17:11:22 +0000

[diff] [blame]

337

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

338

result, exc_info = self.__rungroup(subdir, testname, group_func)

339

if container:

340

self.release_container()

341

if exc_info and isinstance(exc_info[1], error.TestError):

342

return False

343

elif exc_info:

344

raise exc_info[0], exc_info[1], exc_info[2]

345

else:

346

return True

apw

2006-03-30 18:50:19 +0000

[diff] [blame]

347

mbligh

d7fb4a6

2006-10-01 00:57:53 +0000

[diff] [blame]

348

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

349

def __rungroup(self, subdir, testname, function, *args, **dargs):

"""\

subdir:

name of the group

testname:

name of the test to run, or support step

function:

subroutine to run

*args:

arguments for the function

mbligh

88ab90f

2007-08-29 15:52:49 +0000

[diff] [blame]

359

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

360

Returns a 2-tuple (result, exc_info) where result

361

is the return value of function, and exc_info is

362

the sys.exc_info() of the exception thrown by the

363

function (which may be None).

364

"""

apw

1da244b

2007-09-27 17:18:01 +0000

[diff] [blame]

365

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

366

result, exc_info = None, None

367

try:

368

self.record('START', subdir, testname)

369

self._increment_group_level()

370

result = function(*args, **dargs)

371

self._decrement_group_level()

372

self.record('END GOOD', subdir, testname)

373

except error.TestNAError, e:

374

self._decrement_group_level()

375

self.record('END TEST_NA', subdir, testname, str(e))

376

except Exception, e:

377

exc_info = sys.exc_info()

378

self._decrement_group_level()

379

err_msg = str(e) + '\n' + traceback.format_exc()

380

self.record('END FAIL', subdir, testname, err_msg)

mbligh

d660afe

2008-06-05 22:17:53 +0000

[diff] [blame]

381

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

382

return result, exc_info

apw

1da244b

2007-09-27 17:18:01 +0000

[diff] [blame]

383

mbligh

88ab90f

2007-08-29 15:52:49 +0000

[diff] [blame]

384

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

385

def run_group(self, function, *args, **dargs):

"""\

function:

subroutine to run

*args:

arguments for the function

391

"""

apw

08403ca

2007-09-27 17:17:22 +0000

[diff] [blame]

392

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

393

# Allow the tag for the group to be specified

394

name = function.__name__

395

tag = dargs.pop('tag', None)

396

if tag:

397

name = tag

mbligh

88ab90f

2007-08-29 15:52:49 +0000

[diff] [blame]

398

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

399

outputdir = os.path.join(self.resultdir, name)

400

if os.path.exists(outputdir):

401

msg = ("%s already exists, test <%s> may have"

402

" already run with tag <%s>"

403

% (outputdir, name, name) )

404

raise error.TestError(msg)

405

os.mkdir(outputdir)

406

mbligh

2008-06-06 22:48:19 +0000

[diff] [blame]

407

result, exc_info = self.__rungroup(name, name, function, *args, **dargs)

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

408

409

# if there was a non-TestError exception, raise it

410

if exc_info and not isinstance(exc_info[1], error.TestError):

411

err = ''.join(traceback.format_exception(*exc_info))

412

raise error.TestError(name + ' failed\n' + err)

413

414

# pass back the actual return value from the function

return result

def new_container(self, mbytes=None, cpus=None, root=None, name=None):

419

if not autotest_utils.grep('cpuset', '/proc/filesystems'):

420

print "Containers not enabled by latest reboot"

421

return # containers weren't enabled in this kernel boot

422

pid = os.getpid()

423

if not name:

424

name = 'test%d' % pid # make arbitrary unique name

mbligh

2008-06-06 22:48:19 +0000

[diff] [blame]

425

self.container = cpuset.cpuset(name, job_size=mbytes, job_pid=pid,

426

cpus=cpus, root=root)

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

427

# This job's python shell is now running in the new container

428

# and all forked test processes will inherit that container

429

430

431

def release_container(self):

432

if self.container:

433

self.container.release()

434

self.container = None

435

mbligh

2008-01-25 18:16:41 +0000

[diff] [blame]

436

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

437

def cpu_count(self):

438

if self.container:

439

return len(self.container.cpus)

440

return autotest_utils.count_cpus() # use total system count

mbligh

2008-01-25 18:16:41 +0000

[diff] [blame]

441

mbligh

2008-01-25 18:16:41 +0000

[diff] [blame]

442

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

443

# Check the passed kernel identifier against the command line

444

# and the running kernel, abort the job on missmatch.

445

def kernel_check_ident(self, expected_when, expected_id, subdir,

446

type = 'src', patches=[]):

447

print (("POST BOOT: checking booted kernel " +

448

"mark=%d identity='%s' type='%s'") %

449

(expected_when, expected_id, type))

mbligh

2008-01-25 18:16:41 +0000

[diff] [blame]

450

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

451

running_id = autotest_utils.running_os_ident()

mbligh

2008-01-25 18:16:41 +0000

[diff] [blame]

452

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

453

cmdline = utils.read_one_line("/proc/cmdline")

mbligh

2008-01-25 18:16:41 +0000

[diff] [blame]

454

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

455

find_sum = re.compile(r'.*IDENT=(\d+)')

456

m = find_sum.match(cmdline)

457

cmdline_when = -1

458

if m:

459

cmdline_when = int(m.groups()[0])

apw

2007-09-25 16:53:05 +0000

[diff] [blame]

460

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

461

# We have all the facts, see if they indicate we

462

# booted the requested kernel or not.

463

bad = False

464

if (type == 'src' and expected_id != running_id or

465

type == 'rpm' and

466

not running_id.startswith(expected_id + '::')):

467

print "check_kernel_ident: kernel identifier mismatch"

468

bad = True

469

if expected_when != cmdline_when:

470

print "check_kernel_ident: kernel command line mismatch"

471

bad = True

apw

2007-09-25 16:53:05 +0000

[diff] [blame]

472

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

473

if bad:

474

print " Expected Ident: " + expected_id

475

print " Running Ident: " + running_id

476

print " Expected Mark: %d" % (expected_when)

477

print "Command Line Mark: %d" % (cmdline_when)

478

print " Command Line: " + cmdline

apw

2007-09-25 16:53:05 +0000

[diff] [blame]

479

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

480

raise error.JobError("boot failure", "reboot.verify")

apw

2007-09-25 16:53:05 +0000

[diff] [blame]

481

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

482

kernel_info = {'kernel': expected_id}

483

for i, patch in enumerate(patches):

484

kernel_info["patch%d" % i] = patch

485

self.record('GOOD', subdir, 'reboot.verify', expected_id)

486

self._decrement_group_level()

487

self.record('END GOOD', subdir, 'reboot',

488

optional_fields=kernel_info)

apw

2007-09-25 16:53:05 +0000

[diff] [blame]

489

apw

2007-09-25 16:53:05 +0000

[diff] [blame]

490

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

491

def filesystem(self, device, mountpoint = None, loop_size = 0):

492

if not mountpoint:

493

mountpoint = self.tmpdir

494

return filesystem.filesystem(self, device, mountpoint,loop_size)

apw

2007-09-25 16:53:05 +0000

[diff] [blame]

495

apw

2007-09-25 16:53:05 +0000

[diff] [blame]

496

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

497

def enable_external_logging(self):

498

pass

apw

2007-09-25 16:53:05 +0000

[diff] [blame]

499

mbligh

d7fb4a6

2006-10-01 00:57:53 +0000

[diff] [blame]

500

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

501

def disable_external_logging(self):

502

pass

mbligh

2008-04-07 21:51:17 +0000

[diff] [blame]

503

504

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

505

def reboot_setup(self):

506

pass

mbligh

2008-04-07 21:51:17 +0000

[diff] [blame]

507

mbligh

2008-04-07 21:51:17 +0000

[diff] [blame]

508

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

509

def reboot(self, tag='autotest'):

510

self.reboot_setup()

511

self.record('START', None, 'reboot')

512

self._increment_group_level()

513

self.record('GOOD', None, 'reboot.start')

514

self.harness.run_reboot()

515

default = self.config_get('boot.set_default')

516

if default:

517

self.bootloader.set_default(tag)

518

else:

519

self.bootloader.boot_once(tag)

520

cmd = "(sleep 5; reboot) </dev/null >/dev/null 2>&1 &"

521

utils.system(cmd)

522

self.quit()

mbligh

2006-10-02 00:37:35 +0000

[diff] [blame]

523

mbligh

2006-10-02 00:37:35 +0000

[diff] [blame]

524

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

525

def noop(self, text):

526

print "job: noop: " + text

mbligh

2006-10-02 00:37:35 +0000

[diff] [blame]

527

apw

2006-03-30 18:50:19 +0000

[diff] [blame]

528

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

529

def parallel(self, *tasklist):

530

"""Run tasks in parallel"""

mbligh

2006-10-02 00:37:35 +0000

[diff] [blame]

531

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

532

pids = []

533

old_log_filename = self.log_filename

534

for i, task in enumerate(tasklist):

535

self.log_filename = old_log_filename + (".%d" % i)

536

task_func = lambda: task[0](*task[1:])

mbligh

2008-06-06 22:48:19 +0000

[diff] [blame]

537

pids.append(parallel.fork_start(self.resultdir, task_func))

apw

8fef4ac

2006-10-10 22:53:37 +0000

[diff] [blame]

538

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

539

old_log_path = os.path.join(self.resultdir, old_log_filename)

540

old_log = open(old_log_path, "a")

541

exceptions = []

542

for i, pid in enumerate(pids):

543

# wait for the task to finish

544

try:

545

parallel.fork_waitfor(self.resultdir, pid)

546

except Exception, e:

547

exceptions.append(e)

548

# copy the logs from the subtask into the main log

549

new_log_path = old_log_path + (".%d" % i)

550

if os.path.exists(new_log_path):

551

new_log = open(new_log_path)

552

old_log.write(new_log.read())

553

new_log.close()

554

old_log.flush()

555

os.remove(new_log_path)

556

old_log.close()

mbligh

2007-12-19 16:19:05 +0000

[diff] [blame]

557

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

558

self.log_filename = old_log_filename

mbligh

2007-12-19 16:19:05 +0000

[diff] [blame]

559

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

560

# handle any exceptions raised by the parallel tasks

561

if exceptions:

562

msg = "%d task(s) failed" % len(exceptions)

563

raise error.JobError(msg, str(exceptions), exceptions)

apw

2006-03-30 18:50:19 +0000

[diff] [blame]

564

mbligh

d509b71

2008-01-14 17:41:25 +0000

[diff] [blame]

565

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

566

def quit(self):

567

# XXX: should have a better name.

568

self.harness.run_pause()

569

raise error.JobContinue("more to come")

mbligh

2006-10-02 00:37:35 +0000

[diff] [blame]

570

apw

2006-03-30 18:50:19 +0000

[diff] [blame]

571

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

572

def complete(self, status):

573

"""Clean up and exit"""

574

# We are about to exit 'complete' so clean up the control file.

575

try:

576

os.unlink(self.state_file)

577

except:

578

pass

mbligh

2006-10-02 00:37:35 +0000

[diff] [blame]

579

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

580

self.harness.run_complete()

581

self.disable_external_logging()

582

sys.exit(status)

mbligh

c0b10d3

2008-03-03 16:03:28 +0000

[diff] [blame]

583

apw

2006-03-30 18:50:19 +0000

[diff] [blame]

584

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

585

def set_state(self, var, val):

586

# Deep copies make sure that the state can't be altered

587

# without it being re-written. Perf wise, deep copies

588

# are overshadowed by pickling/loading.

589

self.state[var] = copy.deepcopy(val)

590

pickle.dump(self.state, open(self.state_file, 'w'))

mbligh

2006-10-02 00:37:35 +0000

[diff] [blame]

591

mbligh

2008-04-25 16:07:56 +0000

[diff] [blame]

592

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

593

def __load_state(self):

594

assert not hasattr(self, "state")

595

try:

596

self.state = pickle.load(open(self.state_file, 'r'))

597

self.state_existed = True

598

except Exception:

599

print "Initializing the state engine."

600

self.state = {}

601

self.set_state('__steps', []) # writes pickle file

602

self.state_existed = False

mbligh

2008-04-25 16:07:56 +0000

[diff] [blame]

603

mbligh

2008-04-25 16:07:56 +0000

[diff] [blame]

604

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

605

def get_state(self, var, default=None):

606

if var in self.state or default == None:

607

val = self.state[var]

608

else:

609

val = default

610

return copy.deepcopy(val)

mbligh

2008-04-25 16:07:56 +0000

[diff] [blame]

611

mbligh

2008-04-25 16:07:56 +0000

[diff] [blame]

612

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

613

def __create_step_tuple(self, fn, args, dargs):

614

# Legacy code passes in an array where the first arg is

615

# the function or its name.

616

if isinstance(fn, list):

617

assert(len(args) == 0)

618

assert(len(dargs) == 0)

619

args = fn[1:]

620

fn = fn[0]

621

# Pickling actual functions is harry, thus we have to call

622

# them by name. Unfortunately, this means only functions

623

# defined globally can be used as a next step.

624

if callable(fn):

625

fn = fn.__name__

626

if not isinstance(fn, types.StringTypes):

627

raise StepError("Next steps must be functions or "

628

"strings containing the function name")

629

ancestry = copy.copy(self.current_step_ancestry)

630

return (ancestry, fn, args, dargs)

mbligh

2008-04-25 16:07:56 +0000

[diff] [blame]

631

mbligh

12a04cb

2008-04-25 16:07:20 +0000

[diff] [blame]

632

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

633

def next_step_append(self, fn, *args, **dargs):

634

"""Define the next step and place it at the end"""

635

steps = self.get_state('__steps')

636

steps.append(self.__create_step_tuple(fn, args, dargs))

637

self.set_state('__steps', steps)

mbligh

12a04cb

2008-04-25 16:07:20 +0000

[diff] [blame]

638

apw

2006-03-30 18:50:19 +0000

[diff] [blame]

639

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

640

def next_step(self, fn, *args, **dargs):

641

"""Create a new step and place it after any steps added

642

while running the current step but before any steps added in

643

previous steps"""

644

steps = self.get_state('__steps')

645

steps.insert(self.next_step_index,

646

self.__create_step_tuple(fn, args, dargs))

647

self.next_step_index += 1

648

self.set_state('__steps', steps)

mbligh

2006-10-02 00:37:35 +0000

[diff] [blame]

649

mbligh

8f4d043

2008-06-02 19:42:50 +0000

[diff] [blame]

650

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

651

def next_step_prepend(self, fn, *args, **dargs):

652

"""Insert a new step, executing first"""

653

steps = self.get_state('__steps')

654

steps.insert(0, self.__create_step_tuple(fn, args, dargs))

655

self.next_step_index += 1

656

self.set_state('__steps', steps)

mbligh

8f4d043

2008-06-02 19:42:50 +0000

[diff] [blame]

657

mbligh

237bed3

2007-09-05 13:05:57 +0000

[diff] [blame]

658

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

659

def _run_step_fn(self, local_vars, fn, args, dargs):

660

"""Run a (step) function within the given context"""

mbligh

237bed3

2007-09-05 13:05:57 +0000

[diff] [blame]

661

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

662

local_vars['__args'] = args

663

local_vars['__dargs'] = dargs

mbligh

2008-06-06 22:48:19 +0000

[diff] [blame]

664

exec('__ret = %s(*__args, **__dargs)' % fn, local_vars, local_vars)

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

665

return local_vars['__ret']

mbligh

2008-06-02 19:40:01 +0000

[diff] [blame]

666

mbligh

2008-06-02 19:40:01 +0000

[diff] [blame]

667

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

668

def _create_frame(self, global_vars, ancestry, fn_name):

669

"""Set up the environment like it would have been when this

670

function was first defined.

mbligh

2008-06-02 19:40:01 +0000

[diff] [blame]

671

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

672

Child step engine 'implementations' must have 'return locals()'

673

at end end of their steps. Because of this, we can call the

674

parent function and get back all child functions (i.e. those

675

defined within it).

mbligh

2008-06-02 19:40:01 +0000

[diff] [blame]

676

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

677

Unfortunately, the call stack of the function calling

678

job.next_step might have been deeper than the function it

679

added. In order to make sure that the environment is what it

680

should be, we need to then pop off the frames we built until

681

we find the frame where the function was first defined."""

mbligh

2008-06-02 19:40:01 +0000

[diff] [blame]

682

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

683

# The copies ensure that the parent frames are not modified

684

# while building child frames. This matters if we then

685

# pop some frames in the next part of this function.

686

current_frame = copy.copy(global_vars)

687

frames = [current_frame]

688

for steps_fn_name in ancestry:

mbligh

2008-06-06 22:48:19 +0000

[diff] [blame]

689

ret = self._run_step_fn(current_frame, steps_fn_name, [], {})

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

690

current_frame = copy.copy(ret)

691

frames.append(current_frame)

mbligh

2008-06-02 19:40:01 +0000

[diff] [blame]

692

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

693

while len(frames) > 2:

694

if fn_name not in frames[-2]:

695

break

696

if frames[-2][fn_name] != frames[-1][fn_name]:

697

break

698

frames.pop()

699

ancestry.pop()

mbligh

2008-06-02 19:40:01 +0000

[diff] [blame]

700

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

701

return (frames[-1], ancestry)

mbligh

2008-06-02 19:40:01 +0000

[diff] [blame]

702

mbligh

2008-06-02 19:40:01 +0000

[diff] [blame]

703

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

704

def _add_step_init(self, local_vars, current_function):

705

"""If the function returned a dictionary that includes a

706

function named 'step_init', prepend it to our list of steps.

707

This will only get run the first time a function with a nested

708

use of the step engine is run."""

mbligh

2008-06-02 19:40:01 +0000

[diff] [blame]

709

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

710

if (isinstance(local_vars, dict) and

711

'step_init' in local_vars and

712

callable(local_vars['step_init'])):

713

# The init step is a child of the function

714

# we were just running.

715

self.current_step_ancestry.append(current_function)

716

self.next_step_prepend('step_init')

mbligh

2008-06-02 19:40:01 +0000

[diff] [blame]

717

mbligh

2008-06-02 19:40:01 +0000

[diff] [blame]

718

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

719

def step_engine(self):

720

"""the stepping engine -- if the control file defines

721

step_init we will be using this engine to drive multiple runs.

722

"""

723

"""Do the next step"""

mbligh

2008-06-02 19:40:01 +0000

[diff] [blame]

724

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

725

# Set up the environment and then interpret the control file.

726

# Some control files will have code outside of functions,

727

# which means we need to have our state engine initialized

728

# before reading in the file.

729

global_control_vars = {'job': self}

730

exec(JOB_PREAMBLE, global_control_vars, global_control_vars)

731

execfile(self.control, global_control_vars, global_control_vars)

apw

83f8d77

2006-04-27 14:12:56 +0000

[diff] [blame]

732

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

733

# If we loaded in a mid-job state file, then we presumably

734

# know what steps we have yet to run.

735

if not self.state_existed:

736

if global_control_vars.has_key('step_init'):

737

self.next_step(global_control_vars['step_init'])

apw

83f8d77

2006-04-27 14:12:56 +0000

[diff] [blame]

738

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

739

# Iterate through the steps. If we reboot, we'll simply

740

# continue iterating on the next step.

741

while len(self.get_state('__steps')) > 0:

742

steps = self.get_state('__steps')

743

(ancestry, fn_name, args, dargs) = steps.pop(0)

744

self.set_state('__steps', steps)

apw

2006-03-30 18:50:19 +0000

[diff] [blame]

745

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

746

self.next_step_index = 0

mbligh

2008-06-06 22:48:19 +0000

[diff] [blame]

747

ret = self._create_frame(global_control_vars, ancestry, fn_name)

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

748

local_vars, self.current_step_ancestry = ret

mbligh

2008-06-06 22:48:19 +0000

[diff] [blame]

749

local_vars = self._run_step_fn(local_vars, fn_name, args, dargs)

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

750

self._add_step_init(local_vars, fn_name)

apw

2006-03-30 18:50:19 +0000

[diff] [blame]

751

apw

2006-03-30 18:50:19 +0000

[diff] [blame]

752

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

753

def _init_group_level(self):

754

self.group_level = self.get_state("__group_level", default=0)

mbligh

2006-10-02 00:37:35 +0000

[diff] [blame]

755

jadmanski

2008-05-01 22:05:31 +0000

[diff] [blame]

756

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

757

def _increment_group_level(self):

758

self.group_level += 1

759

self.set_state("__group_level", self.group_level)

jadmanski

2008-05-01 22:05:31 +0000

[diff] [blame]

760

jadmanski

2008-05-01 22:05:31 +0000

[diff] [blame]

761

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

762

def _decrement_group_level(self):

763

self.group_level -= 1

764

self.set_state("__group_level", self.group_level)

jadmanski

2008-05-01 22:05:31 +0000

[diff] [blame]

765

jadmanski

2008-05-01 22:05:31 +0000

[diff] [blame]

766

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

767

def record(self, status_code, subdir, operation, status = '',

768

optional_fields=None):

769

"""

770

Record job-level status

jadmanski

2008-05-01 22:05:31 +0000

[diff] [blame]

771

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

772

The intent is to make this file both machine parseable and

773

human readable. That involves a little more complexity, but

774

really isn't all that bad ;-)

apw

7db8d0b

2006-10-09 08:10:25 +0000

[diff] [blame]

775

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

776

Format is <status code>\t<subdir>\t<operation>\t<status>

mbligh

2007-09-18 21:34:57 +0000

[diff] [blame]

777

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

778

status code: (GOOD|WARN|FAIL|ABORT)

779

or START

780

or END (GOOD|WARN|FAIL|ABORT)

mbligh

2007-09-18 21:34:57 +0000

[diff] [blame]

781

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

782

subdir: MUST be a relevant subdirectory in the results,

783

or None, which will be represented as '----'

mbligh

2007-09-18 21:34:57 +0000

[diff] [blame]

784

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

785

operation: description of what you ran (e.g. "dbench", or

786

"mkfs -t foobar /dev/sda9")

mbligh

2007-09-18 21:34:57 +0000

[diff] [blame]

787

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

788

status: error message or "completed sucessfully"

mbligh

2007-09-18 21:34:57 +0000

[diff] [blame]

789

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

790

------------------------------------------------------------

mbligh

2007-09-18 21:34:57 +0000

[diff] [blame]

791

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

792

Initial tabs indicate indent levels for grouping, and is

793

governed by self.group_level

mbligh

2007-09-18 21:34:57 +0000

[diff] [blame]

794

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

795

multiline messages have secondary lines prefaced by a double

796

space (' ')

797

"""

mbligh

2007-09-18 21:34:57 +0000

[diff] [blame]

798

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

799

if subdir:

800

if re.match(r'[\n\t]', subdir):

mbligh

2008-06-06 22:48:19 +0000

[diff] [blame]

801

raise ValueError("Invalid character in subdir string")

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

802

substr = subdir

803

else:

804

substr = '----'

mbligh

2007-09-18 21:34:57 +0000

[diff] [blame]

805

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

806

if not logging.is_valid_status(status_code):

mbligh

2008-06-06 22:48:19 +0000

[diff] [blame]

807

raise ValueError("Invalid status code supplied: %s" % status_code)

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

808

if not operation:

809

operation = '----'

jadmanski

2008-05-01 22:05:31 +0000

[diff] [blame]

810

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

811

if re.match(r'[\n\t]', operation):

mbligh

2008-06-06 22:48:19 +0000

[diff] [blame]

812

raise ValueError("Invalid character in operation string")

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

813

operation = operation.rstrip()

jadmanski

2008-05-01 22:05:31 +0000

[diff] [blame]

814

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

815

if not optional_fields:

816

optional_fields = {}

jadmanski

2008-05-01 22:05:31 +0000

[diff] [blame]

817

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

818

status = status.rstrip()

819

status = re.sub(r"\t", " ", status)

820

# Ensure any continuation lines are marked so we can

821

# detect them in the status file to ensure it is parsable.

mbligh

2008-06-06 22:48:19 +0000

[diff] [blame]

822

status = re.sub(r"\n", "\n" + "\t" * self.group_level + " ", status)

mbligh

2007-09-18 21:34:57 +0000

[diff] [blame]

823

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

824

# Generate timestamps for inclusion in the logs

825

epoch_time = int(time.time()) # seconds since epoch, in UTC

826

local_time = time.localtime(epoch_time)

827

optional_fields["timestamp"] = str(epoch_time)

828

optional_fields["localtime"] = time.strftime("%b %d %H:%M:%S",

829

local_time)

mbligh

3027030

2007-11-05 20:33:52 +0000

[diff] [blame]

830

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

831

fields = [status_code, substr, operation]

832

fields += ["%s=%s" % x for x in optional_fields.iteritems()]

833

fields.append(status)

jadmanski

2008-05-01 22:05:31 +0000

[diff] [blame]

834

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

835

msg = '\t'.join(str(x) for x in fields)

836

msg = '\t' * self.group_level + msg

apw

7db8d0b

2006-10-09 08:10:25 +0000

[diff] [blame]

837

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

838

msg_tag = ""

839

if "." in self.log_filename:

840

msg_tag = self.log_filename.split(".", 1)[1]

mbligh

2007-12-19 16:19:05 +0000

[diff] [blame]

841

mbligh

2008-06-06 22:48:19 +0000

[diff] [blame]

842

self.harness.test_status_detail(status_code, substr, operation, status,

843

msg_tag)

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

844

self.harness.test_status(msg, msg_tag)

mbligh

2007-12-19 16:19:05 +0000

[diff] [blame]

845

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

846

# log to stdout (if enabled)

847

#if self.log_filename == self.DEFAULT_LOG_FILENAME:

848

print msg

mbligh

2007-12-19 16:19:05 +0000

[diff] [blame]

849

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

850

# log to the "root" status log

851

status_file = os.path.join(self.resultdir, self.log_filename)

852

open(status_file, "a").write(msg + "\n")

mbligh

2007-12-19 16:19:05 +0000

[diff] [blame]

853

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

854

# log to the subdir status log (if subdir is set)

855

if subdir:

856

dir = os.path.join(self.resultdir, subdir)

mbligh

2008-06-06 22:48:19 +0000

[diff] [blame]

857

status_file = os.path.join(dir, self.DEFAULT_LOG_FILENAME)

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

858

open(status_file, "a").write(msg + "\n")

apw

2006-04-27 14:14:04 +0000

[diff] [blame]

859

860

jadmanski

2008-05-06 20:38:53 +0000

[diff] [blame]

861

class disk_usage_monitor:

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

862

def __init__(self, logging_func, device, max_mb_per_hour):

863

self.func = logging_func

864

self.device = device

865

self.max_mb_per_hour = max_mb_per_hour

jadmanski

2008-05-06 20:38:53 +0000

[diff] [blame]

866

867

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

868

def start(self):

869

self.initial_space = autotest_utils.freespace(self.device)

870

self.start_time = time.time()

jadmanski

2008-05-06 20:38:53 +0000

[diff] [blame]

871

872

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

873

def stop(self):

874

# if no maximum usage rate was set, we don't need to

875

# generate any warnings

876

if not self.max_mb_per_hour:

877

return

jadmanski

2008-05-06 20:38:53 +0000

[diff] [blame]

878

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

879

final_space = autotest_utils.freespace(self.device)

880

used_space = self.initial_space - final_space

881

stop_time = time.time()

882

total_time = stop_time - self.start_time

883

# round up the time to one minute, to keep extremely short

884

# tests from generating false positives due to short, badly

885

# timed bursts of activity

886

total_time = max(total_time, 60.0)

jadmanski

2008-05-06 20:38:53 +0000

[diff] [blame]

887

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

888

# determine the usage rate

889

bytes_per_sec = used_space / total_time

890

mb_per_sec = bytes_per_sec / 1024**2

891

mb_per_hour = mb_per_sec * 60 * 60

jadmanski

2008-05-06 20:38:53 +0000

[diff] [blame]

892

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

893

if mb_per_hour > self.max_mb_per_hour:

mbligh

2008-06-06 22:48:19 +0000

[diff] [blame]

894

msg = ("disk space on %s was consumed at a rate of %.2f MB/hour")

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

895

msg %= (self.device, mb_per_hour)

896

self.func(msg)

jadmanski

2008-05-06 20:38:53 +0000

[diff] [blame]

897

898

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

899

@classmethod

900

def watch(cls, *monitor_args, **monitor_dargs):

901

""" Generic decorator to wrap a function call with the

902

standard create-monitor -> start -> call -> stop idiom."""

903

def decorator(func):

904

def watched_func(*args, **dargs):

905

monitor = cls(*monitor_args, **monitor_dargs)

monitor.start()

try:

func(*args, **dargs)

finally:

monitor.stop()

return watched_func

return decorator

jadmanski

2008-05-06 20:38:53 +0000

[diff] [blame]

913

914

mbligh

2008-04-07 21:51:17 +0000

[diff] [blame]

915

def runjob(control, cont = False, tag = "default", harness_type = '',

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

916

use_external_logging = False):

917

"""The main interface to this module

mbligh

2006-07-28 17:35:28 +0000

[diff] [blame]

918

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

919

control

920

The control file to use for this job.

921

cont

922

Whether this is the continuation of a previously started job

923

"""

924

control = os.path.abspath(control)

925

state = control + '.state'

apw

2006-04-27 14:14:04 +0000

[diff] [blame]

926

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

927

# instantiate the job object ready for the control file.

928

myjob = None

929

try:

930

# Check that the control file is valid

931

if not os.path.exists(control):

mbligh

2008-06-06 22:48:19 +0000

[diff] [blame]

932

raise error.JobError(control + ": control file not found")

apw

2006-04-27 14:14:04 +0000

[diff] [blame]

933

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

934

# When continuing, the job is complete when there is no

935

# state file, ensure we don't try and continue.

936

if cont and not os.path.exists(state):

937

raise error.JobComplete("all done")

938

if cont == False and os.path.exists(state):

939

os.unlink(state)

apw

2006-04-27 14:14:04 +0000

[diff] [blame]

940

mbligh

2008-06-06 22:48:19 +0000

[diff] [blame]

941

myjob = job(control, tag, cont, harness_type, use_external_logging)

apw

2006-04-27 14:14:04 +0000

[diff] [blame]

942

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

943

# Load in the users control file, may do any one of:

944

# 1) execute in toto

945

# 2) define steps, and select the first via next_step()

946

myjob.step_engine()

apw

2006-04-27 14:14:04 +0000

[diff] [blame]

947

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

948

except error.JobContinue:

949

sys.exit(5)

apw

2006-04-27 14:14:04 +0000

[diff] [blame]

950

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

951

except error.JobComplete:

952

sys.exit(1)

apw

b832e1b

2007-11-24 20:24:38 +0000

[diff] [blame]

953

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

954

except error.JobError, instance:

955

print "JOB ERROR: " + instance.args[0]

956

if myjob:

957

command = None

958

if len(instance.args) > 1:

959

command = instance.args[1]

960

myjob.record('ABORT', None, command, instance.args[0])

961

myjob._decrement_group_level()

962

myjob.record('END ABORT', None, None)

963

assert(myjob.group_level == 0)

964

myjob.complete(1)

965

else:

966

sys.exit(1)

apw

2006-04-27 14:14:04 +0000

[diff] [blame]

967

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

968

except Exception, e:

969

msg = str(e) + '\n' + traceback.format_exc()

970

print "JOB ERROR: " + msg

971

if myjob:

972

myjob.record('ABORT', None, None, msg)

973

myjob._decrement_group_level()

974

myjob.record('END ABORT', None, None)

975

assert(myjob.group_level == 0)

976

myjob.complete(1)

977

else:

978

sys.exit(1)

mbligh

892d37f

2007-03-01 17:03:25 +0000

[diff] [blame]

979

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

980

# If we get here, then we assume the job is complete and good.

981

myjob._decrement_group_level()

982

myjob.record('END GOOD', None, None)

983

assert(myjob.group_level == 0)

mbligh

0144e5a

2008-03-07 18:17:53 +0000

[diff] [blame]

984

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

985

myjob.complete(0)

mbligh

2008-04-07 21:51:17 +0000

[diff] [blame]

986

987

988

# site_job.py may be non-existant or empty, make sure that an appropriate

989

# site_job class is created nevertheless

990

try:

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

991

from site_job import site_job

mbligh

2008-04-07 21:51:17 +0000

[diff] [blame]

992

except ImportError:

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

993

class site_job(base_job):

994

pass

mbligh

2008-04-07 21:51:17 +0000

[diff] [blame]

995

996

class job(site_job):

jadmanski