Blame - client/bin/job.py - platform/external/autotest

2006-07-28 17:35:28 +0000

[diff] [blame]

1

"""The main job wrapper

mbligh

a250805

2006-05-28 21:29:53 +0000

[diff] [blame]

2

mbligh

2006-07-28 17:35:28 +0000

[diff] [blame]

3

This is the core infrastructure.

4

"""

5

6

__author__ = """Copyright Andy Whitcroft, Martin J. Bligh 2006"""

mbligh

a250805

2006-05-28 21:29:53 +0000

[diff] [blame]

7

mbligh

8f243ec

2006-10-10 05:55:49 +0000

[diff] [blame]

8

# standard stuff

mbligh

2008-04-25 16:07:56 +0000

[diff] [blame]

9

import os, sys, re, pickle, shutil, time, traceback, types, copy

mbligh

302482e

2008-05-01 20:06:16 +0000

[diff] [blame]

10

mbligh

8f243ec

2006-10-10 05:55:49 +0000

[diff] [blame]

11

# autotest stuff

mbligh

c61fb36

2008-06-05 16:22:15 +0000

[diff] [blame]

12

from autotest_lib.client.bin import autotest_utils, parallel, kernel, xen

13

from autotest_lib.client.bin import profilers, fd_stack, boottool, harness

14

from autotest_lib.client.bin import config, sysinfo, cpuset, test, filesystem

mbligh

e829ba5

2008-06-03 15:04:08 +0000

[diff] [blame]

15

from autotest_lib.client.common_lib import error, barrier, logging, utils

mbligh

302482e

2008-05-01 20:06:16 +0000

[diff] [blame]

16

mbligh

2008-04-25 16:07:56 +0000

[diff] [blame]

17

JOB_PREAMBLE = """

mbligh

539d876

2008-06-11 22:11:43 +0000

[diff] [blame]

18

from autotest_lib.client.common_lib.error import *

mbligh

4700d94

2008-06-11 21:42:31 +0000

[diff] [blame]

19

from autotest_lib.client.bin.autotest_utils import *

mbligh

2008-04-25 16:07:56 +0000

[diff] [blame]

20

"""

21

mbligh

302482e

2008-05-01 20:06:16 +0000

[diff] [blame]

22

class StepError(error.AutotestError):

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

23

pass

mbligh

12a04cb

2008-04-25 16:07:20 +0000

[diff] [blame]

24

25

mbligh

2008-06-10 16:26:59 +0000

[diff] [blame]

26

class base_job(object):

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

27

"""The actual job against which we do everything.

mbligh

2006-07-28 17:35:28 +0000

[diff] [blame]

28

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

29

Properties:

30

autodir

31

The top level autotest directory (/usr/local/autotest).

32

Comes from os.environ['AUTODIR'].

bindir

<autodir>/bin/

libdir

<autodir>/lib/

testdir

<autodir>/tests/

site_testdir

<autodir>/site_tests/

profdir

<autodir>/profilers/

tmpdir

<autodir>/tmp/

resultdir

<autodir>/results/<jobtag>

47

stdout

48

fd_stack object for stdout

49

stderr

50

fd_stack object for stderr

51

profilers

52

the profilers object for this job

53

harness

54

the server harness object for this job

55

config

56

the job configuration for this job

57

"""

mbligh

2006-07-28 17:35:28 +0000

[diff] [blame]

58

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

59

DEFAULT_LOG_FILENAME = "status"

mbligh

2007-12-19 16:19:05 +0000

[diff] [blame]

60

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

61

def __init__(self, control, jobtag, cont, harness_type=None,

62

use_external_logging = False):

63

"""

64

control

65

The control file (pathname of)

66

jobtag

67

The job tag string (eg "default")

68

cont

69

If this is the continuation of this job

70

harness_type

71

An alternative server harness

72

"""

73

self.autodir = os.environ['AUTODIR']

74

self.bindir = os.path.join(self.autodir, 'bin')

75

self.libdir = os.path.join(self.autodir, 'lib')

76

self.testdir = os.path.join(self.autodir, 'tests')

77

self.site_testdir = os.path.join(self.autodir, 'site_tests')

78

self.profdir = os.path.join(self.autodir, 'profilers')

79

self.tmpdir = os.path.join(self.autodir, 'tmp')

80

self.resultdir = os.path.join(self.autodir, 'results', jobtag)

81

self.sysinfodir = os.path.join(self.resultdir, 'sysinfo')

82

self.control = os.path.abspath(control)

83

self.state_file = self.control + '.state'

84

self.current_step_ancestry = []

85

self.next_step_index = 0

mbligh

2008-06-10 16:26:59 +0000

[diff] [blame]

86

self._load_state()

mbligh

a250805

2006-05-28 21:29:53 +0000

[diff] [blame]

87

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

88

if not cont:

89

"""

90

Don't cleanup the tmp dir (which contains the lockfile)

91

in the constructor, this would be a problem for multiple

92

jobs starting at the same time on the same client. Instead

93

do the delete at the server side. We simply create the tmp

94

directory here if it does not already exist.

95

"""

96

if not os.path.exists(self.tmpdir):

97

os.mkdir(self.tmpdir)

apw

96da1a4

2006-11-02 00:23:18 +0000

[diff] [blame]

98

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

99

results = os.path.join(self.autodir, 'results')

100

if not os.path.exists(results):

101

os.mkdir(results)

mbligh

c1cbc99

2008-05-27 20:01:45 +0000

[diff] [blame]

102

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

103

download = os.path.join(self.testdir, 'download')

104

if not os.path.exists(download):

105

os.mkdir(download)

apw

96da1a4

2006-11-02 00:23:18 +0000

[diff] [blame]

106

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

107

if os.path.exists(self.resultdir):

mbligh

2008-06-06 22:48:19 +0000

[diff] [blame]

108

utils.system('rm -rf ' + self.resultdir)

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

109

os.mkdir(self.resultdir)

110

os.mkdir(self.sysinfodir)

apw

870988b

2007-09-25 16:50:53 +0000

[diff] [blame]

111

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

112

os.mkdir(os.path.join(self.resultdir, 'debug'))

113

os.mkdir(os.path.join(self.resultdir, 'analysis'))

mbligh

f4ca14f

2008-03-03 16:03:05 +0000

[diff] [blame]

114

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

115

shutil.copyfile(self.control,

116

os.path.join(self.resultdir, 'control'))

mbligh

4b08966

2006-06-14 22:34:58 +0000

[diff] [blame]

117

mbligh

f4c3532

2006-03-13 01:01:10 +0000

[diff] [blame]

118

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

119

self.control = control

120

self.jobtag = jobtag

121

self.log_filename = self.DEFAULT_LOG_FILENAME

122

self.container = None

jadmanski

2008-05-01 22:05:31 +0000

[diff] [blame]

123

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

124

self.stdout = fd_stack.fd_stack(1, sys.stdout)

125

self.stderr = fd_stack.fd_stack(2, sys.stderr)

mbligh

f4c3532

2006-03-13 01:01:10 +0000

[diff] [blame]

126

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

127

self._init_group_level()

apw

059e1b1

2006-10-12 17:18:26 +0000

[diff] [blame]

128

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

129

self.config = config.config(self)

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

130

self.harness = harness.select(harness_type, self)

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

131

self.profilers = profilers.profilers(self)

mbligh

2006-10-02 00:37:35 +0000

[diff] [blame]

132

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

133

try:

134

tool = self.config_get('boottool.executable')

135

self.bootloader = boottool.boottool(tool)

136

except:

137

pass

mbligh

3a6d6ca

2006-04-23 15:50:24 +0000

[diff] [blame]

138

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

139

sysinfo.log_per_reboot_data(self.sysinfodir)

apw

357f50f

2006-12-01 11:22:39 +0000

[diff] [blame]

140

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

141

if not cont:

142

self.record('START', None, None)

143

self._increment_group_level()

apw

f91efaf

2007-11-24 17:32:13 +0000

[diff] [blame]

144

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

145

self.harness.run_start()

jadmanski

2008-05-06 20:38:53 +0000

[diff] [blame]

146

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

147

if use_external_logging:

148

self.enable_external_logging()

jadmanski

2008-05-06 20:38:53 +0000

[diff] [blame]

149

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

150

# load the max disk usage rate - default to no monitoring

mbligh

2008-06-06 22:48:19 +0000

[diff] [blame]

151

self.max_disk_usage_rate = self.get_state('__monitor_disk', default=0.0)

jadmanski

2008-05-06 20:38:53 +0000

[diff] [blame]

152

jadmanski

2008-05-06 20:38:53 +0000

[diff] [blame]

153

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

154

def monitor_disk_usage(self, max_rate):

155

"""\

156

Signal that the job should monitor disk space usage on /

157

and generate a warning if a test uses up disk space at a

158

rate exceeding 'max_rate'.

mbligh

0692e47

2007-08-30 16:07:53 +0000

[diff] [blame]

159

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

160

Parameters:

161

max_rate - the maximium allowed rate of disk consumption

162

during a test, in MB/hour, or 0 to indicate

163

no limit.

164

"""

165

self.set_state('__monitor_disk', max_rate)

166

self.max_disk_usage_rate = max_rate

mbligh

0692e47

2007-08-30 16:07:53 +0000

[diff] [blame]

167

168

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

169

def relative_path(self, path):

170

"""\

171

Return a patch relative to the job results directory

172

"""

173

head = len(self.resultdir) + 1 # remove the / inbetween

174

return path[head:]

mbligh

362ab3d

2007-08-30 11:24:04 +0000

[diff] [blame]

175

mbligh

2006-10-02 00:37:35 +0000

[diff] [blame]

176

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

177

def control_get(self):

178

return self.control

mbligh

8d83cdc

2007-12-03 18:09:18 +0000

[diff] [blame]

179

180

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

181

def control_set(self, control):

182

self.control = os.path.abspath(control)

apw

de1503a

2006-10-10 08:34:21 +0000

[diff] [blame]

183

184

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

185

def harness_select(self, which):

186

self.harness = harness.select(which, self)

apw

059e1b1

2006-10-12 17:18:26 +0000

[diff] [blame]

187

188

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

189

def config_set(self, name, value):

190

self.config.set(name, value)

apw

059e1b1

2006-10-12 17:18:26 +0000

[diff] [blame]

191

mbligh

1e8858e

2006-11-24 22:18:35 +0000

[diff] [blame]

192

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

193

def config_get(self, name):

194

return self.config.get(name)

mbligh

72b88fc

2006-12-16 18:41:35 +0000

[diff] [blame]

195

mbligh

c1f8ced

2008-06-13 21:43:28 +0000

[diff] [blame^]

196

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

197

def setup_dirs(self, results_dir, tmp_dir):

198

if not tmp_dir:

199

tmp_dir = os.path.join(self.tmpdir, 'build')

200

if not os.path.exists(tmp_dir):

201

os.mkdir(tmp_dir)

202

if not os.path.isdir(tmp_dir):

203

e_msg = "Temp dir (%s) is not a dir - args backwards?" % self.tmpdir

204

raise ValueError(e_msg)

mbligh

8baa2ea

2006-12-17 23:01:24 +0000

[diff] [blame]

205

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

206

# We label the first build "build" and then subsequent ones

207

# as "build.2", "build.3", etc. Whilst this is a little bit

208

# inconsistent, 99.9% of jobs will only have one build

209

# (that's not done as kernbench, sparse, or buildtest),

210

# so it works out much cleaner. One of life's comprimises.

211

if not results_dir:

212

results_dir = os.path.join(self.resultdir, 'build')

213

i = 2

214

while os.path.exists(results_dir):

215

results_dir = os.path.join(self.resultdir, 'build.%d' % i)

216

i += 1

217

if not os.path.exists(results_dir):

218

os.mkdir(results_dir)

mbligh

8baa2ea

2006-12-17 23:01:24 +0000

[diff] [blame]

219

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

220

return (results_dir, tmp_dir)

mbligh

8baa2ea

2006-12-17 23:01:24 +0000

[diff] [blame]

221

222

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

223

def xen(self, base_tree, results_dir = '', tmp_dir = '', leave = False, \

224

kjob = None ):

225

"""Summon a xen object"""

226

(results_dir, tmp_dir) = self.setup_dirs(results_dir, tmp_dir)

227

build_dir = 'xen'

228

return xen.xen(self, base_tree, results_dir, tmp_dir, build_dir, leave, kjob)

mbligh

f4c3532

2006-03-13 01:01:10 +0000

[diff] [blame]

229

mbligh

2006-10-02 00:37:35 +0000

[diff] [blame]

230

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

231

def kernel(self, base_tree, results_dir = '', tmp_dir = '', leave = False):

232

"""Summon a kernel object"""

233

(results_dir, tmp_dir) = self.setup_dirs(results_dir, tmp_dir)

234

build_dir = 'linux'

mbligh

2008-06-06 22:48:19 +0000

[diff] [blame]

235

return kernel.auto_kernel(self, base_tree, results_dir, tmp_dir,

236

build_dir, leave)

mbligh

fadca20

2006-09-23 04:40:01 +0000

[diff] [blame]

237

mbligh

2006-10-02 00:37:35 +0000

[diff] [blame]

238

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

239

def barrier(self, *args, **kwds):

240

"""Create a barrier object"""

241

return barrier.barrier(*args, **kwds)

mbligh

4b08966

2006-06-14 22:34:58 +0000

[diff] [blame]

242

243

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

244

def setup_dep(self, deps):

245

"""Set up the dependencies for this test.

apw

f1a8116

2006-04-25 10:10:29 +0000

[diff] [blame]

246

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

247

deps is a list of libraries required for this test.

"""

for dep in deps:

try:

os.chdir(os.path.join(self.autodir, 'deps', dep))

252

utils.system('./' + dep + '.py')

253

except:

254

err = "setting up dependency " + dep + "\n"

255

raise error.UnhandledError(err)

mbligh

2006-10-02 00:37:35 +0000

[diff] [blame]

256

mbligh

12a7df7

2006-10-06 03:54:33 +0000

[diff] [blame]

257

mbligh

2008-06-10 16:26:59 +0000

[diff] [blame]

258

def _runtest(self, url, tag, args, dargs):

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

259

try:

260

l = lambda : test.runtest(self, url, tag, args, dargs)

261

pid = parallel.fork_start(self.resultdir, l)

262

parallel.fork_waitfor(self.resultdir, pid)

263

except error.AutotestError:

264

raise

265

except Exception, e:

266

msg = "Unhandled %s error occured during test\n"

267

msg %= str(e.__class__.__name__)

268

raise error.UnhandledError(msg)

mbligh

2007-11-13 17:11:22 +0000

[diff] [blame]

269

mbligh

65938a2

2007-12-10 16:58:52 +0000

[diff] [blame]

270

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

271

def run_test(self, url, *args, **dargs):

272

"""Summon a test object and run it.

jadmanski

2008-05-06 20:38:53 +0000

[diff] [blame]

273

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

274

tag

275

tag to add to testname

276

url

277

url of the test to run

278

"""

mbligh

2007-11-13 17:11:22 +0000

[diff] [blame]

279

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

280

if not url:

281

raise TypeError("Test name is invalid. "

282

"Switched arguments?")

283

(group, testname) = test.testname(url)

284

namelen = len(testname)

285

dargs = dargs.copy()

286

tntag = dargs.pop('tag', None)

287

if tntag: # testname tag is included in reported test name

288

testname += '.' + tntag

289

subdir = testname

290

sdtag = dargs.pop('subdir_tag', None)

291

if sdtag: # subdir-only tag is not included in reports

292

subdir = subdir + '.' + sdtag

293

tag = subdir[namelen+1:] # '' if none

mbligh

2007-11-13 17:11:22 +0000

[diff] [blame]

294

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

295

outputdir = os.path.join(self.resultdir, subdir)

296

if os.path.exists(outputdir):

297

msg = ("%s already exists, test <%s> may have"

298

" already run with tag <%s>"

299

% (outputdir, testname, tag) )

300

raise error.TestError(msg)

301

os.mkdir(outputdir)

mbligh

2007-11-13 17:11:22 +0000

[diff] [blame]

302

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

303

container = dargs.pop('container', None)

304

if container:

305

cname = container.get('name', None)

306

if not cname: # get old name

307

cname = container.get('container_name', None)

308

mbytes = container.get('mbytes', None)

309

if not mbytes: # get old name

310

mbytes = container.get('mem', None)

311

cpus = container.get('cpus', None)

312

if not cpus: # get old name

313

cpus = container.get('cpu', None)

314

root = container.get('root', None)

315

self.new_container(mbytes=mbytes, cpus=cpus,

316

root=root, name=cname)

317

# We are running in a container now...

mbligh

2007-11-13 17:11:22 +0000

[diff] [blame]

318

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

319

def log_warning(reason):

320

self.record("WARN", subdir, testname, reason)

mbligh

2008-06-06 22:48:19 +0000

[diff] [blame]

321

@disk_usage_monitor.watch(log_warning, "/", self.max_disk_usage_rate)

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

322

def group_func():

323

try:

mbligh

2008-06-10 16:26:59 +0000

[diff] [blame]

324

self._runtest(url, tag, args, dargs)

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

325

except error.TestNAError, detail:

326

self.record('TEST_NA', subdir, testname,

327

str(detail))

328

raise

329

except Exception, detail:

330

self.record('FAIL', subdir, testname,

str(detail))

raise

else:

self.record('GOOD', subdir, testname,

335

'completed successfully')

mbligh

2007-11-13 17:11:22 +0000

[diff] [blame]

336

mbligh

2008-06-10 16:26:59 +0000

[diff] [blame]

337

result, exc_info = self._rungroup(subdir, testname, group_func)

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

338

if container:

339

self.release_container()

340

if exc_info and isinstance(exc_info[1], error.TestError):

341

return False

342

elif exc_info:

343

raise exc_info[0], exc_info[1], exc_info[2]

344

else:

345

return True

apw

2006-03-30 18:50:19 +0000

[diff] [blame]

346

mbligh

d7fb4a6

2006-10-01 00:57:53 +0000

[diff] [blame]

347

mbligh

2008-06-10 16:26:59 +0000

[diff] [blame]

348

def _rungroup(self, subdir, testname, function, *args, **dargs):

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

"""\

subdir:

name of the group

testname:

name of the test to run, or support step

function:

subroutine to run

*args:

arguments for the function

mbligh

88ab90f

2007-08-29 15:52:49 +0000

[diff] [blame]

358

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

359

Returns a 2-tuple (result, exc_info) where result

360

is the return value of function, and exc_info is

361

the sys.exc_info() of the exception thrown by the

362

function (which may be None).

363

"""

apw

1da244b

2007-09-27 17:18:01 +0000

[diff] [blame]

364

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

365

result, exc_info = None, None

366

try:

367

self.record('START', subdir, testname)

368

self._increment_group_level()

369

result = function(*args, **dargs)

370

self._decrement_group_level()

371

self.record('END GOOD', subdir, testname)

372

except error.TestNAError, e:

373

self._decrement_group_level()

374

self.record('END TEST_NA', subdir, testname, str(e))

375

except Exception, e:

376

exc_info = sys.exc_info()

377

self._decrement_group_level()

378

err_msg = str(e) + '\n' + traceback.format_exc()

379

self.record('END FAIL', subdir, testname, err_msg)

mbligh

d660afe

2008-06-05 22:17:53 +0000

[diff] [blame]

380

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

381

return result, exc_info

apw

1da244b

2007-09-27 17:18:01 +0000

[diff] [blame]

382

mbligh

88ab90f

2007-08-29 15:52:49 +0000

[diff] [blame]

383

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

384

def run_group(self, function, *args, **dargs):

"""\

function:

subroutine to run

*args:

arguments for the function

390

"""

apw

08403ca

2007-09-27 17:17:22 +0000

[diff] [blame]

391

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

392

# Allow the tag for the group to be specified

393

name = function.__name__

394

tag = dargs.pop('tag', None)

395

if tag:

396

name = tag

mbligh

88ab90f

2007-08-29 15:52:49 +0000

[diff] [blame]

397

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

398

outputdir = os.path.join(self.resultdir, name)

399

if os.path.exists(outputdir):

400

msg = ("%s already exists, test <%s> may have"

401

" already run with tag <%s>"

402

% (outputdir, name, name) )

403

raise error.TestError(msg)

404

os.mkdir(outputdir)

405

mbligh

c1f8ced

2008-06-13 21:43:28 +0000

[diff] [blame^]

406

result, exc_info = self._rungroup(name, name, function, *args, **dargs)

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

407

408

# if there was a non-TestError exception, raise it

409

if exc_info and not isinstance(exc_info[1], error.TestError):

410

err = ''.join(traceback.format_exception(*exc_info))

411

raise error.TestError(name + ' failed\n' + err)

412

413

# pass back the actual return value from the function

return result

def new_container(self, mbytes=None, cpus=None, root=None, name=None):

418

if not autotest_utils.grep('cpuset', '/proc/filesystems'):

419

print "Containers not enabled by latest reboot"

420

return # containers weren't enabled in this kernel boot

421

pid = os.getpid()

422

if not name:

423

name = 'test%d' % pid # make arbitrary unique name

mbligh

2008-06-06 22:48:19 +0000

[diff] [blame]

424

self.container = cpuset.cpuset(name, job_size=mbytes, job_pid=pid,

425

cpus=cpus, root=root)

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

426

# This job's python shell is now running in the new container

427

# and all forked test processes will inherit that container

428

429

430

def release_container(self):

431

if self.container:

432

self.container.release()

433

self.container = None

434

mbligh

2008-01-25 18:16:41 +0000

[diff] [blame]

435

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

436

def cpu_count(self):

437

if self.container:

438

return len(self.container.cpus)

439

return autotest_utils.count_cpus() # use total system count

mbligh

2008-01-25 18:16:41 +0000

[diff] [blame]

440

mbligh

2008-01-25 18:16:41 +0000

[diff] [blame]

441

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

442

# Check the passed kernel identifier against the command line

443

# and the running kernel, abort the job on missmatch.

444

def kernel_check_ident(self, expected_when, expected_id, subdir,

445

type = 'src', patches=[]):

446

print (("POST BOOT: checking booted kernel " +

447

"mark=%d identity='%s' type='%s'") %

448

(expected_when, expected_id, type))

mbligh

2008-01-25 18:16:41 +0000

[diff] [blame]

449

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

450

running_id = autotest_utils.running_os_ident()

mbligh

2008-01-25 18:16:41 +0000

[diff] [blame]

451

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

452

cmdline = utils.read_one_line("/proc/cmdline")

mbligh

2008-01-25 18:16:41 +0000

[diff] [blame]

453

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

454

find_sum = re.compile(r'.*IDENT=(\d+)')

455

m = find_sum.match(cmdline)

456

cmdline_when = -1

457

if m:

458

cmdline_when = int(m.groups()[0])

apw

2007-09-25 16:53:05 +0000

[diff] [blame]

459

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

460

# We have all the facts, see if they indicate we

461

# booted the requested kernel or not.

462

bad = False

463

if (type == 'src' and expected_id != running_id or

464

type == 'rpm' and

465

not running_id.startswith(expected_id + '::')):

466

print "check_kernel_ident: kernel identifier mismatch"

467

bad = True

468

if expected_when != cmdline_when:

469

print "check_kernel_ident: kernel command line mismatch"

470

bad = True

apw

2007-09-25 16:53:05 +0000

[diff] [blame]

471

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

472

if bad:

473

print " Expected Ident: " + expected_id

474

print " Running Ident: " + running_id

475

print " Expected Mark: %d" % (expected_when)

476

print "Command Line Mark: %d" % (cmdline_when)

477

print " Command Line: " + cmdline

apw

2007-09-25 16:53:05 +0000

[diff] [blame]

478

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

479

raise error.JobError("boot failure", "reboot.verify")

apw

2007-09-25 16:53:05 +0000

[diff] [blame]

480

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

481

kernel_info = {'kernel': expected_id}

482

for i, patch in enumerate(patches):

483

kernel_info["patch%d" % i] = patch

484

self.record('GOOD', subdir, 'reboot.verify', expected_id)

485

self._decrement_group_level()

486

self.record('END GOOD', subdir, 'reboot',

487

optional_fields=kernel_info)

apw

2007-09-25 16:53:05 +0000

[diff] [blame]

488

apw

2007-09-25 16:53:05 +0000

[diff] [blame]

489

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

490

def filesystem(self, device, mountpoint = None, loop_size = 0):

491

if not mountpoint:

492

mountpoint = self.tmpdir

493

return filesystem.filesystem(self, device, mountpoint,loop_size)

apw

2007-09-25 16:53:05 +0000

[diff] [blame]

494

apw

2007-09-25 16:53:05 +0000

[diff] [blame]

495

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

496

def enable_external_logging(self):

497

pass

apw

2007-09-25 16:53:05 +0000

[diff] [blame]

498

mbligh

d7fb4a6

2006-10-01 00:57:53 +0000

[diff] [blame]

499

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

500

def disable_external_logging(self):

501

pass

mbligh

2008-04-07 21:51:17 +0000

[diff] [blame]

502

503

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

504

def reboot_setup(self):

505

pass

mbligh

2008-04-07 21:51:17 +0000

[diff] [blame]

506

mbligh

2008-04-07 21:51:17 +0000

[diff] [blame]

507

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

508

def reboot(self, tag='autotest'):

509

self.reboot_setup()

510

self.record('START', None, 'reboot')

511

self._increment_group_level()

512

self.record('GOOD', None, 'reboot.start')

513

self.harness.run_reboot()

514

default = self.config_get('boot.set_default')

515

if default:

516

self.bootloader.set_default(tag)

517

else:

518

self.bootloader.boot_once(tag)

519

cmd = "(sleep 5; reboot) </dev/null >/dev/null 2>&1 &"

520

utils.system(cmd)

521

self.quit()

mbligh

2006-10-02 00:37:35 +0000

[diff] [blame]

522

mbligh

2006-10-02 00:37:35 +0000

[diff] [blame]

523

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

524

def noop(self, text):

525

print "job: noop: " + text

mbligh

2006-10-02 00:37:35 +0000

[diff] [blame]

526

apw

2006-03-30 18:50:19 +0000

[diff] [blame]

527

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

528

def parallel(self, *tasklist):

529

"""Run tasks in parallel"""

mbligh

2006-10-02 00:37:35 +0000

[diff] [blame]

530

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

531

pids = []

532

old_log_filename = self.log_filename

533

for i, task in enumerate(tasklist):

534

self.log_filename = old_log_filename + (".%d" % i)

535

task_func = lambda: task[0](*task[1:])

mbligh

2008-06-06 22:48:19 +0000

[diff] [blame]

536

pids.append(parallel.fork_start(self.resultdir, task_func))

apw

8fef4ac

2006-10-10 22:53:37 +0000

[diff] [blame]

537

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

538

old_log_path = os.path.join(self.resultdir, old_log_filename)

539

old_log = open(old_log_path, "a")

540

exceptions = []

541

for i, pid in enumerate(pids):

542

# wait for the task to finish

543

try:

544

parallel.fork_waitfor(self.resultdir, pid)

545

except Exception, e:

546

exceptions.append(e)

547

# copy the logs from the subtask into the main log

548

new_log_path = old_log_path + (".%d" % i)

549

if os.path.exists(new_log_path):

550

new_log = open(new_log_path)

551

old_log.write(new_log.read())

552

new_log.close()

553

old_log.flush()

554

os.remove(new_log_path)

555

old_log.close()

mbligh

2007-12-19 16:19:05 +0000

[diff] [blame]

556

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

557

self.log_filename = old_log_filename

mbligh

2007-12-19 16:19:05 +0000

[diff] [blame]

558

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

559

# handle any exceptions raised by the parallel tasks

560

if exceptions:

561

msg = "%d task(s) failed" % len(exceptions)

562

raise error.JobError(msg, str(exceptions), exceptions)

apw

2006-03-30 18:50:19 +0000

[diff] [blame]

563

mbligh

d509b71

2008-01-14 17:41:25 +0000

[diff] [blame]

564

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

565

def quit(self):

566

# XXX: should have a better name.

567

self.harness.run_pause()

568

raise error.JobContinue("more to come")

mbligh

2006-10-02 00:37:35 +0000

[diff] [blame]

569

apw

2006-03-30 18:50:19 +0000

[diff] [blame]

570

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

571

def complete(self, status):

572

"""Clean up and exit"""

573

# We are about to exit 'complete' so clean up the control file.

574

try:

575

os.unlink(self.state_file)

576

except:

577

pass

mbligh

2006-10-02 00:37:35 +0000

[diff] [blame]

578

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

579

self.harness.run_complete()

580

self.disable_external_logging()

581

sys.exit(status)

mbligh

c0b10d3

2008-03-03 16:03:28 +0000

[diff] [blame]

582

apw

2006-03-30 18:50:19 +0000

[diff] [blame]

583

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

584

def set_state(self, var, val):

585

# Deep copies make sure that the state can't be altered

586

# without it being re-written. Perf wise, deep copies

587

# are overshadowed by pickling/loading.

588

self.state[var] = copy.deepcopy(val)

589

pickle.dump(self.state, open(self.state_file, 'w'))

mbligh

2006-10-02 00:37:35 +0000

[diff] [blame]

590

mbligh

2008-04-25 16:07:56 +0000

[diff] [blame]

591

mbligh

2008-06-10 16:26:59 +0000

[diff] [blame]

592

def _load_state(self):

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

593

assert not hasattr(self, "state")

594

try:

595

self.state = pickle.load(open(self.state_file, 'r'))

596

self.state_existed = True

597

except Exception:

598

print "Initializing the state engine."

599

self.state = {}

600

self.set_state('__steps', []) # writes pickle file

601

self.state_existed = False

mbligh

2008-04-25 16:07:56 +0000

[diff] [blame]

602

mbligh

2008-04-25 16:07:56 +0000

[diff] [blame]

603

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

604

def get_state(self, var, default=None):

605

if var in self.state or default == None:

606

val = self.state[var]

607

else:

608

val = default

609

return copy.deepcopy(val)

mbligh

2008-04-25 16:07:56 +0000

[diff] [blame]

610

mbligh

2008-04-25 16:07:56 +0000

[diff] [blame]

611

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

612

def __create_step_tuple(self, fn, args, dargs):

613

# Legacy code passes in an array where the first arg is

614

# the function or its name.

615

if isinstance(fn, list):

616

assert(len(args) == 0)

617

assert(len(dargs) == 0)

618

args = fn[1:]

619

fn = fn[0]

620

# Pickling actual functions is harry, thus we have to call

621

# them by name. Unfortunately, this means only functions

622

# defined globally can be used as a next step.

623

if callable(fn):

624

fn = fn.__name__

625

if not isinstance(fn, types.StringTypes):

626

raise StepError("Next steps must be functions or "

627

"strings containing the function name")

628

ancestry = copy.copy(self.current_step_ancestry)

629

return (ancestry, fn, args, dargs)

mbligh

2008-04-25 16:07:56 +0000

[diff] [blame]

630

mbligh

12a04cb

2008-04-25 16:07:20 +0000

[diff] [blame]

631

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

632

def next_step_append(self, fn, *args, **dargs):

633

"""Define the next step and place it at the end"""

634

steps = self.get_state('__steps')

635

steps.append(self.__create_step_tuple(fn, args, dargs))

636

self.set_state('__steps', steps)

mbligh

12a04cb

2008-04-25 16:07:20 +0000

[diff] [blame]

637

apw

2006-03-30 18:50:19 +0000

[diff] [blame]

638

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

639

def next_step(self, fn, *args, **dargs):

640

"""Create a new step and place it after any steps added

641

while running the current step but before any steps added in

642

previous steps"""

643

steps = self.get_state('__steps')

644

steps.insert(self.next_step_index,

645

self.__create_step_tuple(fn, args, dargs))

646

self.next_step_index += 1

647

self.set_state('__steps', steps)

mbligh

2006-10-02 00:37:35 +0000

[diff] [blame]

648

mbligh

8f4d043

2008-06-02 19:42:50 +0000

[diff] [blame]

649

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

650

def next_step_prepend(self, fn, *args, **dargs):

651

"""Insert a new step, executing first"""

652

steps = self.get_state('__steps')

653

steps.insert(0, self.__create_step_tuple(fn, args, dargs))

654

self.next_step_index += 1

655

self.set_state('__steps', steps)

mbligh

8f4d043

2008-06-02 19:42:50 +0000

[diff] [blame]

656

mbligh

237bed3

2007-09-05 13:05:57 +0000

[diff] [blame]

657

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

658

def _run_step_fn(self, local_vars, fn, args, dargs):

659

"""Run a (step) function within the given context"""

mbligh

237bed3

2007-09-05 13:05:57 +0000

[diff] [blame]

660

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

661

local_vars['__args'] = args

662

local_vars['__dargs'] = dargs

mbligh

2008-06-06 22:48:19 +0000

[diff] [blame]

663

exec('__ret = %s(*__args, **__dargs)' % fn, local_vars, local_vars)

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

664

return local_vars['__ret']

mbligh

2008-06-02 19:40:01 +0000

[diff] [blame]

665

mbligh

2008-06-02 19:40:01 +0000

[diff] [blame]

666

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

667

def _create_frame(self, global_vars, ancestry, fn_name):

668

"""Set up the environment like it would have been when this

669

function was first defined.

mbligh

2008-06-02 19:40:01 +0000

[diff] [blame]

670

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

671

Child step engine 'implementations' must have 'return locals()'

672

at end end of their steps. Because of this, we can call the

673

parent function and get back all child functions (i.e. those

674

defined within it).

mbligh

2008-06-02 19:40:01 +0000

[diff] [blame]

675

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

676

Unfortunately, the call stack of the function calling

677

job.next_step might have been deeper than the function it

678

added. In order to make sure that the environment is what it

679

should be, we need to then pop off the frames we built until

680

we find the frame where the function was first defined."""

mbligh

2008-06-02 19:40:01 +0000

[diff] [blame]

681

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

682

# The copies ensure that the parent frames are not modified

683

# while building child frames. This matters if we then

684

# pop some frames in the next part of this function.

685

current_frame = copy.copy(global_vars)

686

frames = [current_frame]

687

for steps_fn_name in ancestry:

mbligh

2008-06-06 22:48:19 +0000

[diff] [blame]

688

ret = self._run_step_fn(current_frame, steps_fn_name, [], {})

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

689

current_frame = copy.copy(ret)

690

frames.append(current_frame)

mbligh

2008-06-02 19:40:01 +0000

[diff] [blame]

691

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

692

while len(frames) > 2:

693

if fn_name not in frames[-2]:

694

break

695

if frames[-2][fn_name] != frames[-1][fn_name]:

696

break

697

frames.pop()

698

ancestry.pop()

mbligh

2008-06-02 19:40:01 +0000

[diff] [blame]

699

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

700

return (frames[-1], ancestry)

mbligh

2008-06-02 19:40:01 +0000

[diff] [blame]

701

mbligh

2008-06-02 19:40:01 +0000

[diff] [blame]

702

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

703

def _add_step_init(self, local_vars, current_function):

704

"""If the function returned a dictionary that includes a

705

function named 'step_init', prepend it to our list of steps.

706

This will only get run the first time a function with a nested

707

use of the step engine is run."""

mbligh

2008-06-02 19:40:01 +0000

[diff] [blame]

708

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

709

if (isinstance(local_vars, dict) and

710

'step_init' in local_vars and

711

callable(local_vars['step_init'])):

712

# The init step is a child of the function

713

# we were just running.

714

self.current_step_ancestry.append(current_function)

715

self.next_step_prepend('step_init')

mbligh

2008-06-02 19:40:01 +0000

[diff] [blame]

716

mbligh

2008-06-02 19:40:01 +0000

[diff] [blame]

717

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

718

def step_engine(self):

719

"""the stepping engine -- if the control file defines

720

step_init we will be using this engine to drive multiple runs.

721

"""

722

"""Do the next step"""

mbligh

2008-06-02 19:40:01 +0000

[diff] [blame]

723

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

724

# Set up the environment and then interpret the control file.

725

# Some control files will have code outside of functions,

726

# which means we need to have our state engine initialized

727

# before reading in the file.

728

global_control_vars = {'job': self}

729

exec(JOB_PREAMBLE, global_control_vars, global_control_vars)

730

execfile(self.control, global_control_vars, global_control_vars)

apw

83f8d77

2006-04-27 14:12:56 +0000

[diff] [blame]

731

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

732

# If we loaded in a mid-job state file, then we presumably

733

# know what steps we have yet to run.

734

if not self.state_existed:

735

if global_control_vars.has_key('step_init'):

736

self.next_step(global_control_vars['step_init'])

apw

83f8d77

2006-04-27 14:12:56 +0000

[diff] [blame]

737

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

738

# Iterate through the steps. If we reboot, we'll simply

739

# continue iterating on the next step.

740

while len(self.get_state('__steps')) > 0:

741

steps = self.get_state('__steps')

742

(ancestry, fn_name, args, dargs) = steps.pop(0)

743

self.set_state('__steps', steps)

apw

2006-03-30 18:50:19 +0000

[diff] [blame]

744

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

745

self.next_step_index = 0

mbligh

2008-06-06 22:48:19 +0000

[diff] [blame]

746

ret = self._create_frame(global_control_vars, ancestry, fn_name)

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

747

local_vars, self.current_step_ancestry = ret

mbligh

2008-06-06 22:48:19 +0000

[diff] [blame]

748

local_vars = self._run_step_fn(local_vars, fn_name, args, dargs)

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

749

self._add_step_init(local_vars, fn_name)

apw

2006-03-30 18:50:19 +0000

[diff] [blame]

750

apw

2006-03-30 18:50:19 +0000

[diff] [blame]

751

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

752

def _init_group_level(self):

753

self.group_level = self.get_state("__group_level", default=0)

mbligh

2006-10-02 00:37:35 +0000

[diff] [blame]

754

jadmanski

2008-05-01 22:05:31 +0000

[diff] [blame]

755

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

756

def _increment_group_level(self):

757

self.group_level += 1

758

self.set_state("__group_level", self.group_level)

jadmanski

2008-05-01 22:05:31 +0000

[diff] [blame]

759

jadmanski

2008-05-01 22:05:31 +0000

[diff] [blame]

760

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

761

def _decrement_group_level(self):

762

self.group_level -= 1

763

self.set_state("__group_level", self.group_level)

jadmanski

2008-05-01 22:05:31 +0000

[diff] [blame]

764

jadmanski

2008-05-01 22:05:31 +0000

[diff] [blame]

765

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

766

def record(self, status_code, subdir, operation, status = '',

767

optional_fields=None):

768

"""

769

Record job-level status

jadmanski

2008-05-01 22:05:31 +0000

[diff] [blame]

770

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

771

The intent is to make this file both machine parseable and

772

human readable. That involves a little more complexity, but

773

really isn't all that bad ;-)

apw

7db8d0b

2006-10-09 08:10:25 +0000

[diff] [blame]

774

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

775

Format is <status code>\t<subdir>\t<operation>\t<status>

mbligh

2007-09-18 21:34:57 +0000

[diff] [blame]

776

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

777

status code: (GOOD|WARN|FAIL|ABORT)

778

or START

779

or END (GOOD|WARN|FAIL|ABORT)

mbligh

2007-09-18 21:34:57 +0000

[diff] [blame]

780

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

781

subdir: MUST be a relevant subdirectory in the results,

782

or None, which will be represented as '----'

mbligh

2007-09-18 21:34:57 +0000

[diff] [blame]

783

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

784

operation: description of what you ran (e.g. "dbench", or

785

"mkfs -t foobar /dev/sda9")

mbligh

2007-09-18 21:34:57 +0000

[diff] [blame]

786

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

787

status: error message or "completed sucessfully"

mbligh

2007-09-18 21:34:57 +0000

[diff] [blame]

788

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

789

------------------------------------------------------------

mbligh

2007-09-18 21:34:57 +0000

[diff] [blame]

790

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

791

Initial tabs indicate indent levels for grouping, and is

792

governed by self.group_level

mbligh

2007-09-18 21:34:57 +0000

[diff] [blame]

793

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

794

multiline messages have secondary lines prefaced by a double

795

space (' ')

796

"""

mbligh

2007-09-18 21:34:57 +0000

[diff] [blame]

797

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

798

if subdir:

799

if re.match(r'[\n\t]', subdir):

mbligh

2008-06-06 22:48:19 +0000

[diff] [blame]

800

raise ValueError("Invalid character in subdir string")

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

801

substr = subdir

802

else:

803

substr = '----'

mbligh

2007-09-18 21:34:57 +0000

[diff] [blame]

804

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

805

if not logging.is_valid_status(status_code):

mbligh

2008-06-06 22:48:19 +0000

[diff] [blame]

806

raise ValueError("Invalid status code supplied: %s" % status_code)

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

807

if not operation:

808

operation = '----'

jadmanski

2008-05-01 22:05:31 +0000

[diff] [blame]

809

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

810

if re.match(r'[\n\t]', operation):

mbligh

2008-06-06 22:48:19 +0000

[diff] [blame]

811

raise ValueError("Invalid character in operation string")

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

812

operation = operation.rstrip()

jadmanski

2008-05-01 22:05:31 +0000

[diff] [blame]

813

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

814

if not optional_fields:

815

optional_fields = {}

jadmanski

2008-05-01 22:05:31 +0000

[diff] [blame]

816

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

817

status = status.rstrip()

818

status = re.sub(r"\t", " ", status)

819

# Ensure any continuation lines are marked so we can

820

# detect them in the status file to ensure it is parsable.

mbligh

2008-06-06 22:48:19 +0000

[diff] [blame]

821

status = re.sub(r"\n", "\n" + "\t" * self.group_level + " ", status)

mbligh

2007-09-18 21:34:57 +0000

[diff] [blame]

822

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

823

# Generate timestamps for inclusion in the logs

824

epoch_time = int(time.time()) # seconds since epoch, in UTC

825

local_time = time.localtime(epoch_time)

826

optional_fields["timestamp"] = str(epoch_time)

827

optional_fields["localtime"] = time.strftime("%b %d %H:%M:%S",

828

local_time)

mbligh

3027030

2007-11-05 20:33:52 +0000

[diff] [blame]

829

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

830

fields = [status_code, substr, operation]

831

fields += ["%s=%s" % x for x in optional_fields.iteritems()]

832

fields.append(status)

jadmanski

2008-05-01 22:05:31 +0000

[diff] [blame]

833

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

834

msg = '\t'.join(str(x) for x in fields)

835

msg = '\t' * self.group_level + msg

apw

7db8d0b

2006-10-09 08:10:25 +0000

[diff] [blame]

836

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

837

msg_tag = ""

838

if "." in self.log_filename:

839

msg_tag = self.log_filename.split(".", 1)[1]

mbligh

2007-12-19 16:19:05 +0000

[diff] [blame]

840

mbligh

2008-06-06 22:48:19 +0000

[diff] [blame]

841

self.harness.test_status_detail(status_code, substr, operation, status,

842

msg_tag)

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

843

self.harness.test_status(msg, msg_tag)

mbligh

2007-12-19 16:19:05 +0000

[diff] [blame]

844

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

845

# log to stdout (if enabled)

846

#if self.log_filename == self.DEFAULT_LOG_FILENAME:

847

print msg

mbligh

2007-12-19 16:19:05 +0000

[diff] [blame]

848

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

849

# log to the "root" status log

850

status_file = os.path.join(self.resultdir, self.log_filename)

851

open(status_file, "a").write(msg + "\n")

mbligh

2007-12-19 16:19:05 +0000

[diff] [blame]

852

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

853

# log to the subdir status log (if subdir is set)

854

if subdir:

855

dir = os.path.join(self.resultdir, subdir)

mbligh

2008-06-06 22:48:19 +0000

[diff] [blame]

856

status_file = os.path.join(dir, self.DEFAULT_LOG_FILENAME)

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

857

open(status_file, "a").write(msg + "\n")

apw

2006-04-27 14:14:04 +0000

[diff] [blame]

858

859

jadmanski

2008-05-06 20:38:53 +0000

[diff] [blame]

860

class disk_usage_monitor:

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

861

def __init__(self, logging_func, device, max_mb_per_hour):

862

self.func = logging_func

863

self.device = device

864

self.max_mb_per_hour = max_mb_per_hour

jadmanski

2008-05-06 20:38:53 +0000

[diff] [blame]

865

866

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

867

def start(self):

868

self.initial_space = autotest_utils.freespace(self.device)

869

self.start_time = time.time()

jadmanski

2008-05-06 20:38:53 +0000

[diff] [blame]

870

871

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

872

def stop(self):

873

# if no maximum usage rate was set, we don't need to

874

# generate any warnings

875

if not self.max_mb_per_hour:

876

return

jadmanski

2008-05-06 20:38:53 +0000

[diff] [blame]

877

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

878

final_space = autotest_utils.freespace(self.device)

879

used_space = self.initial_space - final_space

880

stop_time = time.time()

881

total_time = stop_time - self.start_time

882

# round up the time to one minute, to keep extremely short

883

# tests from generating false positives due to short, badly

884

# timed bursts of activity

885

total_time = max(total_time, 60.0)

jadmanski

2008-05-06 20:38:53 +0000

[diff] [blame]

886

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

887

# determine the usage rate

888

bytes_per_sec = used_space / total_time

889

mb_per_sec = bytes_per_sec / 1024**2

890

mb_per_hour = mb_per_sec * 60 * 60

jadmanski

2008-05-06 20:38:53 +0000

[diff] [blame]

891

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

892

if mb_per_hour > self.max_mb_per_hour:

mbligh

2008-06-06 22:48:19 +0000

[diff] [blame]

893

msg = ("disk space on %s was consumed at a rate of %.2f MB/hour")

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

894

msg %= (self.device, mb_per_hour)

895

self.func(msg)

jadmanski

2008-05-06 20:38:53 +0000

[diff] [blame]

896

897

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

898

@classmethod

899

def watch(cls, *monitor_args, **monitor_dargs):

900

""" Generic decorator to wrap a function call with the

901

standard create-monitor -> start -> call -> stop idiom."""

902

def decorator(func):

903

def watched_func(*args, **dargs):

904

monitor = cls(*monitor_args, **monitor_dargs)

monitor.start()

try:

func(*args, **dargs)

finally:

monitor.stop()

return watched_func

return decorator

jadmanski

2008-05-06 20:38:53 +0000

[diff] [blame]

912

913

mbligh

2008-04-07 21:51:17 +0000

[diff] [blame]

914

def runjob(control, cont = False, tag = "default", harness_type = '',

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

915

use_external_logging = False):

916

"""The main interface to this module

mbligh

2006-07-28 17:35:28 +0000

[diff] [blame]

917

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

918

control

919

The control file to use for this job.

920

cont

921

Whether this is the continuation of a previously started job

922

"""

923

control = os.path.abspath(control)

924

state = control + '.state'

apw

2006-04-27 14:14:04 +0000

[diff] [blame]

925

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

926

# instantiate the job object ready for the control file.

927

myjob = None

928

try:

929

# Check that the control file is valid

930

if not os.path.exists(control):

mbligh

2008-06-06 22:48:19 +0000

[diff] [blame]

931

raise error.JobError(control + ": control file not found")

apw

2006-04-27 14:14:04 +0000

[diff] [blame]

932

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

933

# When continuing, the job is complete when there is no

934

# state file, ensure we don't try and continue.

935

if cont and not os.path.exists(state):

936

raise error.JobComplete("all done")

937

if cont == False and os.path.exists(state):

938

os.unlink(state)

apw

2006-04-27 14:14:04 +0000

[diff] [blame]

939

mbligh

2008-06-06 22:48:19 +0000

[diff] [blame]

940

myjob = job(control, tag, cont, harness_type, use_external_logging)

apw

2006-04-27 14:14:04 +0000

[diff] [blame]

941

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

942

# Load in the users control file, may do any one of:

943

# 1) execute in toto

944

# 2) define steps, and select the first via next_step()

945

myjob.step_engine()

apw

2006-04-27 14:14:04 +0000

[diff] [blame]

946

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

947

except error.JobContinue:

948

sys.exit(5)

apw

2006-04-27 14:14:04 +0000

[diff] [blame]

949

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

950

except error.JobComplete:

951

sys.exit(1)

apw

b832e1b

2007-11-24 20:24:38 +0000

[diff] [blame]

952

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

953

except error.JobError, instance:

954

print "JOB ERROR: " + instance.args[0]

955

if myjob:

956

command = None

957

if len(instance.args) > 1:

958

command = instance.args[1]

959

myjob.record('ABORT', None, command, instance.args[0])

960

myjob._decrement_group_level()

961

myjob.record('END ABORT', None, None)

962

assert(myjob.group_level == 0)

963

myjob.complete(1)

964

else:

965

sys.exit(1)

apw

2006-04-27 14:14:04 +0000

[diff] [blame]

966

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

967

except Exception, e:

968

msg = str(e) + '\n' + traceback.format_exc()

969

print "JOB ERROR: " + msg

970

if myjob:

971

myjob.record('ABORT', None, None, msg)

972

myjob._decrement_group_level()

973

myjob.record('END ABORT', None, None)

974

assert(myjob.group_level == 0)

975

myjob.complete(1)

976

else:

977

sys.exit(1)

mbligh

892d37f

2007-03-01 17:03:25 +0000

[diff] [blame]

978

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

979

# If we get here, then we assume the job is complete and good.

980

myjob._decrement_group_level()

981

myjob.record('END GOOD', None, None)

982

assert(myjob.group_level == 0)

mbligh

0144e5a

2008-03-07 18:17:53 +0000

[diff] [blame]

983

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

984

myjob.complete(0)

mbligh

2008-04-07 21:51:17 +0000

[diff] [blame]

985

986

987

# site_job.py may be non-existant or empty, make sure that an appropriate

988

# site_job class is created nevertheless

989

try:

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

990

from site_job import site_job

mbligh

2008-04-07 21:51:17 +0000

[diff] [blame]

991

except ImportError:

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

992

class site_job(base_job):

993

pass

mbligh

2008-04-07 21:51:17 +0000

[diff] [blame]

994

995

class job(site_job):

jadmanski