Blame - client/bin/job.py - platform/external/autotest

2006-07-28 17:35:28 +0000

[diff] [blame]

1

"""The main job wrapper

mbligh

a250805

2006-05-28 21:29:53 +0000

[diff] [blame]

2

mbligh

2006-07-28 17:35:28 +0000

[diff] [blame]

3

This is the core infrastructure.

4

"""

5

6

__author__ = """Copyright Andy Whitcroft, Martin J. Bligh 2006"""

mbligh

a250805

2006-05-28 21:29:53 +0000

[diff] [blame]

7

mbligh

8f243ec

2006-10-10 05:55:49 +0000

[diff] [blame]

8

# standard stuff

mbligh

2008-04-25 16:07:56 +0000

[diff] [blame]

9

import os, sys, re, pickle, shutil, time, traceback, types, copy

mbligh

302482e

2008-05-01 20:06:16 +0000

[diff] [blame]

10

mbligh

8f243ec

2006-10-10 05:55:49 +0000

[diff] [blame]

11

# autotest stuff

mbligh

c61fb36

2008-06-05 16:22:15 +0000

[diff] [blame]

12

from autotest_lib.client.bin import autotest_utils, parallel, kernel, xen

13

from autotest_lib.client.bin import profilers, fd_stack, boottool, harness

14

from autotest_lib.client.bin import config, sysinfo, cpuset, test, filesystem

mbligh

e829ba5

2008-06-03 15:04:08 +0000

[diff] [blame]

15

from autotest_lib.client.common_lib import error, barrier, logging, utils

mbligh

302482e

2008-05-01 20:06:16 +0000

[diff] [blame]

16

mbligh

2008-04-25 16:07:56 +0000

[diff] [blame]

17

JOB_PREAMBLE = """

mbligh

4700d94

2008-06-11 21:42:31 +0000

[diff] [blame^]

18

from autotest_lib.common.common_lib.error import *

19

from autotest_lib.client.bin.autotest_utils import *

mbligh

2008-04-25 16:07:56 +0000

[diff] [blame]

20

"""

21

mbligh

302482e

2008-05-01 20:06:16 +0000

[diff] [blame]

22

class StepError(error.AutotestError):

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

23

pass

mbligh

12a04cb

2008-04-25 16:07:20 +0000

[diff] [blame]

24

25

mbligh

2008-06-10 16:26:59 +0000

[diff] [blame]

26

class base_job(object):

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

27

"""The actual job against which we do everything.

mbligh

2006-07-28 17:35:28 +0000

[diff] [blame]

28

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

29

Properties:

30

autodir

31

The top level autotest directory (/usr/local/autotest).

32

Comes from os.environ['AUTODIR'].

bindir

<autodir>/bin/

libdir

<autodir>/lib/

testdir

<autodir>/tests/

site_testdir

<autodir>/site_tests/

profdir

<autodir>/profilers/

tmpdir

<autodir>/tmp/

resultdir

<autodir>/results/<jobtag>

47

stdout

48

fd_stack object for stdout

49

stderr

50

fd_stack object for stderr

51

profilers

52

the profilers object for this job

53

harness

54

the server harness object for this job

55

config

56

the job configuration for this job

57

"""

mbligh

2006-07-28 17:35:28 +0000

[diff] [blame]

58

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

59

DEFAULT_LOG_FILENAME = "status"

mbligh

2007-12-19 16:19:05 +0000

[diff] [blame]

60

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

61

def __init__(self, control, jobtag, cont, harness_type=None,

62

use_external_logging = False):

63

"""

64

control

65

The control file (pathname of)

66

jobtag

67

The job tag string (eg "default")

68

cont

69

If this is the continuation of this job

70

harness_type

71

An alternative server harness

72

"""

73

self.autodir = os.environ['AUTODIR']

74

self.bindir = os.path.join(self.autodir, 'bin')

75

self.libdir = os.path.join(self.autodir, 'lib')

76

self.testdir = os.path.join(self.autodir, 'tests')

77

self.site_testdir = os.path.join(self.autodir, 'site_tests')

78

self.profdir = os.path.join(self.autodir, 'profilers')

79

self.tmpdir = os.path.join(self.autodir, 'tmp')

80

self.resultdir = os.path.join(self.autodir, 'results', jobtag)

81

self.sysinfodir = os.path.join(self.resultdir, 'sysinfo')

82

self.control = os.path.abspath(control)

83

self.state_file = self.control + '.state'

84

self.current_step_ancestry = []

85

self.next_step_index = 0

mbligh

2008-06-10 16:26:59 +0000

[diff] [blame]

86

self._load_state()

mbligh

a250805

2006-05-28 21:29:53 +0000

[diff] [blame]

87

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

88

if not cont:

89

"""

90

Don't cleanup the tmp dir (which contains the lockfile)

91

in the constructor, this would be a problem for multiple

92

jobs starting at the same time on the same client. Instead

93

do the delete at the server side. We simply create the tmp

94

directory here if it does not already exist.

95

"""

96

if not os.path.exists(self.tmpdir):

97

os.mkdir(self.tmpdir)

apw

96da1a4

2006-11-02 00:23:18 +0000

[diff] [blame]

98

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

99

results = os.path.join(self.autodir, 'results')

100

if not os.path.exists(results):

101

os.mkdir(results)

mbligh

c1cbc99

2008-05-27 20:01:45 +0000

[diff] [blame]

102

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

103

download = os.path.join(self.testdir, 'download')

104

if not os.path.exists(download):

105

os.mkdir(download)

apw

96da1a4

2006-11-02 00:23:18 +0000

[diff] [blame]

106

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

107

if os.path.exists(self.resultdir):

mbligh

2008-06-06 22:48:19 +0000

[diff] [blame]

108

utils.system('rm -rf ' + self.resultdir)

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

109

os.mkdir(self.resultdir)

110

os.mkdir(self.sysinfodir)

apw

870988b

2007-09-25 16:50:53 +0000

[diff] [blame]

111

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

112

os.mkdir(os.path.join(self.resultdir, 'debug'))

113

os.mkdir(os.path.join(self.resultdir, 'analysis'))

mbligh

f4ca14f

2008-03-03 16:03:05 +0000

[diff] [blame]

114

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

115

shutil.copyfile(self.control,

116

os.path.join(self.resultdir, 'control'))

mbligh

4b08966

2006-06-14 22:34:58 +0000

[diff] [blame]

117

mbligh

f4c3532

2006-03-13 01:01:10 +0000

[diff] [blame]

118

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

119

self.control = control

120

self.jobtag = jobtag

121

self.log_filename = self.DEFAULT_LOG_FILENAME

122

self.container = None

jadmanski

2008-05-01 22:05:31 +0000

[diff] [blame]

123

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

124

self.stdout = fd_stack.fd_stack(1, sys.stdout)

125

self.stderr = fd_stack.fd_stack(2, sys.stderr)

mbligh

f4c3532

2006-03-13 01:01:10 +0000

[diff] [blame]

126

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

127

self._init_group_level()

apw

059e1b1

2006-10-12 17:18:26 +0000

[diff] [blame]

128

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

129

self.config = config.config(self)

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

130

self.harness = harness.select(harness_type, self)

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

131

self.profilers = profilers.profilers(self)

mbligh

2006-10-02 00:37:35 +0000

[diff] [blame]

132

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

133

try:

134

tool = self.config_get('boottool.executable')

135

self.bootloader = boottool.boottool(tool)

136

except:

137

pass

mbligh

3a6d6ca

2006-04-23 15:50:24 +0000

[diff] [blame]

138

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

139

sysinfo.log_per_reboot_data(self.sysinfodir)

apw

357f50f

2006-12-01 11:22:39 +0000

[diff] [blame]

140

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

141

if not cont:

142

self.record('START', None, None)

143

self._increment_group_level()

apw

f91efaf

2007-11-24 17:32:13 +0000

[diff] [blame]

144

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

145

self.harness.run_start()

jadmanski

2008-05-06 20:38:53 +0000

[diff] [blame]

146

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

147

if use_external_logging:

148

self.enable_external_logging()

jadmanski

2008-05-06 20:38:53 +0000

[diff] [blame]

149

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

150

# load the max disk usage rate - default to no monitoring

mbligh

2008-06-06 22:48:19 +0000

[diff] [blame]

151

self.max_disk_usage_rate = self.get_state('__monitor_disk', default=0.0)

jadmanski

2008-05-06 20:38:53 +0000

[diff] [blame]

152

jadmanski

2008-05-06 20:38:53 +0000

[diff] [blame]

153

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

154

def monitor_disk_usage(self, max_rate):

155

"""\

156

Signal that the job should monitor disk space usage on /

157

and generate a warning if a test uses up disk space at a

158

rate exceeding 'max_rate'.

mbligh

0692e47

2007-08-30 16:07:53 +0000

[diff] [blame]

159

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

160

Parameters:

161

max_rate - the maximium allowed rate of disk consumption

162

during a test, in MB/hour, or 0 to indicate

163

no limit.

164

"""

165

self.set_state('__monitor_disk', max_rate)

166

self.max_disk_usage_rate = max_rate

mbligh

0692e47

2007-08-30 16:07:53 +0000

[diff] [blame]

167

168

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

169

def relative_path(self, path):

170

"""\

171

Return a patch relative to the job results directory

172

"""

173

head = len(self.resultdir) + 1 # remove the / inbetween

174

return path[head:]

mbligh

362ab3d

2007-08-30 11:24:04 +0000

[diff] [blame]

175

mbligh

2006-10-02 00:37:35 +0000

[diff] [blame]

176

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

177

def control_get(self):

178

return self.control

mbligh

8d83cdc

2007-12-03 18:09:18 +0000

[diff] [blame]

179

180

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

181

def control_set(self, control):

182

self.control = os.path.abspath(control)

apw

de1503a

2006-10-10 08:34:21 +0000

[diff] [blame]

183

184

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

185

def harness_select(self, which):

186

self.harness = harness.select(which, self)

apw

059e1b1

2006-10-12 17:18:26 +0000

[diff] [blame]

187

188

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

189

def config_set(self, name, value):

190

self.config.set(name, value)

apw

059e1b1

2006-10-12 17:18:26 +0000

[diff] [blame]

191

mbligh

1e8858e

2006-11-24 22:18:35 +0000

[diff] [blame]

192

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

193

def config_get(self, name):

194

return self.config.get(name)

mbligh

72b88fc

2006-12-16 18:41:35 +0000

[diff] [blame]

195

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

196

def setup_dirs(self, results_dir, tmp_dir):

197

if not tmp_dir:

198

tmp_dir = os.path.join(self.tmpdir, 'build')

199

if not os.path.exists(tmp_dir):

200

os.mkdir(tmp_dir)

201

if not os.path.isdir(tmp_dir):

202

e_msg = "Temp dir (%s) is not a dir - args backwards?" % self.tmpdir

203

raise ValueError(e_msg)

mbligh

8baa2ea

2006-12-17 23:01:24 +0000

[diff] [blame]

204

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

205

# We label the first build "build" and then subsequent ones

206

# as "build.2", "build.3", etc. Whilst this is a little bit

207

# inconsistent, 99.9% of jobs will only have one build

208

# (that's not done as kernbench, sparse, or buildtest),

209

# so it works out much cleaner. One of life's comprimises.

210

if not results_dir:

211

results_dir = os.path.join(self.resultdir, 'build')

212

i = 2

213

while os.path.exists(results_dir):

214

results_dir = os.path.join(self.resultdir, 'build.%d' % i)

215

i += 1

216

if not os.path.exists(results_dir):

217

os.mkdir(results_dir)

mbligh

8baa2ea

2006-12-17 23:01:24 +0000

[diff] [blame]

218

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

219

return (results_dir, tmp_dir)

mbligh

8baa2ea

2006-12-17 23:01:24 +0000

[diff] [blame]

220

221

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

222

def xen(self, base_tree, results_dir = '', tmp_dir = '', leave = False, \

223

kjob = None ):

224

"""Summon a xen object"""

225

(results_dir, tmp_dir) = self.setup_dirs(results_dir, tmp_dir)

226

build_dir = 'xen'

227

return xen.xen(self, base_tree, results_dir, tmp_dir, build_dir, leave, kjob)

mbligh

f4c3532

2006-03-13 01:01:10 +0000

[diff] [blame]

228

mbligh

2006-10-02 00:37:35 +0000

[diff] [blame]

229

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

230

def kernel(self, base_tree, results_dir = '', tmp_dir = '', leave = False):

231

"""Summon a kernel object"""

232

(results_dir, tmp_dir) = self.setup_dirs(results_dir, tmp_dir)

233

build_dir = 'linux'

mbligh

2008-06-06 22:48:19 +0000

[diff] [blame]

234

return kernel.auto_kernel(self, base_tree, results_dir, tmp_dir,

235

build_dir, leave)

mbligh

fadca20

2006-09-23 04:40:01 +0000

[diff] [blame]

236

mbligh

2006-10-02 00:37:35 +0000

[diff] [blame]

237

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

238

def barrier(self, *args, **kwds):

239

"""Create a barrier object"""

240

return barrier.barrier(*args, **kwds)

mbligh

4b08966

2006-06-14 22:34:58 +0000

[diff] [blame]

241

242

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

243

def setup_dep(self, deps):

244

"""Set up the dependencies for this test.

apw

f1a8116

2006-04-25 10:10:29 +0000

[diff] [blame]

245

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

246

deps is a list of libraries required for this test.

"""

for dep in deps:

try:

os.chdir(os.path.join(self.autodir, 'deps', dep))

251

utils.system('./' + dep + '.py')

252

except:

253

err = "setting up dependency " + dep + "\n"

254

raise error.UnhandledError(err)

mbligh

2006-10-02 00:37:35 +0000

[diff] [blame]

255

mbligh

12a7df7

2006-10-06 03:54:33 +0000

[diff] [blame]

256

mbligh

2008-06-10 16:26:59 +0000

[diff] [blame]

257

def _runtest(self, url, tag, args, dargs):

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

258

try:

259

l = lambda : test.runtest(self, url, tag, args, dargs)

260

pid = parallel.fork_start(self.resultdir, l)

261

parallel.fork_waitfor(self.resultdir, pid)

262

except error.AutotestError:

263

raise

264

except Exception, e:

265

msg = "Unhandled %s error occured during test\n"

266

msg %= str(e.__class__.__name__)

267

raise error.UnhandledError(msg)

mbligh

2007-11-13 17:11:22 +0000

[diff] [blame]

268

mbligh

65938a2

2007-12-10 16:58:52 +0000

[diff] [blame]

269

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

270

def run_test(self, url, *args, **dargs):

271

"""Summon a test object and run it.

jadmanski

2008-05-06 20:38:53 +0000

[diff] [blame]

272

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

273

tag

274

tag to add to testname

275

url

276

url of the test to run

277

"""

mbligh

2007-11-13 17:11:22 +0000

[diff] [blame]

278

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

279

if not url:

280

raise TypeError("Test name is invalid. "

281

"Switched arguments?")

282

(group, testname) = test.testname(url)

283

namelen = len(testname)

284

dargs = dargs.copy()

285

tntag = dargs.pop('tag', None)

286

if tntag: # testname tag is included in reported test name

287

testname += '.' + tntag

288

subdir = testname

289

sdtag = dargs.pop('subdir_tag', None)

290

if sdtag: # subdir-only tag is not included in reports

291

subdir = subdir + '.' + sdtag

292

tag = subdir[namelen+1:] # '' if none

mbligh

2007-11-13 17:11:22 +0000

[diff] [blame]

293

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

294

outputdir = os.path.join(self.resultdir, subdir)

295

if os.path.exists(outputdir):

296

msg = ("%s already exists, test <%s> may have"

297

" already run with tag <%s>"

298

% (outputdir, testname, tag) )

299

raise error.TestError(msg)

300

os.mkdir(outputdir)

mbligh

2007-11-13 17:11:22 +0000

[diff] [blame]

301

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

302

container = dargs.pop('container', None)

303

if container:

304

cname = container.get('name', None)

305

if not cname: # get old name

306

cname = container.get('container_name', None)

307

mbytes = container.get('mbytes', None)

308

if not mbytes: # get old name

309

mbytes = container.get('mem', None)

310

cpus = container.get('cpus', None)

311

if not cpus: # get old name

312

cpus = container.get('cpu', None)

313

root = container.get('root', None)

314

self.new_container(mbytes=mbytes, cpus=cpus,

315

root=root, name=cname)

316

# We are running in a container now...

mbligh

2007-11-13 17:11:22 +0000

[diff] [blame]

317

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

318

def log_warning(reason):

319

self.record("WARN", subdir, testname, reason)

mbligh

2008-06-06 22:48:19 +0000

[diff] [blame]

320

@disk_usage_monitor.watch(log_warning, "/", self.max_disk_usage_rate)

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

321

def group_func():

322

try:

mbligh

2008-06-10 16:26:59 +0000

[diff] [blame]

323

self._runtest(url, tag, args, dargs)

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

324

except error.TestNAError, detail:

325

self.record('TEST_NA', subdir, testname,

326

str(detail))

327

raise

328

except Exception, detail:

329

self.record('FAIL', subdir, testname,

str(detail))

raise

else:

self.record('GOOD', subdir, testname,

334

'completed successfully')

mbligh

2007-11-13 17:11:22 +0000

[diff] [blame]

335

mbligh

2008-06-10 16:26:59 +0000

[diff] [blame]

336

result, exc_info = self._rungroup(subdir, testname, group_func)

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

337

if container:

338

self.release_container()

339

if exc_info and isinstance(exc_info[1], error.TestError):

340

return False

341

elif exc_info:

342

raise exc_info[0], exc_info[1], exc_info[2]

343

else:

344

return True

apw

2006-03-30 18:50:19 +0000

[diff] [blame]

345

mbligh

d7fb4a6

2006-10-01 00:57:53 +0000

[diff] [blame]

346

mbligh

2008-06-10 16:26:59 +0000

[diff] [blame]

347

def _rungroup(self, subdir, testname, function, *args, **dargs):

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

"""\

subdir:

name of the group

testname:

name of the test to run, or support step

function:

subroutine to run

*args:

arguments for the function

mbligh

88ab90f

2007-08-29 15:52:49 +0000

[diff] [blame]

357

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

358

Returns a 2-tuple (result, exc_info) where result

359

is the return value of function, and exc_info is

360

the sys.exc_info() of the exception thrown by the

361

function (which may be None).

362

"""

apw

1da244b

2007-09-27 17:18:01 +0000

[diff] [blame]

363

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

364

result, exc_info = None, None

365

try:

366

self.record('START', subdir, testname)

367

self._increment_group_level()

368

result = function(*args, **dargs)

369

self._decrement_group_level()

370

self.record('END GOOD', subdir, testname)

371

except error.TestNAError, e:

372

self._decrement_group_level()

373

self.record('END TEST_NA', subdir, testname, str(e))

374

except Exception, e:

375

exc_info = sys.exc_info()

376

self._decrement_group_level()

377

err_msg = str(e) + '\n' + traceback.format_exc()

378

self.record('END FAIL', subdir, testname, err_msg)

mbligh

d660afe

2008-06-05 22:17:53 +0000

[diff] [blame]

379

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

380

return result, exc_info

apw

1da244b

2007-09-27 17:18:01 +0000

[diff] [blame]

381

mbligh

88ab90f

2007-08-29 15:52:49 +0000

[diff] [blame]

382

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

383

def run_group(self, function, *args, **dargs):

"""\

function:

subroutine to run

*args:

arguments for the function

389

"""

apw

08403ca

2007-09-27 17:17:22 +0000

[diff] [blame]

390

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

391

# Allow the tag for the group to be specified

392

name = function.__name__

393

tag = dargs.pop('tag', None)

394

if tag:

395

name = tag

mbligh

88ab90f

2007-08-29 15:52:49 +0000

[diff] [blame]

396

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

397

outputdir = os.path.join(self.resultdir, name)

398

if os.path.exists(outputdir):

399

msg = ("%s already exists, test <%s> may have"

400

" already run with tag <%s>"

401

% (outputdir, name, name) )

402

raise error.TestError(msg)

403

os.mkdir(outputdir)

404

mbligh

2008-06-06 22:48:19 +0000

[diff] [blame]

405

result, exc_info = self.__rungroup(name, name, function, *args, **dargs)

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

406

407

# if there was a non-TestError exception, raise it

408

if exc_info and not isinstance(exc_info[1], error.TestError):

409

err = ''.join(traceback.format_exception(*exc_info))

410

raise error.TestError(name + ' failed\n' + err)

411

412

# pass back the actual return value from the function

return result

def new_container(self, mbytes=None, cpus=None, root=None, name=None):

417

if not autotest_utils.grep('cpuset', '/proc/filesystems'):

418

print "Containers not enabled by latest reboot"

419

return # containers weren't enabled in this kernel boot

420

pid = os.getpid()

421

if not name:

422

name = 'test%d' % pid # make arbitrary unique name

mbligh

2008-06-06 22:48:19 +0000

[diff] [blame]

423

self.container = cpuset.cpuset(name, job_size=mbytes, job_pid=pid,

424

cpus=cpus, root=root)

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

425

# This job's python shell is now running in the new container

426

# and all forked test processes will inherit that container

427

428

429

def release_container(self):

430

if self.container:

431

self.container.release()

432

self.container = None

433

mbligh

2008-01-25 18:16:41 +0000

[diff] [blame]

434

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

435

def cpu_count(self):

436

if self.container:

437

return len(self.container.cpus)

438

return autotest_utils.count_cpus() # use total system count

mbligh

2008-01-25 18:16:41 +0000

[diff] [blame]

439

mbligh

2008-01-25 18:16:41 +0000

[diff] [blame]

440

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

441

# Check the passed kernel identifier against the command line

442

# and the running kernel, abort the job on missmatch.

443

def kernel_check_ident(self, expected_when, expected_id, subdir,

444

type = 'src', patches=[]):

445

print (("POST BOOT: checking booted kernel " +

446

"mark=%d identity='%s' type='%s'") %

447

(expected_when, expected_id, type))

mbligh

2008-01-25 18:16:41 +0000

[diff] [blame]

448

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

449

running_id = autotest_utils.running_os_ident()

mbligh

2008-01-25 18:16:41 +0000

[diff] [blame]

450

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

451

cmdline = utils.read_one_line("/proc/cmdline")

mbligh

2008-01-25 18:16:41 +0000

[diff] [blame]

452

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

453

find_sum = re.compile(r'.*IDENT=(\d+)')

454

m = find_sum.match(cmdline)

455

cmdline_when = -1

456

if m:

457

cmdline_when = int(m.groups()[0])

apw

2007-09-25 16:53:05 +0000

[diff] [blame]

458

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

459

# We have all the facts, see if they indicate we

460

# booted the requested kernel or not.

461

bad = False

462

if (type == 'src' and expected_id != running_id or

463

type == 'rpm' and

464

not running_id.startswith(expected_id + '::')):

465

print "check_kernel_ident: kernel identifier mismatch"

466

bad = True

467

if expected_when != cmdline_when:

468

print "check_kernel_ident: kernel command line mismatch"

469

bad = True

apw

2007-09-25 16:53:05 +0000

[diff] [blame]

470

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

471

if bad:

472

print " Expected Ident: " + expected_id

473

print " Running Ident: " + running_id

474

print " Expected Mark: %d" % (expected_when)

475

print "Command Line Mark: %d" % (cmdline_when)

476

print " Command Line: " + cmdline

apw

2007-09-25 16:53:05 +0000

[diff] [blame]

477

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

478

raise error.JobError("boot failure", "reboot.verify")

apw

2007-09-25 16:53:05 +0000

[diff] [blame]

479

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

480

kernel_info = {'kernel': expected_id}

481

for i, patch in enumerate(patches):

482

kernel_info["patch%d" % i] = patch

483

self.record('GOOD', subdir, 'reboot.verify', expected_id)

484

self._decrement_group_level()

485

self.record('END GOOD', subdir, 'reboot',

486

optional_fields=kernel_info)

apw

2007-09-25 16:53:05 +0000

[diff] [blame]

487

apw

2007-09-25 16:53:05 +0000

[diff] [blame]

488

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

489

def filesystem(self, device, mountpoint = None, loop_size = 0):

490

if not mountpoint:

491

mountpoint = self.tmpdir

492

return filesystem.filesystem(self, device, mountpoint,loop_size)

apw

2007-09-25 16:53:05 +0000

[diff] [blame]

493

apw

2007-09-25 16:53:05 +0000

[diff] [blame]

494

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

495

def enable_external_logging(self):

496

pass

apw

2007-09-25 16:53:05 +0000

[diff] [blame]

497

mbligh

d7fb4a6

2006-10-01 00:57:53 +0000

[diff] [blame]

498

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

499

def disable_external_logging(self):

500

pass

mbligh

2008-04-07 21:51:17 +0000

[diff] [blame]

501

502

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

503

def reboot_setup(self):

504

pass

mbligh

2008-04-07 21:51:17 +0000

[diff] [blame]

505

mbligh

2008-04-07 21:51:17 +0000

[diff] [blame]

506

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

507

def reboot(self, tag='autotest'):

508

self.reboot_setup()

509

self.record('START', None, 'reboot')

510

self._increment_group_level()

511

self.record('GOOD', None, 'reboot.start')

512

self.harness.run_reboot()

513

default = self.config_get('boot.set_default')

514

if default:

515

self.bootloader.set_default(tag)

516

else:

517

self.bootloader.boot_once(tag)

518

cmd = "(sleep 5; reboot) </dev/null >/dev/null 2>&1 &"

519

utils.system(cmd)

520

self.quit()

mbligh

2006-10-02 00:37:35 +0000

[diff] [blame]

521

mbligh

2006-10-02 00:37:35 +0000

[diff] [blame]

522

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

523

def noop(self, text):

524

print "job: noop: " + text

mbligh

2006-10-02 00:37:35 +0000

[diff] [blame]

525

apw

2006-03-30 18:50:19 +0000

[diff] [blame]

526

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

527

def parallel(self, *tasklist):

528

"""Run tasks in parallel"""

mbligh

2006-10-02 00:37:35 +0000

[diff] [blame]

529

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

530

pids = []

531

old_log_filename = self.log_filename

532

for i, task in enumerate(tasklist):

533

self.log_filename = old_log_filename + (".%d" % i)

534

task_func = lambda: task[0](*task[1:])

mbligh

2008-06-06 22:48:19 +0000

[diff] [blame]

535

pids.append(parallel.fork_start(self.resultdir, task_func))

apw

8fef4ac

2006-10-10 22:53:37 +0000

[diff] [blame]

536

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

537

old_log_path = os.path.join(self.resultdir, old_log_filename)

538

old_log = open(old_log_path, "a")

539

exceptions = []

540

for i, pid in enumerate(pids):

541

# wait for the task to finish

542

try:

543

parallel.fork_waitfor(self.resultdir, pid)

544

except Exception, e:

545

exceptions.append(e)

546

# copy the logs from the subtask into the main log

547

new_log_path = old_log_path + (".%d" % i)

548

if os.path.exists(new_log_path):

549

new_log = open(new_log_path)

550

old_log.write(new_log.read())

551

new_log.close()

552

old_log.flush()

553

os.remove(new_log_path)

554

old_log.close()

mbligh

2007-12-19 16:19:05 +0000

[diff] [blame]

555

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

556

self.log_filename = old_log_filename

mbligh

2007-12-19 16:19:05 +0000

[diff] [blame]

557

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

558

# handle any exceptions raised by the parallel tasks

559

if exceptions:

560

msg = "%d task(s) failed" % len(exceptions)

561

raise error.JobError(msg, str(exceptions), exceptions)

apw

2006-03-30 18:50:19 +0000

[diff] [blame]

562

mbligh

d509b71

2008-01-14 17:41:25 +0000

[diff] [blame]

563

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

564

def quit(self):

565

# XXX: should have a better name.

566

self.harness.run_pause()

567

raise error.JobContinue("more to come")

mbligh

2006-10-02 00:37:35 +0000

[diff] [blame]

568

apw

2006-03-30 18:50:19 +0000

[diff] [blame]

569

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

570

def complete(self, status):

571

"""Clean up and exit"""

572

# We are about to exit 'complete' so clean up the control file.

573

try:

574

os.unlink(self.state_file)

575

except:

576

pass

mbligh

2006-10-02 00:37:35 +0000

[diff] [blame]

577

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

578

self.harness.run_complete()

579

self.disable_external_logging()

580

sys.exit(status)

mbligh

c0b10d3

2008-03-03 16:03:28 +0000

[diff] [blame]

581

apw

2006-03-30 18:50:19 +0000

[diff] [blame]

582

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

583

def set_state(self, var, val):

584

# Deep copies make sure that the state can't be altered

585

# without it being re-written. Perf wise, deep copies

586

# are overshadowed by pickling/loading.

587

self.state[var] = copy.deepcopy(val)

588

pickle.dump(self.state, open(self.state_file, 'w'))

mbligh

2006-10-02 00:37:35 +0000

[diff] [blame]

589

mbligh

2008-04-25 16:07:56 +0000

[diff] [blame]

590

mbligh

2008-06-10 16:26:59 +0000

[diff] [blame]

591

def _load_state(self):

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

592

assert not hasattr(self, "state")

593

try:

594

self.state = pickle.load(open(self.state_file, 'r'))

595

self.state_existed = True

596

except Exception:

597

print "Initializing the state engine."

598

self.state = {}

599

self.set_state('__steps', []) # writes pickle file

600

self.state_existed = False

mbligh

2008-04-25 16:07:56 +0000

[diff] [blame]

601

mbligh

2008-04-25 16:07:56 +0000

[diff] [blame]

602

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

603

def get_state(self, var, default=None):

604

if var in self.state or default == None:

605

val = self.state[var]

606

else:

607

val = default

608

return copy.deepcopy(val)

mbligh

2008-04-25 16:07:56 +0000

[diff] [blame]

609

mbligh

2008-04-25 16:07:56 +0000

[diff] [blame]

610

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

611

def __create_step_tuple(self, fn, args, dargs):

612

# Legacy code passes in an array where the first arg is

613

# the function or its name.

614

if isinstance(fn, list):

615

assert(len(args) == 0)

616

assert(len(dargs) == 0)

617

args = fn[1:]

618

fn = fn[0]

619

# Pickling actual functions is harry, thus we have to call

620

# them by name. Unfortunately, this means only functions

621

# defined globally can be used as a next step.

622

if callable(fn):

623

fn = fn.__name__

624

if not isinstance(fn, types.StringTypes):

625

raise StepError("Next steps must be functions or "

626

"strings containing the function name")

627

ancestry = copy.copy(self.current_step_ancestry)

628

return (ancestry, fn, args, dargs)

mbligh

2008-04-25 16:07:56 +0000

[diff] [blame]

629

mbligh

12a04cb

2008-04-25 16:07:20 +0000

[diff] [blame]

630

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

631

def next_step_append(self, fn, *args, **dargs):

632

"""Define the next step and place it at the end"""

633

steps = self.get_state('__steps')

634

steps.append(self.__create_step_tuple(fn, args, dargs))

635

self.set_state('__steps', steps)

mbligh

12a04cb

2008-04-25 16:07:20 +0000

[diff] [blame]

636

apw

2006-03-30 18:50:19 +0000

[diff] [blame]

637

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

638

def next_step(self, fn, *args, **dargs):

639

"""Create a new step and place it after any steps added

640

while running the current step but before any steps added in

641

previous steps"""

642

steps = self.get_state('__steps')

643

steps.insert(self.next_step_index,

644

self.__create_step_tuple(fn, args, dargs))

645

self.next_step_index += 1

646

self.set_state('__steps', steps)

mbligh

2006-10-02 00:37:35 +0000

[diff] [blame]

647

mbligh

8f4d043

2008-06-02 19:42:50 +0000

[diff] [blame]

648

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

649

def next_step_prepend(self, fn, *args, **dargs):

650

"""Insert a new step, executing first"""

651

steps = self.get_state('__steps')

652

steps.insert(0, self.__create_step_tuple(fn, args, dargs))

653

self.next_step_index += 1

654

self.set_state('__steps', steps)

mbligh

8f4d043

2008-06-02 19:42:50 +0000

[diff] [blame]

655

mbligh

237bed3

2007-09-05 13:05:57 +0000

[diff] [blame]

656

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

657

def _run_step_fn(self, local_vars, fn, args, dargs):

658

"""Run a (step) function within the given context"""

mbligh

237bed3

2007-09-05 13:05:57 +0000

[diff] [blame]

659

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

660

local_vars['__args'] = args

661

local_vars['__dargs'] = dargs

mbligh

2008-06-06 22:48:19 +0000

[diff] [blame]

662

exec('__ret = %s(*__args, **__dargs)' % fn, local_vars, local_vars)

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

663

return local_vars['__ret']

mbligh

2008-06-02 19:40:01 +0000

[diff] [blame]

664

mbligh

2008-06-02 19:40:01 +0000

[diff] [blame]

665

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

666

def _create_frame(self, global_vars, ancestry, fn_name):

667

"""Set up the environment like it would have been when this

668

function was first defined.

mbligh

2008-06-02 19:40:01 +0000

[diff] [blame]

669

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

670

Child step engine 'implementations' must have 'return locals()'

671

at end end of their steps. Because of this, we can call the

672

parent function and get back all child functions (i.e. those

673

defined within it).

mbligh

2008-06-02 19:40:01 +0000

[diff] [blame]

674

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

675

Unfortunately, the call stack of the function calling

676

job.next_step might have been deeper than the function it

677

added. In order to make sure that the environment is what it

678

should be, we need to then pop off the frames we built until

679

we find the frame where the function was first defined."""

mbligh

2008-06-02 19:40:01 +0000

[diff] [blame]

680

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

681

# The copies ensure that the parent frames are not modified

682

# while building child frames. This matters if we then

683

# pop some frames in the next part of this function.

684

current_frame = copy.copy(global_vars)

685

frames = [current_frame]

686

for steps_fn_name in ancestry:

mbligh

2008-06-06 22:48:19 +0000

[diff] [blame]

687

ret = self._run_step_fn(current_frame, steps_fn_name, [], {})

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

688

current_frame = copy.copy(ret)

689

frames.append(current_frame)

mbligh

2008-06-02 19:40:01 +0000

[diff] [blame]

690

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

691

while len(frames) > 2:

692

if fn_name not in frames[-2]:

693

break

694

if frames[-2][fn_name] != frames[-1][fn_name]:

695

break

696

frames.pop()

697

ancestry.pop()

mbligh

2008-06-02 19:40:01 +0000

[diff] [blame]

698

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

699

return (frames[-1], ancestry)

mbligh

2008-06-02 19:40:01 +0000

[diff] [blame]

700

mbligh

2008-06-02 19:40:01 +0000

[diff] [blame]

701

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

702

def _add_step_init(self, local_vars, current_function):

703

"""If the function returned a dictionary that includes a

704

function named 'step_init', prepend it to our list of steps.

705

This will only get run the first time a function with a nested

706

use of the step engine is run."""

mbligh

2008-06-02 19:40:01 +0000

[diff] [blame]

707

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

708

if (isinstance(local_vars, dict) and

709

'step_init' in local_vars and

710

callable(local_vars['step_init'])):

711

# The init step is a child of the function

712

# we were just running.

713

self.current_step_ancestry.append(current_function)

714

self.next_step_prepend('step_init')

mbligh

2008-06-02 19:40:01 +0000

[diff] [blame]

715

mbligh

2008-06-02 19:40:01 +0000

[diff] [blame]

716

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

717

def step_engine(self):

718

"""the stepping engine -- if the control file defines

719

step_init we will be using this engine to drive multiple runs.

720

"""

721

"""Do the next step"""

mbligh

2008-06-02 19:40:01 +0000

[diff] [blame]

722

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

723

# Set up the environment and then interpret the control file.

724

# Some control files will have code outside of functions,

725

# which means we need to have our state engine initialized

726

# before reading in the file.

727

global_control_vars = {'job': self}

728

exec(JOB_PREAMBLE, global_control_vars, global_control_vars)

729

execfile(self.control, global_control_vars, global_control_vars)

apw

83f8d77

2006-04-27 14:12:56 +0000

[diff] [blame]

730

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

731

# If we loaded in a mid-job state file, then we presumably

732

# know what steps we have yet to run.

733

if not self.state_existed:

734

if global_control_vars.has_key('step_init'):

735

self.next_step(global_control_vars['step_init'])

apw

83f8d77

2006-04-27 14:12:56 +0000

[diff] [blame]

736

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

737

# Iterate through the steps. If we reboot, we'll simply

738

# continue iterating on the next step.

739

while len(self.get_state('__steps')) > 0:

740

steps = self.get_state('__steps')

741

(ancestry, fn_name, args, dargs) = steps.pop(0)

742

self.set_state('__steps', steps)

apw

2006-03-30 18:50:19 +0000

[diff] [blame]

743

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

744

self.next_step_index = 0

mbligh

2008-06-06 22:48:19 +0000

[diff] [blame]

745

ret = self._create_frame(global_control_vars, ancestry, fn_name)

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

746

local_vars, self.current_step_ancestry = ret

mbligh

2008-06-06 22:48:19 +0000

[diff] [blame]

747

local_vars = self._run_step_fn(local_vars, fn_name, args, dargs)

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

748

self._add_step_init(local_vars, fn_name)

apw

2006-03-30 18:50:19 +0000

[diff] [blame]

749

apw

2006-03-30 18:50:19 +0000

[diff] [blame]

750

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

751

def _init_group_level(self):

752

self.group_level = self.get_state("__group_level", default=0)

mbligh

2006-10-02 00:37:35 +0000

[diff] [blame]

753

jadmanski

2008-05-01 22:05:31 +0000

[diff] [blame]

754

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

755

def _increment_group_level(self):

756

self.group_level += 1

757

self.set_state("__group_level", self.group_level)

jadmanski

2008-05-01 22:05:31 +0000

[diff] [blame]

758

jadmanski

2008-05-01 22:05:31 +0000

[diff] [blame]

759

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

760

def _decrement_group_level(self):

761

self.group_level -= 1

762

self.set_state("__group_level", self.group_level)

jadmanski

2008-05-01 22:05:31 +0000

[diff] [blame]

763

jadmanski

2008-05-01 22:05:31 +0000

[diff] [blame]

764

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

765

def record(self, status_code, subdir, operation, status = '',

766

optional_fields=None):

767

"""

768

Record job-level status

jadmanski

2008-05-01 22:05:31 +0000

[diff] [blame]

769

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

770

The intent is to make this file both machine parseable and

771

human readable. That involves a little more complexity, but

772

really isn't all that bad ;-)

apw

7db8d0b

2006-10-09 08:10:25 +0000

[diff] [blame]

773

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

774

Format is <status code>\t<subdir>\t<operation>\t<status>

mbligh

2007-09-18 21:34:57 +0000

[diff] [blame]

775

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

776

status code: (GOOD|WARN|FAIL|ABORT)

777

or START

778

or END (GOOD|WARN|FAIL|ABORT)

mbligh

2007-09-18 21:34:57 +0000

[diff] [blame]

779

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

780

subdir: MUST be a relevant subdirectory in the results,

781

or None, which will be represented as '----'

mbligh

2007-09-18 21:34:57 +0000

[diff] [blame]

782

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

783

operation: description of what you ran (e.g. "dbench", or

784

"mkfs -t foobar /dev/sda9")

mbligh

2007-09-18 21:34:57 +0000

[diff] [blame]

785

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

786

status: error message or "completed sucessfully"

mbligh

2007-09-18 21:34:57 +0000

[diff] [blame]

787

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

788

------------------------------------------------------------

mbligh

2007-09-18 21:34:57 +0000

[diff] [blame]

789

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

790

Initial tabs indicate indent levels for grouping, and is

791

governed by self.group_level

mbligh

2007-09-18 21:34:57 +0000

[diff] [blame]

792

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

793

multiline messages have secondary lines prefaced by a double

794

space (' ')

795

"""

mbligh

2007-09-18 21:34:57 +0000

[diff] [blame]

796

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

797

if subdir:

798

if re.match(r'[\n\t]', subdir):

mbligh

2008-06-06 22:48:19 +0000

[diff] [blame]

799

raise ValueError("Invalid character in subdir string")

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

800

substr = subdir

801

else:

802

substr = '----'

mbligh

2007-09-18 21:34:57 +0000

[diff] [blame]

803

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

804

if not logging.is_valid_status(status_code):

mbligh

2008-06-06 22:48:19 +0000

[diff] [blame]

805

raise ValueError("Invalid status code supplied: %s" % status_code)

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

806

if not operation:

807

operation = '----'

jadmanski

2008-05-01 22:05:31 +0000

[diff] [blame]

808

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

809

if re.match(r'[\n\t]', operation):

mbligh

2008-06-06 22:48:19 +0000

[diff] [blame]

810

raise ValueError("Invalid character in operation string")

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

811

operation = operation.rstrip()

jadmanski

2008-05-01 22:05:31 +0000

[diff] [blame]

812

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

813

if not optional_fields:

814

optional_fields = {}

jadmanski

2008-05-01 22:05:31 +0000

[diff] [blame]

815

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

816

status = status.rstrip()

817

status = re.sub(r"\t", " ", status)

818

# Ensure any continuation lines are marked so we can

819

# detect them in the status file to ensure it is parsable.

mbligh

2008-06-06 22:48:19 +0000

[diff] [blame]

820

status = re.sub(r"\n", "\n" + "\t" * self.group_level + " ", status)

mbligh

2007-09-18 21:34:57 +0000

[diff] [blame]

821

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

822

# Generate timestamps for inclusion in the logs

823

epoch_time = int(time.time()) # seconds since epoch, in UTC

824

local_time = time.localtime(epoch_time)

825

optional_fields["timestamp"] = str(epoch_time)

826

optional_fields["localtime"] = time.strftime("%b %d %H:%M:%S",

827

local_time)

mbligh

3027030

2007-11-05 20:33:52 +0000

[diff] [blame]

828

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

829

fields = [status_code, substr, operation]

830

fields += ["%s=%s" % x for x in optional_fields.iteritems()]

831

fields.append(status)

jadmanski

2008-05-01 22:05:31 +0000

[diff] [blame]

832

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

833

msg = '\t'.join(str(x) for x in fields)

834

msg = '\t' * self.group_level + msg

apw

7db8d0b

2006-10-09 08:10:25 +0000

[diff] [blame]

835

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

836

msg_tag = ""

837

if "." in self.log_filename:

838

msg_tag = self.log_filename.split(".", 1)[1]

mbligh

2007-12-19 16:19:05 +0000

[diff] [blame]

839

mbligh

2008-06-06 22:48:19 +0000

[diff] [blame]

840

self.harness.test_status_detail(status_code, substr, operation, status,

841

msg_tag)

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

842

self.harness.test_status(msg, msg_tag)

mbligh

2007-12-19 16:19:05 +0000

[diff] [blame]

843

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

844

# log to stdout (if enabled)

845

#if self.log_filename == self.DEFAULT_LOG_FILENAME:

846

print msg

mbligh

2007-12-19 16:19:05 +0000

[diff] [blame]

847

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

848

# log to the "root" status log

849

status_file = os.path.join(self.resultdir, self.log_filename)

850

open(status_file, "a").write(msg + "\n")

mbligh

2007-12-19 16:19:05 +0000

[diff] [blame]

851

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

852

# log to the subdir status log (if subdir is set)

853

if subdir:

854

dir = os.path.join(self.resultdir, subdir)

mbligh

2008-06-06 22:48:19 +0000

[diff] [blame]

855

status_file = os.path.join(dir, self.DEFAULT_LOG_FILENAME)

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

856

open(status_file, "a").write(msg + "\n")

apw

2006-04-27 14:14:04 +0000

[diff] [blame]

857

858

jadmanski

2008-05-06 20:38:53 +0000

[diff] [blame]

859

class disk_usage_monitor:

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

860

def __init__(self, logging_func, device, max_mb_per_hour):

861

self.func = logging_func

862

self.device = device

863

self.max_mb_per_hour = max_mb_per_hour

jadmanski

2008-05-06 20:38:53 +0000

[diff] [blame]

864

865

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

866

def start(self):

867

self.initial_space = autotest_utils.freespace(self.device)

868

self.start_time = time.time()

jadmanski

2008-05-06 20:38:53 +0000

[diff] [blame]

869

870

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

871

def stop(self):

872

# if no maximum usage rate was set, we don't need to

873

# generate any warnings

874

if not self.max_mb_per_hour:

875

return

jadmanski

2008-05-06 20:38:53 +0000

[diff] [blame]

876

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

877

final_space = autotest_utils.freespace(self.device)

878

used_space = self.initial_space - final_space

879

stop_time = time.time()

880

total_time = stop_time - self.start_time

881

# round up the time to one minute, to keep extremely short

882

# tests from generating false positives due to short, badly

883

# timed bursts of activity

884

total_time = max(total_time, 60.0)

jadmanski

2008-05-06 20:38:53 +0000

[diff] [blame]

885

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

886

# determine the usage rate

887

bytes_per_sec = used_space / total_time

888

mb_per_sec = bytes_per_sec / 1024**2

889

mb_per_hour = mb_per_sec * 60 * 60

jadmanski

2008-05-06 20:38:53 +0000

[diff] [blame]

890

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

891

if mb_per_hour > self.max_mb_per_hour:

mbligh

2008-06-06 22:48:19 +0000

[diff] [blame]

892

msg = ("disk space on %s was consumed at a rate of %.2f MB/hour")

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

893

msg %= (self.device, mb_per_hour)

894

self.func(msg)

jadmanski

2008-05-06 20:38:53 +0000

[diff] [blame]

895

896

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

897

@classmethod

898

def watch(cls, *monitor_args, **monitor_dargs):

899

""" Generic decorator to wrap a function call with the

900

standard create-monitor -> start -> call -> stop idiom."""

901

def decorator(func):

902

def watched_func(*args, **dargs):

903

monitor = cls(*monitor_args, **monitor_dargs)

monitor.start()

try:

func(*args, **dargs)

finally:

monitor.stop()

return watched_func

return decorator

jadmanski

2008-05-06 20:38:53 +0000

[diff] [blame]

911

912

mbligh

2008-04-07 21:51:17 +0000

[diff] [blame]

913

def runjob(control, cont = False, tag = "default", harness_type = '',

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

914

use_external_logging = False):

915

"""The main interface to this module

mbligh

2006-07-28 17:35:28 +0000

[diff] [blame]

916

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

917

control

918

The control file to use for this job.

919

cont

920

Whether this is the continuation of a previously started job

921

"""

922

control = os.path.abspath(control)

923

state = control + '.state'

apw

2006-04-27 14:14:04 +0000

[diff] [blame]

924

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

925

# instantiate the job object ready for the control file.

926

myjob = None

927

try:

928

# Check that the control file is valid

929

if not os.path.exists(control):

mbligh

2008-06-06 22:48:19 +0000

[diff] [blame]

930

raise error.JobError(control + ": control file not found")

apw

2006-04-27 14:14:04 +0000

[diff] [blame]

931

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

932

# When continuing, the job is complete when there is no

933

# state file, ensure we don't try and continue.

934

if cont and not os.path.exists(state):

935

raise error.JobComplete("all done")

936

if cont == False and os.path.exists(state):

937

os.unlink(state)

apw

2006-04-27 14:14:04 +0000

[diff] [blame]

938

mbligh

2008-06-06 22:48:19 +0000

[diff] [blame]

939

myjob = job(control, tag, cont, harness_type, use_external_logging)

apw

2006-04-27 14:14:04 +0000

[diff] [blame]

940

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

941

# Load in the users control file, may do any one of:

942

# 1) execute in toto

943

# 2) define steps, and select the first via next_step()

944

myjob.step_engine()

apw

2006-04-27 14:14:04 +0000

[diff] [blame]

945

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

946

except error.JobContinue:

947

sys.exit(5)

apw

2006-04-27 14:14:04 +0000

[diff] [blame]

948

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

949

except error.JobComplete:

950

sys.exit(1)

apw

b832e1b

2007-11-24 20:24:38 +0000

[diff] [blame]

951

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

952

except error.JobError, instance:

953

print "JOB ERROR: " + instance.args[0]

954

if myjob:

955

command = None

956

if len(instance.args) > 1:

957

command = instance.args[1]

958

myjob.record('ABORT', None, command, instance.args[0])

959

myjob._decrement_group_level()

960

myjob.record('END ABORT', None, None)

961

assert(myjob.group_level == 0)

962

myjob.complete(1)

963

else:

964

sys.exit(1)

apw

2006-04-27 14:14:04 +0000

[diff] [blame]

965

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

966

except Exception, e:

967

msg = str(e) + '\n' + traceback.format_exc()

968

print "JOB ERROR: " + msg

969

if myjob:

970

myjob.record('ABORT', None, None, msg)

971

myjob._decrement_group_level()

972

myjob.record('END ABORT', None, None)

973

assert(myjob.group_level == 0)

974

myjob.complete(1)

975

else:

976

sys.exit(1)

mbligh

892d37f

2007-03-01 17:03:25 +0000

[diff] [blame]

977

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

978

# If we get here, then we assume the job is complete and good.

979

myjob._decrement_group_level()

980

myjob.record('END GOOD', None, None)

981

assert(myjob.group_level == 0)

mbligh

0144e5a

2008-03-07 18:17:53 +0000

[diff] [blame]

982

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

983

myjob.complete(0)

mbligh

2008-04-07 21:51:17 +0000

[diff] [blame]

984

985

986

# site_job.py may be non-existant or empty, make sure that an appropriate

987

# site_job class is created nevertheless

988

try:

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

989

from site_job import site_job

mbligh

2008-04-07 21:51:17 +0000

[diff] [blame]

990

except ImportError:

jadmanski

2008-06-06 21:10:57 +0000

[diff] [blame]

991

class site_job(base_job):

992

pass

mbligh

2008-04-07 21:51:17 +0000

[diff] [blame]

993

994

class job(site_job):

jadmanski