Blame - jinja2/lexer.py - platform/external/python/jinja

2007-02-26 22:17:32 +0100

[diff] [blame]

1

# -*- coding: utf-8 -*-

2

"""

Armin Ronacher

07bc684

2008-03-31 14:18:49 +0200

[diff] [blame]

3

jinja2.lexer

4

~~~~~~~~~~~~

Armin Ronacher

3b65b8a

2007-02-27 20:21:45 +0100

[diff] [blame]

5

Armin Ronacher

5a8e497

2007-04-05 11:21:38 +0200

[diff] [blame]

6

This module implements a Jinja / Python combination lexer. The

7

`Lexer` class provided by this module is used to do some preprocessing

8

for Jinja.

9

10

On the one hand it filters out invalid operators like the bitshift

11

operators we don't allow in templates. On the other hand it separates

12

template code and python code in expressions.

13

Armin Ronacher

55494e4

2010-01-22 09:41:48 +0100

[diff] [blame]

14

Armin Ronacher

3b65b8a

2007-02-27 20:21:45 +0100

[diff] [blame]

15

:license: BSD, see LICENSE for more details.

Armin Ronacher

2007-02-26 22:17:32 +0100

[diff] [blame]

16

"""

17

import re

Armin Ronacher

2013-05-19 13:46:22 +0100

[diff] [blame]

18

import six

19

Armin Ronacher

2008-05-01 22:59:47 +0200

[diff] [blame]

20

from operator import itemgetter

21

from collections import deque

Armin Ronacher

82b3f3d

2008-03-31 20:01:08 +0200

[diff] [blame]

22

from jinja2.exceptions import TemplateSyntaxError

Thomas Waldmann

2013-05-18 00:06:22 +0200

[diff] [blame]

23

from jinja2.utils import LRUCache

Armin Ronacher

2013-05-19 13:46:22 +0100

[diff] [blame]

24

from jinja2._compat import next

Armin Ronacher

2007-02-26 22:17:32 +0100

[diff] [blame]

25

26

Armin Ronacher

2007-04-17 17:13:10 +0200

[diff] [blame]

27

# cache for the lexers. Exists in order to be able to have multiple

28

# environments with the same lexer

Armin Ronacher

187bde1

2008-05-01 18:19:16 +0200

[diff] [blame]

29

_lexer_cache = LRUCache(50)

Armin Ronacher

2007-04-17 17:13:10 +0200

[diff] [blame]

30

Armin Ronacher

2007-02-26 22:17:32 +0100

[diff] [blame]

31

# static regular expressions

Armin Ronacher

2008-08-13 18:24:17 +0200

[diff] [blame]

32

whitespace_re = re.compile(r'\s+', re.U)

Armin Ronacher

2007-02-26 22:17:32 +0100

[diff] [blame]

33

string_re = re.compile(r"('([^'\\]*(?:\\.[^'\\]*)*)'"

Armin Ronacher

2008-08-13 18:24:17 +0200

[diff] [blame]

34

r'|"([^"\\]*(?:\\.[^"\\]*)*)")', re.S)

Armin Ronacher

2007-09-07 17:52:41 +0200

[diff] [blame]

35

integer_re = re.compile(r'\d+')

Armin Ronacher

bd35772

2009-08-05 20:25:06 +0200

[diff] [blame]

36

37

# we use the unicode identifier rule if this python version is able

38

# to handle unicode identifiers, otherwise the standard ASCII one.

39

try:

40

compile('föö', '<unknown>', 'eval')

41

except SyntaxError:

42

name_re = re.compile(r'\b[a-zA-Z_][a-zA-Z0-9_]*\b')

43

else:

44

from jinja2 import _stringdefs

45

name_re = re.compile(r'[%s][%s]*' % (_stringdefs.xid_start,

46

_stringdefs.xid_continue))

47

Armin Ronacher

cb1b97f

2008-09-10 14:03:53 +0200

[diff] [blame]

48

float_re = re.compile(r'(?<!\.)\d+\.\d+')

Armin Ronacher

2008-05-23 23:18:14 +0200

[diff] [blame]

49

newline_re = re.compile(r'(\r\n|\r|\n)')

Armin Ronacher

2007-02-26 22:17:32 +0100

[diff] [blame]

50

Thomas Waldmann

2013-05-18 00:06:22 +0200

[diff] [blame]

51

try:

52

intern = intern # py2

53

except NameError:

54

import sys

55

intern = sys.intern # py3

56

Armin Ronacher

2009-02-04 19:33:58 +0100

[diff] [blame]

57

# internal the tokens and keep references to them

58

TOKEN_ADD = intern('add')

59

TOKEN_ASSIGN = intern('assign')

60

TOKEN_COLON = intern('colon')

61

TOKEN_COMMA = intern('comma')

62

TOKEN_DIV = intern('div')

63

TOKEN_DOT = intern('dot')

64

TOKEN_EQ = intern('eq')

65

TOKEN_FLOORDIV = intern('floordiv')

66

TOKEN_GT = intern('gt')

67

TOKEN_GTEQ = intern('gteq')

68

TOKEN_LBRACE = intern('lbrace')

69

TOKEN_LBRACKET = intern('lbracket')

70

TOKEN_LPAREN = intern('lparen')

71

TOKEN_LT = intern('lt')

72

TOKEN_LTEQ = intern('lteq')

73

TOKEN_MOD = intern('mod')

74

TOKEN_MUL = intern('mul')

75

TOKEN_NE = intern('ne')

76

TOKEN_PIPE = intern('pipe')

77

TOKEN_POW = intern('pow')

78

TOKEN_RBRACE = intern('rbrace')

79

TOKEN_RBRACKET = intern('rbracket')

80

TOKEN_RPAREN = intern('rparen')

81

TOKEN_SEMICOLON = intern('semicolon')

82

TOKEN_SUB = intern('sub')

83

TOKEN_TILDE = intern('tilde')

84

TOKEN_WHITESPACE = intern('whitespace')

85

TOKEN_FLOAT = intern('float')

86

TOKEN_INTEGER = intern('integer')

87

TOKEN_NAME = intern('name')

88

TOKEN_STRING = intern('string')

89

TOKEN_OPERATOR = intern('operator')

90

TOKEN_BLOCK_BEGIN = intern('block_begin')

91

TOKEN_BLOCK_END = intern('block_end')

92

TOKEN_VARIABLE_BEGIN = intern('variable_begin')

93

TOKEN_VARIABLE_END = intern('variable_end')

94

TOKEN_RAW_BEGIN = intern('raw_begin')

95

TOKEN_RAW_END = intern('raw_end')

96

TOKEN_COMMENT_BEGIN = intern('comment_begin')

97

TOKEN_COMMENT_END = intern('comment_end')

98

TOKEN_COMMENT = intern('comment')

99

TOKEN_LINESTATEMENT_BEGIN = intern('linestatement_begin')

100

TOKEN_LINESTATEMENT_END = intern('linestatement_end')

Armin Ronacher

2009-03-30 21:00:16 +0200

[diff] [blame]

101

TOKEN_LINECOMMENT_BEGIN = intern('linecomment_begin')

102

TOKEN_LINECOMMENT_END = intern('linecomment_end')

103

TOKEN_LINECOMMENT = intern('linecomment')

Armin Ronacher

2009-02-04 19:33:58 +0100

[diff] [blame]

104

TOKEN_DATA = intern('data')

105

TOKEN_INITIAL = intern('initial')

106

TOKEN_EOF = intern('eof')

107

Armin Ronacher

2007-09-07 17:52:41 +0200

[diff] [blame]

108

# bind operators to token types

109

operators = {

Armin Ronacher

2009-02-04 19:33:58 +0100

[diff] [blame]

'+': TOKEN_ADD,

'-': TOKEN_SUB,

'/': TOKEN_DIV,

'//': TOKEN_FLOORDIV,

'*': TOKEN_MUL,

'%': TOKEN_MOD,

'**': TOKEN_POW,

'~': TOKEN_TILDE,

'[': TOKEN_LBRACKET,

']': TOKEN_RBRACKET,

'(': TOKEN_LPAREN,

')': TOKEN_RPAREN,

'{': TOKEN_LBRACE,

'}': TOKEN_RBRACE,

'==': TOKEN_EQ,

'!=': TOKEN_NE,

'>': TOKEN_GT,

'>=': TOKEN_GTEQ,

'<': TOKEN_LT,

'<=': TOKEN_LTEQ,

'=': TOKEN_ASSIGN,

'.': TOKEN_DOT,

':': TOKEN_COLON,

'|': TOKEN_PIPE,

',': TOKEN_COMMA,

';': TOKEN_SEMICOLON

Armin Ronacher

2007-09-07 17:52:41 +0200

[diff] [blame]

136

}

137

Thomas Waldmann

2013-05-17 23:52:14 +0200

[diff] [blame]

138

reverse_operators = dict([(v, k) for k, v in six.iteritems(operators)])

Armin Ronacher

2007-09-07 17:52:41 +0200

[diff] [blame]

139

assert len(operators) == len(reverse_operators), 'operators dropped'

Armin Ronacher

e791c2a

2008-04-07 18:39:54 +0200

[diff] [blame]

140

operator_re = re.compile('(%s)' % '|'.join(re.escape(x) for x in

141

sorted(operators, key=lambda x: -len(x))))

Armin Ronacher

2007-09-07 17:52:41 +0200

[diff] [blame]

142

Armin Ronacher

2009-03-30 21:00:16 +0200

[diff] [blame]

143

ignored_tokens = frozenset([TOKEN_COMMENT_BEGIN, TOKEN_COMMENT,

144

TOKEN_COMMENT_END, TOKEN_WHITESPACE,

145

TOKEN_WHITESPACE, TOKEN_LINECOMMENT_BEGIN,

146

TOKEN_LINECOMMENT_END, TOKEN_LINECOMMENT])

Armin Ronacher

2009-03-31 23:51:56 +0200

[diff] [blame]

147

ignore_if_empty = frozenset([TOKEN_WHITESPACE, TOKEN_DATA,

148

TOKEN_COMMENT, TOKEN_LINECOMMENT])

Armin Ronacher

2009-03-30 21:00:16 +0200

[diff] [blame]

149

Armin Ronacher

2007-02-26 22:17:32 +0100

[diff] [blame]

150

Armin Ronacher

2010-02-06 14:01:26 +0100

[diff] [blame]

151

def _describe_token_type(token_type):

152

if token_type in reverse_operators:

153

return reverse_operators[token_type]

154

return {

155

TOKEN_COMMENT_BEGIN: 'begin of comment',

156

TOKEN_COMMENT_END: 'end of comment',

157

TOKEN_COMMENT: 'comment',

158

TOKEN_LINECOMMENT: 'comment',

159

TOKEN_BLOCK_BEGIN: 'begin of statement block',

160

TOKEN_BLOCK_END: 'end of statement block',

161

TOKEN_VARIABLE_BEGIN: 'begin of print statement',

162

TOKEN_VARIABLE_END: 'end of print statement',

163

TOKEN_LINESTATEMENT_BEGIN: 'begin of line statement',

164

TOKEN_LINESTATEMENT_END: 'end of line statement',

165

TOKEN_DATA: 'template data / text',

166

TOKEN_EOF: 'end of template'

167

}.get(token_type, token_type)

168

169

170

def describe_token(token):

171

"""Returns a description of the token."""

172

if token.type == 'name':

173

return token.value

174

return _describe_token_type(token.type)

175

176

177

def describe_token_expr(expr):

178

"""Like `describe_token` but for token expressions."""

179

if ':' in expr:

180

type, value = expr.split(':', 1)

if type == 'name':

return value

else:

type = expr

return _describe_token_type(type)

186

187

Armin Ronacher

d02fc7d

2008-06-14 14:19:47 +0200

[diff] [blame]

188

def count_newlines(value):

189

"""Count the number of newline characters in the string. This is

190

useful for extensions that filter a stream.

191

"""

192

return len(newline_re.findall(value))

193

194

Armin Ronacher

2009-03-30 21:00:16 +0200

[diff] [blame]

195

def compile_rules(environment):

196

"""Compiles all the rules from the environment into a list of rules."""

197

e = re.escape

198

rules = [

199

(len(environment.comment_start_string), 'comment',

200

e(environment.comment_start_string)),

201

(len(environment.block_start_string), 'block',

202

e(environment.block_start_string)),

203

(len(environment.variable_start_string), 'variable',

Armin Ronacher

1bb3ab7

2009-04-01 19:16:25 +0200

[diff] [blame]

204

e(environment.variable_start_string))

Armin Ronacher

2009-03-30 21:00:16 +0200

[diff] [blame]

205

]

206

207

if environment.line_statement_prefix is not None:

208

rules.append((len(environment.line_statement_prefix), 'linestatement',

Adam Spiers

08f38a8

2013-05-01 18:42:55 +0100

[diff] [blame]

209

r'^[ \t\v]*' + e(environment.line_statement_prefix)))

Armin Ronacher

2009-03-30 21:00:16 +0200

[diff] [blame]

210

if environment.line_comment_prefix is not None:

211

rules.append((len(environment.line_comment_prefix), 'linecomment',

Armin Ronacher

a0727a6

2009-04-02 14:14:30 +0200

[diff] [blame]

212

r'(?:^|(?<=\S))[^\S\r\n]*' +

213

e(environment.line_comment_prefix)))

Armin Ronacher

2009-03-30 21:00:16 +0200

[diff] [blame]

214

215

return [x[1:] for x in sorted(rules, reverse=True)]

216

217

Armin Ronacher

2007-02-26 22:17:32 +0100

[diff] [blame]

218

class Failure(object):

Armin Ronacher

b5124e6

2008-04-25 00:36:14 +0200

[diff] [blame]

219

"""Class that raises a `TemplateSyntaxError` if called.

Armin Ronacher

2007-02-26 22:17:32 +0100

[diff] [blame]

220

Used by the `Lexer` to specify known errors.

221

"""

222

223

def __init__(self, message, cls=TemplateSyntaxError):

224

self.message = message

225

self.error_class = cls

226

Armin Ronacher

720e55b

2007-05-30 00:57:49 +0200

[diff] [blame]

227

def __call__(self, lineno, filename):

228

raise self.error_class(self.message, lineno, filename)

Armin Ronacher

2007-02-26 22:17:32 +0100

[diff] [blame]

229

230

Armin Ronacher

2008-05-01 22:59:47 +0200

[diff] [blame]

class Token(tuple):

"""Token class."""

__slots__ = ()

lineno, type, value = (property(itemgetter(x)) for x in range(3))

235

236

def __new__(cls, lineno, type, value):

237

return tuple.__new__(cls, (lineno, intern(str(type)), value))

238

239

def __str__(self):

Armin Ronacher

8a1d27f

2008-05-19 08:37:19 +0200

[diff] [blame]

240

if self.type in reverse_operators:

Armin Ronacher

2008-05-01 22:59:47 +0200

[diff] [blame]

241

return reverse_operators[self.type]

Ali Afshar

272ca2a

2009-01-05 12:14:14 +0100

[diff] [blame]

242

elif self.type == 'name':

Armin Ronacher

2008-05-01 22:59:47 +0200

[diff] [blame]

return self.value

return self.type

def test(self, expr):

247

"""Test a token against a token expression. This can either be a

Armin Ronacher

023b5e9

2008-05-08 11:03:10 +0200

[diff] [blame]

248

token type or ``'token_type:token_value'``. This can only test

249

against string values and types.

Armin Ronacher

2008-05-01 22:59:47 +0200

[diff] [blame]

250

"""

Armin Ronacher

cda43df

2008-05-03 17:10:05 +0200

[diff] [blame]

251

# here we do a regular string equality check as test_any is usually

Armin Ronacher

2008-05-01 22:59:47 +0200

[diff] [blame]

252

# passed an iterable of not interned strings.

253

if self.type == expr:

254

return True

255

elif ':' in expr:

256

return expr.split(':', 1) == [self.type, self.value]

257

return False

258

Armin Ronacher

cda43df

2008-05-03 17:10:05 +0200

[diff] [blame]

259

def test_any(self, *iterable):

Armin Ronacher

2008-05-01 22:59:47 +0200

[diff] [blame]

260

"""Test against multiple token expressions."""

261

for expr in iterable:

if self.test(expr):

return True

return False

def __repr__(self):

return 'Token(%r, %r, %r)' % (

self.lineno,

self.type,

self.value

)

Thomas Waldmann

2013-05-18 00:06:22 +0200

[diff] [blame]

274

class TokenStreamIterator(six.Iterator):

Armin Ronacher

2008-05-01 22:59:47 +0200

[diff] [blame]

275

"""The iterator for tokenstreams. Iterate over the stream

276

until the eof token is reached.

277

"""

278

279

def __init__(self, stream):

Armin Ronacher

2008-06-13 22:44:01 +0200

[diff] [blame]

280

self.stream = stream

Armin Ronacher

2008-05-01 22:59:47 +0200

[diff] [blame]

def __iter__(self):

return self

Thomas Waldmann

2013-05-18 00:06:22 +0200

[diff] [blame]

285

def __next__(self):

Armin Ronacher

2008-06-13 22:44:01 +0200

[diff] [blame]

286

token = self.stream.current

Armin Ronacher

2009-02-04 19:33:58 +0100

[diff] [blame]

287

if token.type is TOKEN_EOF:

Armin Ronacher

2008-06-13 22:44:01 +0200

[diff] [blame]

288

self.stream.close()

Armin Ronacher

2008-05-01 22:59:47 +0200

[diff] [blame]

289

raise StopIteration()

Armin Ronacher

2013-05-19 13:46:22 +0100

[diff] [blame]

290

next(self.stream)

Armin Ronacher

2008-05-01 22:59:47 +0200

[diff] [blame]

return token

Thomas Waldmann

2013-05-18 00:06:22 +0200

[diff] [blame]

294

class TokenStream(six.Iterator):

Armin Ronacher

023b5e9

2008-05-08 11:03:10 +0200

[diff] [blame]

295

"""A token stream is an iterable that yields :class:`Token`\s. The

296

parser however does not iterate over it but calls :meth:`next` to go

297

one token ahead. The current active token is stored as :attr:`current`.

Armin Ronacher

2008-05-01 22:59:47 +0200

[diff] [blame]

298

"""

299

Armin Ronacher

2008-05-16 09:11:39 +0200

[diff] [blame]

300

def __init__(self, generator, name, filename):

Thomas Waldmann

2013-05-18 00:06:22 +0200

[diff] [blame]

301

self._iter = iter(generator)

Armin Ronacher

2008-05-01 22:59:47 +0200

[diff] [blame]

302

self._pushed = deque()

Armin Ronacher

2008-05-16 09:11:39 +0200

[diff] [blame]

303

self.name = name

Armin Ronacher

2008-05-01 22:59:47 +0200

[diff] [blame]

304

self.filename = filename

Armin Ronacher

2008-06-13 22:44:01 +0200

[diff] [blame]

305

self.closed = False

Armin Ronacher

2009-02-04 19:33:58 +0100

[diff] [blame]

306

self.current = Token(1, TOKEN_INITIAL, '')

Armin Ronacher

2013-05-19 13:46:22 +0100

[diff] [blame]

307

next(self)

Armin Ronacher

2008-05-01 22:59:47 +0200

[diff] [blame]

308

309

def __iter__(self):

310

return TokenStreamIterator(self)

311

Thomas Waldmann

2013-05-18 00:06:22 +0200

[diff] [blame]

312

def __bool__(self):

Armin Ronacher

2009-02-04 19:33:58 +0100

[diff] [blame]

313

return bool(self._pushed) or self.current.type is not TOKEN_EOF

Thomas Waldmann

2013-05-18 00:06:22 +0200

[diff] [blame]

314

__nonzero__ = __bool__ # py2

Armin Ronacher

2008-05-01 22:59:47 +0200

[diff] [blame]

315

Armin Ronacher

42a1988

2009-08-05 18:45:39 +0200

[diff] [blame]

316

eos = property(lambda x: not x, doc="Are we at the end of the stream?")

Armin Ronacher

2008-05-01 22:59:47 +0200

[diff] [blame]

317

318

def push(self, token):

319

"""Push a token back to the stream."""

320

self._pushed.append(token)

321

322

def look(self):

323

"""Look at the next token."""

Armin Ronacher

2013-05-19 13:46:22 +0100

[diff] [blame]

324

old_token = next(self)

Armin Ronacher

2008-05-01 22:59:47 +0200

[diff] [blame]

325

result = self.current

326

self.push(result)

327

self.current = old_token

328

return result

329

Armin Ronacher

ea847c5

2008-05-02 20:04:32 +0200

[diff] [blame]

330

def skip(self, n=1):

Armin Ronacher

2008-05-01 22:59:47 +0200

[diff] [blame]

331

"""Got n tokens ahead."""

Thomas Waldmann

2013-05-17 23:52:14 +0200

[diff] [blame]

332

for x in range(n):

Armin Ronacher

2013-05-19 13:46:22 +0100

[diff] [blame]

333

next(self)

Armin Ronacher

2008-05-01 22:59:47 +0200

[diff] [blame]

334

Armin Ronacher

2008-05-11 22:20:51 +0200

[diff] [blame]

335

def next_if(self, expr):

336

"""Perform the token test and return the token if it matched.

337

Otherwise the return value is `None`.

338

"""

339

if self.current.test(expr):

Armin Ronacher

2013-05-19 13:46:22 +0100

[diff] [blame]

340

return next(self)

Armin Ronacher

2008-05-11 22:20:51 +0200

[diff] [blame]

341

342

def skip_if(self, expr):

Armin Ronacher

9cf9591

2008-05-24 19:54:43 +0200

[diff] [blame]

343

"""Like :meth:`next_if` but only returns `True` or `False`."""

Armin Ronacher

2008-05-11 22:20:51 +0200

[diff] [blame]

344

return self.next_if(expr) is not None

345

Thomas Waldmann

2013-05-18 00:06:22 +0200

[diff] [blame]

346

def __next__(self):

Armin Ronacher

2008-05-01 22:59:47 +0200

[diff] [blame]

347

"""Go one token ahead and return the old one"""

348

rv = self.current

Armin Ronacher

2008-05-11 22:20:51 +0200

[diff] [blame]

349

if self._pushed:

350

self.current = self._pushed.popleft()

Armin Ronacher

2009-02-04 19:33:58 +0100

[diff] [blame]

351

elif self.current.type is not TOKEN_EOF:

Armin Ronacher

2008-05-11 22:20:51 +0200

[diff] [blame]

352

try:

Armin Ronacher

2013-05-19 13:46:22 +0100

[diff] [blame]

353

self.current = next(self._iter)

Armin Ronacher

2008-05-11 22:20:51 +0200

[diff] [blame]

354

except StopIteration:

355

self.close()

Armin Ronacher

2008-05-01 22:59:47 +0200

[diff] [blame]

return rv

def close(self):

"""Close the stream."""

Armin Ronacher

2009-02-04 19:33:58 +0100

[diff] [blame]

360

self.current = Token(self.current.lineno, TOKEN_EOF, '')

Thomas Waldmann

2013-05-18 00:06:22 +0200

[diff] [blame]

361

self._iter = None

Armin Ronacher

2008-06-13 22:44:01 +0200

[diff] [blame]

362

self.closed = True

Armin Ronacher

2008-05-01 22:59:47 +0200

[diff] [blame]

363

364

def expect(self, expr):

Armin Ronacher

023b5e9

2008-05-08 11:03:10 +0200

[diff] [blame]

365

"""Expect a given token type and return it. This accepts the same

366

argument as :meth:`jinja2.lexer.Token.test`.

367

"""

Armin Ronacher

2008-05-01 22:59:47 +0200

[diff] [blame]

368

if not self.current.test(expr):

Armin Ronacher

2010-02-06 14:01:26 +0100

[diff] [blame]

369

expr = describe_token_expr(expr)

Armin Ronacher

2009-02-04 19:33:58 +0100

[diff] [blame]

370

if self.current.type is TOKEN_EOF:

Armin Ronacher

2008-05-01 22:59:47 +0200

[diff] [blame]

371

raise TemplateSyntaxError('unexpected end of template, '

372

'expected %r.' % expr,

373

self.current.lineno,

Armin Ronacher

2008-05-16 09:11:39 +0200

[diff] [blame]

374

self.name, self.filename)

Armin Ronacher

2008-05-01 22:59:47 +0200

[diff] [blame]

375

raise TemplateSyntaxError("expected token %r, got %r" %

Armin Ronacher

2010-02-06 14:01:26 +0100

[diff] [blame]

376

(expr, describe_token(self.current)),

Armin Ronacher

2008-05-01 22:59:47 +0200

[diff] [blame]

377

self.current.lineno,

Armin Ronacher

2008-05-16 09:11:39 +0200

[diff] [blame]

378

self.name, self.filename)

Armin Ronacher

2008-05-01 22:59:47 +0200

[diff] [blame]

379

try:

380

return self.current

381

finally:

Armin Ronacher

2013-05-19 13:46:22 +0100

[diff] [blame]

382

next(self)

Armin Ronacher

2008-05-01 22:59:47 +0200

[diff] [blame]

383

384

Armin Ronacher

2008-08-13 18:24:17 +0200

[diff] [blame]

385

def get_lexer(environment):

386

"""Return a lexer which is probably cached."""

387

key = (environment.block_start_string,

388

environment.block_end_string,

389

environment.variable_start_string,

390

environment.variable_end_string,

391

environment.comment_start_string,

392

environment.comment_end_string,

393

environment.line_statement_prefix,

Armin Ronacher

2009-03-30 21:00:16 +0200

[diff] [blame]

394

environment.line_comment_prefix,

Armin Ronacher

2008-08-13 18:24:17 +0200

[diff] [blame]

395

environment.trim_blocks,

Kristi Tsukida

c5f6531

2012-07-11 09:15:42 -0700

[diff] [blame]

396

environment.lstrip_blocks,

W. Trevor King

7e912c6

2013-01-11 08:23:24 -0500

[diff] [blame]

397

environment.newline_sequence,

398

environment.keep_trailing_newline)

Armin Ronacher

2008-08-13 18:24:17 +0200

[diff] [blame]

399

lexer = _lexer_cache.get(key)

400

if lexer is None:

401

lexer = Lexer(environment)

402

_lexer_cache[key] = lexer

403

return lexer

Armin Ronacher

2007-04-17 17:13:10 +0200

[diff] [blame]

404

405

Armin Ronacher

2007-02-26 22:17:32 +0100

[diff] [blame]

406

class Lexer(object):

Armin Ronacher

b5124e6

2008-04-25 00:36:14 +0200

[diff] [blame]

407

"""Class that implements a lexer for a given environment. Automatically

Armin Ronacher

2007-02-26 22:17:32 +0100

[diff] [blame]

408

created by the environment class, usually you don't have to do that.

Armin Ronacher

2007-04-17 17:13:10 +0200

[diff] [blame]

409

410

Note that the lexer is not automatically bound to an environment.

411

Multiple environments can share the same lexer.

Armin Ronacher

2007-02-26 22:17:32 +0100

[diff] [blame]

412

"""

413

414

def __init__(self, environment):

415

# shortcuts

416

c = lambda x: re.compile(x, re.M | re.S)

417

e = re.escape

418

Armin Ronacher

2007-03-27 22:51:51 +0200

[diff] [blame]

419

# lexing rules for tags

Armin Ronacher

2007-02-26 22:17:32 +0100

[diff] [blame]

420

tag_rules = [

Armin Ronacher

2009-02-04 19:33:58 +0100

[diff] [blame]

421

(whitespace_re, TOKEN_WHITESPACE, None),

422

(float_re, TOKEN_FLOAT, None),

423

(integer_re, TOKEN_INTEGER, None),

424

(name_re, TOKEN_NAME, None),

425

(string_re, TOKEN_STRING, None),

426

(operator_re, TOKEN_OPERATOR, None)

Armin Ronacher

2007-02-26 22:17:32 +0100

[diff] [blame]

427

]

428

Dmitry Jemerov

2011-09-26 19:04:29 +0200

[diff] [blame]

429

# assemble the root lexing rule. because "|" is ungreedy

Armin Ronacher

d874fbe

2007-02-27 20:51:59 +0100

[diff] [blame]

430

# we have to sort by length so that the lexer continues working

431

# as expected when we have parsing rules like <% for block and

432

# <%= for variables. (if someone wants asp like syntax)

Armin Ronacher

33d528a

2007-05-14 18:21:44 +0200

[diff] [blame]

433

# variables are just part of the rules if variable processing

434

# is required.

Armin Ronacher

2009-03-30 21:00:16 +0200

[diff] [blame]

435

root_tag_rules = compile_rules(environment)

Armin Ronacher

d874fbe

2007-02-27 20:51:59 +0100

[diff] [blame]

436

Armin Ronacher

2007-03-27 22:51:51 +0200

[diff] [blame]

437

# block suffix if trimming is enabled

438

block_suffix_re = environment.trim_blocks and '\\n?' or ''

439

Kristi Tsukida

59f3366

2012-07-10 17:13:50 -0700

[diff] [blame]

440

# strip leading spaces if lstrip_blocks is enabled

Kristi Tsukida

2012-07-12 13:01:42 -0700

[diff] [blame]

441

prefix_re = {}

442

if environment.lstrip_blocks:

Kristi Tsukida

54f7d2e

2012-07-12 13:37:21 -0700

[diff] [blame]

443

# use '{%+' to manually disable lstrip_blocks behavior

444

no_lstrip_re = e('+')

445

# detect overlap between block and variable or comment strings

446

block_diff = c(r'^%s(.*)' % e(environment.block_start_string))

447

# make sure we don't mistake a block for a variable or a comment

448

m = block_diff.match(environment.comment_start_string)

449

no_lstrip_re += m and r'|%s' % e(m.group(1)) or ''

450

m = block_diff.match(environment.variable_start_string)

451

no_lstrip_re += m and r'|%s' % e(m.group(1)) or ''

452

453

# detect overlap between comment and variable strings

454

comment_diff = c(r'^%s(.*)' % e(environment.comment_start_string))

455

m = comment_diff.match(environment.variable_start_string)

456

no_variable_re = m and r'(?!%s)' % e(m.group(1)) or ''

457

Kristi Tsukida

2012-07-12 13:01:42 -0700

[diff] [blame]

458

lstrip_re = r'^[ \t]*'

459

block_prefix_re = r'%s%s(?!%s)|%s\+?' % (

460

lstrip_re,

461

e(environment.block_start_string),

462

no_lstrip_re,

463

e(environment.block_start_string),

464

)

Kristi Tsukida

54f7d2e

2012-07-12 13:37:21 -0700

[diff] [blame]

465

comment_prefix_re = r'%s%s%s|%s\+?' % (

466

lstrip_re,

467

e(environment.comment_start_string),

468

no_variable_re,

469

e(environment.comment_start_string),

470

)

Kristi Tsukida

2012-07-12 13:01:42 -0700

[diff] [blame]

471

prefix_re['block'] = block_prefix_re

Kristi Tsukida

54f7d2e

2012-07-12 13:37:21 -0700

[diff] [blame]

472

prefix_re['comment'] = comment_prefix_re

Kristi Tsukida

2012-07-12 13:01:42 -0700

[diff] [blame]

473

else:

474

block_prefix_re = '%s' % e(environment.block_start_string)

Kristi Tsukida

59f3366

2012-07-10 17:13:50 -0700

[diff] [blame]

475

Armin Ronacher

2008-05-23 23:18:14 +0200

[diff] [blame]

476

self.newline_sequence = environment.newline_sequence

W. Trevor King

7e912c6

2013-01-11 08:23:24 -0500

[diff] [blame]

477

self.keep_trailing_newline = environment.keep_trailing_newline

Armin Ronacher

2008-05-23 23:18:14 +0200

[diff] [blame]

478

Armin Ronacher

2007-03-27 22:51:51 +0200

[diff] [blame]

479

# global lexing rules

Armin Ronacher

2007-02-26 22:17:32 +0100

[diff] [blame]

480

self.rules = {

481

'root': [

Armin Ronacher

2007-11-17 23:45:04 +0100

[diff] [blame]

482

# directives

483

(c('(.*?)(?:%s)' % '|'.join(

Armin Ronacher

ac0c0d0

2010-06-05 14:37:32 +0200

[diff] [blame]

484

[r'(?P<raw_begin>(?:\s*%s\-|%s)\s*raw\s*(?:\-%s\s*|%s))' % (

Armin Ronacher

2007-11-17 23:45:04 +0100

[diff] [blame]

485

e(environment.block_start_string),

Kristi Tsukida

15605a8

2012-07-10 13:25:38 -0700

[diff] [blame]

486

block_prefix_re,

Armin Ronacher

ac0c0d0

2010-06-05 14:37:32 +0200

[diff] [blame]

487

e(environment.block_end_string),

Armin Ronacher

2007-11-17 23:45:04 +0100

[diff] [blame]

488

e(environment.block_end_string)

489

)] + [

Kristi Tsukida

2012-07-12 13:01:42 -0700

[diff] [blame]

490

r'(?P<%s_begin>\s*%s\-|%s)' % (n, r, prefix_re.get(n,r))

Armin Ronacher

2007-11-17 23:45:04 +0100

[diff] [blame]

491

for n, r in root_tag_rules

Armin Ronacher

2009-02-04 19:33:58 +0100

[diff] [blame]

492

])), (TOKEN_DATA, '#bygroup'), '#bygroup'),

Armin Ronacher

2007-03-27 22:51:51 +0200

[diff] [blame]

493

# data

Armin Ronacher

2009-03-31 23:51:56 +0200

[diff] [blame]

494

(c('.+'), TOKEN_DATA, None)

Armin Ronacher

2007-02-26 22:17:32 +0100

[diff] [blame]

495

],

Armin Ronacher

2007-03-27 22:51:51 +0200

[diff] [blame]

496

# comments

Armin Ronacher

2009-02-04 19:33:58 +0100

[diff] [blame]

497

TOKEN_COMMENT_BEGIN: [

Armin Ronacher

2007-03-31 20:40:38 +0200

[diff] [blame]

498

(c(r'(.*?)((?:\-%s\s*|%s)%s)' % (

Armin Ronacher

2007-03-28 21:44:04 +0200

[diff] [blame]

499

e(environment.comment_end_string),

Armin Ronacher

2007-03-31 20:40:38 +0200

[diff] [blame]

500

e(environment.comment_end_string),

501

block_suffix_re

Armin Ronacher

2009-02-04 19:33:58 +0100

[diff] [blame]

502

)), (TOKEN_COMMENT, TOKEN_COMMENT_END), '#pop'),

Armin Ronacher

2007-02-26 22:17:32 +0100

[diff] [blame]

503

(c('(.)'), (Failure('Missing end of comment tag'),), None)

504

],

Armin Ronacher

2007-04-17 17:13:10 +0200

[diff] [blame]

505

# blocks

Armin Ronacher

2009-02-04 19:33:58 +0100

[diff] [blame]

506

TOKEN_BLOCK_BEGIN: [

Armin Ronacher

2007-03-31 20:40:38 +0200

[diff] [blame]

507

(c('(?:\-%s\s*|%s)%s' % (

Armin Ronacher

2007-03-28 21:44:04 +0200

[diff] [blame]

508

e(environment.block_end_string),

Armin Ronacher

2007-03-31 20:40:38 +0200

[diff] [blame]

509

e(environment.block_end_string),

510

block_suffix_re

Armin Ronacher

2009-02-04 19:33:58 +0100

[diff] [blame]

511

)), TOKEN_BLOCK_END, '#pop'),

Armin Ronacher

2007-02-26 22:17:32 +0100

[diff] [blame]

512

] + tag_rules,

Armin Ronacher

2008-04-16 14:21:57 +0200

[diff] [blame]

513

# variables

Armin Ronacher

2009-02-04 19:33:58 +0100

[diff] [blame]

514

TOKEN_VARIABLE_BEGIN: [

Armin Ronacher

2008-04-16 14:21:57 +0200

[diff] [blame]

515

(c('\-%s\s*|%s' % (

516

e(environment.variable_end_string),

517

e(environment.variable_end_string)

Armin Ronacher

2009-02-04 19:33:58 +0100

[diff] [blame]

518

)), TOKEN_VARIABLE_END, '#pop')

Armin Ronacher

2008-04-16 14:21:57 +0200

[diff] [blame]

519

] + tag_rules,

Armin Ronacher

2007-03-27 22:51:51 +0200

[diff] [blame]

520

# raw block

Armin Ronacher

2009-02-04 19:33:58 +0100

[diff] [blame]

521

TOKEN_RAW_BEGIN: [

Armin Ronacher

2007-03-28 21:44:04 +0200

[diff] [blame]

522

(c('(.*?)((?:\s*%s\-|%s)\s*endraw\s*(?:\-%s\s*|%s%s))' % (

523

e(environment.block_start_string),

Kristi Tsukida

15605a8

2012-07-10 13:25:38 -0700

[diff] [blame]

524

block_prefix_re,

Armin Ronacher

2007-03-28 21:44:04 +0200

[diff] [blame]

525

e(environment.block_end_string),

526

e(environment.block_end_string),

Armin Ronacher

2007-03-27 22:51:51 +0200

[diff] [blame]

527

block_suffix_re

Armin Ronacher

2009-02-04 19:33:58 +0100

[diff] [blame]

528

)), (TOKEN_DATA, TOKEN_RAW_END), '#pop'),

Armin Ronacher

2007-03-27 22:51:51 +0200

[diff] [blame]

529

(c('(.)'), (Failure('Missing end of raw directive'),), None)

Armin Ronacher

2008-04-16 14:21:57 +0200

[diff] [blame]

530

],

531

# line statements

Armin Ronacher

2009-02-04 19:33:58 +0100

[diff] [blame]

532

TOKEN_LINESTATEMENT_BEGIN: [

533

(c(r'\s*(\n|$)'), TOKEN_LINESTATEMENT_END, '#pop')

Armin Ronacher

2009-03-30 21:00:16 +0200

[diff] [blame]

534

] + tag_rules,

535

# line comments

536

TOKEN_LINECOMMENT_BEGIN: [

Armin Ronacher

2009-03-31 23:51:56 +0200

[diff] [blame]

537

(c(r'(.*?)()(?=\n|$)'), (TOKEN_LINECOMMENT,

538

TOKEN_LINECOMMENT_END), '#pop')

Armin Ronacher

2009-03-30 21:00:16 +0200

[diff] [blame]

539

]

Armin Ronacher

2008-04-16 14:21:57 +0200

[diff] [blame]

540

}

Armin Ronacher

bf7c4ad

2008-04-12 12:02:36 +0200

[diff] [blame]

541

Armin Ronacher

2008-05-23 23:18:14 +0200

[diff] [blame]

542

def _normalize_newlines(self, value):

Dmitry Jemerov

2011-09-26 19:04:29 +0200

[diff] [blame]

543

"""Called for strings and template data to normalize it to unicode."""

Armin Ronacher

2008-05-23 23:18:14 +0200

[diff] [blame]

544

return newline_re.sub(self.newline_sequence, value)

545

Armin Ronacher

2008-11-02 15:58:14 +0100

[diff] [blame]

546

def tokenize(self, source, name=None, filename=None, state=None):

Armin Ronacher

2008-06-13 22:44:01 +0200

[diff] [blame]

547

"""Calls tokeniter + tokenize and wraps it in a token stream.

Armin Ronacher

2007-02-26 22:17:32 +0100

[diff] [blame]

548

"""

Armin Ronacher

2008-11-02 15:58:14 +0100

[diff] [blame]

549

stream = self.tokeniter(source, name, filename, state)

Armin Ronacher

2008-06-13 22:44:01 +0200

[diff] [blame]

550

return TokenStream(self.wrap(stream, name, filename), name, filename)

551

552

def wrap(self, stream, name=None, filename=None):

553

"""This is called with the stream as returned by `tokenize` and wraps

554

every token in a :class:`Token` and converts the value.

555

"""

556

for lineno, token, value in stream:

Armin Ronacher

2009-03-30 21:00:16 +0200

[diff] [blame]

557

if token in ignored_tokens:

Armin Ronacher

2008-06-13 22:44:01 +0200

[diff] [blame]

558

continue

559

elif token == 'linestatement_begin':

560

token = 'block_begin'

561

elif token == 'linestatement_end':

562

token = 'block_end'

563

# we are not interested in those tokens in the parser

564

elif token in ('raw_begin', 'raw_end'):

565

continue

566

elif token == 'data':

567

value = self._normalize_newlines(value)

568

elif token == 'keyword':

569

token = value

570

elif token == 'name':

571

value = str(value)

572

elif token == 'string':

573

# try to unescape string

574

try:

575

value = self._normalize_newlines(value[1:-1]) \

576

.encode('ascii', 'backslashreplace') \

577

.decode('unicode-escape')

Thomas Waldmann

2013-05-17 23:52:14 +0200

[diff] [blame]

578

except Exception as e:

Armin Ronacher

2008-06-13 22:44:01 +0200

[diff] [blame]

579

msg = str(e).split(':')[-1].strip()

580

raise TemplateSyntaxError(msg, lineno, name, filename)

581

# if we can express it as bytestring (ascii only)

582

# we do that for support of semi broken APIs

Armin Ronacher

0d242be

2010-02-10 01:35:13 +0100

[diff] [blame]

583

# as datetime.datetime.strftime. On python 3 this

584

# call becomes a noop thanks to 2to3

Armin Ronacher

2008-06-13 22:44:01 +0200

[diff] [blame]

585

try:

Armin Ronacher

d1ff858

2008-05-11 00:30:43 +0200

[diff] [blame]

586

value = str(value)

Armin Ronacher

2008-06-13 22:44:01 +0200

[diff] [blame]

587

except UnicodeError:

588

pass

589

elif token == 'integer':

590

value = int(value)

591

elif token == 'float':

592

value = float(value)

593

elif token == 'operator':

594

token = operators[value]

595

yield Token(lineno, token, value)

Armin Ronacher

2007-02-26 22:17:32 +0100

[diff] [blame]

596

Armin Ronacher

2008-11-02 15:58:14 +0100

[diff] [blame]

597

def tokeniter(self, source, name, filename=None, state=None):

Armin Ronacher

b5124e6

2008-04-25 00:36:14 +0200

[diff] [blame]

598

"""This method tokenizes the text and returns the tokens in a

599

generator. Use this method if you just want to tokenize a template.

Armin Ronacher

2007-02-26 22:17:32 +0100

[diff] [blame]

600

"""

Armin Ronacher

f3acf0b

2013-05-19 11:09:19 +0100

[diff] [blame]

601

source = six.text_type(source)

W. Trevor King

7e912c6

2013-01-11 08:23:24 -0500

[diff] [blame]

602

lines = source.splitlines()

603

if self.keep_trailing_newline and source:

604

for newline in ('\r\n', '\r', '\n'):

605

if source.endswith(newline):

606

lines.append('')

607

break

608

source = '\n'.join(lines)

Armin Ronacher

7977e5c

2007-03-12 07:22:17 +0100

[diff] [blame]

609

pos = 0

610

lineno = 1

Armin Ronacher

2007-02-26 22:17:32 +0100

[diff] [blame]

611

stack = ['root']

Armin Ronacher

2008-11-02 15:58:14 +0100

[diff] [blame]

612

if state is not None and state != 'root':

613

assert state in ('variable', 'block'), 'invalid state'

614

stack.append(state + '_begin')

615

else:

616

state = 'root'

617

statetokens = self.rules[stack[-1]]

Armin Ronacher

2007-02-26 22:17:32 +0100

[diff] [blame]

618

source_length = len(source)

619

Armin Ronacher

2007-04-17 17:13:10 +0200

[diff] [blame]

620

balancing_stack = []

621

Armin Ronacher

2008-04-12 14:19:36 +0200

[diff] [blame]

622

while 1:

Armin Ronacher

2007-02-26 22:17:32 +0100

[diff] [blame]

623

# tokenizer loop

624

for regex, tokens, new_state in statetokens:

625

m = regex.match(source, pos)

Armin Ronacher

2007-04-17 17:13:10 +0200

[diff] [blame]

626

# if no match we try again with the next rule

Armin Ronacher

2008-04-12 14:19:36 +0200

[diff] [blame]

627

if m is None:

Armin Ronacher

2007-04-17 17:13:10 +0200

[diff] [blame]

628

continue

629

Dmitry Jemerov

2011-09-26 19:04:29 +0200

[diff] [blame]

630

# we only match blocks and variables if braces / parentheses

Armin Ronacher

2007-04-17 17:13:10 +0200

[diff] [blame]

631

# are balanced. continue parsing with the lower rule which

632

# is the operator rule. do this only if the end tags look

633

# like operators

634

if balancing_stack and \

Armin Ronacher

2008-04-12 14:19:36 +0200

[diff] [blame]

635

tokens in ('variable_end', 'block_end',

636

'linestatement_end'):

Armin Ronacher

2007-04-17 17:13:10 +0200

[diff] [blame]

637

continue

638

639

# tuples support more options

640

if isinstance(tokens, tuple):

641

for idx, token in enumerate(tokens):

Armin Ronacher

2007-04-17 17:13:10 +0200

[diff] [blame]

642

# failure group

Armin Ronacher

d8b8c3e

2008-05-22 21:28:32 +0200

[diff] [blame]

643

if token.__class__ is Failure:

Armin Ronacher

720e55b

2007-05-30 00:57:49 +0200

[diff] [blame]

644

raise token(lineno, filename)

Armin Ronacher

2007-04-17 17:13:10 +0200

[diff] [blame]

645

# bygroup is a bit more complex, in that case we

646

# yield for the current token the first named

647

# group that matched

648

elif token == '#bygroup':

Thomas Waldmann

2013-05-17 23:52:14 +0200

[diff] [blame]

649

for key, value in six.iteritems(m.groupdict()):

Armin Ronacher

2007-02-26 22:17:32 +0100

[diff] [blame]

650

if value is not None:

Armin Ronacher

2007-04-17 17:13:10 +0200

[diff] [blame]

651

yield lineno, key, value

652

lineno += value.count('\n')

Armin Ronacher

2007-02-26 22:17:32 +0100

[diff] [blame]

653

break

654

else:

Armin Ronacher

2007-04-17 17:13:10 +0200

[diff] [blame]

655

raise RuntimeError('%r wanted to resolve '

656

'the token dynamically'

657

' but no group matched'

658

% regex)

659

# normal group

Armin Ronacher

2007-02-26 22:17:32 +0100

[diff] [blame]

660

else:

Armin Ronacher

2007-04-17 17:13:10 +0200

[diff] [blame]

661

data = m.group(idx + 1)

Armin Ronacher

2009-03-31 23:51:56 +0200

[diff] [blame]

662

if data or token not in ignore_if_empty:

Armin Ronacher

2007-04-17 17:13:10 +0200

[diff] [blame]

663

yield lineno, token, data

664

lineno += data.count('\n')

665

Armin Ronacher

2008-04-12 14:19:36 +0200

[diff] [blame]

666

# strings as token just are yielded as it.

Armin Ronacher

2007-04-17 17:13:10 +0200

[diff] [blame]

667

else:

668

data = m.group()

669

# update brace/parentheses balance

670

if tokens == 'operator':

671

if data == '{':

672

balancing_stack.append('}')

673

elif data == '(':

674

balancing_stack.append(')')

675

elif data == '[':

676

balancing_stack.append(']')

677

elif data in ('}', ')', ']'):

Armin Ronacher

f750daa

2007-05-29 23:22:38 +0200

[diff] [blame]

678

if not balancing_stack:

Armin Ronacher

2010-02-06 14:01:26 +0100

[diff] [blame]

679

raise TemplateSyntaxError('unexpected \'%s\'' %

Armin Ronacher

2008-05-16 09:11:39 +0200

[diff] [blame]

680

data, lineno, name,

Armin Ronacher

f750daa

2007-05-29 23:22:38 +0200

[diff] [blame]

681

filename)

682

expected_op = balancing_stack.pop()

683

if expected_op != data:

Armin Ronacher

2010-02-06 14:01:26 +0100

[diff] [blame]

684

raise TemplateSyntaxError('unexpected \'%s\', '

685

'expected \'%s\'' %

Armin Ronacher

f750daa

2007-05-29 23:22:38 +0200

[diff] [blame]

686

(data, expected_op),

Armin Ronacher

2008-05-16 09:11:39 +0200

[diff] [blame]

687

lineno, name,

688

filename)

Armin Ronacher

2007-04-17 17:13:10 +0200

[diff] [blame]

689

# yield items

Armin Ronacher

2009-03-31 23:51:56 +0200

[diff] [blame]

690

if data or tokens not in ignore_if_empty:

691

yield lineno, tokens, data

Armin Ronacher

2007-04-17 17:13:10 +0200

[diff] [blame]

692

lineno += data.count('\n')

693

694

# fetch new position into new variable so that we can check

695

# if there is a internal parsing error which would result

696

# in an infinite loop

697

pos2 = m.end()

698

699

# handle state changes

700

if new_state is not None:

701

# remove the uppermost state

702

if new_state == '#pop':

703

stack.pop()

704

# resolve the new state by group checking

705

elif new_state == '#bygroup':

Thomas Waldmann

2013-05-17 23:52:14 +0200

[diff] [blame]

706

for key, value in six.iteritems(m.groupdict()):

Armin Ronacher

2007-04-17 17:13:10 +0200

[diff] [blame]

707

if value is not None:

stack.append(key)

break

else:

raise RuntimeError('%r wanted to resolve the '

712

'new state dynamically but'

713

' no group matched' %

714

regex)

715

# direct state name given

716

else:

717

stack.append(new_state)

718

statetokens = self.rules[stack[-1]]

719

# we are still at the same position and no stack change.

720

# this means a loop without break condition, avoid that and

721

# raise error

722

elif pos2 == pos:

723

raise RuntimeError('%r yielded empty string without '

724

'stack change' % regex)

725

# publish new function and start again

726

pos = pos2

727

break

Dmitry Jemerov

2011-09-26 19:04:29 +0200

[diff] [blame]

728

# if loop terminated without break we haven't found a single match

Armin Ronacher

2007-02-26 22:17:32 +0100

[diff] [blame]

729

# either we are at the end of the file or we have a problem

730

else:

731

# end of text

732

if pos >= source_length:

733

return

734

# something went wrong

735

raise TemplateSyntaxError('unexpected char %r at %d' %

Armin Ronacher

2007-04-17 17:13:10 +0200

[diff] [blame]

736

(source[pos], pos), lineno,

Armin Ronacher