Blame - lib/TableGen/TGLexer.cpp - fp2-dev/platform/external/llvm

blob: 45d0b1ed2b046546c3af000fd53489112b6cf04d [file] [log] [blame]

Chris Lattner	a805874	2007-11-18 02:57:27 +0000	[diff] [blame]	1	//===- TGLexer.cpp - Lexer for TableGen -----------------------------------===//
				2	//
				3	// The LLVM Compiler Infrastructure
				4	//
Chris Lattner	3060910	2007-12-29 20:37:13 +0000	[diff] [blame]	5	// This file is distributed under the University of Illinois Open Source
				6	// License. See LICENSE.TXT for details.
Chris Lattner	a805874	2007-11-18 02:57:27 +0000	[diff] [blame]	7	//
				8	//===----------------------------------------------------------------------===//
				9	//
				10	// Implement the Lexer for TableGen.
				11	//
				12	//===----------------------------------------------------------------------===//
				13
Chris Lattner	6aaca04	2007-11-18 05:25:45 +0000	[diff] [blame]	14	#include "TGLexer.h"
Peter Collingbourne	7c78888	2011-10-01 16:41:13 +0000	[diff] [blame]	15	#include "llvm/TableGen/Error.h"
Chris Lattner	099e198	2009-06-21 03:36:54 +0000	[diff] [blame]	16	#include "llvm/Support/SourceMgr.h"
Chris Lattner	a805874	2007-11-18 02:57:27 +0000	[diff] [blame]	17	#include "llvm/Support/MemoryBuffer.h"
Chuck Rose III	8b0ec64	2007-11-21 19:36:25 +0000	[diff] [blame]	18	#include "llvm/Config/config.h"
Bill Wendling	cd466f5	2010-12-08 20:02:49 +0000	[diff] [blame]	19	#include "llvm/ADT/StringSwitch.h"
				20	#include "llvm/ADT/Twine.h"
Chris Lattner	a805874	2007-11-18 02:57:27 +0000	[diff] [blame]	21	#include <cctype>
Duncan Sands	4520dd2	2008-10-08 07:23:46 +0000	[diff] [blame]	22	#include <cstdio>
Anton Korobeynikov	ae9f3a3	2008-02-20 11:08:44 +0000	[diff] [blame]	23	#include <cstdlib>
				24	#include <cstring>
Dan Gohman	63f9720	2008-10-17 01:33:43 +0000	[diff] [blame]	25	#include <cerrno>
Chris Lattner	a805874	2007-11-18 02:57:27 +0000	[diff] [blame]	26	using namespace llvm;
				27
Chris Lattner	8070ea3	2009-06-21 03:41:50 +0000	[diff] [blame]	28	TGLexer::TGLexer(SourceMgr &SM) : SrcMgr(SM) {
Chris Lattner	aa739d2	2009-03-13 07:05:43 +0000	[diff] [blame]	29	CurBuffer = 0;
				30	CurBuf = SrcMgr.getMemoryBuffer(CurBuffer);
Chris Lattner	a805874	2007-11-18 02:57:27 +0000	[diff] [blame]	31	CurPtr = CurBuf->getBufferStart();
Chris Lattner	56a9fcf	2007-11-19 07:43:52 +0000	[diff] [blame]	32	TokStart = 0;
Chris Lattner	a805874	2007-11-18 02:57:27 +0000	[diff] [blame]	33	}
				34
Chris Lattner	1e3a8a4	2009-06-21 03:39:35 +0000	[diff] [blame]	35	SMLoc TGLexer::getLoc() const {
				36	return SMLoc::getFromPointer(TokStart);
Chris Lattner	1c8ae59	2009-03-13 16:01:53 +0000	[diff] [blame]	37	}
				38
Chris Lattner	c8a9bbc	2007-11-19 07:38:58 +0000	[diff] [blame]	39	/// ReturnError - Set the error to the specified string at the specified
Chris Lattner	f460165	2007-11-22 20:49:04 +0000	[diff] [blame]	40	/// location. This is defined to always return tgtok::Error.
Benjamin Kramer	d1e1703	2010-09-27 17:42:11 +0000	[diff] [blame]	41	tgtok::TokKind TGLexer::ReturnError(const char *Loc, const Twine &Msg) {
Chris Lattner	c8a9bbc	2007-11-19 07:38:58 +0000	[diff] [blame]	42	PrintError(Loc, Msg);
Chris Lattner	f460165	2007-11-22 20:49:04 +0000	[diff] [blame]	43	return tgtok::Error;
Chris Lattner	c8a9bbc	2007-11-19 07:38:58 +0000	[diff] [blame]	44	}
Chris Lattner	a805874	2007-11-18 02:57:27 +0000	[diff] [blame]	45
Chris Lattner	a805874	2007-11-18 02:57:27 +0000	[diff] [blame]	46	int TGLexer::getNextChar() {
				47	char CurChar = *CurPtr++;
				48	switch (CurChar) {
				49	default:
Chris Lattner	c181918	2007-11-18 05:48:46 +0000	[diff] [blame]	50	return (unsigned char)CurChar;
Chris Lattner	aa739d2	2009-03-13 07:05:43 +0000	[diff] [blame]	51	case 0: {
Chris Lattner	a805874	2007-11-18 02:57:27 +0000	[diff] [blame]	52	// A nul character in the stream is either the end of the current buffer or
				53	// a random nul in the file. Disambiguate that here.
				54	if (CurPtr-1 != CurBuf->getBufferEnd())
				55	return 0; // Just whitespace.
				56
				57	// If this is the end of an included file, pop the parent file off the
				58	// include stack.
Chris Lattner	1e3a8a4	2009-06-21 03:39:35 +0000	[diff] [blame]	59	SMLoc ParentIncludeLoc = SrcMgr.getParentIncludeLoc(CurBuffer);
				60	if (ParentIncludeLoc != SMLoc()) {
Chris Lattner	aa739d2	2009-03-13 07:05:43 +0000	[diff] [blame]	61	CurBuffer = SrcMgr.FindBufferContainingLoc(ParentIncludeLoc);
				62	CurBuf = SrcMgr.getMemoryBuffer(CurBuffer);
Chris Lattner	1c8ae59	2009-03-13 16:01:53 +0000	[diff] [blame]	63	CurPtr = ParentIncludeLoc.getPointer();
Chris Lattner	a805874	2007-11-18 02:57:27 +0000	[diff] [blame]	64	return getNextChar();
				65	}
				66
				67	// Otherwise, return end of file.
				68	--CurPtr; // Another call to lex will return EOF again.
				69	return EOF;
Chris Lattner	aa739d2	2009-03-13 07:05:43 +0000	[diff] [blame]	70	}
Chris Lattner	a805874	2007-11-18 02:57:27 +0000	[diff] [blame]	71	case '\n':
				72	case '\r':
				73	// Handle the newline character by ignoring it and incrementing the line
				74	// count. However, be careful about 'dos style' files with \n\r in them.
				75	// Only treat a \n\r or \r\n as a single line.
				76	if ((CurPtr == '\n' \|\| (CurPtr == '\r')) &&
				77	*CurPtr != CurChar)
Chris Lattner	c181918	2007-11-18 05:48:46 +0000	[diff] [blame]	78	++CurPtr; // Eat the two char newline sequence.
Chris Lattner	a805874	2007-11-18 02:57:27 +0000	[diff] [blame]	79	return '\n';
				80	}
				81	}
				82
David Greene	a761f92	2011-10-19 13:03:35 +0000	[diff] [blame]	83	int TGLexer::peekNextChar(int Index) {
				84	return *(CurPtr + Index);
				85	}
				86
Chris Lattner	f460165	2007-11-22 20:49:04 +0000	[diff] [blame]	87	tgtok::TokKind TGLexer::LexToken() {
Chris Lattner	56a9fcf	2007-11-19 07:43:52 +0000	[diff] [blame]	88	TokStart = CurPtr;
Chris Lattner	a805874	2007-11-18 02:57:27 +0000	[diff] [blame]	89	// This always consumes at least one character.
				90	int CurChar = getNextChar();
				91
				92	switch (CurChar) {
				93	default:
David Greene	d3d1cad	2011-10-19 13:04:43 +0000	[diff] [blame^]	94	// Handle letters: [a-zA-Z_]
				95	if (isalpha(CurChar) \|\| CurChar == '_')
Chris Lattner	a805874	2007-11-18 02:57:27 +0000	[diff] [blame]	96	return LexIdentifier();
David Greene	d3d1cad	2011-10-19 13:04:43 +0000	[diff] [blame^]	97
Chris Lattner	f460165	2007-11-22 20:49:04 +0000	[diff] [blame]	98	// Unknown character, emit an error.
				99	return ReturnError(TokStart, "Unexpected character");
				100	case EOF: return tgtok::Eof;
				101	case ':': return tgtok::colon;
				102	case ';': return tgtok::semi;
				103	case '.': return tgtok::period;
				104	case ',': return tgtok::comma;
				105	case '<': return tgtok::less;
				106	case '>': return tgtok::greater;
				107	case ']': return tgtok::r_square;
				108	case '{': return tgtok::l_brace;
				109	case '}': return tgtok::r_brace;
				110	case '(': return tgtok::l_paren;
				111	case ')': return tgtok::r_paren;
				112	case '=': return tgtok::equal;
				113	case '?': return tgtok::question;
David Greene	d3d1cad	2011-10-19 13:04:43 +0000	[diff] [blame^]	114	case '#': return tgtok::paste;
Chris Lattner	f460165	2007-11-22 20:49:04 +0000	[diff] [blame]	115
Chris Lattner	a805874	2007-11-18 02:57:27 +0000	[diff] [blame]	116	case 0:
				117	case ' ':
				118	case '\t':
				119	case '\n':
				120	case '\r':
				121	// Ignore whitespace.
				122	return LexToken();
				123	case '/':
				124	// If this is the start of a // comment, skip until the end of the line or
				125	// the end of the buffer.
				126	if (*CurPtr == '/')
				127	SkipBCPLComment();
				128	else if (CurPtr == '') {
				129	if (SkipCComment())
Chris Lattner	f460165	2007-11-22 20:49:04 +0000	[diff] [blame]	130	return tgtok::Error;
				131	} else // Otherwise, this is an error.
				132	return ReturnError(TokStart, "Unexpected character");
Chris Lattner	a805874	2007-11-18 02:57:27 +0000	[diff] [blame]	133	return LexToken();
				134	case '-': case '+':
				135	case '0': case '1': case '2': case '3': case '4': case '5': case '6':
David Greene	7efe936	2011-10-19 13:03:39 +0000	[diff] [blame]	136	case '7': case '8': case '9': {
				137	int NextChar = 0;
				138	if (isdigit(CurChar)) {
				139	// Allow identifiers to start with a number if it is followed by
				140	// an identifier. This can happen with paste operations like
				141	// foo#8i.
				142	int i = 0;
				143	do {
				144	NextChar = peekNextChar(i++);
				145	} while (isdigit(NextChar));
				146
				147	if (NextChar == 'x' \|\| NextChar == 'b') {
				148	// If this is [0-9]b[01] or [0-9]x[0-9A-fa-f] this is most
				149	// likely a number.
				150	int NextNextChar = peekNextChar(i);
				151	switch (NextNextChar) {
				152	default:
				153	break;
				154	case '0': case '1':
				155	if (NextChar == 'b')
				156	return LexNumber();
				157	// Fallthrough
				158	case '2': case '3': case '4': case '5':
				159	case '6': case '7': case '8': case '9':
				160	case 'a': case 'b': case 'c': case 'd': case 'e': case 'f':
				161	case 'A': case 'B': case 'C': case 'D': case 'E': case 'F':
				162	if (NextChar == 'x')
				163	return LexNumber();
				164	break;
				165	}
				166	}
				167	}
				168
				169	if (isalpha(NextChar) \|\| NextChar == '_')
				170	return LexIdentifier();
				171
Chris Lattner	a805874	2007-11-18 02:57:27 +0000	[diff] [blame]	172	return LexNumber();
David Greene	7efe936	2011-10-19 13:03:39 +0000	[diff] [blame]	173	}
Chris Lattner	a805874	2007-11-18 02:57:27 +0000	[diff] [blame]	174	case '"': return LexString();
				175	case '$': return LexVarName();
				176	case '[': return LexBracket();
				177	case '!': return LexExclaim();
				178	}
				179	}
				180
				181	/// LexString - Lex "[^"]*"
Chris Lattner	f460165	2007-11-22 20:49:04 +0000	[diff] [blame]	182	tgtok::TokKind TGLexer::LexString() {
Chris Lattner	a805874	2007-11-18 02:57:27 +0000	[diff] [blame]	183	const char *StrStart = CurPtr;
				184
Chris Lattner	ea9f4df	2009-03-13 21:03:27 +0000	[diff] [blame]	185	CurStrVal = "";
				186
Chris Lattner	a805874	2007-11-18 02:57:27 +0000	[diff] [blame]	187	while (*CurPtr != '"') {
				188	// If we hit the end of the buffer, report an error.
Chris Lattner	c8a9bbc	2007-11-19 07:38:58 +0000	[diff] [blame]	189	if (*CurPtr == 0 && CurPtr == CurBuf->getBufferEnd())
				190	return ReturnError(StrStart, "End of file in string literal");
				191
				192	if (CurPtr == '\n' \|\| CurPtr == '\r')
				193	return ReturnError(StrStart, "End of line in string literal");
Chris Lattner	a805874	2007-11-18 02:57:27 +0000	[diff] [blame]	194
Chris Lattner	ea9f4df	2009-03-13 21:03:27 +0000	[diff] [blame]	195	if (*CurPtr != '\\') {
				196	CurStrVal += *CurPtr++;
				197	continue;
				198	}
				199
Chris Lattner	a805874	2007-11-18 02:57:27 +0000	[diff] [blame]	200	++CurPtr;
Chris Lattner	ea9f4df	2009-03-13 21:03:27 +0000	[diff] [blame]	201
				202	switch (*CurPtr) {
				203	case '\\': case '\'': case '"':
				204	// These turn into their literal character.
				205	CurStrVal += *CurPtr++;
				206	break;
Chris Lattner	e023bb6	2009-03-13 21:23:43 +0000	[diff] [blame]	207	case 't':
Chris Lattner	7f3b28a	2009-03-13 21:33:17 +0000	[diff] [blame]	208	CurStrVal += '\t';
Chris Lattner	e023bb6	2009-03-13 21:23:43 +0000	[diff] [blame]	209	++CurPtr;
				210	break;
				211	case 'n':
Chris Lattner	7f3b28a	2009-03-13 21:33:17 +0000	[diff] [blame]	212	CurStrVal += '\n';
Chris Lattner	e023bb6	2009-03-13 21:23:43 +0000	[diff] [blame]	213	++CurPtr;
				214	break;
				215
Chris Lattner	ea9f4df	2009-03-13 21:03:27 +0000	[diff] [blame]	216	case '\n':
				217	case '\r':
				218	return ReturnError(CurPtr, "escaped newlines not supported in tblgen");
				219
				220	// If we hit the end of the buffer, report an error.
				221	case '\0':
				222	if (CurPtr == CurBuf->getBufferEnd())
				223	return ReturnError(StrStart, "End of file in string literal");
				224	// FALL THROUGH
				225	default:
				226	return ReturnError(CurPtr, "invalid escape in string literal");
				227	}
Chris Lattner	a805874	2007-11-18 02:57:27 +0000	[diff] [blame]	228	}
				229
Chris Lattner	a805874	2007-11-18 02:57:27 +0000	[diff] [blame]	230	++CurPtr;
Chris Lattner	f460165	2007-11-22 20:49:04 +0000	[diff] [blame]	231	return tgtok::StrVal;
Chris Lattner	a805874	2007-11-18 02:57:27 +0000	[diff] [blame]	232	}
				233
Chris Lattner	f460165	2007-11-22 20:49:04 +0000	[diff] [blame]	234	tgtok::TokKind TGLexer::LexVarName() {
Chris Lattner	a805874	2007-11-18 02:57:27 +0000	[diff] [blame]	235	if (!isalpha(CurPtr[0]) && CurPtr[0] != '_')
Chris Lattner	f460165	2007-11-22 20:49:04 +0000	[diff] [blame]	236	return ReturnError(TokStart, "Invalid variable name");
Chris Lattner	a805874	2007-11-18 02:57:27 +0000	[diff] [blame]	237
				238	// Otherwise, we're ok, consume the rest of the characters.
				239	const char *VarNameStart = CurPtr++;
				240
				241	while (isalpha(CurPtr) \|\| isdigit(CurPtr) \|\| *CurPtr == '_')
				242	++CurPtr;
				243
Chris Lattner	f460165	2007-11-22 20:49:04 +0000	[diff] [blame]	244	CurStrVal.assign(VarNameStart, CurPtr);
				245	return tgtok::VarName;
Chris Lattner	a805874	2007-11-18 02:57:27 +0000	[diff] [blame]	246	}
				247
				248
Chris Lattner	f460165	2007-11-22 20:49:04 +0000	[diff] [blame]	249	tgtok::TokKind TGLexer::LexIdentifier() {
Chris Lattner	c2b0875	2010-10-05 22:59:29 +0000	[diff] [blame]	250	// The first letter is [a-zA-Z_#].
Chris Lattner	f460165	2007-11-22 20:49:04 +0000	[diff] [blame]	251	const char *IdentStart = TokStart;
Benjamin Kramer	37d42af	2011-10-06 18:23:56 +0000	[diff] [blame]	252
Chris Lattner	c2b0875	2010-10-05 22:59:29 +0000	[diff] [blame]	253	// Match the rest of the identifier regex: [0-9a-zA-Z_#]*
David Greene	d3d1cad	2011-10-19 13:04:43 +0000	[diff] [blame^]	254	while (isalpha(CurPtr) \|\| isdigit(CurPtr) \|\| *CurPtr == '_')
Chris Lattner	c2b0875	2010-10-05 22:59:29 +0000	[diff] [blame]	255	++CurPtr;
Benjamin Kramer	37d42af	2011-10-06 18:23:56 +0000	[diff] [blame]	256
Chris Lattner	a805874	2007-11-18 02:57:27 +0000	[diff] [blame]	257	// Check to see if this identifier is a keyword.
Benjamin Kramer	37d42af	2011-10-06 18:23:56 +0000	[diff] [blame]	258	StringRef Str(IdentStart, CurPtr-IdentStart);
				259
Benjamin Kramer	37d42af	2011-10-06 18:23:56 +0000	[diff] [blame]	260	if (Str == "include") {
Chris Lattner	f460165	2007-11-22 20:49:04 +0000	[diff] [blame]	261	if (LexInclude()) return tgtok::Error;
				262	return Lex();
Chris Lattner	a805874	2007-11-18 02:57:27 +0000	[diff] [blame]	263	}
Benjamin Kramer	37d42af	2011-10-06 18:23:56 +0000	[diff] [blame]	264
Benjamin Kramer	ee57318	2011-10-06 18:53:43 +0000	[diff] [blame]	265	tgtok::TokKind Kind = StringSwitch<tgtok::TokKind>(Str)
				266	.Case("int", tgtok::Int)
				267	.Case("bit", tgtok::Bit)
				268	.Case("bits", tgtok::Bits)
				269	.Case("string", tgtok::String)
				270	.Case("list", tgtok::List)
				271	.Case("code", tgtok::Code)
				272	.Case("dag", tgtok::Dag)
				273	.Case("class", tgtok::Class)
				274	.Case("def", tgtok::Def)
Benjamin Kramer	ee57318	2011-10-06 18:53:43 +0000	[diff] [blame]	275	.Case("defm", tgtok::Defm)
				276	.Case("multiclass", tgtok::MultiClass)
				277	.Case("field", tgtok::Field)
				278	.Case("let", tgtok::Let)
				279	.Case("in", tgtok::In)
				280	.Default(tgtok::Id);
				281
				282	if (Kind == tgtok::Id)
				283	CurStrVal.assign(Str.begin(), Str.end());
				284	return Kind;
Chris Lattner	a805874	2007-11-18 02:57:27 +0000	[diff] [blame]	285	}
				286
				287	/// LexInclude - We just read the "include" token. Get the string token that
				288	/// comes next and enter the include.
				289	bool TGLexer::LexInclude() {
				290	// The token after the include must be a string.
Chris Lattner	f460165	2007-11-22 20:49:04 +0000	[diff] [blame]	291	tgtok::TokKind Tok = LexToken();
				292	if (Tok == tgtok::Error) return true;
				293	if (Tok != tgtok::StrVal) {
				294	PrintError(getLoc(), "Expected filename after include");
Chris Lattner	a805874	2007-11-18 02:57:27 +0000	[diff] [blame]	295	return true;
				296	}
				297
				298	// Get the string.
Chris Lattner	f460165	2007-11-22 20:49:04 +0000	[diff] [blame]	299	std::string Filename = CurStrVal;
Joerg Sonnenberger	dd13790	2011-06-01 13:10:15 +0000	[diff] [blame]	300	std::string IncludedFile;
Chris Lattner	a805874	2007-11-18 02:57:27 +0000	[diff] [blame]	301
Chris Lattner	7ee5d5f	2009-06-21 05:06:04 +0000	[diff] [blame]	302
Joerg Sonnenberger	dd13790	2011-06-01 13:10:15 +0000	[diff] [blame]	303	CurBuffer = SrcMgr.AddIncludeFile(Filename, SMLoc::getFromPointer(CurPtr),
				304	IncludedFile);
Chris Lattner	d926e04	2009-06-21 05:33:06 +0000	[diff] [blame]	305	if (CurBuffer == -1) {
Chris Lattner	f460165	2007-11-22 20:49:04 +0000	[diff] [blame]	306	PrintError(getLoc(), "Could not find include file '" + Filename + "'");
Chris Lattner	a805874	2007-11-18 02:57:27 +0000	[diff] [blame]	307	return true;
				308	}
				309
Joerg Sonnenberger	dd13790	2011-06-01 13:10:15 +0000	[diff] [blame]	310	Dependencies.push_back(IncludedFile);
Chris Lattner	a805874	2007-11-18 02:57:27 +0000	[diff] [blame]	311	// Save the line number and lex buffer of the includer.
Chris Lattner	7ee5d5f	2009-06-21 05:06:04 +0000	[diff] [blame]	312	CurBuf = SrcMgr.getMemoryBuffer(CurBuffer);
Chris Lattner	a805874	2007-11-18 02:57:27 +0000	[diff] [blame]	313	CurPtr = CurBuf->getBufferStart();
				314	return false;
				315	}
				316
				317	void TGLexer::SkipBCPLComment() {
				318	++CurPtr; // skip the second slash.
				319	while (1) {
				320	switch (*CurPtr) {
				321	case '\n':
				322	case '\r':
				323	return; // Newline is end of comment.
				324	case 0:
				325	// If this is the end of the buffer, end the comment.
				326	if (CurPtr == CurBuf->getBufferEnd())
				327	return;
				328	break;
				329	}
				330	// Otherwise, skip the character.
				331	++CurPtr;
				332	}
				333	}
				334
				335	/// SkipCComment - This skips C-style /**/ comments. The only difference from C
				336	/// is that we allow nesting.
				337	bool TGLexer::SkipCComment() {
				338	++CurPtr; // skip the star.
				339	unsigned CommentDepth = 1;
				340
				341	while (1) {
				342	int CurChar = getNextChar();
				343	switch (CurChar) {
				344	case EOF:
Chris Lattner	f460165	2007-11-22 20:49:04 +0000	[diff] [blame]	345	PrintError(TokStart, "Unterminated comment!");
Chris Lattner	a805874	2007-11-18 02:57:27 +0000	[diff] [blame]	346	return true;
				347	case '*':
				348	// End of the comment?
				349	if (CurPtr[0] != '/') break;
				350
				351	++CurPtr; // End the */.
				352	if (--CommentDepth == 0)
				353	return false;
				354	break;
				355	case '/':
				356	// Start of a nested comment?
				357	if (CurPtr[0] != '*') break;
				358	++CurPtr;
				359	++CommentDepth;
				360	break;
				361	}
				362	}
				363	}
				364
				365	/// LexNumber - Lex:
				366	/// [-+]?[0-9]+
				367	/// 0x[0-9a-fA-F]+
				368	/// 0b[01]+
Chris Lattner	f460165	2007-11-22 20:49:04 +0000	[diff] [blame]	369	tgtok::TokKind TGLexer::LexNumber() {
Chris Lattner	a805874	2007-11-18 02:57:27 +0000	[diff] [blame]	370	if (CurPtr[-1] == '0') {
				371	if (CurPtr[0] == 'x') {
				372	++CurPtr;
Chris Lattner	f460165	2007-11-22 20:49:04 +0000	[diff] [blame]	373	const char *NumStart = CurPtr;
Chris Lattner	a805874	2007-11-18 02:57:27 +0000	[diff] [blame]	374	while (isxdigit(CurPtr[0]))
				375	++CurPtr;
				376
Chris Lattner	c8a9bbc	2007-11-19 07:38:58 +0000	[diff] [blame]	377	// Requires at least one hex digit.
				378	if (CurPtr == NumStart)
Chris Lattner	4226bb0	2009-06-21 19:22:49 +0000	[diff] [blame]	379	return ReturnError(TokStart, "Invalid hexadecimal number");
Chris Lattner	c8a9bbc	2007-11-19 07:38:58 +0000	[diff] [blame]	380
Dan Gohman	63f9720	2008-10-17 01:33:43 +0000	[diff] [blame]	381	errno = 0;
Chris Lattner	f460165	2007-11-22 20:49:04 +0000	[diff] [blame]	382	CurIntVal = strtoll(NumStart, 0, 16);
Dan Gohman	63f9720	2008-10-17 01:33:43 +0000	[diff] [blame]	383	if (errno == EINVAL)
Chris Lattner	4226bb0	2009-06-21 19:22:49 +0000	[diff] [blame]	384	return ReturnError(TokStart, "Invalid hexadecimal number");
Dan Gohman	63f9720	2008-10-17 01:33:43 +0000	[diff] [blame]	385	if (errno == ERANGE) {
				386	errno = 0;
				387	CurIntVal = (int64_t)strtoull(NumStart, 0, 16);
				388	if (errno == EINVAL)
Chris Lattner	4226bb0	2009-06-21 19:22:49 +0000	[diff] [blame]	389	return ReturnError(TokStart, "Invalid hexadecimal number");
Dan Gohman	63f9720	2008-10-17 01:33:43 +0000	[diff] [blame]	390	if (errno == ERANGE)
Chris Lattner	4226bb0	2009-06-21 19:22:49 +0000	[diff] [blame]	391	return ReturnError(TokStart, "Hexadecimal number out of range");
Dan Gohman	63f9720	2008-10-17 01:33:43 +0000	[diff] [blame]	392	}
Chris Lattner	f460165	2007-11-22 20:49:04 +0000	[diff] [blame]	393	return tgtok::IntVal;
Chris Lattner	a805874	2007-11-18 02:57:27 +0000	[diff] [blame]	394	} else if (CurPtr[0] == 'b') {
				395	++CurPtr;
Chris Lattner	f460165	2007-11-22 20:49:04 +0000	[diff] [blame]	396	const char *NumStart = CurPtr;
Chris Lattner	a805874	2007-11-18 02:57:27 +0000	[diff] [blame]	397	while (CurPtr[0] == '0' \|\| CurPtr[0] == '1')
				398	++CurPtr;
Chris Lattner	c8a9bbc	2007-11-19 07:38:58 +0000	[diff] [blame]	399
				400	// Requires at least one binary digit.
				401	if (CurPtr == NumStart)
				402	return ReturnError(CurPtr-2, "Invalid binary number");
Chris Lattner	f460165	2007-11-22 20:49:04 +0000	[diff] [blame]	403	CurIntVal = strtoll(NumStart, 0, 2);
				404	return tgtok::IntVal;
Chris Lattner	a805874	2007-11-18 02:57:27 +0000	[diff] [blame]	405	}
				406	}
				407
				408	// Check for a sign without a digit.
Chris Lattner	f460165	2007-11-22 20:49:04 +0000	[diff] [blame]	409	if (!isdigit(CurPtr[0])) {
				410	if (CurPtr[-1] == '-')
				411	return tgtok::minus;
				412	else if (CurPtr[-1] == '+')
				413	return tgtok::plus;
Chris Lattner	a805874	2007-11-18 02:57:27 +0000	[diff] [blame]	414	}
				415
				416	while (isdigit(CurPtr[0]))
				417	++CurPtr;
Chris Lattner	f460165	2007-11-22 20:49:04 +0000	[diff] [blame]	418	CurIntVal = strtoll(TokStart, 0, 10);
				419	return tgtok::IntVal;
Chris Lattner	a805874	2007-11-18 02:57:27 +0000	[diff] [blame]	420	}
				421
				422	/// LexBracket - We just read '['. If this is a code block, return it,
				423	/// otherwise return the bracket. Match: '[' and '[{ ( [^}]+ \| }[^]] )* }]'
Chris Lattner	f460165	2007-11-22 20:49:04 +0000	[diff] [blame]	424	tgtok::TokKind TGLexer::LexBracket() {
Chris Lattner	a805874	2007-11-18 02:57:27 +0000	[diff] [blame]	425	if (CurPtr[0] != '{')
Chris Lattner	f460165	2007-11-22 20:49:04 +0000	[diff] [blame]	426	return tgtok::l_square;
Chris Lattner	a805874	2007-11-18 02:57:27 +0000	[diff] [blame]	427	++CurPtr;
				428	const char *CodeStart = CurPtr;
				429	while (1) {
				430	int Char = getNextChar();
				431	if (Char == EOF) break;
				432
				433	if (Char != '}') continue;
				434
				435	Char = getNextChar();
				436	if (Char == EOF) break;
				437	if (Char == ']') {
Chris Lattner	f460165	2007-11-22 20:49:04 +0000	[diff] [blame]	438	CurStrVal.assign(CodeStart, CurPtr-2);
				439	return tgtok::CodeFragment;
Chris Lattner	a805874	2007-11-18 02:57:27 +0000	[diff] [blame]	440	}
				441	}
				442
Chris Lattner	c8a9bbc	2007-11-19 07:38:58 +0000	[diff] [blame]	443	return ReturnError(CodeStart-2, "Unterminated Code Block");
Chris Lattner	a805874	2007-11-18 02:57:27 +0000	[diff] [blame]	444	}
				445
				446	/// LexExclaim - Lex '!' and '![a-zA-Z]+'.
Chris Lattner	f460165	2007-11-22 20:49:04 +0000	[diff] [blame]	447	tgtok::TokKind TGLexer::LexExclaim() {
Chris Lattner	a805874	2007-11-18 02:57:27 +0000	[diff] [blame]	448	if (!isalpha(*CurPtr))
Bill Wendling	dd2b6cb	2010-12-08 13:03:15 +0000	[diff] [blame]	449	return ReturnError(CurPtr - 1, "Invalid \"!operator\"");
Chris Lattner	a805874	2007-11-18 02:57:27 +0000	[diff] [blame]	450
				451	const char *Start = CurPtr++;
				452	while (isalpha(*CurPtr))
				453	++CurPtr;
				454
				455	// Check to see which operator this is.
Bill Wendling	cd466f5	2010-12-08 20:02:49 +0000	[diff] [blame]	456	tgtok::TokKind Kind =
				457	StringSwitch<tgtok::TokKind>(StringRef(Start, CurPtr - Start))
				458	.Case("eq", tgtok::XEq)
				459	.Case("if", tgtok::XIf)
David Greene	1434f66	2011-01-07 17:05:37 +0000	[diff] [blame]	460	.Case("head", tgtok::XHead)
				461	.Case("tail", tgtok::XTail)
Bill Wendling	cd466f5	2010-12-08 20:02:49 +0000	[diff] [blame]	462	.Case("con", tgtok::XConcat)
				463	.Case("shl", tgtok::XSHL)
				464	.Case("sra", tgtok::XSRA)
				465	.Case("srl", tgtok::XSRL)
				466	.Case("cast", tgtok::XCast)
David Greene	1434f66	2011-01-07 17:05:37 +0000	[diff] [blame]	467	.Case("empty", tgtok::XEmpty)
Bill Wendling	cd466f5	2010-12-08 20:02:49 +0000	[diff] [blame]	468	.Case("subst", tgtok::XSubst)
				469	.Case("foreach", tgtok::XForEach)
				470	.Case("strconcat", tgtok::XStrConcat)
				471	.Default(tgtok::Error);
David Greene	d418c1b	2009-05-14 20:54:48 +0000	[diff] [blame]	472
Bill Wendling	cd466f5	2010-12-08 20:02:49 +0000	[diff] [blame]	473	return Kind != tgtok::Error ? Kind : ReturnError(Start-1, "Unknown operator");
Chris Lattner	a805874	2007-11-18 02:57:27 +0000	[diff] [blame]	474	}
				475