Parser: Support tuples without parens.

In Python, tuples normally don't need parens, e.g. a, b = c, d for i, j in e: pass However, they are sometimes required to avoid ambiguity: fct((x, y)) [(1, 2), (3, 4)] This distinction is handled with parseExpression vs parseNonTupleExpression. -- MOS_MIGRATED_REVID=89118478
author: Laurent Le Brun <laurentlb@google.com> 2015-03-20 13:01:58 +0000
committer: Han-Wen Nienhuys <hanwen@google.com> 2015-03-20 14:38:33 +0000
commit: 56093895a38d339ba9e22f0108e240247e7554fb (patch)
tree: dae23db1559fd43cfdf126752ebe9efd109994ac /src/main/java/com/google/devtools/build/lib/syntax
parent: 46c9f07f8991cd35e389fb75e32ad9df2165c4e7 (diff)
1 files changed, 57 insertions, 45 deletions
diff --git a/src/main/java/com/google/devtools/build/lib/syntax/Parser.java b/src/main/java/com/google/devtools/build/lib/syntax/Parser.java
index 58160070ca..d736a272e5 100644
--- a/src/main/java/com/google/devtools/build/lib/syntax/Parser.java
+++ b/src/main/java/com/google/devtools/build/lib/syntax/Parser.java
@@ -75,6 +75,10 @@ class Parser {
   private static final EnumSet<TokenKind> DICT_TERMINATOR_SET =
     EnumSet.of(TokenKind.EOF, TokenKind.RBRACE, TokenKind.SEMI);
 
+  private static final EnumSet<TokenKind> EXPR_LIST_TERMINATOR_SET =
+      EnumSet.of(TokenKind.EOF, TokenKind.RBRACE, TokenKind.RBRACKET,
+          TokenKind.RPAREN, TokenKind.NEWLINE, TokenKind.SEMI);
+
   private static final EnumSet<TokenKind> EXPR_TERMINATOR_SET = EnumSet.of(
       TokenKind.EOF,
       TokenKind.COMMA,
@@ -354,20 +358,20 @@ class Parser {
     return setLocation(new FuncallExpression(receiver, function, args), start, end);
   }
 
-  // arg ::= IDENTIFIER '=' expr
+  // arg ::= IDENTIFIER '=' nontupleexpr
   //       | expr
   private Argument.Passed parseFuncallArgument() {
     final int start = token.left;
     // parse **expr
     if (token.kind == TokenKind.STAR_STAR) {
       nextToken();
-      Expression expr = parseExpression();
+      Expression expr = parseNonTupleExpression();
       return setLocation(new Argument.StarStar(expr), start, expr);
     }
     // parse *expr
     if (token.kind == TokenKind.STAR) {
       nextToken();
-      Expression expr = parseExpression();
+      Expression expr = parseNonTupleExpression();
       return setLocation(new Argument.Star(expr), start, expr);
     }
     // parse keyword = expr
@@ -377,18 +381,18 @@ class Parser {
       nextToken();
       if (token.kind == TokenKind.EQUALS) { // it's a named argument
         nextToken();
-        Expression expr = parseExpression();
+        Expression expr = parseNonTupleExpression();
         return setLocation(new Argument.Keyword(name, expr), start, expr);
       } else { // oops, back up!
         pushToken(identToken);
       }
     }
     // parse a positional argument
-    Expression expr = parseExpression();
+    Expression expr = parseNonTupleExpression();
     return setLocation(new Argument.Positional(expr), start, expr);
   }
 
-  // arg ::= IDENTIFIER '=' expr
+  // arg ::= IDENTIFIER '=' nontupleexpr
   //       | IDENTIFIER
   private Parameter<Expression, Expression> parseFunctionParameter() {
     // TODO(bazel-team): optionally support type annotations
@@ -412,7 +416,7 @@ class Parser {
       Ident ident = parseIdent();
       if (token.kind == TokenKind.EQUALS) { // there's a default value
         nextToken();
-        Expression expr = parseExpression();
+        Expression expr = parseNonTupleExpression();
         return setLocation(new Parameter.Optional<Expression, Expression>(
             ident.getName(), expr), start, expr);
       } else {
@@ -472,17 +476,19 @@ class Parser {
     return arguments;
   }
 
-  // expr_list ::= ( (expr ',')* expr ','? )?
+  // expr_list parses a comma-separated list of expression. It assumes that the
+  // first expression was already parsed, so it starts with a comma.
+  // It is used to parse tuples and list elements.
+  // expr_list ::= ( ',' expr )* ','?
   private List<Expression> parseExprList() {
     List<Expression> list = new ArrayList<>();
     //  terminating tokens for an expression list
-    while (token.kind != TokenKind.RPAREN && token.kind != TokenKind.RBRACKET) {
-      list.add(parseExpression());
-      if (token.kind == TokenKind.COMMA) {
-        nextToken();
-      } else {
+    while (token.kind == TokenKind.COMMA) {
+      expect(TokenKind.COMMA);
+      if (EXPR_LIST_TERMINATOR_SET.contains(token.kind)) {
         break;
       }
+      list.add(parseNonTupleExpression());
     }
     return list;
   }
@@ -502,12 +508,12 @@ class Parser {
     return list;
   }
 
-  // dict_entry ::= expression ':' expression
+  // dict_entry ::= nontupleexpr ':' nontupleexpr
   private DictionaryEntryLiteral parseDictEntry() {
     int start = token.left;
-    Expression key = parseExpression();
+    Expression key = parseNonTupleExpression();
     expect(TokenKind.COLON);
-    Expression value = parseExpression();
+    Expression value = parseNonTupleExpression();
     return setLocation(new DictionaryEntryLiteral(key, value), start, value);
   }
 
@@ -571,7 +577,6 @@ class Parser {
   //            | list_expression
   //            | '(' ')'                    // a tuple with zero elements
   //            | '(' expr ')'               // a parenthesized expression
-  //            | '(' expr ',' expr_list ')' // a tuple with n elements
   //            | dict_expression
   //            | '-' primary_with_suffix
   private Expression parsePrimary() {
@@ -605,7 +610,7 @@ class Parser {
         }
       }
       case LBRACKET: { // it's a list
-        return parseListExpression();
+        return parseListMaker();
       }
       case LBRACE: { // it's a dictionary
         return parseDictExpression();
@@ -622,16 +627,6 @@ class Parser {
         }
         // parse the first expression
         Expression expression = parseExpression();
-        if (token.kind == TokenKind.COMMA) {  // it's a tuple
-          nextToken();
-          // parse the rest of the expression tuple
-          List<Expression> tuple = parseExprList();
-          // add the first expression to the front of the tuple
-          tuple.add(0, expression);
-          expect(TokenKind.RPAREN);
-          return setLocation(
-              ListLiteral.makeTuple(tuple), start, token.right);
-        }
         setLocation(expression, start, token.right);
         if (token.kind == TokenKind.RPAREN) {
           nextToken();
@@ -686,7 +681,7 @@ class Parser {
     if (token.kind == TokenKind.COLON) {
       startExpr = setLocation(new IntegerLiteral(0), token.left, token.right);
     } else {
-      startExpr = parseExpression();
+      startExpr = parseNonTupleExpression();
     }
     args.add(setLocation(new Argument.Positional(startExpr), loc1, startExpr));
     // This is a dictionary access
@@ -701,7 +696,7 @@ class Parser {
     if (token.kind == TokenKind.RBRACKET) {
       endExpr = setLocation(new IntegerLiteral(Integer.MAX_VALUE), token.left, token.right);
     } else {
-      endExpr = parseExpression();
+      endExpr = parseNonTupleExpression();
     }
     expect(TokenKind.RBRACKET);
 
@@ -743,11 +738,11 @@ class Parser {
     return multipleVariables ? makeErrorExpression(start, end) : firstIdent;
   }
 
-  // list_expression ::= '[' ']'
-  //                    |'[' expr ']'
-  //                    |'[' expr ',' expr_list ']'
-  //                    |'[' expr ('FOR' loop_variables 'IN' expr)+ ']'
-  private Expression parseListExpression() {
+  // list_maker ::= '[' ']'
+  //               |'[' expr ']'
+  //               |'[' expr expr_list ']'
+  //               |'[' expr ('FOR' loop_variables 'IN' expr)+ ']'
+  private Expression parseListMaker() {
     int start = token.left;
     expect(TokenKind.LBRACKET);
     if (token.kind == TokenKind.RBRACKET) { // empty List
@@ -756,7 +751,7 @@ class Parser {
       nextToken();
       return literal;
     }
-    Expression expression = parseExpression();
+    Expression expression = parseNonTupleExpression();
     Preconditions.checkNotNull(expression,
         "null element in list in AST at %s:%s", token.left, token.right);
     switch (token.kind) {
@@ -791,7 +786,6 @@ class Parser {
         return makeErrorExpression(start, end);
       }
       case COMMA: {
-        nextToken();
         List<Expression> list = parseExprList();
         Preconditions.checkState(!list.contains(null),
             "null element in list in AST at %s:%s", token.left, token.right);
@@ -871,7 +865,7 @@ class Parser {
   // the order), and it assumes left-to-right associativity.
   private Expression parseBinOpExpression(int prec) {
     int start = token.left;
-    Expression expr = parseExpression(prec + 1);
+    Expression expr = parseNonTupleExpression(prec + 1);
     // The loop is not strictly needed, but it prevents risks of stack overflow. Depth is
     // limited to number of different precedence levels (operatorPrecedence.size()).
     for (;;) {
@@ -883,7 +877,7 @@ class Parser {
         return expr;
       }
       nextToken();
-      Expression secondary = parseExpression(prec + 1);
+      Expression secondary = parseNonTupleExpression(prec + 1);
       expr = optimizeBinOpExpression(operator, expr, secondary);
       setLocation(expr, start, secondary);
     }
@@ -906,15 +900,33 @@ class Parser {
     return new BinaryOperatorExpression(operator, expr, secondary);
   }
 
+  // Equivalent to 'testlist' rule in Python grammar. It can parse every
+  // kind of expression.
+  // In many cases, we need to use parseNonTupleExpression to avoid ambiguity
+  // e.g.  fct(x, y)  vs  fct((x, y))
   private Expression parseExpression() {
     int start = token.left;
-    Expression expr = parseExpression(0);
+    Expression expression = parseNonTupleExpression();
+    if (token.kind != TokenKind.COMMA) {
+      return expression;
+    }
+
+    // It's a tuple
+    List<Expression> tuple = parseExprList();
+    tuple.add(0, expression);  // add the first expression to the front of the tuple
+    return setLocation(ListLiteral.makeTuple(tuple), start, token.right);
+  }
+
+  // Equivalent to 'test' rule in Python grammar.
+  private Expression parseNonTupleExpression() {
+    int start = token.left;
+    Expression expr = parseNonTupleExpression(0);
     if (token.kind == TokenKind.IF) {
       nextToken();
-      Expression condition = parseExpression(0);
+      Expression condition = parseNonTupleExpression(0);
       if (token.kind == TokenKind.ELSE) {
         nextToken();
-        Expression elseClause = parseExpression();
+        Expression elseClause = parseNonTupleExpression();
         return setLocation(new ConditionalExpression(expr, condition, elseClause),
             start, elseClause);
       } else {
@@ -926,7 +938,7 @@ class Parser {
     return expr;
   }
 
-  private Expression parseExpression(int prec) {
+  private Expression parseNonTupleExpression(int prec) {
     if (prec >= operatorPrecedence.size()) {
       return parsePrimaryWithSuffix();
     }
@@ -940,7 +952,7 @@ class Parser {
   private Expression parseNotExpression(int prec) {
     int start = token.left;
     expect(TokenKind.NOT);
-    Expression expression = parseExpression(prec + 1);
+    Expression expression = parseNonTupleExpression(prec + 1);
     NotExpression notExpression = new NotExpression(expression);
     return setLocation(notExpression, start, token.right);
   }
@@ -1121,7 +1133,7 @@ class Parser {
   private ConditionalStatements parseConditionalStatements(TokenKind tokenKind) {
     int start = token.left;
     expect(tokenKind);
-    Expression expr = parseExpression();
+    Expression expr = parseNonTupleExpression();
     expect(TokenKind.COLON);
     List<Statement> thenBlock = parseSuite();
     ConditionalStatements stmt = new ConditionalStatements(expr, thenBlock);
author	Laurent Le Brun <laurentlb@google.com>	2015-03-20 13:01:58 +0000
committer	Han-Wen Nienhuys <hanwen@google.com>	2015-03-20 14:38:33 +0000
commit	56093895a38d339ba9e22f0108e240247e7554fb (patch)
tree	dae23db1559fd43cfdf126752ebe9efd109994ac /src/main/java/com/google/devtools/build/lib/syntax
parent	46c9f07f8991cd35e389fb75e32ad9df2165c4e7 (diff)