如何扩展JavaScript语言以支持新的运算符?

如何扩展JavaScript语言以支持新的运算符?,第1张

如何扩展JavaScript语言以支持新的运算符?

是的,这是可能的,甚至不是很难:)


我们需要讨论一些事情:

  1. 什么是语法和语义。
  2. 程序语言如何解析?什么是语法树?
  3. 扩展语言语法。
  4. 扩展语言语义。
  5. 如何将运算符添加到Javascript语言。

如果您很懒,只是想看看它在运行- 我将工作代码放在GitHub上

1.什么是语法和语义?

通常,一种语言由两部分组成。

  • 语法 -这些是语言中的符号,如一元运算符

    ++
    ()和
    expression
    s(如)
    Functionexpression
    表示“内联”函数。语法仅代表所使用的符号,而 不代表 其含义。简而言之 ,语法只是字母和符号的图示 -它没有固有的含义。

  • 语义 与这些符号联系在一起。语义学的

    ++
    意思是“一个增量”,实际上这里是确切的定义。它把含义与我们的语法联系在一起,没有它,语法只是带有顺序的符号列表。

2.如何解析编程语言?什么是语法树?

在某些时候,当某人用Javascript或任何其他编程语言执行您的代码时-它需要了解该代码。其中一部分叫做 词法分析 (或
词法化
,在这里不要做细微的区别)意味着分解代码,例如:

function foo(){ return 5;}

对其有意义的部分进行说明-
也就是说,这里有一个

function
关键字,后跟一个标识符,一个空的参数列表,然后是一个
{
包含带有文字的return关键字的块开头
5
,然后是一个分号,然后一个end块
}

这部分 完全 是语法,它所做的只是将其分解为

function,foo,(,),{,return,5,;,}
。它仍然对代码 不了解

之后-

Syntax Tree
建立一个。语法树更了解语法,但仍然完全是语法。例如,语法树将看到以下标记:

function foo(){ return 5;}

然后找出“嘿!这里有一个函数声明!”。

之所以称其为树,是因为它-树允许嵌套。

例如,上面的代码可以产生如下内容:

       Program FunctionDeclaration (identifier = 'foo')    BlockStatement    ReturnStatement    Literal (5)

这很简单,只是向您展示它并不总是那么线性,让我们检查一下

5 +5

       Program expressionStatement         Binaryexpression (operator +)      Literal (5)       Literal(5)   // notice the split her

可能会发生这种分裂。

基本上,语法树使我们可以表达语法。

这就是

x ∘ y
失败的地方-它看到
并且不了解语法。

3.扩展语言语法。

这仅需要一个解析语法的项目。我们在这里要做的是读取“我们的”语言的语法,该语法与Javascript不同(并且不符合规范),然后将 *** 作符替换为Javascript语法可以使用的语言。

我们要做的 不是 Javascript。它不遵循Javascript规范,并且标准投诉JS解析器将对其抛出异常。

4.扩展语言语义

无论如何,我们始终会这样做:)我们在这里要做的只是定义一个在调用运算符时要调用的函数。

5.如何向Javascript语言添加运算符。

让我首先在此前缀之后说,我们 不会 在此处向JS添加 *** 作符,而是-我们正在定义自己的语言-我们将其称为“
CakeLanguage”或其他名称,然后将其添加到 *** 作符中。这是因为

它不是JS语法的一部分,并且JS语法不允许像某些其他语言一样使用任意运算符。

为此,我们将使用两个开源项目:

  • esprima ,它将JS代码并为其生成语法树。
  • espregen 朝另一个方向发展,从语法树esprima spits生成JS代码。

如果您密切注意,您会知道我们 不能 直接使用esprima,因为我们将提供它不了解的语法。

我们将添加一个有趣的

#
*** 作符
x # y === 2x + y
。我们将它赋予多重性的优先级(因为运算符具有运算符优先级)。

因此,在获得Esprima.js的副本之后-我们需要更改以下内容:

FnExprTokens
-这是我们需要添加的 表达式
#
以便可以识别它。然后,它看起来像这样:

FnExprTokens = ['(', '{', '[', 'in', 'typeof', 'instanceof', 'new',         'return', 'case', 'delete', 'throw', 'void',         // assignment operators         '=', '+=', '-=', '*=', '/=', '%=', '<<=', '>>=', '>>>=',         '&=', '|=', '^=', ',',         // binary/unary operators         '+', '-', '*', '/', '%','#', '++', '--', '<<', '>>', '>>>', '&',         '|', '^', '!', '~', '&&', '||', '?', ':', '===', '==', '>=',         '<=', '<', '>', '!=', '!=='];

scanPunctuator
添加它及其字符代码(可能的话):
case 0x23: // #

然后进行测试,如下所示:

 if ('<>=!+-*#%&|^/'.indexOf(ch1) >= 0) {

代替:

    if ('<>=!+-*%&|^/'.indexOf(ch1) >= 0) {

然后

binaryPrecedence
让我们赋予它与多重性相同的优先级:

case '*':case '/':case '#': // put it elsewhere if you want to give it another precedencecase '%':   prec = 11;   break;

而已!我们刚刚扩展了语言语法以支持

#
运算符。

我们尚未完成,我们需要将其转换回JS。

首先,

visitor
为树定义一个简短函数,该函数递归访问其所有节点。

function visitor(tree,visit){    for(var i in tree){        visit(tree[i]);        if(typeof tree[i] === "object" && tree[i] !== null){ visitor(tree[i],visit);        }    }}

这只是通过Esprima生成的树并进行访问。我们将其传递给函数,并在每个节点上运行该函数。

现在,让我们来对待我们特殊的新运算符:

visitor(syntax,function(el){ // for every node in the syntax    if(el.type === "Binaryexpression"){ // if it's a binary expression        if(el.operator === "#"){ // with the operator #        el.type = "Callexpression"; // it is now a call expression        el.callee = {name:"operator_sharp",type:"Identifier"}; // for the function operator_#        el.arguments = [el.left, el.right]; // with the left and right side as arguments        delete el.operator; // remove Binaryexpression properties        delete el.left;        delete el.right;        }    }});

简而言之:

var syntax = esprima.parse("5 # 5");visitor(syntax,function(el){ // for every node in the syntax    if(el.type === "Binaryexpression"){ // if it's a binary expression        if(el.operator === "#"){ // with the operator #        el.type = "Callexpression"; // it is now a call expression        el.callee = {name:"operator_sharp",type:"Identifier"}; // for the function operator_#        el.arguments = [el.left, el.right]; // with the left and right side as arguments        delete el.operator; // remove Binaryexpression properties        delete el.left;        delete el.right;        }    }});var asJS = espregen.generate(syntax); // produces operator_sharp(5,5);

我们需要做的最后一件事是定义函数本身:

function operator_sharp(x,y){    return 2*x + y;}

并将其包含在我们的代码上方。

这里的所有都是它的!如果到目前为止,您应该得到一个cookie :)

这是GitHub上的代码,因此您可以使用它。



欢迎分享,转载请注明来源:内存溢出

原文地址: https://outofmemory.cn/zaji/5127024.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-11-17
下一篇 2022-11-17

发表评论

登录后才能评论

评论列表(0条)

保存