是的,这是可能的,甚至不是很难:)
我们需要讨论一些事情:
- 什么是语法和语义。
- 程序语言如何解析?什么是语法树?
- 扩展语言语法。
- 扩展语言语义。
- 如何将运算符添加到Javascript语言。
如果您很懒,只是想看看它在运行- 我将工作代码放在GitHub上
1.什么是语法和语义?通常,一种语言由两部分组成。
语法 -这些是语言中的符号,如一元运算符
++
()和expression
s(如)Functionexpression
表示“内联”函数。语法仅代表所使用的符号,而 不代表 其含义。简而言之 ,语法只是字母和符号的图示 -它没有固有的含义。语义 与这些符号联系在一起。语义学的
++
意思是“一个增量”,实际上这里是确切的定义。它把含义与我们的语法联系在一起,没有它,语法只是带有顺序的符号列表。
在某些时候,当某人用Javascript或任何其他编程语言执行您的代码时-它需要了解该代码。其中一部分叫做 词法分析 (或
词法化 ,在这里不要做细微的区别)意味着分解代码,例如:
function foo(){ return 5;}
对其有意义的部分进行说明-
也就是说,这里有一个
function关键字,后跟一个标识符,一个空的参数列表,然后是一个
{包含带有文字的return关键字的块开头
5,然后是一个分号,然后一个end块
}。
这部分 完全 是语法,它所做的只是将其分解为
function,foo,(,),{,return,5,;,}。它仍然对代码 不了解 。
之后-
Syntax Tree建立一个。语法树更了解语法,但仍然完全是语法。例如,语法树将看到以下标记:
function foo(){ return 5;}
然后找出“嘿!这里有一个函数声明!”。
之所以称其为树,是因为它-树允许嵌套。
例如,上面的代码可以产生如下内容:
Program FunctionDeclaration (identifier = 'foo') BlockStatement ReturnStatement Literal (5)
这很简单,只是向您展示它并不总是那么线性,让我们检查一下
5 +5:
Program expressionStatement Binaryexpression (operator +) Literal (5) Literal(5) // notice the split her
可能会发生这种分裂。
基本上,语法树使我们可以表达语法。
这就是
x ∘ y失败的地方-它看到
∘并且不了解语法。3.扩展语言语法。
这仅需要一个解析语法的项目。我们在这里要做的是读取“我们的”语言的语法,该语法与Javascript不同(并且不符合规范),然后将 *** 作符替换为Javascript语法可以使用的语言。
我们要做的 不是 Javascript。它不遵循Javascript规范,并且标准投诉JS解析器将对其抛出异常。
4.扩展语言语义无论如何,我们始终会这样做:)我们在这里要做的只是定义一个在调用运算符时要调用的函数。
5.如何向Javascript语言添加运算符。让我首先在此前缀之后说,我们 不会 在此处向JS添加 *** 作符,而是-我们正在定义自己的语言-我们将其称为“
CakeLanguage”或其他名称,然后将其添加到 *** 作符中。这是因为
∘它不是JS语法的一部分,并且JS语法不允许像某些其他语言一样使用任意运算符。
为此,我们将使用两个开源项目:
- esprima ,它将JS代码并为其生成语法树。
- espregen 朝另一个方向发展,从语法树esprima spits生成JS代码。
如果您密切注意,您会知道我们 不能 直接使用esprima,因为我们将提供它不了解的语法。
我们将添加一个有趣的
#*** 作符
x # y === 2x + y。我们将它赋予多重性的优先级(因为运算符具有运算符优先级)。
因此,在获得Esprima.js的副本之后-我们需要更改以下内容:
到
FnExprTokens-这是我们需要添加的 表达式 ,
#以便可以识别它。然后,它看起来像这样:
FnExprTokens = ['(', '{', '[', 'in', 'typeof', 'instanceof', 'new', 'return', 'case', 'delete', 'throw', 'void', // assignment operators '=', '+=', '-=', '*=', '/=', '%=', '<<=', '>>=', '>>>=', '&=', '|=', '^=', ',', // binary/unary operators '+', '-', '*', '/', '%','#', '++', '--', '<<', '>>', '>>>', '&', '|', '^', '!', '~', '&&', '||', '?', ':', '===', '==', '>=', '<=', '<', '>', '!=', '!=='];
要
scanPunctuator添加它及其字符代码(可能的话):
case 0x23: // #
然后进行测试,如下所示:
if ('<>=!+-*#%&|^/'.indexOf(ch1) >= 0) {
代替:
if ('<>=!+-*%&|^/'.indexOf(ch1) >= 0) {
然后
binaryPrecedence让我们赋予它与多重性相同的优先级:
case '*':case '/':case '#': // put it elsewhere if you want to give it another precedencecase '%': prec = 11; break;
而已!我们刚刚扩展了语言语法以支持
#运算符。
我们尚未完成,我们需要将其转换回JS。
首先,
visitor为树定义一个简短函数,该函数递归访问其所有节点。
function visitor(tree,visit){ for(var i in tree){ visit(tree[i]); if(typeof tree[i] === "object" && tree[i] !== null){ visitor(tree[i],visit); } }}
这只是通过Esprima生成的树并进行访问。我们将其传递给函数,并在每个节点上运行该函数。
现在,让我们来对待我们特殊的新运算符:
visitor(syntax,function(el){ // for every node in the syntax if(el.type === "Binaryexpression"){ // if it's a binary expression if(el.operator === "#"){ // with the operator # el.type = "Callexpression"; // it is now a call expression el.callee = {name:"operator_sharp",type:"Identifier"}; // for the function operator_# el.arguments = [el.left, el.right]; // with the left and right side as arguments delete el.operator; // remove Binaryexpression properties delete el.left; delete el.right; } }});
简而言之:
var syntax = esprima.parse("5 # 5");visitor(syntax,function(el){ // for every node in the syntax if(el.type === "Binaryexpression"){ // if it's a binary expression if(el.operator === "#"){ // with the operator # el.type = "Callexpression"; // it is now a call expression el.callee = {name:"operator_sharp",type:"Identifier"}; // for the function operator_# el.arguments = [el.left, el.right]; // with the left and right side as arguments delete el.operator; // remove Binaryexpression properties delete el.left; delete el.right; } }});var asJS = espregen.generate(syntax); // produces operator_sharp(5,5);
我们需要做的最后一件事是定义函数本身:
function operator_sharp(x,y){ return 2*x + y;}
并将其包含在我们的代码上方。
这里的所有都是它的!如果到目前为止,您应该得到一个cookie :)
这是GitHub上的代码,因此您可以使用它。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)