摘要:本文主要介紹解析生成的抽象語法樹節點,的實現也是基于的。原文地址解析器是把源碼轉化為抽象語法樹的解析器。參考文獻前端進階之抽象語法樹抽象語法樹
前言
Babel為當前最流行的代碼JavaScript編譯器了,其使用的JavaScript解析器為babel-parser,最初是從Acorn 項目fork出來的。Acorn 非常快,易于使用,并且針對非標準特性(以及那些未來的標準特性) 設計了一個基于插件的架構。本文主要介紹esprima解析生成的抽象語法樹節點,esprima的實現也是基于Acorn的。
原文地址
解析器 ParserJavaScript Parser 是把js源碼轉化為抽象語法樹(AST)的解析器。這個步驟分為兩個階段:詞法分析(Lexical Analysis) 和 語法分析(Syntactic Analysis)。
常用的JavaScript Parser:
esprima
uglifyJS2
traceur
acorn
espree
@babel/parser
詞法分析詞法分析階段把字符串形式的代碼轉換為 令牌(tokens)流。你可以把令牌看作是一個扁平的語法片段數組。
n * n;
例如上面n*n的詞法分析得到結果如下:
[ { type: { ... }, value: "n", start: 0, end: 1, loc: { ... } }, { type: { ... }, value: "*", start: 2, end: 3, loc: { ... } }, { type: { ... }, value: "n", start: 4, end: 5, loc: { ... } }, ]
每一個 type 有一組屬性來描述該令牌:
{ type: { label: "name", keyword: undefined, beforeExpr: false, startsExpr: true, rightAssociative: false, isLoop: false, isAssign: false, prefix: false, postfix: false, binop: null, updateContext: null }, ... }
和 AST 節點一樣它們也有 start,end,loc 屬性。
語法分析語法分析就是根據詞法分析的結果,也就是令牌tokens,將其轉換成AST。
function square(n) { return n * n; }
如上面代碼,生成的AST結構如下:
{ type: "FunctionDeclaration", id: { type: "Identifier", name: "square" }, params: [{ type: "Identifier", name: "n" }], body: { type: "BlockStatement", body: [{ type: "ReturnStatement", argument: { type: "BinaryExpression", operator: "*", left: { type: "Identifier", name: "n" }, right: { type: "Identifier", name: "n" } } }] } }
下文將對AST各個類型節點做解釋。更多AST生成,入口如下:
eslint
AST Explorer
esprima
結合可視化工具,舉個例子
如下代碼:
var a = 42; var b = 5; function addA(d) { return a + d; } var c = addA(2) + b;
第一步詞法分析之后長成如下圖所示:
語法分析,生產抽象語法樹,生成的抽象語法樹如下圖所示
Base Node所有節點類型都實現以下接口:
interface Node { type: string; range?: [number, number]; loc?: SourceLocation; }
該type字段是表示AST變體類型的字符串。該loc字段表示節點的源位置信息。如果解析器沒有生成有關節點源位置的信息,則該字段為null;否則它是一個對象,包括一個起始位置(被解析的源區域的第一個字符的位置)和一個結束位置.
interface SourceLocation { start: Position; end: Position; source?: string | null; }
每個Position對象由一個line數字(1索引)和一個column數字(0索引)組成:
interface Position { line: uint32 >= 1; column: uint32 >= 0; }Programs
interface Program <: Node { type: "Program"; sourceType: "script" | "module"; body: StatementListItem[] | ModuleItem[]; }
表示一個完整的源代碼樹。
Scripts and Modules源代碼數的來源包括兩種,一種是script腳本,一種是modules模塊
當為script時,body為StatementListItem。
當為modules時,body為ModuleItem。
類型StatementListItem和ModuleItem類型如下。
type StatementListItem = Declaration | Statement; type ModuleItem = ImportDeclaration | ExportDeclaration | StatementListItem;ImportDeclaration
import語法,導入模塊
type ImportDeclaration { type: "ImportDeclaration"; specifiers: ImportSpecifier[]; source: Literal; }
ImportSpecifier類型如下:
interface ImportSpecifier { type: "ImportSpecifier" | "ImportDefaultSpecifier" | "ImportNamespaceSpecifier"; local: Identifier; imported?: Identifier; }
ImportSpecifier語法如下:
import { foo } from "./foo";
ImportDefaultSpecifier語法如下:
import foo from "./foo";
ImportNamespaceSpecifier語法如下
import * as foo from "./foo";ExportDeclaration
export類型如下
type ExportDeclaration = ExportAllDeclaration | ExportDefaultDeclaration | ExportNamedDeclaration;
ExportAllDeclaration從指定模塊中導出
interface ExportAllDeclaration { type: "ExportAllDeclaration"; source: Literal; }
語法如下:
export * from "./foo";
ExportDefaultDeclaration導出默認模塊
interface ExportDefaultDeclaration { type: "ExportDefaultDeclaration"; declaration: Identifier | BindingPattern | ClassDeclaration | Expression | FunctionDeclaration; }
語法如下:
export default "foo";
ExportNamedDeclaration導出部分模塊
interface ExportNamedDeclaration { type: "ExportNamedDeclaration"; declaration: ClassDeclaration | FunctionDeclaration | VariableDeclaration; specifiers: ExportSpecifier[]; source: Literal; }
語法如下:
export const foo = "foo";Declarations and Statements
declaration,即聲明,類型如下:
type Declaration = VariableDeclaration | FunctionDeclaration | ClassDeclaration;
statements,即語句,類型如下:
type Statement = BlockStatement | BreakStatement | ContinueStatement | DebuggerStatement | DoWhileStatement | EmptyStatement | ExpressionStatement | ForStatement | ForInStatement | ForOfStatement | FunctionDeclaration | IfStatement | LabeledStatement | ReturnStatement | SwitchStatement | ThrowStatement | TryStatement | VariableDeclaration | WhileStatement | WithStatement;VariableDeclarator
變量聲明,kind 屬性表示是什么類型的聲明,因為 ES6 引入了 const/let。
interface VariableDeclaration <: Declaration { type: "VariableDeclaration"; declarations: [ VariableDeclarator ]; kind: "var" | "let" | "const"; }FunctionDeclaration
函數聲明(非函數表達式)
interface FunctionDeclaration { type: "FunctionDeclaration"; id: Identifier | null; params: FunctionParameter[]; body: BlockStatement; generator: boolean; async: boolean; expression: false; }
例如:
function foo() {} function *bar() { yield "44"; } async function noop() { await new Promise(function(resolve, reject) { resolve("55"); }) }ClassDeclaration
類聲明(非類表達式)
interface ClassDeclaration { type: "ClassDeclaration"; id: Identifier | null; superClass: Identifier | null; body: ClassBody; }
ClassBody聲明如下:
interface ClassBody { type: "ClassBody"; body: MethodDefinition[]; }
MethodDefinition表示方法聲明;
interface MethodDefinition { type: "MethodDefinition"; key: Expression | null; computed: boolean; value: FunctionExpression | null; kind: "method" | "constructor"; static: boolean; }
class foo { constructor() {} method() {} };ContinueStatement
continue語句
interface ContinueStatement { type: "ContinueStatement"; label: Identifier | null; }
例如:
for (var i = 0; i < 10; i++) { if (i === 0) { continue; } }DebuggerStatement
debugger語句
interface DebuggerStatement { type: "DebuggerStatement"; }
例如
while(true) { debugger; }DoWhileStatement
do-while語句
interface DoWhileStatement { type: "DoWhileStatement"; body: Statement; test: Expression; }
test表示while條件
例如:
var i = 0; do { i++; } while(i = 2)EmptyStatement
空語句
interface EmptyStatement { type: "EmptyStatement"; }
例如:
if(true); var a = []; for(i = 0; i < a.length; a[i++] = 0);ExpressionStatement
表達式語句,即,由單個表達式組成的語句。
interface ExpressionStatement { type: "ExpressionStatement"; expression: Expression; directive?: string; }
當表達式語句表示一個指令(例如“use strict”)時,directive屬性將包含該指令字符串。
例如:
(function(){});ForStatement
for語句
interface ForStatement { type: "ForStatement"; init: Expression | VariableDeclaration | null; test: Expression | null; update: Expression | null; body: Statement; }ForInStatement
for...in語句
interface ForInStatement { type: "ForInStatement"; left: Expression; right: Expression; body: Statement; each: false; }ForOfStatement
for...of語句
interface ForOfStatement { type: "ForOfStatement"; left: Expression; right: Expression; body: Statement; }IfStatement
if 語句
interface IfStatement { type: "IfStatement"; test: Expression; consequent: Statement; alternate?: Statement; }
consequent表示if命中后內容,alternate表示else或者else if的內容。
LabeledStatementlabel語句,多用于精確的使用嵌套循環中的continue和break。
interface LabeledStatement { type: "LabeledStatement"; label: Identifier; body: Statement; }
如:
var num = 0; outPoint: for (var i = 0 ; i < 10 ; i++){ for (var j = 0 ; j < 10 ; j++){ if( i == 5 && j == 5 ){ break outPoint; } num++; } }ReturnStatement
return 語句
interface ReturnStatement { type: "ReturnStatement"; argument: Expression | null; }SwitchStatement
Switch語句
interface SwitchStatement { type: "SwitchStatement"; discriminant: Expression; cases: SwitchCase[]; }
discriminant表示switch的變量。
SwitchCase類型如下
interface SwitchCase { type: "SwitchCase"; test: Expression | null; consequent: Statement[]; }ThrowStatement
throw語句
interface ThrowStatement { type: "ThrowStatement"; argument: Expression; }TryStatement
try...catch語句
interface TryStatement { type: "TryStatement"; block: BlockStatement; handler: CatchClause | null; finalizer: BlockStatement | null; }
handler為catch處理聲明內容,finalizer為finally內容。
CatchClaus 類型如下
interface CatchClause { type: "CatchClause"; param: Identifier | BindingPattern; body: BlockStatement; }
例如:
try { foo(); } catch (e) { console.erroe(e); } finally { bar(); }WhileStatement
while語句
interface WhileStatement { type: "WhileStatement"; test: Expression; body: Statement; }
test為判定表達式
WithStatementwith語句(指定塊語句的作用域的作用域)
interface WithStatement { type: "WithStatement"; object: Expression; body: Statement; }
如:
var a = {}; with(a) { name = "xiao.ming"; } console.log(a); // {name: "xiao.ming"}Expressions and Patterns
Expressions可用類型如下:
type Expression = ThisExpression | Identifier | Literal | ArrayExpression | ObjectExpression | FunctionExpression | ArrowFunctionExpression | ClassExpression | TaggedTemplateExpression | MemberExpression | Super | MetaProperty | NewExpression | CallExpression | UpdateExpression | AwaitExpression | UnaryExpression | BinaryExpression | LogicalExpression | ConditionalExpression | YieldExpression | AssignmentExpression | SequenceExpression;
Patterns可用有兩種類型,函數模式和對象模式如下:
type BindingPattern = ArrayPattern | ObjectPattern;ThisExpression
this 表達式
interface ThisExpression { type: "ThisExpression"; }Identifier
標識符,就是我們寫 JS 時自定義的名稱,如變量名,函數名,屬性名,都歸為標識符。相應的接口是這樣的:
interface Identifier { type: "Identifier"; name: string; }Literal
字面量,這里不是指 [] 或者 {} 這些,而是本身語義就代表了一個值的字面量,如 1,“hello”, true 這些,還有正則表達式(有一個擴展的 Node 來表示正則表達式),如 /d?/。
interface Literal { type: "Literal"; value: boolean | number | string | RegExp | null; raw: string; regex?: { pattern: string, flags: string }; }
例如:
var a = 1; var b = "b"; var c = false; var d = /d/;ArrayExpression
數組表達式
interface ArrayExpression { type: "ArrayExpression"; elements: ArrayExpressionElement[]; }
例:
[1, 2, 3, 4];ArrayExpressionElement
數組表達式的節點,類型如下
type ArrayExpressionElement = Expression | SpreadElement;
Expression包含所有表達式,SpreadElement為擴展運算符語法。
SpreadElement擴展運算符
interface SpreadElement { type: "SpreadElement"; argument: Expression; }
如:
var a = [3, 4]; var b = [1, 2, ...a]; var c = {foo: 1}; var b = {bar: 2, ...c};ObjectExpression
對象表達式
interface ObjectExpression { type: "ObjectExpression"; properties: Property[]; }
Property代表為對象的屬性描述
類型如下
interface Property { type: "Property"; key: Expression; computed: boolean; value: Expression | null; kind: "get" | "set" | "init"; method: false; shorthand: boolean; }
kind用來表示是普通的初始化,或者是 get/set。
例如:
var obj = { foo: "foo", bar: function() {}, noop() {}, // method 為 true ["computed"]: "computed" // computed 為 true }FunctionExpression
函數表達式
interface FunctionExpression { type: "FunctionExpression"; id: Identifier | null; params: FunctionParameter[]; body: BlockStatement; generator: boolean; async: boolean; expression: boolean; }
例如:
var foo = function () {}ArrowFunctionExpression
箭頭函數表達式
interface ArrowFunctionExpression { type: "ArrowFunctionExpression"; id: Identifier | null; params: FunctionParameter[]; body: BlockStatement | Expression; generator: boolean; async: boolean; expression: false; }
generator表示是否為generator函數,async表示是否為async/await函數,params為參數定義。
FunctionParameter類型如下
type FunctionParameter = AssignmentPattern | Identifier | BindingPattern;
例:
var foo = () => {};ClassExpression
類表達式
interface ClassExpression { type: "ClassExpression"; id: Identifier | null; superClass: Identifier | null; body: ClassBody; }
例如:
var foo = class { constructor() {} method() {} };TaggedTemplateExpression
標記模板文字函數
interface TaggedTemplateExpression { type: "TaggedTemplateExpression"; readonly tag: Expression; readonly quasi: TemplateLiteral; }
TemplateLiteral類型如下
interface TemplateLiteral { type: "TemplateLiteral"; quasis: TemplateElement[]; expressions: Expression[]; }
TemplateElement類型如下
interface TemplateElement { type: "TemplateElement"; value: { cooked: string; raw: string }; tail: boolean; }
例如
var foo = function(a){ console.log(a); } foo`test`;MemberExpression
屬性成員表達式
interface MemberExpression { type: "MemberExpression"; computed: boolean; object: Expression; property: Expression; }
例如:
const foo = {bar: "bar"}; foo.bar; foo["bar"]; // computed 為 trueSuper
父類關鍵字
interface Super { type: "Super"; }
例如:
class foo {}; class bar extends foo { constructor() { super(); } }MetaProperty
(這個不知道干嘛用的)
interface MetaProperty { type: "MetaProperty"; meta: Identifier; property: Identifier; }
例如:
new.target // 通過new 聲明的對象,new.target會存在 import.metaCallExpression
函數執行表達式
interface CallExpression { type: "CallExpression"; callee: Expression | Import; arguments: ArgumentListElement[]; }
Import類型,沒搞懂。
interface Import { type: "Import" }
ArgumentListElement類型
type ArgumentListElement = Expression | SpreadElement;
如:
var foo = function (){}; foo();NewExpression
new 表達式
interface NewExpression { type: "NewExpression"; callee: Expression; arguments: ArgumentListElement[]; }UpdateExpression
更新操作符表達式,如++、--;
interface UpdateExpression { type: "UpdateExpression"; operator: "++" | "--"; argument: Expression; prefix: boolean; }
如:
var i = 0; i++; ++i; // prefix為trueAwaitExpression
await表達式,會與async連用。
interface AwaitExpression { type: "AwaitExpression"; argument: Expression; }
如
async function foo() { var bar = function() { new Primise(function(resolve, reject) { setTimeout(function() { resove("foo") }, 1000); }); } return await bar(); } foo() // fooUnaryExpression
一元操作符表達式
interface UnaryExpression { type: "UnaryExpression"; operator: UnaryOperator; prefix: boolean; argument: Expression; }
枚舉UnaryOperator
enum UnaryOperator { "-" | "+" | "!" | "~" | "typeof" | "void" | "delete" | "throw" }BinaryExpression
二元操作符表達式
interface BinaryExpression { type: "BinaryExpression"; operator: BinaryOperator; left: Expression; right: Expression; }
枚舉BinaryOperator
enum BinaryOperator { "==" | "!=" | "===" | "!==" | "<" | "<=" | ">" | ">=" | "<<" | ">>" | ">>>" | "+" | "-" | "*" | "/" | "%" | "**" | "|" | "^" | "&" | "in" | "instanceof" | "|>" }LogicalExpression
邏輯運算符表達式
interface LogicalExpression { type: "LogicalExpression"; operator: "||" | "&&"; left: Expression; right: Expression; }
如:
var a = "-"; var b = a || "-"; if (a && b) {}ConditionalExpression
條件運算符
interface ConditionalExpression { type: "ConditionalExpression"; test: Expression; consequent: Expression; alternate: Expression; }
例如:
var a = true; var b = a ? "consequent" : "alternate";YieldExpression
yield表達式
interface YieldExpression { type: "YieldExpression"; argument: Expression | null; delegate: boolean; }
例如:
function* gen(x) { var y = yield x + 2; return y; }AssignmentExpression
賦值表達式。
interface AssignmentExpression { type: "AssignmentExpression"; operator: "=" | "*=" | "**=" | "/=" | "%=" | "+=" | "-=" | "<<=" | ">>=" | ">>>=" | "&=" | "^=" | "|="; left: Expression; right: Expression; }
operator屬性表示一個賦值運算符,left和right是賦值運算符左右的表達式。
SequenceExpression序列表達式(使用逗號)。
interface SequenceExpression { type: "SequenceExpression"; expressions: Expression[]; }
var a, b; a = 1, b = 2ArrayPattern
數組解析模式
interface ArrayPattern { type: "ArrayPattern"; elements: ArrayPatternElement[]; }
例:
const [a, b] = [1,3];
elements代表數組節點
ArrayPatternElement如下
type ArrayPatternElement = AssignmentPattern | Identifier | BindingPattern | RestElement | null;AssignmentPattern
默認賦值模式,數組解析、對象解析、函數參數默認值使用。
interface AssignmentPattern { type: "AssignmentPattern"; left: Identifier | BindingPattern; right: Expression; }
例:
const [a, b = 4] = [1,3];RestElement
剩余參數模式,語法與擴展運算符相近。
interface RestElement { type: "RestElement"; argument: Identifier | BindingPattern; }
例:
const [a, b, ...c] = [1, 2, 3, 4];ObjectPatterns
對象解析模式
interface ObjectPattern { type: "ObjectPattern"; properties: Property[]; }
例:
const object = {a: 1, b: 2}; const { a, b } = object;結束
AST的作用大致分為幾類
IDE使用,如代碼風格檢測(eslint等)、代碼的格式化,代碼高亮,代碼錯誤等等
代碼的混淆壓縮
轉換代碼的工具。如webpack,rollup,各種代碼規范之間的轉換,ts,jsx等轉換為原生js
了解AST,最終還是為了讓我們了解我們使用的工具,當然也讓我們更了解JavaScript,更靠近JavaScript。
參考文獻前端進階之 Javascript 抽象語法樹
抽象語法樹(Abstract Syntax Tree)
文章版權歸作者所有,未經允許請勿轉載,若此文章存在違規行為,您可以聯系管理員刪除。
轉載請注明本文地址:http://specialneedsforspecialkids.com/yun/102602.html
摘要:為什么要談抽象語法樹如果你查看目前任何主流的項目中的,會發現前些年的不計其數的插件誕生。什么是抽象語法樹估計很多同學會和圖中的喵一樣,看完這段官方的定義一臉懵逼。它讀取我們的代碼,然后把它們按照預定的規則合并成一個個的標識。 前言 首先,先說明下該文章是譯文,原文出自《AST for JavaScript developers》。很少花時間特地翻譯一篇文章,咬文嚼字是件很累的事情,實在...
摘要:抽象語法樹,是一個非常基礎而重要的知識點,但國內的文檔卻幾乎一片空白。事實上,在世界中,你可以認為抽象語法樹是最底層。通過抽象語法樹解析,我們可以像童年時拆解玩具一樣,透視這臺機器的運轉,并且重新按著你的意愿來組裝。 抽象語法樹(AST),是一個非常基礎而重要的知識點,但國內的文檔卻幾乎一片空白。本文將帶大家從底層了解AST,并且通過發布一個小型前端工具,來帶大家了解AST的強大功能 ...
摘要:語法樹與代碼轉化實踐歸納于筆者的現代開發語法基礎與實踐技巧系列文章中。抽象語法樹抽象語法樹的作用在于牢牢抓住程序的脈絡,從而方便編譯過程的后續環節如代碼生成對程序進行解讀。 JavaScript 語法樹與代碼轉化實踐 歸納于筆者的現代 JavaScript 開發:語法基礎與實踐技巧系列文章中。本文引用的參考資料聲明于 JavaScript 學習與實踐資料索引中,特別需要聲明是部分代碼片...
摘要:例如會被分解成解析語法分析這個過程是將詞法單元流數組轉換成一個由元素逐級嵌套所組成的代表了程序語法結構的樹,這個樹就叫抽象語法樹。常用的有使用生成并使用抽象語法樹。 一般來說,程序中的一段源代碼在執行之前會經歷下面三個步驟1 分詞/詞法分析這個過程會將由字符組成的字符串分解成有意義的代碼快,這些代碼塊被稱為詞法單元。例如 var a = 4;會被分解成 var、a、=、4、; 2 解析...
摘要:無論你使用的是解釋型語言還是編譯型語言,都有一個共同的部分將源代碼作為純文本解析為抽象語法樹的數據結構。和抽象語法樹相對的是具體語法樹,通常稱作分析樹。這是引入字節碼緩存的原因。 這是專門探索 JavaScript 及其所構建的組件的系列文章的第 14 篇。 想閱讀更多優質文章請猛戳GitHub博客,一年百來篇優質文章等著你! 如果你錯過了前面的章節,可以在這里找到它們: JavaS...
閱讀 2390·2021-10-09 09:41
閱讀 3189·2021-09-26 09:46
閱讀 838·2021-09-03 10:34
閱讀 3162·2021-08-11 11:22
閱讀 3371·2019-08-30 14:12
閱讀 719·2019-08-26 11:34
閱讀 3351·2019-08-26 11:00
閱讀 1774·2019-08-26 10:26