LuaJIT的跟踪编译器是如何工作的?

我一直在研究JIT和LuaJIT的跟踪编译器,最终我有了一些问题。

据我所知,LuaJIT的JIT不像Java的HotSpot那样编译热方法,而是编译源自循环的热路径。这是否意味着如果某些东西不源自循环(比如,我从C-API调用Lua函数),那么该代码将永远不会被JIT编译?当你触发另一个循环时会发生什么?第二个循环的路径是否会被JIT,然后新的路径从该循环也被JIT编译,或者第二个循环是相同路径的一部分?

解释器如何选择最优的热路径?假设我有一个整数 -》字符串的哈希表。现在想象我已经调用了table[x],其中x是3和5足够多次,它们已经成为热路径并被JIT编译,那么解释器如何决定要调用哪个JIT码来处理table[x],其中x是4?

还有一件事一直在困扰我。由于路径被编译而不是函数,跟踪编译器是否需要更多的内存?因为你不能真正地重用另一个路径的编译代码,我是说,而且在一般情况下路径可能比单个函数更大…

点赞
用户255049
用户255049

第一部分是需要理解的是 LuaJIT 的 IRBytecode,你可以在 Wiki 上查看,这是LuaJIT解释器运行和优化的内容,因此对追踪需要编译的内容以及在追踪路径中热点循环的优化(如循环展开)进行决策。

第二个要查看的地方是 LJ FAQ,其中有这样的描述:

Q: 我在哪里可以了解更多关于 LuaJIT 使用的编译器技术?

我计划编写更多有关 LuaJIT 内部机制的文档。在此期间,请使用以下 Google Scholar 搜索来查找相关论文:

搜索:Trace Compiler

搜索:JIT Compiler

搜索:Dynamic Language Optimizations

搜索:SSA Form

搜索:Linear Scan Register Allocation

下面是 LuaJIT 中的创新特性列表。当然,阅读源代码是唯一可以获得深刻理解的方法。 :-)

虽然非常直率(主要是因为 Mike 关注的是开发而不是文档),但最重要的部分在于最后一句话,源代码非常清晰而且是了解 LuaJIT 如何实现功能的唯一方法。此外,创新特性链接 还会给出更多关于搜索的线索。

维基百科有一个关于跟踪 JIT 的更具描述性的页面,然而,页面底部的论文是您在理解 LJ 源代码中使用的概念时最有用的参考。

以下是一些您可以开始阅读的源代码文件(使用 C 语言编写):

2013-11-29 10:44:48
用户636967
用户636967

Mike Pall 在 LuaJIT 邮件列表上以相当详细的方式回复了这个问题。

http://www.freelists.org/post/luajit/How-does-LuaJITs-trace-compiler-work,1

2013-11-29 20:32:30