Lua - 为什么函数调用后的字符串是允许的?

我试图实现一个简单的 C++ 函数,检查 Lua 脚本的语法。为此,我使用了 Lua 的编译器函数 luaL_loadbufferx(),然后检查它的返回值。

最近,我遇到了一个问题,因为我认为应该标记为无效的代码没有被检测到,相反,脚本在运行时失败了(例如在 lua_pcall() 中)。

示例 Lua 代码(可在 official Lua demo 上测试):

function myfunc()
   return "everyone"
end

-- 非预期行为的示例:
-- 以下行不会有错误通过编译时检查
print("Hello " .. myfunc() "!") -- 运行时错误:企图调用一个字符串值
print("Hello " .. myfunc() {1,2,3}) -- 运行时错误:企图调用一个字符串值

-- 其他示例:
-- 以下行包含无效语法的示例,编译器会检测到。
print("Hello " myfunc() .. "!") -- 编译错误:')'预期在 'myfunc' 附近
print("Hello " .. myfunc() 5) -- 编译错误:')'预期在‘5’附近
print("Hello " .. myfunc() .. ) -- 编译错误:')' 附近存在意外符号

显然,目标是在编译时捕获所有语法错误。所以我的问题是:

  1. 什么是“调用字符串值”指的是什么?
  2. 为什么首先允许这种语法?这是我不知道的某种 Lua 特性,还是 luaL_loadbufferx() 在这个特定的示例中有问题?
  3. 是否可能通过其他方法检测到此类错误而不运行它?不幸的是,我的函数在编译时没有访问全局变量的权限,因此我不能直接通过 lua_pcall() 运行代码。

注意:我使用的是 Lua 版本 5.3.4(手册)。

非常感谢您的帮助。

点赞
用户107090
用户107090

myfunc() "!"myfunc(){1,2,3} 都是有效的 Lua 表达式。

Lua 允许形如 exp string 的函数调用。详见Lua 语法中的 functioncallprefixexp

因此,myfunc() "!" 是一个有效的函数调用,调用 myfunc 返回的任何内容,并将其与字符串 "!" 一起调用。

对于形如 exp table-literal 的函数调用,同样的事情也会发生。

2017-07-07 18:03:38
用户2340876
用户2340876

我写下这篇回答来帮助未来遇到类似问题的人,同时也为他们提供解决方案。


手册

Lua 手册(在其 3.4.10 节中 —— 函数调用) 基本上表明存在三种不同的方法来向 Lua 函数提供参数。

参数具有以下语法:

  args ::= ‘(’ [explist] ‘)’
  args ::= tableconstructor
  args ::= LiteralString

所有参数表达式都在调用之前被计算。f{fields} 形式的调用是 f({fields}) 的语法糖;即参数列表是一个单独的新表。f'string'(或 f"string" 或 f[[string]]形式的调用是 f('string') 的语法糖;即参数列表是一个单独的字面量字符串。


解释

正如 lhf他的答案 中指出的,myfunc()"!"myfunc(){1,2,3} 都是有效的 Lua 表达式。这意味着 Lua 编译器没有做错任何事情,因为它在编译时不知道函数返回值。

问题中给出的原始示例代码:

print("Hello " .. myfunc() "!")

然后可以改写为:

print("Hello " .. (myfunc()) ("!"))

这将在执行时转换为:

print("Hello " .. ("everyone") ("!"))

从而导致运行时错误消息 attempt to call a string value(可以改写为:字符串 everyone 不是一个函数,所以你不能调用它)。


解决方案

据我理解,这两种替代的参数提供方式与标准的 func(arg) 语法没有真正的优势。这就是为什么我最终修改了 Lua 解析器文件。保留此替代语法的缺点太大了。以下是我所做的(适用于 v5.3.4):

  1. lparser.c 文件中搜索以下函数:

    static void suffixedexp (LexState *ls, expdesc *v)
    
  2. 在此函数中更改以下 case 语句:

    case '(': case TK_STRING: case '{':
    

    更改为:

    case '(':
    

警告!通过这样做,我修改了 Lua 语言,因此正如 lhf 在他的评论中所述,它不再被称为_纯_ Lua。如果您不确定是否正是您想要的,我不推荐这种方法。

通过这个 _小小的修改_,编译器将检测到上述的这两种替代语法,并将其视为错误。当然,我不能再在 Lua 脚本中使用它们,但对于我的特定应用程序来说就足够了。

我需要做的一切就是将这个变化 _记录在某个地方_,以便在升级到更高的 Lua 版本时找到它。

2017-07-07 22:31:54
用户5263865
用户5263865

另一个方法是改变字符串的元表,使调用字符串成为有效的。

local mt = getmetatable ""
mt.__call = function (self, args) return self .. args end
print(("x") "y") -- 输出 `xy`

现在对字符串的有效语法调用将导致字符串连接,而不是运行时错误。

2017-07-08 08:34:58