如何使用Python解析.lua文件并提取require语句?

我不太擅长解析文件,但我有一些想要完成的事情。以下是一个 .lua 脚本的片段,其中有一些 require 语句。我想使用 Python 解析这个 .lua 文件并提取出 'require' 语句。

例如,这是 require 语句:

require "common.acme_1"
require "common.acme_2"
require "acme_3"
require "common.core.acme_4"

从上面的例子中,我想将目录从所需的文件中分离出来。例如,在 'require "common.acme_1"' 这个例子中,目录是 common,所需的文件是 acme_1。然后,我只需要将 .lua 扩展名添加到 acme_1。我需要这些信息,以便我可以验证文件是否存在于文件系统上(我知道如何做),然后根据 luac(编译器)验证它是否是有效的 lua 文件(我也知道如何做)。

我只需要使用 Python 提取这些 require 语句并将目录名从文件名中拆分出来的帮助。

点赞
用户30105
用户30105

这很直接。

一行命令很棒,但它们需要投入太多精力才能理解,我认为这不是使用正则表达式的工作。

mylines = [line.split('require')[-1] for line in open(mylua.lua).readlines() if line.startswith('require')]

paths = []
for line in mylines:
    if 'common.' in line:
        paths.append('common, line.split('common.')[-1]
    else:
        paths.append('',line)

2014-02-19 21:06:06
用户1099682
用户1099682

下面是一个疯狂的一行命令,不确定这是否正是您想要的,而且肯定不是最优的...

In [270]: import re

In [271]: [[s[::-1] for s in rec[::-1].split(".", 1)][::-1] for rec in re.findall(r"require \"([^\"]*)", text)]
Out[271]:
[['common', 'acme_1'],
 ['common', 'acme_2'],
 ['acme_3'],
 ['common.core', 'acme_4']]
2014-02-19 21:10:02
用户329598
用户329598
文件路径:`'/path/to/test.lua'`

函数解析:
使用 `with` 语句打开该文件,并创建一个以 'require ' 开头的列表,将其分割,只留下最后一部分,并去掉双引号。然后遍历该列表,将点换成斜线,同时添加 '.lua' 后缀。`print` 语句显示结果。
2014-02-19 21:14:25
用户618895
用户618895

你可以使用内置的字符串方法来完成这个工作,但由于解析有点复杂(路径可能是多部分的),因此最简单的解决方案可能是使用正则表达式。如果您使用正则表达式,则可以使用组进行解析和分割:

import re

data = \
'''
require "common.acme_1"
require "common.acme_2"
require "acme_3"
require "common.core.acme_4"
'''

finds = re.findall(r'require\s+"(([^."]+\.)*)?([^."]+)"', data, re.MULTILINE)

print [dict(path=x[0].rstrip('.'),file=x[2]) for x in finds]

第一个组是路径(包括结尾的“。”),第二个组是匹配重复路径部分所需的内部组(被丢弃),第三个组是文件名。如果没有路径,则为 path =''

输出:

[{'path': 'common', 'file': 'acme_1'}, {'path': 'common', 'file': 'acme_2'}, {'path': '', 'file': 'acme_3'}, {'path': 'common.core', 'file': 'acme_4'}]
2014-02-19 21:15:20
用户802303
用户802303
import sys
import os.path
if len(sys.argv) != 2:
    print "Usage:", sys.argv[0], "<inputfile.lua>"
    exit()
f = open(sys.argv[1], "r")
lines = f.readlines()
f.close()
for line in lines:
    if line.startswith("require "):
        path = line.replace('require "', '').replace('"', '').replace("\n", '').replace(".", "/") + ".lua"
        fName = os.path.basename(path)
        path = path.replace(fName, "")
        print "File: " + fName
        print "Directory: " + path
        #在此处对每个文件和路径进行操作

这里提供了一个Python脚本,通过读取一个Lua脚本文件来处理其中的“require”语句。如果有一个参数传递给脚本,则使用该参数作为Lua文件的输入。之后,它逐行读取输入文件,并查找以“require”开头的行。如果找到了这样的行,它将从行中提取路径,打印文件名和所在目录,并留下对文件和路径进行操作的空间。

2014-02-19 21:16:49
用户298607
用户298607

你可以使用 finditer:

lua = '''
require "common.acme_1"
require "common.acme_2"
require "acme_3"
require 'common.core.acme_4'
'''

import re
print [m.group(2) for m in re.finditer(r'^require\s+(\'|")([^\'"]+)(\1)', lua, re.S | re.M)]
# ['common.acme_1', 'common.acme_2', 'acme_3', 'common.core.acme_4']

然后只需按 '.' 分割,将其分割成路径:

for e in [m.group(2) for m in re.finditer(r'^require\s+(\'|")([^\'"]+)(\1)', lua, re.S | re.M)]:
    parts=e.split('.')
    if parts[:-1]:
        print '/'.join(parts[:-1]), parts[-1]
    else:
        print parts[0]

输出:

common acme_1
common acme_2
acme_3
common/core acme_4
2014-02-19 21:20:08