使用Lua逐行读取文件

根据 Lua 文档,file:read("*l") 读取下一行并跳过行末结束符。

注意:"*l":读取下一行并跳过行末结束符,在文件结尾返回 nil。这是默认格式。

这个文档是正确的吗?因为 file:read("*l") 读取的是当前行,而不是下一行,或者我的理解有误?非常令人困惑…

点赞
用户2633423
用户2633423

Lua使用与底层C实现相同的模型来管理文件(其他编程语言也使用该模型,它非常普遍)。如果您不熟悉查看文件的此种方式,则术语可能不清楚。

在此模型中,文件被表示为具有所谓“当前位置”的字节流。当前位置是一种概念性指针,指向要读取或写入下一个I / O操作的文件中的第一个字节。当您打开文件进行读取时,会设置新的流,使其当前位置为文件的开头,即当前位置“指向”文件中的第一个字节。

在Lua中,您可以通过所谓的“文件句柄”来管理流,这是底层流的一种中介。使用句柄执行的任何操作都会传递给相应的流。

Lua io.open打开文件,将C流与之关联并返回表示该流的文件句柄:

local file_handle = io.open(“myfile.txt”) - 打开文件进行读取

因此,如果执行读取某些字节(通常被解释为字符,如果您处理文本文件),则从流中读取这些字节,并且每读取一个字节,流的当前位置都会向前移动一个,每次指向下一个要读取的字节。

Lua文档暗示了这种模型。因此,当它说下一行时,它表示输入操作将从当前位置开始读取流中的所有字符,直到找到行尾字符为止。

请注意,如果将文本文件视为一系列行,则可能会对此产生误导,因为您可能会认为有“当前行”和“下一行”。与C模型相比,这将是更高级别的模型。在C中没有“当前行”。在C中,文本文件只是一连串的字节,其中一些特殊字符(行尾符)经历一些特殊处理(大多数情况下取决于实现),并由某些C标准函数用作行终止符号,即用作标记以检测何时停止读取字符。

对于新手或来自较高级别语言的人,另一个混淆源就是,在C中,由于历史原因,将字节处理为字符(处理单个字节的基本数据类型是char,它是C中最小的数字类型!)。因此,对于具有C背景的人来说,将字节看作字符,反之亦然是很自然的。

尽管Lua比C高级得多,但与C的密切关系(它旨在轻松地与C代码进行接口设计)使其继承了C“字节作为字符”的部分方法。实际上,例如,Lua字符串可以容纳任意字节,并且可以用于处理原始二进制数据。

2013-11-01 14:08:18
用户5386097
用户5386097

像 Lorenso 上面说的,read 从当前文件位置开始读取文件的一部分。它读取多少取决于读指令。在 Lua 5.3 中:

  • "*all":读取到文件结尾
  • "*line":从当前位置读取到行末 行末会被一个特殊字符标记,通常被表示为 LfCr(换行,回车)
  • "*number":读取一个数字,也就是说,它会读取到文本中被认为是数字的结尾,例如逗号 ","
  • num:读取最多 num 个字符的字符串

这里有一个例子,将一个包含数字列表的文件读取到一个数组(表)中,然后返回该数组。(只需将 "*number" 更改为 "*line" 即可逐行读取文件):

function read_array(file)
  local arr = {}
  local handle  = assert( io.open(file,"r") )
  local value = handle:read("*number")
  while value do
    table.insert( arr, value )
    value = handle:read("*number")
  end
  handle:close()
  return arr
end
2021-05-25 00:14:16