为什么 Lua 的字符串可以包含任何数值的字符?

我读到了一些关于字符串的内容: http://www.lua.org/pil/2.4.html

Lua 是八位字符兼容的,因此字符串可以包含任何数值,包括嵌入的零。

什么是八位字符兼容?

为什么它可以包含任何数值?(与基本的 C 字符串不同)

点赞
用户335858
用户335858

有两种常见的存储字符串的方式:

  1. 字符和终止符
  2. 长度和字符

当你使用方式#1时,你需要“牺牲”一个字符作为终止符;当你使用方式#2时,你没有这样的限制。

C 使用第一种方法存储字符串。它使用零号字符作为终止符;其他255个字符可以用来表示字符串的字符。

Lua 使用第二种方法存储字符串。所有256个可能的字符值,包括零,都可以用在Lua字符串中。例如,你可以从字符 'A',0,'B'构建一个三个字符的字符串,Lua将把它视为一个三个字符的字符串。你可以在C中构建相同的字符串,但它的字符串处理库会将其视为单个字符的字符串:strlen将返回1,puts将写入字符A并停止,等等。

2012-06-02 03:04:48
用户2226988
用户2226988

Lua 的字符串类型是一个包含字节的计数序列。字节可以保存 0 到 255 之间的任何值。

字符串类型用于字符字符串。你是对的,少数字符集编码允许任何字节值或字节值序列。Code page 437 就是其中之一,它将 256 个字符映射到 256 个值,每个字符一个字节。Windows-1252 不行,它将 251 个字符映射到 251 个值,每个字符一个字节。UTF-8 将 1,112,064 个字符映射到由一个到四个字节组成的序列,其中某些字节值未被使用,某些值序列也未被使用。

Lua 字符串库确实有将字节视为字符的函数。它们的行为会受实现库的影响,通常使用 C 运行时及其区域设置功能。

有专门的 Lua 库用于显式处理各种字符集编码。

2014-05-12 16:56:57