String sub 方法无法正常工作

我有关于 lua 的又一个问题。我创建了一个方法来计算一些价格的总金额。这些价格的格式为:£500。所以我使用了 string:sub() 和 tonumber() 将它们转换为数字,但是我得到了一些奇怪的结果。下面是我的代码:`

function functions.calculateTotalAmount()
print("正在计算总金额")
saveData.totalAmount = 0
print("在金额文件中有 " .. #saveData.amounts .. " 个金额")
for i=1, #saveData.names do
    print("SaveData.amounts[" .. i .. "] 原始值 = " .. saveData.amounts[i])
    print("SaveData.amounts[" .. i .. "] 去掉符号后的值= " .. saveData.amounts[i]:sub(2))
    print("总金额: " .. saveData.totalAmount)
    if saveData.income[i] then
        saveData.totalAmount = saveData.totalAmount + tonumber(saveData.amounts[i]:sub(2))
    else
        saveData.totalAmount = saveData.totalAmount - tonumber(saveData.amounts[i]:sub(2))
    end
end
totalAmountStr.text = saveData.totalAmount .. " " .. currencyFull
loadsave.saveTable(saveData, "payMeBackTable.json")

我在 for 循环中打印了一些信息以确定问题,并且这是在 for 循环的前两个打印语句中打印的内容:

16:03:51.452 SaveData.amounts 1 原始值 = ¥201

16:03:51.452 SaveData.amounts 1 去掉符号后的值= 201

在 stackoverflow 上这看起来很好,但是在我的日志中,¥ 实际上没有消失,而是被奇怪的矩形符号替换了。此帖子附有打印文字的图片。 有没有人知道这是怎么回事?enter image description here

点赞
用户107090
用户107090

string.sub() 在字符串的 字节 上工作,而不是在其 字符 上工作。当字符串包含 Unicode 文本时,两者之间存在差异。

如果数字位于字符串末尾,请使用以下方式提取它:

amount = tonumber(saveData.amounts[i]:match("%d+$"))
2016-09-14 14:32:38
用户1442917
用户1442917

不要在这种情况下使用 sub,因为 Â¥ 符号可能是多字节序列(取决于编码),因此使用 sub(2) 会将其分成两半而不是删除它。

相反,请使用 gsub("[^%d%.]+","") 来删除所有非数字部分。

不要在这种情况下使用 `sub`,因为 `Â¥` 符号可能是多字节序列(取决于编码),因此使用 `sub(2)` 会将其分成两半而不是删除它。

相反,请使用 `gsub("[^%d%.]+","")` 来删除所有非数字部分。 
2016-09-14 14:33:17
用户1407170
用户1407170

Lua 的字符串是 _字节_(bytes)而非字符,ASCII 字符由 1 字节长度组成,而大多数其他字符则需要消耗多个字节,因此使用 string.sub() 方法无法正常工作。

转换 字节 和 _字符_(或 _码点_)之间有几个标准,但是在互联网上远远最常用的是 UTF-8。如果您使用的是 Lua 5.3 或更高版本,您可以使用新的内置函数来执行 UTF-8 操作。例如,要从 UTF-8 字符串中获取子字符串,您可以执行以下操作:

-- 未进行边界检查的简单版本。
function utf8_sub1(s, start_char_idx, end_char_idx)
  start_byte_idx = utf8.offset(s, start_char_idx)
  end_byte_idx = utf8.offset(s, end_char_idx + 1) - 1
  return string.sub(s, start_byte_idx, end_byte_idx)
end

-- 具有边界检查的更健壮版本。
function utf8_sub2(s, start_char_idx, end_char_idx)
  start_byte_idx = utf8.offset(s, start_char_idx)
  end_byte_idx = utf8.offset(s, end_char_idx + 1)
  if start_byte_idx == nil then
    start_byte_idx = 1
  end
  if end_byte_idx == nil then
    end_byte_idx = -1
  else
    end_byte_idx = end_byte_idx - 1
  end
  return string.sub(s, start_byte_idx, end_byte_idx)
end

s = "Â¥201"

print(string.sub(s, 2, 4)) -- 一个无效的字节序列
print(utf8_sub1(s, 2, 4)) -- "201"
print(utf8_sub2(s, 2, 4)) -- "201"
print(utf8_sub1(s, 2, 5)) -- 抛出一个错误

如果您没有 Lua 5.3,您可以使用此类库来实现相同的功能。

2016-12-04 22:44:26