不区分大小写的关联数组键

我正在Lua中处理关联数组/表。我想将不区分大小写的用户输入与表的区分大小写键进行比较。

例如:

table = { ["HellO"] = "world" }
user_input = "hello"
table_entry = table[user_input]

如果可能的话,我希望像上面的示例一样,最终将 "world" 存储在 table_entry 中。

然而,我真的想避免循环遍历整个表(它将很大),并将 string.lower(key)与 string.lower(user_input)进行比较。

另外,我无法控制表的创建,因此无法只使用小写/大写字母键创建它。

任何反馈都将不胜感激,谢谢。

点赞
用户457598
用户457598

或许可以创建另外一张表,将原表中键的小写版本映射到原表中可能为0、1或多个的混合大小写键。然后将用户输入转换为小写,并在新表中查找。

2012-08-08 15:12:21
用户501459
用户501459

我对表格的创建没有控制,所以我不能只创建小写/大写键的表格。

然后,您至少需要遍历一次它。 这是一个哈希表; 没有办法使不同的字符串哈希为相同的值(除非更改Lua的核心)。

如果内存不是问题,可以进行一次遍历以创建新的查找表。如果内存是问题,则每次都必须遍历整个表格。

或者找到某种方法以控制该表格的创建。 :)

2012-08-08 18:08:32
用户41661
用户41661

你并没有说你打算如何处理冲突(原始表中包含不同值的 'hello''Hello')。

你也没有说原始表会被更新还是它是固定的。如果它将被更新且您无法截取更新,则您将陷入困境,因为您永远不知道真相将是什么。

一些想法:

  • 如果原始表不会被更新,则可以创建一个“影子”表,它使用原始表的密钥转换为小写:

    shadow = { }
    for k, v in pairs(original) do shadow[k:lower()] = v end
    

    使用shadow [userkey:lower()]进行查找。

  • 如果原始表将被更新,但大多数密钥都将命中,则可以构建一个大小写映射,该映射将任何小写映射为混合大小写:

    mixed = { }
    for k in pairs(original) do mixed[k:lower()] = k end
    

    使用original [mixed[userkey: lower()]]进行查找(仅当 mixed[...] 不为 nil 时)。

    在这种情况下,如果您获得了一个好的密钥,即使值已更改,您也已经完成了。但是,如果你没有获得一个丢失的密钥,你将不得不做一些昂贵的事情。(除非你可以拦截更新。)

如果原始表不受您控制,而且您没有方法检测它何时被更新,则您将陷入困境。在这种情况下,我会尝试插入一个空表,并使用 __index__newindex 元方法记录更新。那将增加开销,但仍将比线性搜索便宜。

2012-08-08 21:42:47