如何在 Lua 中查找一个子字符串,其中包含1个或2个字符的偏差。

假设有一个字符串

local a = "Hello universe"

我通过以下方式找到子字符串 "universe"

a:find("universe")

现在,假设字符串是

local a = "un#verse"

要搜索的字符串是 universe;但子字符串仅有一个字符不同。 所以显然 Lua 忽略了这点。

如何使函数即使存在单字符差异也能找到该字符串?

点赞
用户6236
用户6236

如果您知道字符的位置,可以使用 . 替换该字符:a:find("un.verse")

然而,看起来您正在寻找一种模糊字符串搜索。这超出了Lua string库的范围。您可能需要从这篇文章开始:http://ntz-develop.blogspot.com/2011/03/fuzzy-string-search.html

至于Lua模糊搜索实现--我没有使用过任何搜索,但是通过谷歌搜索 "lua模糊搜索" 可以得到几个结果。一些基于这篇论文:http://web.archive.org/web/20070518080535/http://www.heise.de/ct/english/97/04/386/

尝试使用https://github.com/ajsher/luafuzzy

2012-10-19 07:03:15
用户1516484
用户1516484

看起来你需要类似 TRE 这样的东西:

TRE 是一个轻量级、稳健、高效的 POSIX 兼容的正则表达式匹配库,具有一些令人兴奋的特性,例如近似(模糊)匹配。

近似模式匹配允许匹配近似,即在某些接近程度的衡量标准下,允许匹配与搜索模式接近的结果。TRE 使用编辑距离度量(也称为 Levenshtein 距离),其中字符可以插入、删除或替换以便获得精确匹配。每次插入、删除或替换都会增加匹配的距离或成本。TRE 可以报告成本低于某个给定阈值的匹配。TRE 也可以用于搜索成本最低的匹配项。

其 Lua 绑定可作为 lrexlib 的一部分使用。

2012-10-19 08:30:47
用户513763
用户513763

一个简单的自己动手方式(基于模式保持相同长度的假设):

function hammingdistance(a,b)
    local ta={a:byte(1,-1)}
    local tb={b:byte(1,-1)}
    local res = 0
    for k=1,#a do
        if ta[k]~=tb[k] then
            res=res+1
        end
    end
    print(a,b,res) --调试/演示打印
    return res
end

function fuz(s,pat)
    local best_match=10000
    local best_location
    for k=1,#s-#pat+1 do
        local cur_diff=hammingdistance(s:sub(k,k+#pat-1),pat)
        if  cur_diff < best_match then
            best_location = k
            best_match = cur_diff
        end
    end
    local start,ending = math.max(1,best_location),math.min(best_location+#pat-1,#s)
    return start,ending,s:sub(start,ending)
end

s=[[Hello, Universe! UnIvErSe]]
print(fuz(s,'universe'))

免责声明:不建议使用,仅供娱乐:

如果您想要更好的语法(并且不介意混淆标准类型的元表),您可以使用以下代码:

getmetatable('').__sub=hammingdistance
a='Hello'
b='hello'
print(a-b)

但请注意,这种方式的a-b不等于b-a

2012-10-19 09:43:53
用户204011
用户204011

如果你真的在寻找一个单个字符的不同并且不关心性能,这里有一个简单的方法可以实现:

local a = "Hello un#verse"

local myfind = function(s,p)
  local withdot = function(n)
    return p:sub(1,n-1) .. '.' .. p:sub(n+1)
  end
  local a,b
  for i=1,#s do
    a,b = s:find(withdot(i))
    if a then return a,b end
  end
end

print(myfind(a,"universe"))
2012-10-19 09:59:31