SciTE排序选择工具:以前导空格开头的数字未按预期排序

SciTE 编辑器附带的 Lua 脚本引擎可以访问编辑器的文本缓冲区。这就使得我们可以通过用 Lua 编写的工具来扩展 SciTE 的功能,并从工具菜单启动。这里有一个这样的工具:

http://lua-users.org/wiki/SciteSortSelection

它是一个对所选行按字典序排序的工具,但令我感到烦恼的是它不能按数字的实际大小排序,而是像这样排序:

    1
  111
    2
  222
    3
  333

而我期望的是:

    1
    2
    3
  111
  222
  333

谷歌等搜索引擎并没有太大帮助,因为据我所知,在线上还没有解决此问题的方案。而且要找和深入理解 Lua 的 table.sort() 函数的文档也不是很容易。因此,对于了解 Lua 的程序员来说,如何修改现有的 Lua 脚本代码,以便使数字(以及前导空格的文本行)按预期排序,并且对此任务的 Lua 代码运行速度非常快,以至于即使对于大文件(50 MB 甚至更多)的排序也不需要太长时间? 。

点赞
用户2858170
用户2858170

你的期望是错误的。你说算法应该按字母顺序对文本进行排序,这正是它所做的。

对于 Lua 来说,"11" 比 "2" 更小。 我认为您会同意,“aa”应该排在“b”之前,这几乎是相同的。

如果您想更改文本的排序方式,您必须提供自己的函数。

Lua 参考手册中说:

table.sort (list [, comp])

对给定的列表元素按给定的顺序就地排序,从 list[1] 到 list[#list]。 如果给出了 comp,则必须是一个函数,该函数接收两个列表元素,并在最终顺序中第一个元素必须排在第二个元素之前时返回 true (因此,在排序之后,i < j 意味着不 comp(list[j],list[i]))。如果未给出 comp,则默认使用标准 Lua 运算符 <。

请注意,comp 函数必须对列表中的元素定义严格的部分顺序;也就是说,它必须是不对称和传递的。否则,可能无法进行有效的排序。

排序算法不稳定:在给定顺序被认为相等的元素可能会因排序而改变其相对位置。

因此,您可以自由地实现自己的 comp 函数来更改排序方式。

默认情况下,'table.sort(list)`按升序排序列表。 要使它按降序排序,您可以调用:

table.sort(list, function(a,b) return a > b end)

如果您想不同地处理数字,可以这样做:

t = {"111", "11", "3", "2", "a", "b"}

local function myCompare(a,b)
    local a_number = tonumber(a)
    local b_number = tonumber(b)
    if a_number and b_number then
       return a_number < b_number
    end
end

table.sort(t, myCompare)

for i,v in ipairs(t) do
    print(v)
end

这将为您提供以下输出:

2
3
11
111
a
b

当然,这只是一个快速简单的示例。更好的实现取决于您。

2017-04-01 09:01:31
用户7711283
用户7711283

以下是我最终自己想出来的。这确实是一个快速而简单的解决方案,它会使已经很慢的文本行缓冲排序(与 jEdit [Plugins]->[Text Tools]->[Sort Lines] 或 bash 命令行“sort -g” 相比)变得更慢,但它至少可以用于并且按预期工作。为了完整起见,这是我在 SciTE 的 Lua 启动脚本中当前存在的整个代码部分:

-- =============================================================================
-- 排序所选行(在菜单->工具中可用):
-- -----------------------------------------------------------
-- 在 .SciTEUser.properties 中指定:
--     command.name.2.*=# Sort Selected Lines    '
--     command.subsystem.2.*=3
--     command.mode.2.*=savebefore:no
--     command.2.*=SortSelectedLines
--     # command.shortcut.2.*=Ctrl+2 # Ctrl+2 是 command.2.* 的默认值。

function lines(str)
  local t = {}
  local i, lstr = 1, #str
  while i <= lstr do
    local x, y = string.find(str, "\r?\n", i)
    if x then t[#t + 1] = string.sub(str, i, x - 1)
    else break
    end
    i = y + 1
  end
  if i <= lstr then t[#t + 1] = string.sub(str, i) end
  return t
end

-- 对我来说很烦人的是,使用 table.sort(buffer) 在 Lua 中无法将数字以它们的数值顺序排序,这是因为前面有空格。
-- 使用以下比较函数可以避免这个问题:
function compare(a,b)
  return a:gsub(" ", "0") < b:gsub(" ", "0")
-- 如果没有使用‘compare’(table.sort(buf))
-- Lua 会使用隐式方式进行排序(见 Lua 教程):
--   return a < b
-- 所以将提供的返回语句更改为上面的语句就足以将排序恢复到之前的方式。
end

function SortSelectedLines()
  local sel = editor:GetSelText()
  if #sel == 0 then return end
  local eol = string.match(sel, "\n$")
  local buf = lines(sel)
  table.sort(buf, compare)
--table.foreach (buf, print) --用于调试
  local out = table.concat(buf, "\n")
  if eol then out = out.."\n" end
  editor:ReplaceSel(out)
end

--  ---------
-- :Sort Selected Lines
-- -----------------------------------------------------------------------------
2017-04-01 09:08:34