如何使用Lua处理Splash中的表单填写

我正在尝试使用Splash和Lua脚本登录网页(http://quotes.toscrape.com/login),但是我无法登录网站。

script = """

        function find_search_input(inputs)
            if #inputs == 1 then
                return inputs[1]
            else
                return inputs
            end
        end

        function find_input(forms)
            local potential = {}
            for _, form in ipairs(forms) do
                local inputs = form.node:querySelectorAll('input:not([type="hidden"])')
                if #inputs ~= 0 then
                    local input = find_search_input(inputs)
                    if input then
                        return form, input
                    end
                    potential[#potential + 1] = {input=inputs, form=form}
                end
            end
            return potential[1].form, potential[1].input
            end

        function main(splash)
            local url = splash.args.url
            assert(splash:go(url))
            assert(splash:wait(10))

            splash:set_viewport_full()

            local forms = splash:select_all('form')
            local form, input = find_input(forms)
            input['username'] = 'foobar'
            input['password'] = 'foobar'

            assert(splash:wait(0))
            assert(form:submit())

            return {
                html = splash:html()

            }

          end
        """
headers = {
            'User-Agent': 'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.162 Safari/537.36'
        }
        yield SplashRequest('http://quotes.toscrape.com/login', self.parse, endpoint='execute', args={
            'lua_source': script,
            'wait': 5
        }, splash_headers=headers, headers=headers)

表单如下

<form action="/login" method="post" accept-charset="utf-8">
        <input type="hidden" name="csrf_token" value="BJNFrtYLDnpzITvSyQWOXhqCwKbscUEkGReiVjlZfogxAdumaPHM">
        <div class="row">
            <div class="form-group col-xs-3">
                <label for="username">用户名</label>
                <input type="text" class="form-control" id="username" name="username">
            </div>
        </div>
        <div class="row">
            <div class="form-group col-xs-3">
                <label for="username">密码</label>
                <input type="password" class="form-control" id="password" name="password">
            </div>
        </div>
        <input type="submit" value="登录" class="btn btn-primary">

    </form>

我的要求是基于它们的输入类型获取表单中的输入。假设在登录表单中,如果我们获取到电子邮件或文本的输入类型,那么我们将把我们的用户名设置为它的值。同样,如果一个字段类型是密码,那么我们将我们的密码作为值设置到它上面。如果它包含一些隐藏字段,如csrf_tokem,那么我们将从表单中提取它的值并将其与它一起传递。

input['type = email || type = text'] = 'our_user_name'
input['type = password'] = 'our_passwords'
input['type = hidden']= 'value_extracted from the form'

我希望这些可能是一些简单的事情。但是我无法在Lua中实现,因为我没有先前的经验。无论如何,提前谢谢你帮助我解决这个问题。

点赞
用户14540940
用户14540940

我是一个新手lua,感谢你的问题。我刚刚在阅读这个问题时得到了启发。如果您太忙以至于无法解决它,下面的fellow script应该会有所帮助。

function main(splash)
    splash:set_viewport_size(1366, 768)
    splash:set_user_agent('Splash bot')
    assert(splash:go("http://quotes.toscrape.com/login"))
    assert(splash:wait(0.5))

    local form = splash: select('form')
    local values = {
        username = 'foobar',
        password = 'foobar',
    }
    assert(form:fill(values))
    assert(form:submit())
    splash:wait(5)
    return {
        png = splash:png(),
    }
end
2020-10-29 08:16:27