Scrapy splash 在搜索使用 JS 加载的商品时无法正常工作
2020-1-11 21:5:37
收藏:0
阅读:154
评论:1
我正在使用 scrapy 和 scrapy splash 从某些 URL 中获取数据,例如这个[产品地址] (https://www.tottus.cl/tottus/product/CASA-JOVEN/Hielera-Botellas-Metal,_/20420748)或这个[产品地址 2] (https://www.tottus.cl/tottus/product/KRYZPO/Papas-Fritas-Original/20261602).
我有一个带有等待时间并返回 HTML 的 Lua 脚本:
script = """
function main(splash)
assert(splash:go(splash.args.url))
assert(splash:wait(4))
return splash:html()
end
"""
然后我执行它。
yield SplashRequest(url, self.parse_item, args={'lua_source': script},endpoint='execute')
从这里开始,我需要三个元素,它们是三个不同的产品价格。这三个都是用 JS 加载的。
[](https://i.stack.imgur.com/Sw6n5.png)
我已经获得了获取三个元素的xpath。但问题是有时它工作,有时它不工作
price_strikethrough = response.xpath('//div[@class="price-selector"]/div[@class="prices"]/span[contains(@class,"active-price strikethrough")]/span[1]/text()').extract_first()
price_offer1 = response.xpath('//div[@class="price-selector"]/div[@class="prices"]/div[contains(@class,"precioDescuento")][1]/text()').extract_first()
price_offer2 = response.xpath('//div[@class="price-selector"]/div[@class="prices"]/div[contains(@class,"precioDescuento")][2]/text()').extract_first()
我不知道还能做什么来使它正常工作。我尝试更改等待值,但是结果一样。有时它运行良好,有时我无法获得数据。 我该怎么做才能确保始终获得所需的数据?
点赞
评论区的留言会收到邮件通知哦~
推荐文章
- Lua 虚拟机加密load(string.dump(function)) 后执行失败问题如何解决
- 我想创建一个 Nginx 规则,禁止访问
- 如何将两个不同的lua文件合成一个 东西有点长 大佬请耐心看完 我是小白研究几天了都没搞定
- 如何在roblox studio中1:1导入真实世界的地形?
- 求解,lua_resume的第二次调用继续执行协程问题。
- 【上海普陀区】内向猫网络招募【Skynet游戏框架Lua后端程序员】
- SF爱好求教:如何用lua实现游戏内调用数据库函数实现账号密码注册?
- Lua实现网站后台开发
- LUA错误显式返回,社区常见的规约是怎么样的
- lua5.3下载库失败
- 请问如何实现文本框内容和某个网页搜索框内容连接,并把网页输出来的结果反馈到另外一个文本框上
- lua lanes多线程使用
- 一个kv数据库
- openresty 有没有比较轻量的 docker 镜像
- 想问一下,有大佬用过luacurl吗
- 在Lua执行过程中使用Load函数出现问题
- 为什么 neovim 里没有显示一些特殊字符?
- Lua比较两个表的值(不考虑键的顺序)
- 有个lua简单的项目,外包,有意者加微信 liuheng600456详谈,最好在成都
- 如何在 Visual Studio 2022 中运行 Lua 代码?

将下面翻译成中文并且保留原本的 markdown 格式
There is nothing wrong with your approach but the issue seems to be on the website. It is taking a variable time for calculating prices by the site, you need to update the time in your `lua_script` it should be around 7 to 8 seconds.你的方法没有问题,但问题似乎出现在网站上。网站计算价格所需的时间是不确定的,你需要在
lua_script中更新时间,应该大约为 7 到 8 秒。