携程酒店请求并没什么难度,甚至没有加密参数,适合新手入门学习。下面简单介绍一下如何对酒店的数据进行抓取。

1.抓包

F12打开开发者工具,然后再酒店页面刷新。会看到一个getHotelRoomListInland的包,酒店所有相关信息都在里面了,甚至可以看到一些网页上不显示的房型和价格。

2. 转python代码

这里有个快速把xhr包转python代码的技巧,选择复制bash的代码,然后随便找一个能curl转python的网站,就可以快速完成代码编写,其他语言同理。

3. python请求解析

请求包里面的一些随机参数都是可以不提交或者写死的,response['data']['physicRoomMap']里面是一些房间信息,response['data']['saleRoomMap']里面是一些价格、优惠券等信息。

4. 账号风控

抓取虽简单,但是携程也不是吃素的。他对每个账号查询酒店的方式有严格的风控,下一期将聊聊携程对我们的账号做了什么风控检测。

声明

本内容仅供学习交流使用,若涉及版权或侵权问题,请及时联系删除。所有资料与信息均来源于公开网络,旨在促进知识分享与讨论。

Logo

DAMO开发者矩阵,由阿里巴巴达摩院和中国互联网协会联合发起,致力于探讨最前沿的技术趋势与应用成果,搭建高质量的交流与分享平台,推动技术创新与产业应用链接,围绕“人工智能与新型计算”构建开放共享的开发者生态。

更多推荐