转自[ 不止于python ]
目标网站
https://match.yuanrenxue.com/match/1
目标要求
抓取所有(5页)机票的价格,并计算所有机票价格的平均值,填入答案。
网站分析这种js逆向的问题, 首先要打开开发者工具(控制台), 刷新网页, 很明显这个地址, ......
来自[ 不止于python ]
简介12345678910111213reCAPTCHA项目是由卡内基梅隆大学所发展的系统,主要目的是利用CAPTCHA技术来帮助典籍数字化的进行,这个项目将由书本扫描下来无法准确的被光学文字识别技术识别的文字显示在CAPTCHA问题中,让人类在回答CAPTCH......
点击上方蓝字关注我
目标网站
https://match.yuanrenxue.com/match/1
目标要求
抓取所有(5页)机票的价格,并计算所有机票价格的平均值,填入答案。
网站分析
这种js逆向的问题, 首先要打开开发者工具(控制台), 刷新网页, 很明显这个......
博客地址
https://www.mehaei.com
部署环境
已经可以正常访问的博客地址(当然包括域名和云服务器)
部署上宝塔服务(以下教程需要)
申请免费SSL证书
登录 SSL证书管理控制台–> 我的证书 –> 申请免费证书
https://cloud.tence......
效果https://www.mehaei.com
前言
最新想搭建个博客网站, 但是http的网站不安全且一般不会被百度等搜索引擎推荐, 所以要使用https
必要的东西
购买一个域名
购买一个云主机
部署上宝塔服务(这篇文章需要)
域名型(DV)免费 SSL 证书申请流程
https:......
获取sessionStorage
有些爬虫需要携带sessionStorage中的一个参数, 这个参数是存在浏览器中的, 使用requests获取不到, 只能使用selenium来获取
1xNum = browser.execute_script('return sessionS......
直接开始
小伙伴留言说, 某车之家的字体反爬脚本用不了了, 抽了空就先打开网站看一下, 结果发现看不见字符的源码了, 在控制台, 请求源码, 甚至python请求的html都变成了符号html中
控制面板源码中
python请求源码中
全部都变成了 一个方块一个问号(打不出来)
但是试......
字体反扒系列爬虫之路: 字体文件反爬一
爬虫之路: 字体文件反爬二(动态字体文件)
本文转自 [ 不止于python ]
开始吧!小伙伴留言说, 脚本用不了了, 抽了空就先打开网站看一下, 结果发现看不见字符的源码了, 在控制台, 源码, 甚至python请求的html都变成了符号
页面htm......
相关环境版本
123python 3.7.10fastapi 0.63.0Cython 0.29.22
报错文件
1234# main.pyfrom __future__ import annotations......# code
报错信息
1.
123456main.py:1:23:......
01
开始之前, 先看一行代码
1In [44]: "review.rb".strip(".rb")
猜猜结果是什么
按照目前我的理解结果应该是这样
1"review"
但正确结果是
12In [44]: "review......