Find final redirected url in Python(在Python中查找最终重定向的URL)
本文介绍了在Python中查找最终重定向的URL的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!
问题描述
import requests
def extractlink():
with open('extractlink.txt', 'r') as g:
print("opened extractlink.txt for reading")
contents = g.read()
headers = {'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/67.0.3396.99 Safari/537.36'}
r = requests.get(contents, headers=headers)
print(("Links to " + r.url))
time.sleep (2)
目前,r.url只是链接到‘Extetlink.txt’中的URL
我希望修复此脚本,以找到最终重定向的URL并打印结果。问题似乎出在对URL的请求中,尽管尝试了许多替代方案和故障排除步骤,但我的问题似乎没有像其他人一样得到解决。
调试时,r.history
读取为[]
,r.status_code
读取为403
,即使链接在浏览器中重定向为302。
有什么想法吗?
(提取链接.txt只是一个一行文件,带有指向http://butterup.teechip.icu/
的链接,请谨慎输入垃圾网站)
Http
推荐答案状态代码403表示您无权查看该终结点。 这意味着要么您需要登录,要么您可能会丢失一些标题。 您可以从昆虫元素的网络选项卡中查看浏览器使用的标头。请尝试使用与浏览器相同的标题。
这篇关于在Python中查找最终重定向的URL的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持编程学习网!
沃梦达教程
本文标题为:在Python中查找最终重定向的URL


基础教程推荐
猜你喜欢
- 使用Python匹配Stata加权xtil命令的确定方法? 2022-01-01
- 哪些 Python 包提供独立的事件系统? 2022-01-01
- 将 YAML 文件转换为 python dict 2022-01-01
- 症状类型错误:无法确定关系的真值 2022-01-01
- 如何在Python中绘制多元函数? 2022-01-01
- 使 Python 脚本在 Windows 上运行而不指定“.py";延期 2022-01-01
- 合并具有多索引的两个数据帧 2022-01-01
- Python 的 List 是如何实现的? 2022-01-01
- 使用 Google App Engine (Python) 将文件上传到 Google Cloud Storage 2022-01-01
- 如何在 Python 中检测文件是否为二进制(非文本)文 2022-01-01