How to write rscript to to extract URL from HTML table(如何编写RSCRIPT从Html表格中提取URL)
本文介绍了如何编写RSCRIPT从Html表格中提取URL的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!
问题描述
我正在尝试使用https://divvy-tripdata.s3.amazonaws.com/index.htmlrvest库从页面的<;a href=&https://....zip";;>;元素中提取所有类似于rvest的URL:
link <- "https://divvy-tripdata.s3.amazonaws.com/index.html"
library(rvest)
library(xml2)
html <- read_html(link)
html %>% html_attrs("href")
输出:
Html%&>%html_attrs(";href";) Html_attrs(.,";href";)中出错:未使用的参数(";href";)
您能帮我用R从上面的链接中提取所有URL吗?
HTML: https://i.stack.imgur.com/5BiFU.jpg
xml
这些链接来自返回推荐答案的浏览器发出的另一个GET请求。您仍然可以使用rvest并获取关键节点,然后完成URL。
library(rvest)
base_url <- "https://divvy-tripdata.s3.amazonaws.com"
files <- read_html(base_url) |> html_elements('key') |> html_text() |> url_absolute(base_url)
对于较旧的R版本,将|>
替换为%>%
,并将library(magrittr)
添加为导入。
这篇关于如何编写RSCRIPT从Html表格中提取URL的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持编程学习网!
沃梦达教程
本文标题为:如何编写RSCRIPT从Html表格中提取URL


基础教程推荐
猜你喜欢
- 自定义 XMLHttpRequest.prototype.open 2022-01-01
- 我可以在浏览器中与Babel一起使用ES模块,而不捆绑我的代码吗? 2022-01-01
- 直接将值设置为滑块 2022-01-01
- html表格如何通过更改悬停边框来突出显示列? 2022-01-01
- Electron 将 Node.js 和 Chromium 上下文结合起来意味着 2022-01-01
- 如何使用JIT在顺风css中使用布局变体? 2022-01-01
- Vue 3 – <过渡>渲染不能动画的非元素根节点 2022-01-01
- 用于 Twitter 小部件宽度的 HTML/CSS 2022-01-01
- Chart.js 在线性图表上拖动点 2022-01-01
- 如何使用TypeScrip将固定承诺数组中的项设置为可选 2022-01-01