自动控制 发表于 2023-5-8 12:15:41

你的浏览器怎样抓取网页内容?

本帖最后由 自动控制 于 2023-5-8 13:50 编辑

      在浏览网页的过程中,需要保存网页数据,把它复制下来保存到文件就好啦;但是,如果数据量大或者需要经常保存数据,简单重复的操作让人发狂。这时候就需要一个可以自动抓取数据的浏览器。
      1、先观察我们抓取数据的网页,以抓取城市名称和天气信息为例。首先打开【自动控制】菜单中的【项目管理器】窗口。

      2、新建【打开网页】步骤,添加抓取页面的网址,其它选项使用默认值。

      3、再新建【抓取内容】步骤,添加抓取网页元素,点击【自动获取】按钮,浏览器自动进入元素获取模式。

      4、将鼠标指针移动需要抓取的元素位置,确定所需内容全部在红色方框内,点击鼠标右键,选择【获取元素并返回】,返回项目管理器窗口。

      5、选择通过【class】属性作为元素标识,抓取元素后获得【text】文本内容。元素别外命名为”天气“。

      6、新建【保存内容】步骤,选择保存为”Excel文档“格式,设定文件路径。点击【设置内容】按钮,勾选日期和天气两个字段。

      7、最后点击项目管理器工具栏上的保存,保存所有项目设置,下次使用时可直接打开执行项目。点击【开始】按钮执行项目,可以看到项目执行日志,最后打开保存的Excel文档,日期和抓取网页天气信息都保存到表格里了。

      按照这个方法,可以抓取任何显示在网页上的信息,并自动保存到文件。如果有多个网址,就增加自动循环抓取信息。








页: [1]
查看完整版本: 你的浏览器怎样抓取网页内容?