分类: 爬虫

6 篇文章

thumbnail
一些简单操作
一、正则 import re s='''<li><a href="http://news.sina.com.cn/o/2018-11-06/a75.shtml" target="_b…
图片数据的爬取
数据解析基本步骤: 1.爬取页面源码数据 2.数据解析:解析出页面源码中图片的存储位置(此处初步使用了xpath方法爬取,具体方法见xpath文章),本次爬取的内容为'https://pic.netb…
thumbnail
requests模块
概念 : python中原生的一款基于网络请求的模块,功能强大简单便捷,效率高 作用:模拟浏览器发请求 使用:(requests模块的编码流程) 指定url 发起请求 获取响应数据 持久化存储 req…
thumbnail
百度翻译+豆掰榜单+kfc餐厅查询的爬取
百度翻译 对百度翻译的单词进行爬取,并获取该单词的翻译解释的json格式 爬取的网站地址对应为代码中的url部分:复制后访问即可 json格式的结果,可将获得的结果复制后,在网上找寻json格式化的工…