Scrapy爬取豆瓣图书Top250数据,在PowerBI中可视化分析
文章目录 分析
项目说明
近期在学习爬虫,看了很多大佬的项目,厉害又有趣!五一在家把《我们的时代》看完了,在豆瓣上评分后,随便逛了逛,简单浏览了一下的书单。突然想到可以把这些数据爬到本地,后期通过脚本,隔一段时间就自动爬一下,看下有无新书上榜,对爱看书又数据控的人来说还蛮实用的哈哈。
网上搜了一下,爬豆瓣网的案例还挺多的,这里我试着用框架来爬豆瓣图书的相关数据,再导入分析数据,后续做到自动爬数据,一键更新分析结果。
豆瓣图书分析
该网址的数据会不定期更新,感兴趣的同学可以收藏~~~
框架 网页分析
浏览网站,确定要爬取的数据
爬虫代码
打开 ,创建项目
进入项目路径,打开文件夹
items
main
爬取结果
分析 分析结果
说几点有趣的发现,时间截至2020.5(大家也可以随便点点,说不定就能邂逅一本好书呢~)