python爬取bilibili信息（一）

2023-12-09 大全 43 作者：考证青年

爬取哔哩哔哩（）

本人不是计算机专业的专业人员，在书写上会有专业型误差请您谅解，有问题或者错误可以通过笔者qq邮箱：

进行沟通，在此感谢您的观看。

初心：

我是一个小白，并且成功的爬取了，我相信大家一定也没问题，所以我的文章涉及到的比较基础，所以比较繁多，我将利用好时间一点一点地为大家推送，希望可以坚持下去，有所学，有所成长。

提前准备：

是使用工作时，一个比较强大的软件。利用可以给你一种美观的外观，字体可以随意调整，第三方库也可以自由下载。我将在另一个文章中仔细说明的安装

接下来一步步开始你的爬取喽！

第一步主要是观察：

在你的浏览器中打开，哔哩哔哩（）官网。去随意搜索 ”美食 “，“吃货”，主要观察浏览器中网址的变化，以图片为例

主要观察两图片的链接，可发现两个链接的区别

https://search.bilibili.com/all?keyword=（查找内容）

当我们点击，浏览到第二页时，观察此时的链接：

https://search.bilibili.com/all?keyword=（查找内容）page= （页数）

后面有个page 页面，通过这些分析我们可以试着调整（搜索内容），page后面的值观察页面的变化。

到这里我们，就有初次看的页面有了一定的了解。

接下来，按右键查找网页的源代码

刚看到这个代码，我是初学者，刚看到这个时脑子有点懵，但是我们作为信息的提取这，我们要知道提取唯一的可检索的标签。这里我们提到正则表达式。

什么是正则表达式呢？正则表达式是一种用于检索，搜索的网页代码组合。可以代表某些值，检索某些值。对于来说，是第三方库需要下载并引用。

import re
text ='''
我要学python 不能放弃 

'''list = re.findall(r'"fanm">(.*?)',text,re.S)
#用re（正则表达式，得出来的是列表）
print(list)
#不能放弃

笔记：

Ctrl + f ：搜索

可以为你找到，合适的搜索代码，然后使用re，主要是观察是否为唯一，可以用re。

这回就为大家说到这里，学习地内容有很多，看看你是否掌握。

对了，在，也叫小白巨白，为大家视频讲解，欢迎大家前去观看！

tags: 表达式检索小白三方正则

python爬取bilibili信息（一）

有趣的逗号运算符C语言——For初学者

c++上机实验3个人所得税计算器

一份超全的Python学习资料汇总。。

三方Jar包、so文件和三方库导入步骤

【工具篇】Firmwalker车联网安全实用小工具介绍

【连续7届检索！EI（核心）

利用区块链等技术，加强对交通运输信用信息的归集共享和分析应用

印尼西爪哇梳邦县发生山体滑坡已经导致2人死亡

【SpringBoot笔记10】Spring中Bean的6种作用域

ARS548 ARS549RDI 80GHZ毫米波雷达达学习笔记（一)

叠氮PEG修饰二硒化钨 (N3-WSe2；azide

ATFX：黑海运粮遭俄暂停，小麦期货开盘跳涨

关于我们

最火推荐

小编推荐

联系我们

复制成功

python爬取bilibili信息（一）

有趣的逗号运算符C语言——For初学者

c++上机实验3个人所得税计算器

一份超全的Python学习资料汇总。。

三方Jar包、so文件和三方库导入步骤

【工具篇】Firmwalker车联网安全实用小工具介绍

【连续7届检索！EI（核心）

利用区块链等技术，加强对交通运输信用信息的归集共享和分析应用

印尼西爪哇梳邦县发生山体滑坡 已经导致2人死亡

【SpringBoot笔记10】Spring中Bean的6种作用域

ARS548 ARS549RDI 80GHZ毫米波雷达达学习笔记（一)

叠氮PEG修饰二硒化钨 (N3-WSe2；azide

ATFX：黑海运粮遭俄暂停，小麦期货开盘跳涨

关于我们

最火推荐

小编推荐

联系我们

复制成功

印尼西爪哇梳邦县发生山体滑坡已经导致2人死亡