首页 >> 大全

猿人学系列保姆级教程

2023-11-11 大全 27 作者:考证青年

**

猿人学系列保姆级教程

**

保姆教程是什么意思_保姆级教程是什么意思_

3 进一步研究我们发现其实我们页面看到的每一个数据对应的是一个的图片,这样我们就可以把数字跟图片的映射关系找出来(后面代码会展示)

4 但很明显这里的数据是连在一起的,跟我们在页面二看到的2007 2001不一样.其实我们有点前端知识应该就会明白这样改试通过css样式处理的.这样我们就要研究下代码逻辑了.通过研究请求逻辑我们发现下面代码.

保姆教程是什么意思__保姆级教程是什么意思

5 这段代码很明显,意思就是当请求成功后将返回结果的info加到class="4320-bc11-78e5-6253 "的标签下,然后对属性为j_key的元素添加 = none的属性.其中j_key试通过将返回值的key跟data进行MD5加密然后去点=号获得的.最后还要注意一点,每个img还有一个style属性,这个是对位置进行了偏移.

分析到这里应该整个逻辑很明白了,结果代码如下

import base64
import hashlib
from lxml import etree
import requestsclass AB():def __init__(self):self.num_dict = {"": "0","": "1","": "2","": "3","": "4","": "5","": "6","": "7","": "8","": "9"}def get_response(self, url):payload = {}headers = {"Connection": "keep-alive","Accept": "application/json, text/javascript, */*; q=0.01","User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/87.0.4280.88 Safari/537.36","X-Requested-With": "XMLHttpRequest","Referer": "http://match.yuanrenxue.com/match/4","Accept-Language": "zh-CN,zh;q=0.9,en;q=0.8"}response = requests.get(url, headers=headers, data=payload)res_json = response.json()return res_jsondef get_result(self, res_json):info = res_json.get("info")key = res_json.get('key')value = res_json.get('value')j_key = self.getNoneClassNumber(key, value)  # 获取j_key用来做display为none判断html_tree = etree.HTML(info)td_list = html_tree.xpath('//td')  # 每一个td块就是一个数据for td in td_list:num_dict_list = []img_list = td.xpath('./img')for img in img_list:num = self.num_dict[img.xpath('./@src')[0]]cla = img.xpath('./@class')[0]if j_key in cla:  # 当display为none时该数据不展示passelse:temp = {}style = float(img.xpath('./@style')[0].replace('left:', '').replace('px', ''))temp[num] = stylenum_dict_list.append(temp)   # 记录数据直及偏移量num_list = ['', '', '', ''] # 可以确定每个数据都是4位for index, val in enumerate(num_dict_list):tem = list(val.values())[0]key = int(index + tem / 11.5)num_list[key] = list(val.keys())[0]print(''.join(num_list))def getNoneClassNumber(self, key,value):s=key+value#base64编码byte_btoa=base64.b64encode(s.encode('utf-8'))#转为字符串形式str_btoa=str(byte_btoa,'utf-8')#替换“=”字符sub_equal=str_btoa.replace("=", '')#MD5编码,得到最终的j_keyhex_md5=hashlib.md5(sub_equal.encode())img_number=hex_md5.hexdigest()return img_numberif __name__ == '__main__':ab = AB()for i in range(1,4):url = "http://match.yuanrenxue.com/api/match/4?page={}".format(i)res = ab.get_response(url)ab.get_result(res)

关于我们

最火推荐

小编推荐

联系我们


版权声明:本站内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 88@qq.com 举报,一经查实,本站将立刻删除。备案号:桂ICP备2021009421号
Powered By Z-BlogPHP.
复制成功
微信号:
我知道了