日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

58同城字体加密-多套字体文件

發(fā)布時間:2023/12/8 编程问答 44 豆豆
生活随笔 收集整理的這篇文章主要介紹了 58同城字体加密-多套字体文件 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

其實(shí)字體加密不難,我剛開始接觸字體加密的時候應(yīng)該和大部分人一樣感到腦殼疼,這無聊的開發(fā),為啥要寫這么難,在我寫過幾個網(wǎng)站的字體反爬后就感覺并沒有那么難 ,感覺字體反爬都是一個套路,我們以58同城二手車來介紹,(還有汽車之家的論壇,起點(diǎn)中文網(wǎng)(比較簡單),大眾點(diǎn)評,自如)
1, 首先我們看他源碼

汽車的價格被加密了,我們首先想的就是字體加密,
2.查找加密文件

可以看到字體文件被base64加密成一長串字符串了,我們用正則吧字符串取下來 用base64解碼成woff文件,然后再轉(zhuǎn)化為xml文件供我們觀察

3.通過xml文件,我們可以看到字體都是坐標(biāo),都是畫出來的,我們放到專門的軟件吧文件畫出來


可以看到就是0-9的數(shù)字,多請求幾次進(jìn)行對比,我們發(fā)現(xiàn)他有相同的 也有不同點(diǎn)
相同:都是0-9,同一個數(shù)字的自型是一樣的,也就是坐標(biāo)
不同:同一個數(shù)字代表他的name不同
4 破解
我們通過一個字體文件 得出映射關(guān)系 這個關(guān)系是 ,數(shù)字和字形的關(guān)系
然后每次請求獲取的字體文件 解析出 name屬性,和字形 通過字形和你設(shè)定好的關(guān)系進(jìn)行對比 找到數(shù)字
再通過name 在源網(wǎng)頁中進(jìn)行替換

這是我根據(jù)一個字體文件得到的,hex是字形的md5加密后的值

到這差不多就結(jié)束了 ,其實(shí)大部分都是這種的 簡單的咱就不說了,還有那種沒有任何規(guī)律的就直接用ocr識別吧 (我發(fā)布的文章里面也有,如果有好辦法要教教我哦)
全部代碼如下(代碼很丑,沒整理,湊活吧)

import requests import base64 import re from fontTools.ttLib import TTFont from lxml import etree from hashlib import md5 url = 'https://bj.58.com/baoma/?listfrom=dspadvert&PGTID=0d3036e0-0000-1e16-19b4-92f3e56b847f&ClickID=100#mainCon' headers = { 'user-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/88.0.4324.96 Safari/537.36' } ret = requests.get(url=url,headers=headers) ret.encoding='utf8'with open('58.html','w',encoding='utf8') as f:f.write(ret.text)with open('58.html','r',encoding='utf8') as f:ret = f.read() ba64 = re.findall('base64,(.*?)\'\) forma',ret)[0] b= base64.b64decode(ba64) with open('1.woff','wb') as f:f.write(b)# # font_dict = { # # '-': 0, # '时': 1, # '%': 2, # '/': 3, # '万':4, # '+':5, # '¥':6, # '元':7, # '起':8, # '折':9 # } base_font={'font':[{'name':'-','value':'3','hex':'f9d6f8bfb0257137ad304bcae1009022'},{'name':'时','value':'0','hex':'79a6e23d10c68d14e4ec507e6b02bbf2'},{'name':'%','value':'5','hex':'7125656f5dd35120031671deec325dbe'},{'name':'/','value':'7','hex':'927faa2e53d85d841839ec58daddb138'},{'name':'万','value':'8','hex':'73b0b18ef35ebe5df363bccf4ea5e356'},{'name':'+','value':'2','hex':'6d6f25ae791948b9b1b6538c4fd5a09b'},{'name':'¥','value':'1','hex':'f3980be01c0bf2e821672497b680f59d'},{'name':'元','value':'6','hex':'7c26f89c45f85da47fdb94e6edec97b7'},{'name':'起','value':'4','hex':'e32ccaa22e9bfc82e927c8c4c5c7487e'},{'name':'折','value':'9','hex':'415e4dc11caaf995d552a41238fed31d'}, ]} # font = TTFont('1.woff') # # font.saveXML('1.xml') # for i in font_dict: # print('uni'+i[3:-1].zfill(4).upper()) # font_cmap = font['glyf'].glyphs.get('uni'+i[3:-1].zfill(4).upper()).data # glpyh = md5(font_cmap).hexdigest() # print(i,glpyh) #.getBestCmap()fot = {'uni002D':'-','uni65F6':'时','uni0025':'%','uni002F':'/','uni4E07':'万','uni002B':'+','uni00A5':'¥','uni5143':'元','uni8D77':'起','uni6298':'折', } dic = {} font = TTFont('1.woff') font.saveXML('1.xml') font_cmap = font['cmap'].getBestCmap() uni_list = font_cmap.values() print(uni_list) font_n = TTFont('1.woff') for i in uni_list:f = font_n['glyf'].glyphs.get(i).dataglpyh = md5(f).hexdigest()for j in base_font.get('font'):if j.get('hex')==glpyh:dic[fot[i]]=j['value'] print(dic)with open('58.html','r',encoding='utf8') as f:ret = f.read() for i in dic:ret = ret.replace(i,dic[i]) page_html = etree.HTML(ret) lis = page_html.xpath('//*[@id="list"]/ul/li/div')for li in lis:name = ('-').join(li.xpath('../div[1]/a//text()')).replace('\n','').replace('\t','').replace(' ','')# money = li.xpath('../div[2]//text()')print(name)

總結(jié)

以上是生活随笔為你收集整理的58同城字体加密-多套字体文件的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。