日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程语言 > python >内容正文

python

Python 大规模异步新闻爬虫、google翻译、百度翻译、有道翻译、百度指数

發布時間:2024/7/23 python 46 豆豆
生活随笔 收集整理的這篇文章主要介紹了 Python 大规模异步新闻爬虫、google翻译、百度翻译、有道翻译、百度指数 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

參考:https://www.yuanrenxue.com/crawler/news-crawler-urlpool.html

url_pool.py

# -*- coding: utf-8 -*- # @Author : 佛祖保佑, 永無 bug # @Date : # @File : url_pool.py # @Software: PyCharm # @description : XXXimport time import redis import pickle import urllib.parse as urlparseclass UrlDB(object):"""使用 redis 來存儲 URL"""status_failure = b'0'status_success = b'1'def __init__(self, db_name):# self.name = db_name + '.urldb'# self.db = leveldb.LevelDB(self.name)self.name = db_name if db_name else 'redis_hashmap'self.db = redis.StrictRedis()def set_success(self, url=None):if isinstance(url, str):url = url.encode('utf8')try:self.db.hset(self.name, url, self.status_success)status = Trueexcept BaseException as be:status = Falsereturn statusdef set_failure(self, url):if isinstance(url, str):url = url.encode('utf8')try:self.db.hset(self.name, url, self.status_failure)status = Trueexcept BaseException as be:status = Falsereturn statusdef has(self, url):if isinstance(url, str):url = url.encode('utf8')try:attr = self.db.hget(self.name, url)return attrexcept BaseException as be:passreturn Falseclass UrlPool(object):""" 使用 UrlPool 來抓取和管理URLs"""def __init__(self, pool_name):self.name = pool_nameself.db = UrlDB(pool_name)self.waiting = dict() # {host: set([urls]), } 按host分組,記錄等待下載的URLself.pending = dict() # {url: pended_time, } 記錄已被取出(self.pop())但還未被更新狀態(正在下載)的URLself.failure = dict() # {url: times,} 記錄失敗的URL的次數self.failure_threshold = 3self.pending_threshold = 10 # pending的最大時間,過期要重新下載self.waiting_count = 0 # self.waiting 字典里面的url的個數self.max_hosts = ['', 0] # [host: url_count] 目前pool中url最多的host及其url數量self.hub_pool = dict() # {url: last_query_time, } 存放hub urlself.hub_refresh_span = 0self.load_cache()passdef __del__(self):self.dump_cache()def load_cache(self,):path = self.name + '.pkl'try:with open(path, 'rb') as f:self.waiting = pickle.load(f)cc = [len(v) for k, v in self.waiting.items()]print('saved pool loaded! urls:', sum(cc))except BaseException as be:passdef dump_cache(self):path = self.name + '.pkl'try:with open(path, 'wb') as f:pickle.dump(self.waiting, f)print('self.waiting saved!')except BaseException as be:passdef set_hubs(self, urls, hub_refresh_span):self.hub_refresh_span = hub_refresh_spanself.hub_pool = dict()for url in urls:self.hub_pool[url] = 0def set_status(self, url, status_code):if url in self.pending:self.pending.pop(url)if status_code == 200:self.db.set_success(url)returnif status_code == 404:self.db.set_failure(url)returnif url in self.failure:self.failure[url] += 1if self.failure[url] > self.failure_threshold:self.db.set_failure(url)self.failure.pop(url)else:self.add(url)else:self.failure[url] = 1self.add(url)def push_to_pool(self, url=None):host = urlparse.urlparse(url).netlocif not host or '.' not in host:print('try to push_to_pool with bad url:', url, ', len of ur:', len(url))return Falseif host in self.waiting:if url in self.waiting[host]:return Trueself.waiting[host].add(url)if len(self.waiting[host]) > self.max_hosts[1]:self.max_hosts[1] = len(self.waiting[host])self.max_hosts[0] = hostelse:self.waiting[host] = set([url])self.waiting_count += 1return Truedef add(self, url=None, always=False):if always:return self.push_to_pool(url)pended_time = self.pending.get(url, 0)if time.time() - pended_time < self.pending_threshold:print('being downloading:', url)returnif self.db.has(url):returnif pended_time:self.pending.pop(url)return self.push_to_pool(url)def add_many(self, url_list=None, always=False):if isinstance(url_list, str):print('urls is a str !!!!', url_list)self.add(url_list, always)else:for url in url_list:self.add(url, always)def pop(self, count=None, hub_percent=50):print('\n\tmax of host:', self.max_hosts)# 取出的url有兩種類型:hub=1, 普通=0url_attr_url = 0url_attr_hub = 1# 1. 首先取出hub,保證獲取hub里面的最新url.hubs = dict()hub_count = count * hub_percent // 100for hub in self.hub_pool:span = time.time() - self.hub_pool[hub]if span < self.hub_refresh_span:continuehubs[hub] = url_attr_hub # 1 means hub-urlself.hub_pool[hub] = time.time()if len(hubs) >= hub_count:break# 2. 再取出普通urlleft_count = count - len(hubs)urls = dict()for host in self.waiting:if not self.waiting[host]:continueurl = self.waiting[host].pop()urls[url] = url_attr_urlself.pending[url] = time.time()if self.max_hosts[0] == host:self.max_hosts[1] -= 1if len(urls) >= left_count:breakself.waiting_count -= len(urls)print('To pop:%s, hubs: %s, urls: %s, hosts:%s' % (count, len(hubs), len(urls), len(self.waiting)))urls.update(hubs)return urlsdef size(self,):return self.waiting_countdef empty(self,):return self.waiting_count == 0def test():pool = UrlPool('crawl_url_pool')urls = ['http://1.a.cn/xyz','http://2.a.cn/xyz','http://3.a.cn/xyz','http://1.b.cn/xyz-1','http://1.b.cn/xyz-2','http://1.b.cn/xyz-3','http://1.b.cn/xyz-4',]pool.add_many(urls)# del pool# pool = UrlPool('crawl_url_pool')urls = pool.pop(5)urls = list(urls.keys())print('pop:', urls)print('pending:', pool.pending)pool.set_status(urls[0], 200)print('pending:', pool.pending)pool.set_status(urls[1], 404)print('pending:', pool.pending)if __name__ == '__main__':test()

ezpymysql.py

:大規模異步新聞爬蟲: 讓MySQL 數據庫操作更方便 - 猿人學

# file: ezpymysql.py # Author: veelion"""A lightweight wrapper around PyMySQL. only for python3"""import time import logging import traceback import pymysql import pymysql.cursorsversion = "0.7" version_info = (0, 7, 0, 0)class Connection(object):"""A lightweight wrapper around PyMySQL."""def __init__(self, host, database, user=None, password=None,port=0, max_idle_time=7 * 3600, connect_timeout=10,time_zone="+0:00", charset="utf8mb4", sql_mode="TRADITIONAL"):self.host = hostself.database = databaseself.max_idle_time = float(max_idle_time)args = dict(use_unicode=True, charset=charset, database=database,init_command=('SET time_zone = "%s"' % time_zone),cursorclass=pymysql.cursors.DictCursor,connect_timeout=connect_timeout, sql_mode=sql_mode)if user is not None:args["user"] = userif password is not None:args["passwd"] = password# We accept a path to a MySQL socket file or a host(:port) stringif "/" in host:args["unix_socket"] = hostelse:self.socket = Nonepair = host.split(":")if len(pair) == 2:args["host"] = pair[0]args["port"] = int(pair[1])else:args["host"] = hostargs["port"] = 3306if port:args['port'] = portself._db = Noneself._db_args = argsself._last_use_time = time.time()try:self.reconnect()except BaseException as be:logging.error("Cannot connect to MySQL on %s", self.host, exc_info=True)def _ensure_connected(self):# Mysql by default closes client connections that are idle for# 8 hours, but the client library does not report this fact until# you try to perform a query and it fails. Protect against this# case by preemptively closing and reopening the connection# if it has been idle for too long (7 hours by default).if self._db is None or (time.time() - self._last_use_time > self.max_idle_time):self.reconnect()self._last_use_time = time.time()def _cursor(self):self._ensure_connected()return self._db.cursor()def __del__(self):self.close()def close(self):"""Closes this database connection."""if getattr(self, "_db", None) is not None:self._db.close()self._db = Nonedef reconnect(self):"""Closes the existing database connection and re-opens it."""self.close()self._db = pymysql.connect(**self._db_args)self._db.autocommit(True)def query(self, query, *parameters, **kwparameters):"""Returns a row list for the given query and parameters."""cursor = self._cursor()try:cursor.execute(query, kwparameters or parameters)result = cursor.fetchall()return resultfinally:cursor.close()def get(self, query, *parameters, **kwparameters):"""Returns the (singular) row returned by the given query."""cursor = self._cursor()try:cursor.execute(query, kwparameters or parameters)return cursor.fetchone()finally:cursor.close()def execute(self, query, *parameters, **kwparameters):"""Executes the given query, returning the lastrowid from the query."""cursor = self._cursor()try:cursor.execute(query, kwparameters or parameters)return cursor.lastrowidexcept Exception as e:if e.args[0] == 1062:passelse:traceback.print_exc()raise efinally:cursor.close()insert = execute# =============== high level method for table ===================def table_has(self, table_name, field, value):if isinstance(value, str):value = value.encode('utf8')sql_str = f'SELECT {field} FROM {table_name} WHERE {field}="{value}"'d = self.get(sql_str)return ddef table_insert(self, table_name, item):"""item is a dict : key is mysql table field"""fields = list(item.keys())values = list(item.values())field_str = ','.join(fields)val_str = ','.join(['%s'] * len(item))for i in range(len(values)):if isinstance(values[i], str):values[i] = values[i].encode('utf8')sql_str = f'INSERT INTO {table_name} ({field_str}) VALUES({val_str})'try:last_id = self.execute(sql_str, *values)return last_idexcept Exception as e:if e.args[0] == 1062:# just skip duplicated itempasselse:traceback.print_exc()print('sql:', sql)print('item:')for i in range(len(fields)):vs = str(values[i])if len(vs) > 300:print(fields[i], ' : ', len(vs), type(values[i]))else:print(fields[i], ' : ', vs, type(values[i]))raise edef table_update(self, table_name, updates, field_where, value_where):"""updates is a dict of {field_update:value_update}"""upsets = []values = []for k, v in updates.items():s = '%s=%%s' % kupsets.append(s)values.append(v)upsets = ','.join(upsets)sql_str = f'UPDATE {table_name} SET {upsets} WHERE {field_where}="{value_where}"'self.execute(sql_str, *values)if __name__ == '__main__':db = Connection('localhost','db_name','user','password')# 獲取一條記錄sql = 'select * from test_table where id=%s'data = db.get(sql, 2)# 獲取多天記錄sql = 'select * from test_table where id>%s'data = db.query(sql, 2)# 插入一條數據sql = 'insert into test_table(title, url) values(%s, %s)'last_id = db.execute(sql, 'test', 'http://a.com/')# 或者last_id = db.insert(sql, 'test', 'http://a.com/')# 使用更高級的方法插入一條數據item = {'title': 'test','url': 'http://a.com/',}last_id = db.table_insert('test_table', item)

functions.py

# -*- coding: utf-8 -*- # @Author : 佛祖保佑, 永無 bug # @Date : # @File : functions.py # @Software: PyCharm # @description : XXXimport re import requests import cchardet import traceback import urllib.parse as urlparseasync def fetch(session=None, url=None, headers=None, timeout=9, binary=False):_headers = {'User-Agent': ('Mozilla/5.0 (compatible; MSIE 9.0; ''Windows NT 6.1; Win64; x64; Trident/5.0)'),}_headers = headers if headers else _headerstry:async with session.get(url, headers=_headers, timeout=timeout) as response:status_code = response.statushtml_bin_or_text = ''html_content = await response.read()if not binary:encoding = cchardet.detect(html_content)['encoding']html_bin_or_text = html_content.decode(encoding, errors='ignore')request_url = str(response.url)except Exception as e:msg = 'Failed download: {} | exception: {}, {}'.format(url, str(type(e)), str(e))print(msg)html_bin_or_text = ''status_code = -1request_url = urlreturn status_code, html_bin_or_text, request_urldef downloader(url=None, timeout=10, headers=None, debug=False, binary=False):_headers = {'User-Agent': ('Mozilla/5.0 (compatible; MSIE 9.0; ''Windows NT 6.1; Win64; x64; Trident/5.0)'),}_headers = headers if headers else _headersrequest_url = urltry:r = requests.get(url, headers=_headers, timeout=timeout)if binary:html_bin_or_text = r.contentelse:encoding = cchardet.detect(r.content)['encoding']html_bin_or_text = r.content.decode(encoding, errors='ignore')status_code = r.status_coderequest_url = r.urlexcept BaseException as be:if debug:traceback.print_exc()msg = 'failed download: {}'.format(url)print(msg)html_bin_or_text = b'' if binary else ''status_code = -1return status_code, html_bin_or_text, request_urlg_bin_postfix = {'exe', 'doc', 'docx', 'xls', 'xlsx', 'ppt', 'pptx', 'pdf','jpg', 'png', 'bmp', 'jpeg', 'gif', 'zip', 'rar', 'tar','bz2', '7z', 'gz', 'flv', 'mp4', 'avi', 'wmv', 'mkv', 'apk' } g_news_postfix = ['.html?', '.htm?', '.shtml?', '.shtm?']def clean_url(url=None):# 1. 是否為合法的http urlif not url.startswith('http'):return ''# 2. 去掉靜態化url后面的參數for np in g_news_postfix:p = url.find(np)if p > -1:p = url.find('?')url = url[:p]return url# 3. 不下載二進制類內容的鏈接up = urlparse.urlparse(url)path = up.pathif not path:path = '/'postfix = path.split('.')[-1].lower()if postfix in g_bin_postfix:return ''# 4. 去掉標識流量來源的參數# badquery = ['spm', 'utm_source', 'utm_source', 'utm_medium', 'utm_campaign']good_queries = []for query in up.query.split('&'):qv = query.split('=')if qv[0].startswith('spm') or qv[0].startswith('utm_'):continueif len(qv) == 1:continuegood_queries.append(query)query = '&'.join(good_queries)url = urlparse.urlunparse((up.scheme,up.netloc,path,up.params,query,'' # crawler do not care fragment))return urlg_pattern_tag_a = re.compile(r'<a[^>]*?href=[\'"]?([^> \'"]+)[^>]*?>(.*?)</a>', re.I | re.S | re.M)def extract_links_re(url=None, html=None):"""use re module to extract links from html"""news_links = set()tag_a_list = g_pattern_tag_a.findall(html)for tag_a in tag_a_list:link = tag_a[0].strip()if not link:continuelink = urlparse.urljoin(url, link)link = clean_url(link)if not link:continuenews_links.add(link)return news_linksdef init_file_logger(f_name=None):# config loggingimport loggingfrom logging.handlers import TimedRotatingFileHandlerch = TimedRotatingFileHandler(f_name, when="midnight")ch.setLevel(logging.INFO)# create formatterfmt = '%(asctime)s - %(name)s - %(levelname)s - %(message)s'formatter = logging.Formatter(fmt)# add formatter to chch.setFormatter(formatter)logger = logging.getLogger(f_name)# add ch to loggerlogger.addHandler(ch)return loggerif __name__ == '__main__':temp_url = 'http://news.baidu.com/'t_status_code, t_html, t_url = downloader(url=temp_url)print(f'[{t_status_code}, {t_url}]:{len(t_html)}')

config.py

db_host = 'localhost' db_db = 'crawler' db_user = 'your-user' db_password = 'your-password'

新聞爬蟲 (?同步 )

news_sync.py

# -*- coding: utf-8 -*- # @Author : 佛祖保佑, 永無 bug # @Date : # @File : news_sync.py # @Software: PyCharm # @description : XXXimport urllib.parse as urlparse import lzma import farmhash import tracebackfrom ezpymysql import Connection from url_pool import UrlPool import functions as fn import configclass NewsCrawlerSync:def __init__(self, name):self.db = Connection(config.db_host,config.db_db,config.db_user,config.db_password)self.logger = fn.init_file_logger(name + '.log')self.url_pool = UrlPool(name)self.hub_hosts = Noneself.load_hubs()def load_hubs(self,):sql = 'select url from crawler_hub'data = self.db.query(sql)self.hub_hosts = set()hubs = []for d in data:host = urlparse.urlparse(d['url']).netlocself.hub_hosts.add(host)hubs.append(d['url'])self.url_pool.set_hubs(hubs, 300)def save_to_db(self, url, html):url_hash = farmhash.hash64(url)sql = f'select url from crawler_html where urlhash={url_hash}'d = self.db.get(sql, url_hash)if d:if d['url'] != url:msg = 'farm_hash collision: %s <=> %s' % (url, d['url'])self.logger.error(msg)return Trueif isinstance(html, str):html = html.encode('utf8')html_lzma = lzma.compress(html)sql = 'insert into crawler_html(urlhash, url, html_lzma) values(%s, %s, %s)'good = Falsetry:self.db.execute(sql, url_hash, url, html_lzma)good = Trueexcept Exception as e:if e.args[0] == 1062:# Duplicate entrygood = Truepasselse:traceback.print_exc()raise ereturn gooddef filter_good(self, urls):good_links = []for url in urls:host = urlparse.urlparse(url).netlocif host in self.hub_hosts:good_links.append(url)return good_linksdef process(self, url, is_hub):status, html, redirected_url = fn.downloader(url)self.url_pool.set_status(url, status)if redirected_url != url:self.url_pool.set_status(redirected_url, status)# 提取hub網頁中的鏈接, 新聞網頁中也有“相關新聞”的鏈接,按需提取if status != 200:returnif is_hub:new_links = fn.extract_links_re(redirected_url, html)good_links = self.filter_good(new_links)print(f"{len(good_links)} / {len(new_links)}, good_links/new_links")self.url_pool.add_many(good_links)else:self.save_to_db(redirected_url, html)def run(self,):while 1:urls = self.url_pool.pop(5)for url, is_hub in urls.items():self.process(url, is_hub)if __name__ == '__main__':crawler = NewsCrawlerSync('sync_spider')crawler.run()

新聞爬蟲 (?異步 )

news_async.py

# -*- coding: utf-8 -*- # @Author : 佛祖保佑, 永無 bug # @Date : # @File : news_async.py # @Software: PyCharm # @description : XXXimport traceback import time import asyncio import aiohttp import urllib.parse as urlparse import farmhash import lzma# import uvloop # asyncio.set_event_loop_policy(uvloop.EventLoopPolicy())import sanicdbfrom url_pool import UrlPool import functions as fn import configclass NewsCrawlerAsync:def __init__(self, name):self.hub_hosts = set()self._workers = 0self._workers_max = 30self.logger = fn.init_file_logger(name + '.log')self.url_pool = UrlPool(name)self.loop = asyncio.get_event_loop()self.session = aiohttp.ClientSession(loop=self.loop)self.db = sanicdb.SanicDB(config.db_host,config.db_db,config.db_user,config.db_password,loop=self.loop)async def load_hubs(self, ):sql = 'select url from crawler_hub'data = await self.db.query(sql)hubs = []for d in data:host = urlparse.urlparse(d['url']).netlocself.hub_hosts.add(host)hubs.append(d['url'])self.url_pool.set_hubs(hubs, 300)async def save_to_db(self, url, html):url_hash = farmhash.hash64(url)sql = 'select url from crawler_html where urlhash=%s'd = await self.db.get(sql, url_hash)if d:if d['url'] != url:msg = 'farmhash collision: %s <=> %s' % (url, d['url'])self.logger.error(msg)return Trueif isinstance(html, str):html = html.encode('utf8')html_lzma = lzma.compress(html)sql = 'insert into crawler_html(urlhash, url, html_lzma) values(%s, %s, %s)'good = Falsetry:await self.db.execute(sql, url_hash, url, html_lzma)good = Trueexcept Exception as e:if e.args[0] == 1062:# Duplicate entrygood = Truepasselse:traceback.print_exc()raise ereturn gooddef filter_good(self, urls):good_links = []for url in urls:host = urlparse.urlparse(url).netlocif host in self.hub_hosts:good_links.append(url)return good_linksasync def process(self, url, is_hub):status, html, redirected_url = await fn.fetch(self.session, url)self.url_pool.set_status(url, status)if redirected_url != url:self.url_pool.set_status(redirected_url, status)# 提取hub網頁中的鏈接, 新聞網頁中也有“相關新聞”的鏈接,按需提取if status != 200:self._workers -= 1returnif is_hub:new_links = fn.extract_links_re(redirected_url, html)good_links = self.filter_good(new_links)print(f"{len(good_links)} / {len(new_links)}, good_links / new_links")self.url_pool.add_many(good_links)else:await self.save_to_db(redirected_url, html)self._workers -= 1async def loop_crawl(self):await self.load_hubs()last_rating_time = time.time()counter = 0while 1:to_pop = self._workers_max - self._workerstasks = self.url_pool.pop(to_pop)if not tasks:print('no url to crawl, sleep')await asyncio.sleep(3)continuefor url, is_hub in tasks.items():self._workers += 1counter += 1print('crawl:', url)asyncio.ensure_future(self.process(url, is_hub))gap = time.time() - last_rating_timeif gap > 5:rate = counter / gapprint(f'\tloop_crawl() rate:{round(rate, 2)}, counter: {counter}, workers: {self._workers}')last_rating_time = time.time()counter = 0if self._workers > self._workers_max:print('====== got workers_max, sleep 3 sec to next worker =====')await asyncio.sleep(3)def run(self):try:self.loop.run_until_complete(self.loop_crawl())except KeyboardInterrupt:print('stopped by yourself!')del self.url_poolpassif __name__ == '__main__':nc = NewsCrawlerAsync('async_spider')nc.run()

分布式爬蟲 ( CS 模型?)

server.py

# -*- coding: utf-8 -*- # @Author : 佛祖保佑, 永無 bug # @Date : # @File : server.py # @Software: PyCharm # @description : XXXfrom sanic import Sanic from sanic import responsefrom my_url_pool import UrlPoolurl_pool = UrlPool(__file__)# 初始化 url_pool,根據你的需要進行修改 hub_urls = [] url_pool.set_hubs(hub_urls, 300) url_pool.add('https://news.sina.com.cn/')# init main_app = Sanic(__name__)@main_app.listener('after_server_stop') async def cache_url_pool(app=None, loop=None):global url_poolprint('caching url_pool after_server_stop')del url_poolprint('bye!')@main_app.route('/task') async def task_get(request=None):count = request.args.get('count', 10)try:count = int(count)except BaseException as be:count = 10urls = url_pool.pop(count)return response.json(urls)@main_app.route('/task', methods=['POST', ]) async def task_post(request=None):result = request.jsonurl_pool.set_status(result['url'], result['status'])if result['url_real'] != result['url']:url_pool.set_status(result['url_real'], result['status'])if result['new_urls']:print('receive URLs:', len(result['new_urls']))for url in result['new_urls']:url_pool.add(url)return response.text('ok')if __name__ == '__main__':main_app.run(host='0.0.0.0', port=8080, debug=False, access_log=False, workers=1)pass

client.py

# -*- coding: utf-8 -*- # @Author : 佛祖保佑, 永無 bug # @Date : # @File : client.py # @Software: PyCharm # @description : XXXimport re import cchardet import traceback import time import json import asyncio import urllib.parse as urlparse import aiohttp# import uvloop # asyncio.set_event_loop_policy(uvloop.EventLoopPolicy())p_tag_a = re.compile(r'<a[^>]*?href=[\'"]?([^> \'"]+)[^>]*?>(.*?)</a>', re.I | re.S | re.M)def extract_links_re(url, html):new_links = set()aa = p_tag_a.findall(html)for a in aa:link = a[0].strip()if not link:continuelink = urlparse.urljoin(url, link)if not link.startswith('http'):continuenew_links.add(link)return new_linksclass CrawlerClient:def __init__(self, ):self._workers = 0self.workers_max = 20self.server_host = 'localhost'self.server_port = 8080self.headers = {'User-Agent': ('Mozilla/5.0 (compatible; MSIE 9.0; ''Windows NT 6.1; Win64; x64; Trident/5.0)')}self.loop = asyncio.get_event_loop()self.queue = asyncio.Queue(loop=self.loop)self.session = aiohttp.ClientSession(loop=self.loop)async def download(self, url, timeout=25):status_code = 900html = ''url_now = urltry:async with self.session.get(url_now, headers=self.headers, timeout=timeout) as response:status_code = response.statushtml = await response.read()encoding = cchardet.detect(html)['encoding']html = html.decode(encoding, errors='ignore')url_now = str(response.url)except BaseException as be:# traceback.print_exc()print('=== exception: ', be, type(be), str(be))msg = 'Failed download: {} | exception: {}, {}'.format(url, str(type(be)), str(be))print(msg)return status_code, html, url_nowasync def get_urls(self, ):count = self.workers_max - self.queue.qsize()if count <= 0:print('no need to get urls this time')return Noneurl = f'http://{self.server_host}:{self.server_port}/task?count={count}'try:async with self.session.get(url, timeout=3) as response:if response.status not in [200, 201]:returnjsn = await response.text()urls = json.loads(jsn)msg = f'get_urls() to get [{count}] but got[{len(urls)}], @{time.strftime("%Y-%m-%d %H:%M:%S")}'print(msg)for kv in urls.items():await self.queue.put(kv)print('queue size:', self.queue.qsize(), ', _workers:', self._workers)except BaseException as be:traceback.print_exc()returnasync def send_result(self, result):url = f'http://{self.server_host}:{self.server_port}/task'try:async with self.session.post(url, json=result, timeout=3) as response:return response.statusexcept BaseException as be:traceback.print_exc()pass@staticmethoddef save_html(url, html):print('saved:', url, len(html))@staticmethoddef filter_good(urls):"""根據抓取目的過濾提取的URLs,只要你想要的"""good = []for url in urls:if url.startswith('http'):good.append(url)return goodasync def process(self, url, is_hub):status, html, url_now = await self.download(url)self._workers -= 1print('downloaded:', url, ', html:', len(html))if html:new_urls = extract_links_re(url, html)new_urls = self.filter_good(new_urls)self.save_html(url, html)else:new_urls = []result = {'url': url,'url_real': url_now,'status': status,'new_urls': new_urls,}await self.send_result(result)async def loop_get_urls(self, ):print('loop_get_urls() start')while 1:await self.get_urls()await asyncio.sleep(1)async def loop_crawl(self, ):print('loop_crawl() start')asyncio.ensure_future(self.loop_get_urls())counter = 0while 1:item = await self.queue.get()url, url_level = itemself._workers += 1counter += 1asyncio.ensure_future(self.process(url, url_level))if self._workers > self.workers_max:print('====== got workers_max, sleep 3 sec to next worker =====')await asyncio.sleep(3)def start(self):try:self.loop.run_until_complete(self.loop_crawl())except KeyboardInterrupt:print('stopped by yourself!')passdef run():ant = CrawlerClient()ant.start()if __name__ == '__main__':run()

google 翻譯

google 翻譯:Google 翻譯

# -*- coding: utf-8 -*- # @Author : 佛祖保佑, 永無 bug # @Date : # @File : translate_google.py # @Software: PyCharm # @description : XXXimport requests import urllib3 urllib3.disable_warnings()def google_translate(kw=None):url = 'https://translate.google.cn/_/TranslateWebserverUi/data/batchexecute?rpcids=MkEWBc&hl=zh-CN'custom_headers = {'Content-Type': 'application/x-www-form-urlencoded;charset=UTF-8'}# kw = 'this is a test'payload = f"f.req=[[[\"MkEWBc\",\"[[\\\"{kw}\\\",\\\"auto\\\",\\\"zh-CN\\\",true],[null]]\",null,\"generic\"]]]&"resp = requests.post(url, data=payload, headers=custom_headers)print(resp.status_code)print(resp.text)passif __name__ == '__main__':kw_list = ['I love u', 'hello, baby', 'king','this is a test']for item in kw_list:google_translate(kw=item)pass

百度 翻譯

百度翻譯:https://fanyi.baidu.com/

查看 basetrans 請求。

( 多請求幾次,可以發現 sign 每次都不一樣,所以需要 逆向 sign??)

使用 postman 來精簡請求參數,看那些參數是必須的,那些參數是可以直接刪除的。精簡后參數

  • 請求URL:https://fanyi.baidu.com/basetrans
  • 請求頭:Content-Type: application/x-www-form-urlencoded
    Cookie: BAIDUID=AF87393A8DB7C8FED7859A909FF081A3:SL=0:NR=50:FG=1;?
    User-Agent: Mozilla/5.0 (Linux; Android 8.0; Pixel 2 Build/OPD3.170816.012) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/89.0.4389.82 Mobile Safari/537.36
  • 請求 body:query=king&from=en&to=zh&token=94c55bca8b920035077b58d58ba32bea&sign=612765.899756

postman 生成的 Python 代碼:

import requestsurl = "https://fanyi.baidu.com/basetrans"payload = "query=king&from=en&to=zh&token=94c55bca8b920035077b58d58ba32bea&sign=612765.899756" headers = {'Content-Type': 'application/x-www-form-urlencoded','Cookie': 'BAIDUID=AF87393A8DB7C8FED7859A909FF081A3:SL=0:NR=50:FG=1;','User-Agent': 'Mozilla/5.0 (Linux; Android 8.0; Pixel 2 Build/OPD3.170816.012) ''AppleWebKit/537.36 (KHTML, like Gecko) Chrome/89.0.4389.82 Mobile Safari/537.36' }response = requests.request("POST", url, headers=headers, data=payload)print(response.text)

JS 斷點調試

打斷點,然后通過調用堆棧追蹤 sign 是怎么生成的。。。

因為 多個 ajax 請求都會走 b.send(e.data ? e.data:null)?這個函數,所以需要點擊好幾次 "跳轉到下一個斷點" 才能看到 sign 值。

如果想直接斷點就能看到 sign 值,則可以添加 "URL包含" 斷點。

這里使用 "跳轉到下一個斷點" 來追蹤?sign 值。

生成 sign 的函數

點擊 P(e) 函數,查看函數實現

方法 1:直接使用 Python 實現這個函數的邏輯

方法 2:把 js 代碼扣出來,直接 Python 執行

代碼太多,這里直接 扣 js 代碼

function n(r, o) {for (var t = 0; t < o.length - 2; t += 3) {var e = o.charAt(t + 2);e = e >= "a" ? e.charCodeAt(0) - 87 : Number(e),e = "+" === o.charAt(t + 1) ? r >>> e : r << e,r = "+" === o.charAt(t) ? r + e & 4294967295 : r ^ e}return r }function sign(r) {var t = r.match(/[\uD800-\uDBFF][\uDC00-\uDFFF]/g);if (null === t) {var a = r.length;a > 30 && (r = "" + r.substr(0, 10) + r.substr(Math.floor(a / 2) - 5, 10) + r.substr(-10, 10))} else {for (var C = r.split(/[\uD800-\uDBFF][\uDC00-\uDFFF]/), h = 0, f = C.length, u = []; f > h; h++)"" !== C[h] && u.push.apply(u, e(C[h].split(""))),h !== f - 1 && u.push(t[h]);var g = u.length;g > 30 && (r = u.slice(0, 10).join("") + u.slice(Math.floor(g / 2) - 5, Math.floor(g / 2) + 5).join("") + u.slice(-10).join(""))}var l = void 0, d = "" + String.fromCharCode(103) + String.fromCharCode(116) + String.fromCharCode(107);// l = null !== i ? i : (i = o.common[d] || "") || "";l = "320305.131321201";for (var m = l.split("."), S = Number(m[0]) || 0, s = Number(m[1]) || 0, c = [], v = 0, F = 0; F < r.length; F++) {var p = r.charCodeAt(F);128 > p ? c[v++] = p : (2048 > p ? c[v++] = p >> 6 | 192 : (55296 === (64512 & p) && F + 1 < r.length && 56320 === (64512 & r.charCodeAt(F + 1)) ? (p = 65536 + ((1023 & p) << 10) + (1023 & r.charCodeAt(++F)),c[v++] = p >> 18 | 240,c[v++] = p >> 12 & 63 | 128) : c[v++] = p >> 12 | 224,c[v++] = p >> 6 & 63 | 128),c[v++] = 63 & p | 128)}for (var w = S, A = "" + String.fromCharCode(43) + String.fromCharCode(45) + String.fromCharCode(97) + ("" + String.fromCharCode(94) + String.fromCharCode(43) + String.fromCharCode(54)), b = "" + String.fromCharCode(43) + String.fromCharCode(45) + String.fromCharCode(51) + ("" + String.fromCharCode(94) + String.fromCharCode(43) + String.fromCharCode(98)) + ("" + String.fromCharCode(43) + String.fromCharCode(45) + String.fromCharCode(102)), D = 0; D < c.length; D++)w += c[D], w = n(w, A);return w = n(w, b),w ^= s,0 > w && (w = (2147483647 & w) + 2147483648),w %= 1e6,w.toString() + "." + (w ^ S) }console.log(sign('king'))

執行結果:

也可以直接在 Chrome 上的 console 中執行 js

Python 直接調用 JS 代碼( js_code = r"""js代碼"""? 中 r 不能少?)

// l = null !== i ? i : (i = o.common[d] || "") || "";? ? //? l 的值 等于 gkt,通過調試可知,這是個固定值
l = "320305.131321201";? ? // 直接 令 l =?"320305.131321201";

# @Author : 佛祖保佑, 永無 bug # @Date : # @File : translate_baidu.py # @Software: PyCharm # @description : XXXimport execjs import requestsjs_code = r""" function n(r, o) {for (var t = 0; t < o.length - 2; t += 3) {var e = o.charAt(t + 2);e = e >= "a" ? e.charCodeAt(0) - 87 : Number(e),e = "+" === o.charAt(t + 1) ? r >>> e : r << e,r = "+" === o.charAt(t) ? r + e & 4294967295 : r ^ e}return r } function sign(r) {var t = r.match(/[\uD800-\uDBFF][\uDC00-\uDFFF]/g);if (null === t) {var a = r.length;a > 30 && (r = "" + r.substr(0, 10) + r.substr(Math.floor(a / 2) - 5, 10) + r.substr(-10, 10))} else {for (var C = r.split(/[\uD800-\uDBFF][\uDC00-\uDFFF]/), h = 0, f = C.length, u = []; f > h; h++)"" !== C[h] && u.push.apply(u, e(C[h].split(""))),h !== f - 1 && u.push(t[h]);var g = u.length;g > 30 && (r = u.slice(0, 10).join("") + u.slice(Math.floor(g / 2) - 5, Math.floor(g / 2) + 5).join("") + u.slice(-10).join(""))}var l = void 0, d = "" + String.fromCharCode(103) + String.fromCharCode(116) + String.fromCharCode(107);// l = null !== i ? i : (i = o.common[d] || "") || "";l = "320305.131321201";for (var m = l.split("."), S = Number(m[0]) || 0, s = Number(m[1]) || 0, c = [], v = 0, F = 0; F < r.length; F++) {var p = r.charCodeAt(F);128 > p ? c[v++] = p : (2048 > p ? c[v++] = p >> 6 | 192 : (55296 === (64512 & p) && F + 1 < r.length && 56320 === (64512 & r.charCodeAt(F + 1)) ? (p = 65536 + ((1023 & p) << 10) + (1023 & r.charCodeAt(++F)),c[v++] = p >> 18 | 240,c[v++] = p >> 12 & 63 | 128) : c[v++] = p >> 12 | 224,c[v++] = p >> 6 & 63 | 128),c[v++] = 63 & p | 128)}for (var w = S, A = "" + String.fromCharCode(43) + String.fromCharCode(45) + String.fromCharCode(97) + ("" + String.fromCharCode(94) + String.fromCharCode(43) + String.fromCharCode(54)), b = "" + String.fromCharCode(43) + String.fromCharCode(45) + String.fromCharCode(51) + ("" + String.fromCharCode(94) + String.fromCharCode(43) + String.fromCharCode(98)) + ("" + String.fromCharCode(43) + String.fromCharCode(45) + String.fromCharCode(102)), D = 0; D < c.length; D++)w += c[D], w = n(w, A);return w = n(w, b),w ^= s,0 > w && (w = (2147483647 & w) + 2147483648),w %= 1e6,w.toString() + "." + (w ^ S) } console.log(sign('king')) """js_func = execjs.compile(js_code)def bd_translate(kw=None):url = "https://fanyi.baidu.com/basetrans"sign = js_func.call('sign', kw)payload = f"query={kw}&from=en&to=zh&token=94c55bca8b920035077b58d58ba32bea&sign={sign}"headers = {'Content-Type': 'application/x-www-form-urlencoded','Cookie': 'BAIDUID=AF87393A8DB7C8FED7859A909FF081A3:SL=0:NR=50:FG=1;','User-Agent': 'Mozilla/5.0 (Linux; Android 8.0; Pixel 2 Build/OPD3.170816.012) ''AppleWebKit/537.36 (KHTML, like Gecko) Chrome/89.0.4389.82 Mobile Safari/537.36'}response = requests.request("POST", url, headers=headers, data=payload)# print(response.text)print(response.json()['trans'][0]['dst'])if __name__ == '__main__':kw_list = ['hello baby', 'I love u','king']for item in kw_list:bd_translate(kw=item)pass

執行結果:

有道 翻譯

參考:https://www.cnblogs.com/xuchunlin/p/10412505.html

JS逆向 ——? 百度翻譯參數(sign)爬蟲 超級詳細:https://blog.csdn.net/qq_38534107/article/details/90440403

Python 執行 js 代碼

關于 Python 執行 js 代碼

  • 1. 通過 python 模塊?execjs 來解析 js 文件 (安裝:?pip install PyExecJS
  • 2.?python 調用 node.js(需要先安裝 node.js)
  • 3. 使用 PyV8 在 Python 爬蟲中執行 js 代碼:https://www.baidu.com/s?wd=python%20pyv8
  • 4. 使用 瀏覽器( selenium、PhantomJS) 執行 js:https://www.cnblogs.com/chenhuabin/p/10946085.html

PyV8、PyExecJS、js2py 區別:https://www.jianshu.com/p/2da6f6ad01f0

PyV8 github 地址:https://github.com/emmetio/pyv8-binaries

Python 使用 execjs 示例:

python 的 execjs 只支持一些常規的 js 代碼 :https://blog.csdn.net/weixin_42081389/article/details/99984352

import execjs js_str = ''' function add(x, y){return x + y; } ''' test = execjs.compile(js_str)# call 即調用js函數,add 為 js_str 中的函數名,1,2 為所需要的參數。 result = test.call('add', 1, 2) print(result)

有道詞典 js 加密參數 sign破解

分析:

然后轉到 Headers,查看 請求體,可以看到有請求驗證字段,如:salt,sign 等?:

Ctrl + Shift? + F : 全局搜索 sign 這個關鍵字,搜索所有 包含 sign 的 js 文件,發現只搜索出一個,雙擊這個 js 文件:

在 js 文件內容中 搜索 sign ,分析 sign 怎么產生的:

提取 js 的 加密函數( 這里是 md5 );

通過 js 調試,可以找到 md5 函數:

把 md5 函數提取出來,放到一個單獨的 js 文件里面,然后,再通過 js調試 把 md5 函數所依賴的 js 函數全部 提取出來。

目錄結構:

提取 的? 所有 js 函數如下( yd_js.js)

function n(e, t) {return e << t | e >>> 32 - t }function r(e, t) {var n, r, i, o, a;return i = 2147483648 & e,o = 2147483648 & t,n = 1073741824 & e,r = 1073741824 & t,a = (1073741823 & e) + (1073741823 & t),n & r ? 2147483648 ^ a ^ i ^ o : n | r ? 1073741824 & a ? 3221225472 ^ a ^ i ^ o : 1073741824 ^ a ^ i ^ o : a ^ i ^ o }function i(e, t, n) {return e & t | ~e & n }function o(e, t, n) {return e & n | t & ~n }function a(e, t, n) {return e ^ t ^ n }function s(e, t, n) {return t ^ (e | ~n) }function l(e, t, o, a, s, l, c) {return e = r(e, r(r(i(t, o, a), s), c)),r(n(e, l), t) }function c(e, t, i, a, s, l, c) {return e = r(e, r(r(o(t, i, a), s), c)),r(n(e, l), t) }function u(e, t, i, o, s, l, c) {return e = r(e, r(r(a(t, i, o), s), c)),r(n(e, l), t) }function f(e, t, i, o, a, l, c) {return e = r(e, r(r(s(t, i, o), a), c)),r(n(e, l), t) }function d(e) {for (var t, n = e.length, r = n + 8, i = 16 * ((r - r % 64) / 64 + 1), o = Array(i - 1), a = 0, s = 0; s < n;)a = s % 4 * 8,o[t = (s - s % 4) / 4] = o[t] | e.charCodeAt(s) << a,s++;return t = (s - s % 4) / 4,a = s % 4 * 8,o[t] = o[t] | 128 << a,o[i - 2] = n << 3,o[i - 1] = n >>> 29,o }function p(e) {var t, n = "", r = "";for (t = 0; t <= 3; t++)n += (r = "0" + (e >>> 8 * t & 255).toString(16)).substr(r.length - 2, 2);return n }function h(e) {e = e.replace(/\x0d\x0a/g, "\n");for (var t = "", n = 0; n < e.length; n++) {var r = e.charCodeAt(n);if (r < 128)t += String.fromCharCode(r);else if (r > 127 && r < 2048)t += String.fromCharCode(r >> 6 | 192),t += String.fromCharCode(63 & r | 128);else if (r >= 55296 && r <= 56319) {if (n + 1 < e.length) {var i = e.charCodeAt(n + 1);if (i >= 56320 && i <= 57343) {var o = 1024 * (r - 55296) + (i - 56320) + 65536;t += String.fromCharCode(240 | o >> 18 & 7),t += String.fromCharCode(128 | o >> 12 & 63),t += String.fromCharCode(128 | o >> 6 & 63),t += String.fromCharCode(128 | 63 & o),n++}}} elset += String.fromCharCode(r >> 12 | 224),t += String.fromCharCode(r >> 6 & 63 | 128),t += String.fromCharCode(63 & r | 128)}return t; }function md5(e) {var t, n, i, o, a, s, m, g, v, y = Array();for (e = h(e),y = d(e),s = 1732584193,m = 4023233417,g = 2562383102,v = 271733878,t = 0; t < y.length; t += 16)n = s,i = m,o = g,a = v,s = l(s, m, g, v, y[t + 0], 7, 3614090360),v = l(v, s, m, g, y[t + 1], 12, 3905402710),g = l(g, v, s, m, y[t + 2], 17, 606105819),m = l(m, g, v, s, y[t + 3], 22, 3250441966),s = l(s, m, g, v, y[t + 4], 7, 4118548399),v = l(v, s, m, g, y[t + 5], 12, 1200080426),g = l(g, v, s, m, y[t + 6], 17, 2821735955),m = l(m, g, v, s, y[t + 7], 22, 4249261313),s = l(s, m, g, v, y[t + 8], 7, 1770035416),v = l(v, s, m, g, y[t + 9], 12, 2336552879),g = l(g, v, s, m, y[t + 10], 17, 4294925233),m = l(m, g, v, s, y[t + 11], 22, 2304563134),s = l(s, m, g, v, y[t + 12], 7, 1804603682),v = l(v, s, m, g, y[t + 13], 12, 4254626195),g = l(g, v, s, m, y[t + 14], 17, 2792965006),m = l(m, g, v, s, y[t + 15], 22, 1236535329),s = c(s, m, g, v, y[t + 1], 5, 4129170786),v = c(v, s, m, g, y[t + 6], 9, 3225465664),g = c(g, v, s, m, y[t + 11], 14, 643717713),m = c(m, g, v, s, y[t + 0], 20, 3921069994),s = c(s, m, g, v, y[t + 5], 5, 3593408605),v = c(v, s, m, g, y[t + 10], 9, 38016083),g = c(g, v, s, m, y[t + 15], 14, 3634488961),m = c(m, g, v, s, y[t + 4], 20, 3889429448),s = c(s, m, g, v, y[t + 9], 5, 568446438),v = c(v, s, m, g, y[t + 14], 9, 3275163606),g = c(g, v, s, m, y[t + 3], 14, 4107603335),m = c(m, g, v, s, y[t + 8], 20, 1163531501),s = c(s, m, g, v, y[t + 13], 5, 2850285829),v = c(v, s, m, g, y[t + 2], 9, 4243563512),g = c(g, v, s, m, y[t + 7], 14, 1735328473),m = c(m, g, v, s, y[t + 12], 20, 2368359562),s = u(s, m, g, v, y[t + 5], 4, 4294588738),v = u(v, s, m, g, y[t + 8], 11, 2272392833),g = u(g, v, s, m, y[t + 11], 16, 1839030562),m = u(m, g, v, s, y[t + 14], 23, 4259657740),s = u(s, m, g, v, y[t + 1], 4, 2763975236),v = u(v, s, m, g, y[t + 4], 11, 1272893353),g = u(g, v, s, m, y[t + 7], 16, 4139469664),m = u(m, g, v, s, y[t + 10], 23, 3200236656),s = u(s, m, g, v, y[t + 13], 4, 681279174),v = u(v, s, m, g, y[t + 0], 11, 3936430074),g = u(g, v, s, m, y[t + 3], 16, 3572445317),m = u(m, g, v, s, y[t + 6], 23, 76029189),s = u(s, m, g, v, y[t + 9], 4, 3654602809),v = u(v, s, m, g, y[t + 12], 11, 3873151461),g = u(g, v, s, m, y[t + 15], 16, 530742520),m = u(m, g, v, s, y[t + 2], 23, 3299628645),s = f(s, m, g, v, y[t + 0], 6, 4096336452),v = f(v, s, m, g, y[t + 7], 10, 1126891415),g = f(g, v, s, m, y[t + 14], 15, 2878612391),m = f(m, g, v, s, y[t + 5], 21, 4237533241),s = f(s, m, g, v, y[t + 12], 6, 1700485571),v = f(v, s, m, g, y[t + 3], 10, 2399980690),g = f(g, v, s, m, y[t + 10], 15, 4293915773),m = f(m, g, v, s, y[t + 1], 21, 2240044497),s = f(s, m, g, v, y[t + 8], 6, 1873313359),v = f(v, s, m, g, y[t + 15], 10, 4264355552),g = f(g, v, s, m, y[t + 6], 15, 2734768916),m = f(m, g, v, s, y[t + 13], 21, 1309151649),s = f(s, m, g, v, y[t + 4], 6, 4149444226),v = f(v, s, m, g, y[t + 11], 10, 3174756917),g = f(g, v, s, m, y[t + 2], 15, 718787259),m = f(m, g, v, s, y[t + 9], 21, 3951481745),s = r(s, n),m = r(m, i),g = r(g, o),v = r(v, a);return (p(s) + p(m) + p(g) + p(v)).toLowerCase() }// t = (new Date).getTime() + parseInt(10 * Math.random(), 10); // console.log((new Date).getTime()); // console.log(t);

python 代碼 ( yd.py ):

import execjs import time import random import requests import json""" 通過在js文件中查找salt或者sign,可以找到 1.可以找到這個計算salt的公式 r = "" + ((new Date).getTime() + parseInt(10 * Math.random(), 10)) 2.sign:n.md5("fanyideskweb" + t + r + "p09@Bn{h02_BIEe]$P^nG"); md5 一共需要四個參數,第一個和第四個都是固定值得字符串,第三個是所謂的salt, 第二個參數是輸入的需要翻譯的單詞 """def get_md5(v):# 讀取js文件with open('yd_js.js', encoding='utf-8') as f:js = f.read()# 通過compile命令轉成一個js對象js_obj = execjs.compile(js)res = js_obj.call('md5', v)return resdef get_sign(key, salt):sign = "fanyideskweb" + str(key) + str(salt) + "n%A-rKaT5fb[Gy?;N5@Tj"sign = get_md5(sign)return signdef you_dao(key):url = "http://fanyi.youdao.com/translate_o?smartresult=dict&smartresult=rule"ts = str(int((time.time() * 1000)))salt = str(ts) + str(random.randint(0, 10))data = {"i": key,"from": "AUTO","to": "AUTO","smartresult": "dict","client": "fanyideskweb","salt": str(salt),"sign": get_sign(key, salt),"ts": ts,"bv": "5872543b025b19167cde3785ecf1e925","doctype": "json","version": "2.1","keyfrom": "fanyi.web","action": "FY_BY_REALTIME","typoResult": "false",}headers = {"Host": "fanyi.youdao.com",# "Proxy-Connection":"keep-alive","Content-Length": str(len(data)),"Accept": "application/json, text/javascript, */*; q=0.01","Origin": "http://fanyi.youdao.com","X-Requested-With": "XMLHttpRequest","User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) ""Chrome/75.0.3770.90 Safari/537.36","Content-Type": "application/x-www-form-urlencoded; charset=UTF-8","Referer": "http://fanyi.youdao.com/","Accept-Encoding": "gzip, deflate","Accept-Language": "zh-CN,zh;q=0.9","Cookie": "OUTFOX_SEARCH_USER_ID=-803834638@61.149.7.46; ""JSESSIONID=aaa2KqSwX9shJdA5Mk9Ww; OUTFOX_SEARCH_USER_ID_NCOO=1481235354.231604; ""___rl__test__cookies=1564486753731",}r = requests.post(url=url, data=data, headers=headers)if r.status_code == 200:data = json.loads(r.text)src = data.get('translateResult')[0][0]['src']tgt = data.get('translateResult')[0][0]['tgt']print(f'翻譯前 :{src}')print(f'翻譯后 :{tgt}')else:print(f'請求失敗 status code {r.status_code}')if __name__ == '__main__':you_dao("hello, baby")you_dao("I love you")you_dao("thank you very much")you_dao("天王蓋地虎,寶塔鎮河妖")

運行結果截圖:

百度指數 js 破解

分析過程參考:https://blog.csdn.net/wang785994599/article/details/97135979

Python爬蟲 - 簡單抓取百度指數:https://zhuanlan.zhihu.com/p/78634149

Python 代碼實現(?直接從瀏覽器拿到登錄后的Cookie復制粘貼到代碼中 ):

# -*- coding: utf-8 -*-import requests import execjs import urllib3# 禁用警告 urllib3.disable_warnings(urllib3.exceptions.InsecureRequestWarning)js_string = ''' function decrypt(t, e) {for (var n = t.split(""), i = e.split(""), a = {}, r = [], o = 0; o < n.length / 2; o++)a[n[o]] = n[n.length / 2 + o];for (var s = 0; s < e.length; s++)r.push(a[i[s]]);return r.join("") } '''headers = {"Cookie": "直接從瀏覽器拿到登錄后的Cookie復制粘貼","User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) ""Chrome/75.0.3770.142 Safari/537.36" }data_url = 'https://index.baidu.com/api/SearchApi/index?word={}&area=0&days=7' uniq_id_url = 'https://index.baidu.com/Interface/ptbk?uniqid={}' keys = ["all", "pc", "wise"]class BDIndex(object):def __init__(self):self.session = self.get_session()pass@staticmethoddef get_session():"""初始化 session 會話:return:"""session = requests.session()session.headers = headerssession.verify = Falsereturn session@staticmethoddef decrypt(key, data):"""得到解密后的數據:param key: key:param data: key 對應的 value:return:"""js_handler = execjs.compile(js_string)return js_handler.call('decrypt', key, data)def get_bd_index(self, key_word):"""得到百度指數:param key_word::return:"""response = self.session.get(data_url.format(key_word)).json()uniq_id = self.session.get(uniq_id_url.format(response.get("data").get("uniqid"))).json().get("data")result = []data_dict = response.get("data").get("userIndexes")[0]for key in keys:decrypt_data = self.decrypt(uniq_id, data_dict.get(key).get("data"))result.append({key: decrypt_data})return resultif __name__ == '__main__':bd = BDIndex()d = bd.get_bd_index("楊冪")print(d)

運行結果:

總結

以上是生活随笔為你收集整理的Python 大规模异步新闻爬虫、google翻译、百度翻译、有道翻译、百度指数的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。

美女黄色网在线播放 | 亚洲国产精品99久久久久久久久 | 国产探花视频在线播放 | 黄色a级片在线观看 | 干干日日 | 中文字幕乱码亚洲精品一区 | 精品国产美女 | 久久久成人精品 | 黄色aaaaa| 日韩高清一区 | 欧美日韩精品二区第二页 | 免费黄色av. | 成人黄色在线观看视频 | 日韩免费一区二区三区 | 久久精品国产亚洲aⅴ | 深夜免费福利视频 | 91视频在线网址 | 六月丁香激情综合色啪小说 | 丰满少妇一级片 | 久久男女视频 | 96精品视频 | 欧美日韩亚洲一 | 日韩av在线小说 | 久久一区二区三区国产精品 | 午夜精品福利一区二区 | 91av电影在线 | 日本大片免费观看在线 | 四虎影视4hu4虎成人 | 黄色在线网站噜噜噜 | 国产精品理论片 | 久久国产欧美日韩精品 | 久久久一本精品99久久精品 | 最新中文字幕在线观看视频 | 九九精品久久 | 日日干网 | 大型av综合网站 | 人人艹人人 | 中文国产字幕 | 色在线免费 | 在线观看av不卡 | 久久久久久久久久电影 | 色婷婷综合在线 | 中文字幕在线看 | 麻豆精品在线视频 | 欧美做受69| 成年一级片 | 色婷婷免费视频 | 免费a v在线 | 天天操综合网站 | 久热色超碰 | 日韩欧美网站 | 天天在线视频色 | 在线免费观看视频一区 | 午夜在线免费视频 | 99精品视频免费观看视频 | 99热只有精品在线观看 | 国产成人在线播放 | 久久成人国产 | 色综合久久88色综合天天免费 | 午夜婷婷网 | 久久精品一区二区国产 | 天天射天天干天天插 | 日韩激情视频在线 | 一区二区三区播放 | 啪啪免费试看 | 久久国产精品99久久久久久进口 | 91视频下载 | 午夜精品久久久99热福利 | 免费在线观看av | 麻豆91精品91久久久 | 人人讲下载| 91桃色免费视频 | 91豆麻精品91久久久久久 | 91精品一区二区三区久久久久久 | av 在线观看| 免费看色的网站 | 色综合久久久 | 2020天天干天天操 | 日日干av | 最新不卡av | 中文字幕在线观看免费高清电影 | 日本久久精品视频 | 国产综合小视频 | 成年人免费av网站 | 国产成人91| 91.麻豆视频 | 福利视频网址 | 一区二区不卡视频在线观看 | 欧美午夜一区二区福利视频 | 久久爽久久爽久久av东京爽 | av三区在线| 探花视频在线版播放免费观看 | 99热最新| 亚洲精品永久免费视频 | 日韩高清在线一区 | 欧洲色吧| 国产精品一区在线观看你懂的 | 国产精品6 | 色综合欧洲| 精品在线二区 | 亚洲黄色app | 四川妇女搡bbbb搡bbbb搡 | 精品国产免费观看 | 99久久精品无免国产免费 | 成人在线免费小视频 | 99 色 | 一区电影 | 在线看片中文字幕 | 欧美一级日韩三级 | 久久免费视频播放 | 99久久超碰中文字幕伊人 | 日韩av不卡在线播放 | 欧美一区二区三区免费观看 | 久久久婷 | 可以免费观看的av片 | 黄色动态图xx| 久久综合中文字幕 | 免费视频一二三区 | 国产亚洲人 | 婷婷色中文字幕 | 欧美激情精品久久久久久 | 亚洲欧洲精品一区二区 | 九九99靖品| 日日躁夜夜躁aaaaxxxx | 国产一二三区av | 国产人成在线视频 | av7777777| 色偷偷88888欧美精品久久久 | 天天色视频 | 久久影院午夜论 | 在线看v片成人 | 日韩午夜一级片 | 精品久久网站 | 91综合视频在线观看 | 日韩,精品电影 | 精品久久美女 | 亚洲涩综合 | 欧美精品乱码久久久久 | 九色琪琪久久综合网天天 | 国产精品网红直播 | 国产在线97 | 亚洲精品字幕在线观看 | 久久免费看 | 一区精品在线 | 黄色tv视频 | 午夜精品久久久久久久久久 | 青青草国产在线 | 在线观看免费一级片 | av黄在线播放 | 一区二区三区精品在线视频 | 国产在线观看午夜 | 欧美精品一区二区三区四区在线 | 国产精品久久久久久av | av一区二区三区在线播放 | 欧美日本高清视频 | av短片在线观看 | 国产视频中文字幕在线观看 | 日韩在线小视频 | 精品久久免费看 | 日韩网站在线观看 | 亚洲一区二区天堂 | 国产视频99| 超碰官网 | 精品成人国产 | 9幺看片| 人人插人人爱 | 亚洲欧洲一区二区在线观看 | 在线播放精品一区二区三区 | 97在线免费视频观看 | 久久公开视频 | 天堂资源在线观看视频 | 久草com | 草久久久 | 国产视频色 | 一本一本久久a久久 | 免费电影播放 | 99久久精品久久亚洲精品 | 狠狠干狠狠色 | av资源中文字幕 | 夜夜操天天摸 | 麻豆视频一区 | 国产永久免费高清在线观看视频 | 国产精品久久久久一区二区 | 天天射天天色天天干 | 正在播放国产精品 | 国产精品久久久久婷婷二区次 | www日韩在线| 婷婷亚洲激情 | 97在线看| 国产精品视频久久久 | 日韩免费b| 日韩av黄 | 在线观看自拍 | 婷婷日 | 999久久国精品免费观看网站 | 天天干国产 | 国产精品一区二区三区久久久 | 日韩av午夜| 91久久国产综合精品女同国语 | 在线免费av电影 | 天天操夜夜曰 | 中文字幕 国产精品 | 91亚洲免费 | 夜添久久精品亚洲国产精品 | 成人在线观看你懂的 | 国产黄免费看 | 亚洲精品乱码久久久久久蜜桃欧美 | 91亚洲在线观看 | 免费看污污视频的网站 | 亚洲欧美精品一区二区 | 久久久精品久久 | 成人a在线观看高清电影 | 亚洲精品中文在线资源 | 亚洲在线观看av | 麻豆91在线观看 | 亚洲不卡123| 成人h电影在线观看 | 久久视频免费 | 久久成人久久 | 日韩电影在线视频 | 成人免费在线播放 | 五月开心婷婷 | 天天操天天透 | 国产一区二区精品 | 日韩在线网址 | 国产亚洲综合精品 | 国产又粗又猛又色又黄网站 | 亚洲成人av片在线观看 | 亚洲乱码精品久久久 | 丁香六月天婷婷 | 国产精品久久久久久久久久了 | 亚洲国产中文字幕在线 | 久久成人高清视频 | 日本精品一区二区三区在线播放视频 | av一本久道久久波多野结衣 | 色a综合| 久一久久 | 国产麻豆精品免费视频 | 在线视频一区观看 | 欧美国产一区在线 | 久久久久黄| 伊人夜夜 | 日本黄色黄网站 | 在线观看视频亚洲 | 成人av免费在线 | 国内三级在线 | 久综合网 | 97人人看 | 99视频精品免费观看, | 久久99精品国产麻豆宅宅 | 99精品欧美一区二区蜜桃免费 | 国产成人精品午夜在线播放 | www.xxxx欧美| www.久久色 | 亚洲伊人婷婷 | 成人欧美一区二区三区黑人麻豆 | 精品国产一区二区在线 | 一区二三国产 | 香蕉国产91 | 精品国精品自拍自在线 | 日韩v欧美v日本v亚洲v国产v | 亚洲国产经典视频 | 一区二区三区精品久久久 | 成人av在线电影 | 久久视频精品在线观看 | av网站免费线看精品 | 一区二区三区四区五区在线视频 | 亚洲 综合 精品 | 五月天色中色 | 最新中文字幕在线资源 | 亚洲视频综合 | 精品国产一区二区三区蜜臀 | 日韩中文字幕在线看 | 97超碰福利久久精品 | 在线观看中文字幕dvd播放 | 色噜噜狠狠狠狠色综合久不 | 日本久久久精品视频 | 日日夜夜精品 | 久久精久久精 | 美女免费网站 | 久久久国产一区二区三区四区小说 | 国产精品a久久久久 | 日本3级在线观看 | 国产精品日韩欧美一区二区 | 天天干天天怕 | 久久久久国产精品午夜一区 | 亚洲免费精品一区二区 | 天天射天天添 | 久久久网站 | 久久艹99| 亚洲91视频 | 国产亚洲一区二区在线观看 | 国产精品久久99综合免费观看尤物 | 国产一级片一区二区三区 | 一区二区视频电影在线观看 | 天天操伊人| 久草资源在线 | 亚洲精品久久在线 | 91人人爽人人爽人人精88v | 久久人人爽人人爽 | 免费日韩一区二区三区 | 超碰人人在线观看 | 日韩电影在线看 | 久久精品国产久精国产 | 免费情缘 | 精品国产免费一区二区三区五区 | 久草在线最新视频 | a午夜在线 | 99视频一区二区 | 精品国产乱码 | 精品嫩模福利一区二区蜜臀 | 欧美日韩中文在线观看 | 综合婷婷丁香 | 国产一区二区在线免费视频 | 免费在线观看av网址 | 欧美精品久久天天躁 | av网站在线观看免费 | 日韩网站中文字幕 | 国产成人av电影在线观看 | 激情文学综合丁香 | 色噜噜日韩精品欧美一区二区 | 91在线产啪 | 国产成人精品在线 | 久久精品视频日本 | 最新国产精品久久精品 | 欧美91精品久久久久国产性生爱 | 福利视频一区二区 | 在线视频观看成人 | 2019中文字幕第一页 | 久久久久免费精品 | 久久精品99国产国产 | 黄色大全免费观看 | 99视频在线看 | 激情动态 | 97在线看 | a视频免费 | 婷婷丁香av | 日韩精品一区电影 | 成人在线中文字幕 | 久久久精华网 | 伊人色播| 久久8| 久久久久国产精品一区二区 | 国产精品淫片 | 国产一区二区精品久久 | 国产精品免费大片视频 | 毛片一二区 | 99久热在线精品 | 国产精品免费在线 | 国产视频在线观看免费 | 午夜电影 电影 | 97视频在线观看视频免费视频 | 五月激情丁香婷婷 | 久久在线视频在线 | 国产精品久久久久久久久免费 | 国产高清小视频 | 日韩激情在线视频 | 日日日天天天 | 成人在线免费观看网站 | 丁香久久五月 | 精品国产三级a∨在线欧美 免费一级片在线观看 | 久香蕉 | 免费av在线播放 | 日韩在线免费电影 | 久久艹国产视频 | 亚洲精品成人免费 | 欧美最猛性xxx | 天天在线操 | 国产精品亚洲片在线播放 | 最新中文字幕在线资源 | 国产一级在线视频 | 中文字幕一区二区三 | 91精品网站 | 国产精品美女久久久久aⅴ 干干夜夜 | 久久久久国产视频 | 日韩三级视频在线观看 | 久久久蜜桃一区二区 | 成人av一区二区在线观看 | 99免费精品视频 | 99资源网| 玖玖玖国产精品 | 久久综合成人网 | 亚洲色图 校园春色 | 天天爽天天摸 | 在线观看视频黄色 | 天堂视频中文在线 | 天天添夜夜操 | 在线观看免费av网站 | 五月综合激情网 | 国产精品视频永久免费播放 | 国产热re99久久6国产精品 | 欧美精品久久久久久久久老牛影院 | 亚洲经典精品 | 亚洲精品视频在 | 色爽网站 | 免费热情视频 | 久久影视精品 | 99久久精品久久久久久动态片 | 午夜天使 | 国产精品成人国产乱 | 91九色蝌蚪视频在线 | 1000部国产精品成人观看 | 国产日产精品久久久久快鸭 | 国产美女被啪进深处喷白浆视频 | 精品国产一区二区三区久久久久久 | 91香蕉亚洲精品 | 麻豆传媒视频在线免费观看 | 在线播放一区二区三区 | 91aaa在线观看 | 国产中文字幕在线观看 | 久久99久久99精品免观看软件 | 色偷偷人人澡久久超碰69 | 欧美一区二区三区免费观看 | 日韩av成人免费看 | 国产精品久久久久久久久久新婚 | 国产一级免费观看视频 | 久久视影| 日韩精品你懂的 | 国产精品 美女 | 在线免费观看欧美日韩 | 韩日精品在线 | 一级黄色片在线观看 | 看片的网址 | 日韩精品网址 | 久久久久久久电影 | 香蕉视频免费看 | 国产无遮挡又黄又爽在线观看 | 亚洲日本欧美 | 99视频免费在线观看 | 日日综合网 | 亚洲激色| 成年人国产精品 | 四虎最新入口 | www天天操| 狠狠狠色丁香婷婷综合久久88 | 精品国产免费一区二区三区五区 | 日韩久久视频 | 成 人 黄 色 视频免费播放 | 精品日本视频 | 美女一区网站 | 日韩 精品 一区 国产 麻豆 | 在线免费视频你懂的 | 国产精品视频大全 | 午夜精品一区二区三区在线播放 | 日日操日日干 | 99国产成+人+综合+亚洲 欧美 | 国产成人综合精品 | 草久久久久久久 | 五月天天天操 | 久久精品99久久久久久2456 | 精品亚洲一区二区 | 亚洲视频 在线观看 | 成人av资源网 | 久久激情视频 | 500部大龄熟乱视频使用方法 | 五月天天色 | 国产一级电影免费观看 | 日韩理论在线观看 | 久久久久久久久影院 | 中文字幕av电影下载 | 久久丁香网 | 国产一区高清在线观看 | 日本中文字幕在线视频 | 日韩欧美99 | 国产不卡精品视频 | 成人免费大片黄在线播放 | 中文字幕 婷婷 | 免费久久99精品国产 | 波多野结衣在线观看一区二区三区 | 日韩欧美电影在线观看 | 国产一区在线视频 | 日韩精品中文字幕在线播放 | 免费在线观看av电影 | 亚洲妇女av | 亚洲视屏在线播放 | 国产韩国日本高清视频 | 午夜婷婷在线观看 | 国产亚洲一区二区在线观看 | 久久另类小说 | 精品免费久久 | 国产精品久久久久影院日本 | 婷婷去俺也去六月色 | 91视频这里只有精品 | 久久视频免费在线观看 | 精品亚洲va在线va天堂资源站 | 国产啊v在线 | 欧美日韩在线观看一区 | 91在线公开视频 | 精品国产一区二区三区在线 | 国产99久久九九精品免费 | 中文一二区 | 国产精品不卡av | 天天操一操 | 在线小视频你懂的 | 国产精品国产三级国产专区53 | 日韩色中色 | 亚洲激情综合网 | 成年人在线视频观看 | 中文字幕免费高清在线观看 | 欧美一区在线看 | 久久国产精品一区二区三区四区 | 国产精品久久伊人 | 日韩高清毛片 | 国产成人精品国内自产拍免费看 | 精品国产不卡 | www色 | 免费视频 三区 | 国产欧美在线一区二区三区 | 又色又爽的网站 | 五月天久久 | 69欧美视频 | 精品一区二区三区在线播放 | 日韩精品一区二区三区视频播放 | 日韩精品免费一区二区 | 操操操干干干 | 国产一区二区久久久久 | 婷婷综合影院 | 午夜视频黄 | a一片一级| 91香蕉国产 | 国产成人一二片 | 91精品国| 91视频电影 | 中文字幕国内精品 | 国产韩国日本高清视频 | 午夜久久影视 | 国产一级视频 | 中文字幕在线播放一区 | 成人动漫精品一区二区 | 91免费在线看片 | 亚洲精品九九 | 亚洲情婷婷 | 久久久久久欧美二区电影网 | 永久免费毛片 | 999久久久久久久久6666 | www.色婷婷 | 成人影片在线播放 | 不卡的av在线播放 | 开心激情五月婷婷 | 日b视频国产 | 91福利视频一区 | 日韩高清精品免费观看 | 中文字幕在线观看完整版电影 | 91.麻豆视频 | 日韩国产精品一区 | 久草视频看看 | 国产精品高潮呻吟久久av无 | 成人三级av | 久草久| 成人污视频在线观看 | 三日本三级少妇三级99 | 波多野结衣电影一区二区三区 | 97视频免费在线看 | 狠狠操.com | 亚洲成人黄色在线观看 | 国产精品理论片在线播放 | 99国产精品免费网站 | 色综合久久88色综合天天 | 99精品国产99久久久久久97 | 欧美极品裸体 | av片一区| 日韩综合视频在线观看 | 日韩精品你懂的 | 欧美性色xo影院 | 六月丁香婷婷网 | 国产成人精品一区二区三区在线观看 | 国内精品久久影院 | 国产成人一区在线 | 91久久久久久久一区二区 | 992tv在线观看网站 | 成人av中文字幕在线观看 | 992tv在线观看网站 | 久久久久久国产精品美女 | 久久看免费视频 | 久福利 | 亚洲成年人在线播放 | 国产福利91精品张津瑜 | 国产高清视频免费观看 | 在线观看日韩国产 | 国产真实精品久久二三区 | 综合网中文字幕 | 久久久久久久久网站 | 国产黄色片免费在线观看 | 青草视频网 | 中文字幕精品久久 | 96精品在线| 国产区精品在线观看 | 国色天香在线 | 开心激情久久 | sesese图片 | 亚洲蜜桃av | 99热手机在线观看 | 日韩免费播放 | 成人国产精品一区 | 偷拍精偷拍精品欧洲亚洲网站 | 日韩av不卡在线 | 天天曰天天射 | 美女视频黄网站 | 天天摸天天弄 | 国产精品美女久久久久久免费 | 国产麻豆视频 | 精品91视频 | 色婷婷伊人 | 成人久久国产 | 开心色婷婷| 天天爽天天搞 | 天天色综合1 | 999抗病毒口服液 | 激情五月婷婷综合网 | 最近中文字幕完整视频高清1 | 色婷婷婷 | 在线av资源 | 亚洲日本一区二区在线 | 国产午夜精品一区二区三区嫩草 | 国产69精品久久99的直播节目 | 最新av在线播放 | 99在线精品视频 | 国产精品久久久久久一二三四五 | 久青草视频在线观看 | 国产福利网站 | 国产精品成人一区二区 | 婷婷久操 | 91在线porny国产在线看 | 麻豆一区在线观看 | 久久国产精品一区二区三区四区 | 久久网站最新地址 | 丁香婷婷激情网 | 日韩成人一级大片 | 亚洲激情视频 | 天天草天天干天天射 | 免费看一级特黄a大片 | 中文字幕日韩电影 | 91色在线观看视频 | 一本一本久久a久久精品综合 | 韩国精品一区二区三区六区色诱 | 狠狠色狠狠综合久久 | 久久久影院官网 | 色网站在线 | 黄网站色视频 | 中文字幕在线观看第三页 | 精品久久国产一区 | 五月婷婷毛片 | 国产高清 不卡 | 国产成人高清av | 国产精品久久视频 | 久久精品免费看 | 欧美日韩一区二区三区视频 | 精品视频久久 | 人人澡人人舔 | 中国一级片免费看 | 激情小说网站亚洲综合网 | 免费合欢视频成人app | 特级西西444www大精品视频免费看 | 在线免费中文字幕 | 国产女做a爱免费视频 | 色网免费观看 | 久久性生活片 | 久久久久久久福利 | 91伊人久久大香线蕉蜜芽人口 | 日韩免费福利 | 欧美乱熟臀69xxxxxx | 三级av免费观看 | 国产97视频在线 | 最近中文字幕久久 | 国产一级二级三级视频 | 国产精品1000 | 精品国精品自拍自在线 | 高清av不卡 | 91麻豆精品国产91久久久无限制版 | 亚洲丝袜一区二区 | 麻豆一二 | 免费国产视频 | 中文字幕刺激在线 | 国产精品麻豆视频 | 色综合天天做天天爱 | 日韩毛片一区 | 麻豆视频一区 | 九九久久免费 | 免费污片| 在线中文字幕一区二区 | 91在线视频观看免费 | 国产99久久九九精品免费 | 欧美视频xxx| 国产成人精品亚洲a | 国产在线视频在线观看 | 日本成人a | 国产爽视频 | 久久伦理电影 | 久亚洲 | www.夜夜操.com | 欧美一区二区日韩一区二区 | 天天摸天天舔天天操 | 国产午夜精品久久 | 成人免费在线观看av | 久久精品精品电影网 | 麻豆一区二区 | 黄色成人在线观看 | 中文字幕日本在线观看 | 麻豆91在线观看 | 色九九影院 | 国产91综合一区在线观看 | 国产午夜精品一区二区三区欧美 | 婷婷黄色片 | 四虎在线免费观看视频 | 中文字幕中文字幕中文字幕 | av中文字幕电影 | 日本性xxxxx| 亚洲国产剧情av | 久久国产精品99国产 | 国产中文字幕在线观看 | 亚洲精品美女 | 色综合亚洲精品激情狠狠 | 91在线日韩 | 色吧av色av | 婷婷中文在线 | 黄污视频大全 | 最近日本字幕mv免费观看在线 | 超碰999 | 天天干天天干天天干天天干天天干天天干 | 久草视频在线免费 | 日日夜夜精品网站 | 伊人www22综合色 | 亚洲在线视频免费观看 | 国产视频2021 | 五月天婷亚洲天综合网鲁鲁鲁 | 欧美色噜噜噜 | 国产精品入口66mio女同 | 丁香五婷| 在线免费观看成人 | 中文字幕在线电影 | 成人一区二区三区中文字幕 | 五月亚洲综合 | 亚洲综合爱 | 激情视频一区二区 | av免费电影在线观看 | 免费视频色 | 天天干天天做天天爱 | 亚洲另类视频 | 日韩在线观看一区 | 日韩视频免费在线观看 | 亚洲午夜av久久乱码 | av一二三区| 欧美日韩免费观看一区二区三区 | 欧美十八 | 黄色影院在线免费观看 | 亚洲高清视频一区二区三区 | 特级黄色视频毛片 | 久久精品久久综合 | 永久免费毛片 | 国产成人久久精品77777 | 狠狠色丁香婷婷综合视频 | 日韩精品中文字幕av | 亚洲欧美日韩国产一区二区 | 制服丝袜亚洲 | 成年人免费av网站 | 成人高清av在线 | 国产99久久久精品 | 亚洲国产理论片 | 国产成人专区 | 狠狠躁夜夜a产精品视频 | 国产专区欧美专区 | 日韩欧美综合在线视频 | www免费视频com━ | av在线影视 | 日韩精品三区四区 | 婷婷精品进入 | 视频91| 99精品免费在线 | 久久99精品久久久久久清纯直播 | 欧美日韩视频在线观看一区二区 | 亚州国产精品 | 国产精品99久久久久久有的能看 | 成人av在线一区二区 | 一级α片免费看 | 精品国产区在线 | 久久久这里有精品 | 亚洲美女在线国产 | 久久国产电影院 | 日韩中文字幕第一页 | 9999在线视频| 日韩在线大片 | 91在线看片 | 亚洲国产成人在线播放 | 国产免费成人av | 日韩一级黄色大片 | 久久国产香蕉视频 | 伊人五月 | 欧美亚洲另类在线视频 | 狠狠色狠狠色合久久伊人 | 一级免费看视频 | 国产成人无码AⅤ片在线观 日韩av不卡在线 | 久久婷五月 | 婷婷色5月| 国产在线成人 | 韩日精品在线 | 国产特级毛片aaaaaa高清 | 天天爽夜夜操 | av一区二区在线观看中文字幕 | 亚洲免费一级电影 | 亚洲丝袜一区 | 成人av高清 | 美女av免费看 | 狠狠色丁香久久婷婷综合_中 | 国产视频一区在线免费观看 | 日韩在线视频免费播放 | 成年人视频在线观看免费 | 三级av网 | 国产精品一区二区在线观看免费 | 欧美在线视频第一页 | 五月天色综合 | 国产免费黄视频在线观看 | 黄色a一级片 | 操操操人人| 日日操日日操 | 九九爱免费视频 | 激情久久久久久久久久久久久久久久 | 欧美精品免费在线 | 97在线影视 | 精品久久久一区二区 | 亚洲成人黄色在线观看 | 91亚洲精品乱码久久久久久蜜桃 | 亚洲一级黄色av | 91九色国产 | 久草久草视频 | 国产精品永久免费 | 久久人人97超碰精品888 | 日韩视频一区二区三区在线播放免费观看 | 四虎影院在线观看av | 丁香激情五月 | 免费三级骚 | www.色就是色 | 国产亚洲精品久久久久久无几年桃 | 色综合五月天 | 国产精品久久久久一区二区国产 | 日韩免费看| 久久99久久99精品免视看婷婷 | 久久久久久高潮国产精品视 | 欧美成人一区二区 | 青春草视频 | av一级免费 | 亚洲国产精品久久久久婷婷884 | 国产精品自产拍在线观看中文 | 美女国产| av网站大全免费 | 国产午夜在线 | 久久精品一区二区三区四区 | 婷婷国产一区二区三区 | 99免费在线播放99久久免费 | 狠狠色丁香婷婷综合久小说久 | 亚洲 欧洲 国产 日本 综合 | 久久久久久久久久久影视 | 肉色欧美久久久久久久免费看 | 黄色一区二区在线观看 | 99色在线播放 | 久久只精品99品免费久23小说 | 久久亚洲私人国产精品 | 午夜精品视频一区二区三区在线看 | 最近中文字幕mv | 18国产精品白浆在线观看免费 | 免费黄色在线 | 成人小视频在线播放 | 久久人人看 | 97超碰在线人人 | 中文字幕 在线 一 二 | 国内亚洲精品 | 二区中文字幕 | 91大神精品视频在线观看 | 亚洲一区欧美精品 | 免费成人短视频 | 欧美日韩国产在线观看 | 久草在线免 | 日韩激情在线 | 高清视频一区 | 成人h视频 | 日韩女同av| 91资源在线 | 国产精品久久久久久一二三四五 | 精品久久免费看 | 精品国产91亚洲一区二区三区www | 91成版人在线观看入口 | 伊色综合久久之综合久久 | 中文久草| 免费看片网址 | 欧美精品在线观看免费 | 久久99精品国产麻豆宅宅 | 青草视频在线看 | 国产视频丨精品|在线观看 国产精品久久久久久久久久久久午夜 | 最新动作电影 | 日韩午夜在线播放 | 日韩色在线观看 | 成年人免费观看在线视频 | 色五月色开心色婷婷色丁香 | 日韩精品一区二区久久 | 国产手机av | 国产中文字幕一区 | 久久久久久久久久久影视 | 日本成址在线观看 | 在线观看视频黄色 | 国产麻豆剧果冻传媒视频播放量 | 综合网色 | 99热国产在线 | 96久久| 国产精品久久片 | 99草在线视频 | 国产精品久久久久久妇 | 日韩中文字幕在线 | 中文字幕av在线 | 国产精品 中文字幕 亚洲 欧美 | 超碰人人在线 | 久久深夜 | 久久综合五月 | 成人97视频 | 9999毛片 | 久久综合色影院 | 日本资源中文字幕在线 | 麻豆系列在线观看 | 亚洲一区二区天堂 | 成人久久18免费网站 | av电影一区| 国偷自产中文字幕亚洲手机在线 | 国产成人精品三级 | av电影 一区二区 | 亚洲欧美成人网 | 成人动漫一区二区 | 99久久精品午夜一区二区小说 | 成人免费网站视频 | 911国产在线观看 | 成人在线黄色 | 在线观看免费av片 | 91成人蝌蚪 | 日韩在线观看精品 | 免费看片网址 | 天天拍天天操 | 久久狠狠婷婷 | 亚洲午夜精品久久久久久久久 | 激情丁香久久 | 日韩欧美国产激情在线播放 | 夜夜天天干 | 国产成人区 | 国产精品福利午夜在线观看 | 久久成人一区二区 | 国产日产精品一区二区三区四区 | 国产区免费 | 亚洲欧美国产精品 | 日韩视频免费在线观看 | 亚洲视频精品在线 | 中文字幕av免费在线观看 | 91污在线观看 | 日韩亚洲欧美中文字幕 | 亚洲成av人片在线观看 | 日韩欧美精品在线观看视频 | 亚洲一级二级 | 欧美99精品 | 四虎成人av| 在线观看av不卡 | 亚洲成人999 | 毛片网站免费在线观看 | 青草视频在线看 | 在线免费观看视频一区二区三区 | 久久免费毛片视频 | 免费h精品视频在线播放 | 成人av网站在线 | 久久免费视频这里只有精品 | 狠狠狠的干 | 在线国产小视频 | 国产成人1区| 四虎成人精品永久免费av | 97人人模人人爽人人喊网 | 色综合天天视频在线观看 | 毛片888 | 国产裸体永久免费视频网站 | 国产成人精品av在线 | 美女网站在线观看 | 一区二区精品视频 | 国产高清专区 | 欧洲视频一区 | 亚洲黄色av网址 | www狠狠| 91观看视频| 国产大陆亚洲精品国产 | 欧美精品久久久久久久 | 国产视频精品网 | 天天操天天爱天天干 | 国产精品久久久久久久久久免费看 | 国产精选视频 | 国产一区免费在线观看 | 麻豆91小视频 | 国产一区在线精品 | 国产一线二线三线在线观看 | 日韩欧美在线视频一区二区 | 国产精品黄色影片导航在线观看 | 午夜在线观看一区 | 天天操天天操天天操天天 | 人人爱人人射 | 久久国产精品99精国产 | 婷婷五月情| www国产亚洲精品 | 美女网站视频一区 |