日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 > 人文社科 > 生活经验 >内容正文

生活经验

linux下用js生成xml,js2xml:将javascript字符串转换为xml

發(fā)布時間:2023/11/27 生活经验 26 豆豆
生活随笔 收集整理的這篇文章主要介紹了 linux下用js生成xml,js2xml:将javascript字符串转换为xml 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

有時候爬數(shù)據(jù)遇到像下面這種,數(shù)據(jù)在script標(biāo)簽中以javascript形式存在。

var totalReviewsValue = 32;

var averageRating = 4.5;

if(totalReviewsValue != 0){

events = "...";

}

一般我們都是通過正則的方式抽取,其實還可以使用js2xml。將js轉(zhuǎn)換為xml標(biāo)記的文本,這樣就可以通過抽取。

先提前出js文本

from pyquery import PyQuery as pq

doc = pq(html)js_text = doc('script').text()

print(js_text)

var totalReviewsValue = 32;

var averageRating = 4.5;

if(totalReviewsValue != 0){ events = "...";

}

js2xml

import js2xml

doc = pq(html)

js_text = doc('script').text()

parse_js = js2xml.parse(js_text)

print(type(parse_js))

print(parse_js)

為了方便我們查看Element對象,使用下面的代碼:

js2xml.pretty_print(data)

wow,返回我們熟悉的標(biāo)記語言字符串。

...

因為parse_js是lxml庫的Element類對象。如果我們熟悉lxml庫的話,應(yīng)該知道可以使用xpath或者css定位數(shù)據(jù)。

我們想獲取name=averageRating節(jié)點里的number節(jié)點中的value屬性的值。

number = parse_js.xpath("//program/var[@name='averageRating']/number/@value")

print(number)print(number[0])

['4.5']

4.5

總結(jié)

以上是生活随笔為你收集整理的linux下用js生成xml,js2xml:将javascript字符串转换为xml的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。