xml html 转化为字符串,XSLT:将字符串解析为XML节点集(concret:将HTML-String转换为节点集)?...
我面臨的問(wèn)題是我在XML中有一個(gè)字符串的節(jié)點(diǎn),代表HTML。 我需要削減該字符串,但是,當(dāng)然,這可能導(dǎo)致在invalide HTML的標(biāo)記(例如,如果我切字符串總是后30個(gè)字符我很容易失去閉元件等等)。 怎么辦? 這似乎是非常困難的,因?yàn)槲覜](méi)有通過(guò)谷歌找到真正的幫助。XSLT:將字符串解析為XML節(jié)點(diǎn)集(concret:將HTML-String轉(zhuǎn)換為節(jié)點(diǎn)集)?
我的想法至今:以“分析字符串”和正則表達(dá)式選擇節(jié)點(diǎn)和內(nèi)容,并把它們寫上課XML元素節(jié)點(diǎn)。 但是我遇到很大的問(wèn)題來(lái)處理所有情況,特別是嵌套節(jié)點(diǎn)。
有人有一些想法嗎?
FYI:我的記事本:
正則表達(dá)式:抓住第一個(gè)標(biāo)簽
第一個(gè)節(jié)點(diǎn)的讀標(biāo)記名
認(rèn)沽標(biāo)記名正則表達(dá)式和搜索整個(gè)標(biāo)簽,還可以選擇字符串的其余部分(去請(qǐng)稍后再試)
查看完整內(nèi)容:更多標(biāo)簽?是: - >步驟1中,無(wú): - >步驟5
寫入標(biāo)簽作為節(jié)點(diǎn)元件
字符串取其余 - >步驟1
下面是XML的文檔:
header
A little article. Here it's already done!
]]>
我想要做什么:
在我有一個(gè)字符串(HTML),只是想輸出字符的特殊金額(例如,前25)。當(dāng)我這樣做只是在弦上,我得到這樣的結(jié)果:
"
header
A little article"
在下一步我把這個(gè)字符串的HTML輸出,但在這一點(diǎn)上,我獲得合法的標(biāo)記,因?yàn)?/p>
-Tag不關(guān)閉。
所以我的第一種方法是:解析這個(gè)字符串以獲取每個(gè)標(biāo)記的XML-Nodes,然后遍歷每個(gè)節(jié)點(diǎn),編寫一個(gè)xml元素(以確保最終標(biāo)記將有效)并復(fù)制盡可能多的字符,直到達(dá)到極限,在這個(gè)例子中將是25個(gè)字符。
2012-01-03
K.S.
+0
您可能希望在您的問(wèn)題中包含您的XML文檔。 –
2012-01-03 09:50:48
+0
你對(duì)輸入XML有任何控制嗎?如果你沒(méi)有使用CDATA標(biāo)簽,這可能是可能的。使用CDATA標(biāo)記,HTML字符串僅被視為文本的通用字符串,并且不容易在HTML標(biāo)記處進(jìn)行分析。刪除CDATA標(biāo)簽,然后您可以開(kāi)始匹配標(biāo)簽... –
2012-01-03 10:51:43
+0
請(qǐng)編輯您的問(wèn)題并提供轉(zhuǎn)換所需的結(jié)果。目前還不清楚你想要“刪除”哪個(gè)字符串。 –
2012-01-03 12:56:39
總結(jié)
以上是生活随笔為你收集整理的xml html 转化为字符串,XSLT:将字符串解析为XML节点集(concret:将HTML-String转换为节点集)?...的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 四元数乘法_JPL四元数和Hamilto
- 下一篇: 当前元素_前端系列——获取页面中的DOM