php偷取,PHP偷取UTF-8目标网页内容输出为空白
生活随笔
收集整理的這篇文章主要介紹了
php偷取,PHP偷取UTF-8目标网页内容输出为空白
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
利用PHP中的file_get_contents(URL)函數實現偷取網頁正文內容的時候,將偷取過來的UTF-8網頁內容進行轉碼后輸出,直接輸出可以看到偷取后的內容。可有時我們有時也會遇到在輸出偷取過來的內容時,卻是一片空白,什么都沒有。例如有如下代碼:
$url = "http://www.nbrlw.com/wtrl/2/index.html";
$string = file_get_contents($url); //得到網頁內容
echo iconv('utf-8','gbk',$string); //轉碼輸出
卻是一片空白。折騰了半天,原來在轉碼時,應該忽略一些不需要轉碼的字符,即:
echo iconv('utf-8','gbk',$string);
改寫成:
echo iconv('utf-8','gbk// ignore',$string);
utf-8直接轉gbk,這樣問題就來了,當有些字符無法轉換的時候就從此處斷開,導致內容不完整。后來又重新查手冊,才發現iconv還有兩個可選的輔助參數:TRANSLIT和IGNORE ,(其中IGNORE 就是說遇到無法轉換的就跳過)。
No related posts.
總結
以上是生活随笔為你收集整理的php偷取,PHP偷取UTF-8目标网页内容输出为空白的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: php图片去噪,python 图片去噪的
- 下一篇: php svn up,php中执行svn