xenu使用
Xenu使用簡介
你是否常常有問題,損壞的鏈接?你是否厭倦了,看到 404 or “File or Directory Not Found” error page? Wether you are a web developer or a user that is irritated by a website with this broken link issue, this free 或“文件或目錄未找到”錯誤頁?天氣你是一個網頁開發人員或用戶是不滿的網站,這打破了鏈接問題,這個自由 tool 工具 is for you. 非常適合您。
Ironically, the 諷刺的是, Wikipedia page for Xenu’s Link Sleuth 維基百科網頁xenu的鏈接sleuth has a broken link on its footnote section: 有一個破碎的鏈接及其腳注條:
http://www.curriculum.edu.au/SCIS/connections/cnetw02/43xenu.htm http://www.curriculum.edu.au/scis/connections/cnetw02/43xenu.htm
Written by a 寫一 programmer 程序員 that’s as fed up as you with broken links, Xenu’s Link Sleuth crawls the entire website and checks for broken links and then creates a summarized report of all the broken links found. The name Xenu is derived from a Scientology god which does bad things – he is like the Satan of the Scientology world – Tilman, the programmer, is an avid cult and Scientology critic so I think he used “Xenu” to mock the fanatic cult followers. 這是因為厭倦了你與斷開的鏈接, xenu的鏈接sleuth檢索整個網站,并檢查是否有損壞的鏈接,然后創建一個總結報告,所有損壞的鏈接發現。名稱xenu是來自科學上帝是否壞的東西 -他就像是撒旦的科學世界- ti lman,程序員,是一個熱愛科學的邪教和評論家因此,我認為他用“ xenu”模擬狂熱信徒。
Xenu能做什么:用于檢測網站連接有效性的綠色軟件,使用簡單,最大支持100線程( Parallel threads),檢測速度非常快。在對某網站的6層連接100630個連接進行檢測時,使用默認的100線程耗僅費了1小時40分鐘。當然耗費的網絡資源比較多。
xenu怎么用:新建一個鏈接測試,文件——檢查網址——輸入網址——點擊確定。
To start the link checker, open Xenu and then click File > New URL… 開始連結檢查,公開xenu然后單擊文件“ >新的URL …
Enter the URL of the website that you want to check on the prompt. 進入網站的網址,你要檢查就提示。 On this example, I will check the links coming from the project’s homepage: 就這個例子,我會選中鏈接來自該項目的網頁: http://www.symptomfind.com/
If you need to check for external sites check the box otherwise make sure to uncheck it to avoid crawling external sites (it could take time and possibly slow down other servers if you crawl sites that you don’t intend to). 如果您需要檢查外部網站,選中該框,否則一定要取消它,以避免抓取外部網站(可能需要時間和可能放緩,其他服務器如果您的網站抓取你不打算) 。
External sites means sites that are hosted on another domain. Also, you can treat external sites as “internal” by adding the beginning address on the list of “Consider URLs beginning with this as ‘internal’”. On the same manner, you can bypass URLs that you don’t want to crawl like forums and dynamic pages. After you are done setting the URL, click OK to start the crawler. 外部網站是指網站上托管的另一個域。另外,您也可以治療外部網站,為“內部”加入開始地址名單上的“考慮開頭的網址,這作為'內部' ” 。對相同的方式,您可以繞道的網址,您不想抓取像論壇和動態頁面后,您已完成訂定的URL ,單擊確定以啟動抓取工具。
During the crawling process you will see the program checking each page along with the status, type of file, size and HTML title: 在抓取過程中,您將看到該程序檢查每個網頁,隨著地位,文件的類型,大小和HTML標題:
Depending on the speed of your connection and the number of files linked from the URL you entered above, it could take from a few minutes to an hour. The software crawls the web using a multi-threaded technique so it could check for multiple pages concurrently. The number of threads is adjustable using the Options panel. 根據對速度您的連接和文件數量掛鉤,從您所輸入的網址上面,它可以采取從幾分鐘到一小時,該軟件抓取網頁使用多線程技術,所以它可以檢查多個頁面同時。執行緒數目是可調的使用選項面板。
Click OK once the crawling is done: 單擊確定,一旦抓取操作是:
The final output is a very comprehensive report in HTML format with the following contents: 最后產出是一個非常全面的報告,在HTML格式具有下列內容:
* Broken links, ordered by link *損壞的鏈接,下令鏈接
* Broken links, ordered by page *損壞的鏈接,下令由頁
* List of redirected URLs *清單,自由的網址
* List of valid URLs you can submit to a search engine *名單有效的URL ,您可以提交到搜索引擎
* Site Map of HTML pages with a Title *網站地圖的HTML網頁標題
* Broken page-local links *打破頁本地鏈接
* Orphan files *孤兒檔案
* Statistics for managers *統計經理
The most important part of the report is the list of broken links so we can identify them: 最重要的一部分,這份報告是名單已損壞的鏈接,使我們能辨認他們:
Click the first item “Broken links, ordered by link” to see the list of broken links: 單擊第一項“斷開的鏈接,由鏈接” ,即可看到名單已損壞的鏈接:
To interpret the report see below guide: 解釋的報告見下文指南:
From a web developer point of view, this can be fixed by: 從Web發展的觀點來看,這可以固定:
1. 1 。 making the missing page available OR 決策失蹤網頁提供
2. 2 。 removing the broken link from the pages that point to the missing page. 刪除失效鏈接從網頁指向失蹤頁。
Given the case above and considering what is the best way to finish the job, looks like step 1 is more practical to implement since only one file will be affected instead of many files. 鑒于上述情況,并考慮什么是最好的方式,來完成任務,看起來像第1步,是較為實際的做法實施以來,只有一個文件會受到影響,反而許多文件。
What if you are only the user and don’t have direct control of these files? Well, first you can try to find the “Contact Us” page or email the admin if you have their contact details. Quality websites usually fix the issue very quickly – they don’t want to have irritated readers. 如果你只是用戶并沒有直接控制這些文件的?那么,首先您可以嘗試尋找“聯系我們”網頁或電子郵件的管理如果您有他們的聯絡資料。品質的網站通常是解決問題非常很快-他們不希望有讀者惱火。
Now, to get the overall picture of the whole site scroll to the bottom part of the report to see the aggregated result: 現在,為了得到的大局整個網站的滾動到底部的報告的一部分,看到匯總結果:
So, from the report I can see that out of 10590 URLs only 52 are not found or only .49%. Depending on your standard or level of discomfort towards broken links this could be interpreted as either good, bad or in the middle – don’t really matter. 所以,從報告中我可以看到指出, 10590網址只有49個沒有發現或沒有返回信息僅0.49 % 。取決于您的標準或水平的不適,對已損壞的鏈接,這可以被解釋為不是好的,壞的
This tool enables you to find quality shortcomings of websites that don’t check their pages for broken links. With a tool like Xenu’s Link Sleuth , link checking is only a few clicks away.
注意:
1、若不需要檢查外部鏈接(Check external lin),該項不需要打勾。比如測試www.gzzzjz.com,該網站有個外部鏈接www.baidu.com,若勾了外部鏈接,也會檢查www.baidu.com,這顯然不是我們測試的目標,因此不需要勾上檢查外部鏈接;
2、更多選項設置(ore options)。可最多設置100個并列線程。最大層次建議在6以內,否則會有很多鏈接。報告(Report)可全選。比較關心的是中斷鏈接、中斷內部鏈接、統計、有效文字鏈接。應用到所有工作和需要時需要密碼應勾上(ask for password or certificate when needed )
3、若鏈接太多,生成報告時可能死掉打不開報告。解決如下:
a:掃描完成后,在提示“是否生成報告”的提示界面上
b:進入你的賬號的Temp目錄,刪除臨時文件。這個目錄默認是隱藏的。一般在這個位置
?D3KMB2Sjrl0C:\Documents and
Settings\Administrator\Local Settings\Temp其中Administrator為你的賬號
MSt _Tl i0刪除臨時文件可能需要很長時間,建議你直接將Temp目錄刪除。然后重新建立個目錄即可。此前需要將XENU之外的所有程序關閉,防止Temp目錄被使用導致無法刪除。如果該目錄提示不能刪除,則需要進入該目錄,手工刪除幾萬個臨時文件,光顯示出來就需要很多時間,所以需要耐心,但是請相信這是值得的
d:刪除完成后,返回XENU界面,在“選項”-“偏好設置”上進行配置,只選擇中斷連接和統計。在“文件”菜單,點擊“報告”稍微等待一會就可以生成報告
如何分析report的結果:
中斷鏈接,按鏈接順序列出網站中的中斷連接(該鏈接的對象不存在,如http://www.gzzzjz.com/images/ysfw.jpg)地址,每個中斷鏈接下列出了存在這些中斷鏈接的網頁地址;
L0中斷鏈接,按網頁順序表示網頁中存在中斷鏈接的網頁,并在網頁下方標出中斷連接的地址轉向網址列表列出重新轉向定位的網址ftp和gopher網址列表列出存在ftp和gopher類型的網址列表
有效網址列表你可以提交給搜索引擎列出所有有效的網址列表包含一個標題的網頁地圖列出包含標題的網頁地圖sitemap中斷當地鏈接孤立文件
監督統計對所有類型的網址進行統計
使用Xenu 需要注意的:
1、若不需要檢查外部鏈接,該項不需要打勾。比如測試www.boobooke.com,該網站有個外
部鏈接www.baidu.com,若勾了外部鏈接,也會檢查www.baidu.com,這顯然不是我們測試
的目標,因此不需要勾上檢查外部鏈接;
2、更多選項設置。可最多設置100 個并列線程。最大層次建議在6 以內,否則會有很多鏈
接。報告可全選。比較關心的是中斷鏈接、中斷內部鏈接、統計、有效文字鏈接。應用到所
有工作和需要時需要密碼應勾上;
xenu 的局限性:
1、只能測試鏈接存不存在,但無法驗證鏈接的正確性;
2、若輸入https://的地址,則無法測試;
常見的not found , timeout 問題解答:
1.可能xenu 不支持這種類別的文件檢測
2.中間出現了一些權限方面的驗證過程,在xenu 中無法進行權限的傳遞,網頁中是可以的
3.可能出現了路由器級別的跳轉
4 服務器相應的問題
5 網絡的問題
我們可以逐個點擊鏈接去驗證,如果在IE 下能正常打開,就ok 了,如果真的打到比較慢,
那么就要進一步分析下去了。
總結
- 上一篇: 史玉柱时隔3年再露面:游戏是长青行业 喜
- 下一篇: 长城汽车总裁王凤英:中国消费者买车爱面子