python seo 采集内容_SEO如何处理采集内容(4)–转自{GoGo闯}
兩個(gè)問題
在準(zhǔn)備采集前找詞的時(shí)候,有個(gè)蛋疼的問題:
無論任何一種找詞渠道,固定搜索詞(如阿拉巴巴招聘)和個(gè)性搜索詞(如阿里巴巴工程師級(jí)別怎么劃分)總是雜糅到一塊的,對(duì)于同一詞根下的擴(kuò)展詞,如何將這兩類詞分開?
固定搜索詞往往可以根據(jù)固定詞綴的出現(xiàn)次數(shù)來預(yù)估關(guān)鍵詞的流量,畢竟同一個(gè)詞綴出現(xiàn)次數(shù)高,流量也會(huì)相對(duì)高。但個(gè)性化搜索詞流量和競爭度怎么判斷?
為什么非要把兩類詞找出來呢?因?yàn)檫@兩類詞的
如何將固定搜索詞和個(gè)性化搜索詞分開
因?yàn)楣潭ㄋ阉髟~都包含通用的詞綴,比如:
php工程師工資、java程序員工資、學(xué)php有前途嗎、
1
php工程師工資、java程序員工資、學(xué)php有前途嗎、...
這里面“工資”就是通用詞綴,前面可以跟任何關(guān)于職位的變量。
程序搞定?
所以可以通過程序分詞,把包含連續(xù)出現(xiàn)多次詞綴的關(guān)鍵詞單獨(dú)提出來,這點(diǎn)可以通過
然而實(shí)際中,由于jieba默認(rèn)詞典的限制,導(dǎo)致在不同行業(yè)內(nèi)分詞不理想的情況,比如沒有把通用詞綴單獨(dú)切出來,致使后面聚類的效果也不理想的情況。
要達(dá)到理想情況,就要不斷優(yōu)化jieba分詞詞典和聚類算法。
但本渣渣是偽技術(shù),只會(huì)裝逼。即便能搞定也得花挺長時(shí)間。
人肉搞定?
人肉搞定思路就很簡單了
首先把全行業(yè)所有的固定搜索行為全部找出來,比如這是招聘行業(yè)的固定搜索行為,即便不全也可以覆蓋大部分:
當(dāng)把固定搜索行為找出后,就知道這個(gè)行業(yè)都有哪些通用詞綴,剩下的事簡單了,還是照常跑詞,把跑出來的詞包含通用詞綴的全部拎出來,剩下的就都是個(gè)性化搜索詞了。這完全是個(gè)力氣活,拼體力。
全行業(yè)固定搜索詞怎么找?之前本渣渣寫過,詳見:【SEO】關(guān)鍵詞數(shù)據(jù)分析
個(gè)性化搜索詞流量怎么判斷
簡單的就是跑指數(shù)了,愛站和戰(zhàn)神軟件都有這功能。但如果大部分都沒有指數(shù)怎么辦?
相對(duì)精準(zhǔn)的搜索量本渣渣也不知道該怎么判斷,但是可以從關(guān)鍵詞來源渠道來評(píng)個(gè)優(yōu)先級(jí)。
比如移動(dòng)端跑出來的詞一定比從pc端的優(yōu)先級(jí)高。
百度相關(guān)搜索的詞一定比鳳巢的優(yōu)先級(jí)高(鳳巢的詞都被做爛了,小站沒機(jī)會(huì))
如果要上的內(nèi)容類型是問答類的,那百度知道相關(guān)搜索詞一定比百度新聞相關(guān)搜索詞優(yōu)先級(jí)高
…
個(gè)性化搜索詞競爭度怎么判斷
本渣渣就粗暴的看百度搜索結(jié)果
搜索結(jié)果數(shù)越低,競爭度越低,而且title放別人做的少的詞被收錄的概率也會(huì)大
前10搜索結(jié)果中,關(guān)鍵詞飄紅的次數(shù),次數(shù)越低,競爭度越低
{word} site:(domain1 | domain2 | domain3) ,看一下幾個(gè)大網(wǎng)站有沒有做,尤其是58趕集、1688這種流氓,因?yàn)檫@些超大型站點(diǎn)做的詞,大中型站點(diǎn)也跟著做,超大中型站點(diǎn)都搶的詞,就沒小站什么事了
總結(jié)
以上是生活随笔為你收集整理的python seo 采集内容_SEO如何处理采集内容(4)–转自{GoGo闯}的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 基于STM32F103将采集的温度-湿度
- 下一篇: Python count() 方法