大v用户数据统计分析
生活随笔
收集整理的這篇文章主要介紹了
大v用户数据统计分析
小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.
1,統(tǒng)計(jì)數(shù)據(jù)的基本情況,包括微博總數(shù),用戶總數(shù),最活躍和最不活躍的用戶id
#!/bin/sh
source_dir=/home/minelab/data/DATA
source_file_name=userinfo_00_au_1_out
source_file=$source_dir/$source_file_name
#source_file=test.src
out_dir=/home/minelab/liweibo/daV out_file_name=basic_satic.txt
out_file=$out_dir/result/$out_file_name out_id_file_name=id_count.list
out_id_file=$out_dir/result/$out_id_file_name rm -rf $out_file
rm -rf $out_id_file
##進(jìn)行大v用戶基礎(chǔ)數(shù)據(jù)統(tǒng)計(jì)###
#統(tǒng)計(jì)所有微博總數(shù)#
echo "#微博總數(shù):">>$out_file
cat $source_file | wc -l >> $out_file
#統(tǒng)計(jì)用戶總數(shù),發(fā)布微博最多的用戶和最少的用戶#
cat $source_file | awk -F'\t' '{print $16}' | sort | uniq -c | sort -r -n | sed 's/^ *//g' | awk '{print $2"\
\t"$1}'> $out_id_file
echo "#用戶總數(shù):">> $out_file
wc -l $out_id_file | awk '{print $1}'>> $out_file
#統(tǒng)計(jì)發(fā)布微博最多的用戶#
echo "#發(fā)布微博最多的用戶id:">>$out_file
head -n $out_id_file >> $out_file
#統(tǒng)計(jì)發(fā)布微博最少的用戶#
echo "#發(fā)布微博最少的用戶id:">>$out_file
tail -n $out_id_file >> $out_file
大v用戶基本統(tǒng)計(jì)腳本
總結(jié)
以上是生活随笔為你收集整理的大v用户数据统计分析的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 持久层之 MyBatis: 第三篇 :缓
- 下一篇: Apple 应用内支付心得