一、問(wèn)題背景
現(xiàn)在的移動(dòng)剛一通話就可以在網(wǎng)站上看自己的通話記錄,以前是本月只能看上一個(gè)月。不過(guò)流量仍然是只能看上一月的。
目的就是找到用戶在一段時(shí)間內(nèi)的上網(wǎng)流量。
本文并沒(méi)有對(duì)時(shí)間分組。下一節(jié)進(jìn)行分區(qū),有興趣的參看下一篇。
二、數(shù)據(jù)集分析
可以看出實(shí)際數(shù)據(jù)集并不是每個(gè)字段都有值,但是還好,完整地以tab隔開(kāi)了,數(shù)據(jù)格式還是不錯(cuò)的,我們需要的上行下行數(shù)據(jù)都有,沒(méi)有缺失值。其實(shí)這個(gè)需要在程序中處理,如果不在的話 該怎么辦。