在知乎看到一個可視化話題的文章,所以一時心血來潮,打算用Java也寫一個爬蟲并且集成到Spring中,結合ECharts生成人物關系,當然,既然爬一次,個人信息也都要獲取到。
那么今天起起(結束日未知,目錄也會根據(jù)實際情況進行更新),我將寫一個系列的爬取知乎的爬蟲文章,一直到數(shù)據(jù)可視化完成(完成后,爬蟲部分將使用Scala重寫)。
1. 預計可視化部分包括
人物關系可視化
人員地理分布可視化
人員大學分布可視化
男女比例可視化
用戶點贊可視化
2. 預計內容和目錄
開篇感言
如何過濾重復數(shù)據(jù)
如何在爬取時創(chuàng)建人物關系
登陸請求分析
跟隨/關注請求分析
抓取頁面數(shù)據(jù)
jsoup抽取頁面內容
優(yōu)化
使用多線程加速
使用隊列減少數(shù)據(jù)庫訪問
延伸閱讀
- ssh框架 2016-09-30
- 阿里移動安全 [無線安全]玩轉無線電——不安全的藍牙鎖 2017-07-26
- 消息隊列NetMQ 原理分析4-Socket、Session、Option和Pipe 2024-03-26
- Selective Search for Object Recognition 論文筆記【圖片目標分割】 2017-07-26
- 詞向量-LRWE模型-更好地識別反義詞同義詞 2017-07-26
- 從棧不平衡問題 理解 calling convention 2017-07-26
- php imagemagick 處理 圖片剪切、壓縮、合并、插入文本、背景色透明 2017-07-26
- Swift實現(xiàn)JSON轉Model - HandyJSON使用講解 2017-07-26
- 阿里移動安全 Android端惡意鎖屏勒索應用分析 2017-07-26
- 集合結合數(shù)據(jù)結構來看看(二) 2017-07-26