前言
從智聯(lián)招聘爬取相關(guān)信息后,我們關(guān)心的是如何對內(nèi)容進(jìn)行分析,獲取用用的信息。
本次以上篇文章“5分鐘掌握智聯(lián)招聘網(wǎng)站爬取并保存到MongoDB數(shù)據(jù)庫”中爬取的數(shù)據(jù)為基礎(chǔ),分析關(guān)鍵詞為“python”的爬取數(shù)據(jù)的情況,獲取包括全國python招聘數(shù)量Top10的城市列表以及其他相關(guān)信息。
一、主要分析步驟
數(shù)據(jù)讀取
數(shù)據(jù)整理
對職位數(shù)量在全國主要城市的分布情況進(jìn)行分析
對全國范圍內(nèi)的職位月薪情況進(jìn)行分析
對該職位招聘崗位要求描述進(jìn)行詞云圖分析,獲取頻率最高的關(guān)鍵字
選取兩個城市,分別分析月薪分布情況以及招聘要求的詞云圖分析
二、具體分析過程
import pymongoimport pandas as pdimport matplotlib.pyplot as pltimport numpy as np % matplotlib inline plt.style.use('ggplot')
# 解決matplotlib顯示中文問題plt.rcParams['font.sans-ser