前言

從智聯(lián)招聘爬取相關(guān)信息后,我們關(guān)心的是如何對內(nèi)容進(jìn)行分析,獲取用用的信息。

本次以上篇文章“5分鐘掌握智聯(lián)招聘網(wǎng)站爬取并保存到MongoDB數(shù)據(jù)庫”中爬取的數(shù)據(jù)為基礎(chǔ),分析關(guān)鍵詞為“python”的爬取數(shù)據(jù)的情況,獲取包括全國python招聘數(shù)量Top10的城市列表以及其他相關(guān)信息。

一、主要分析步驟

  • 數(shù)據(jù)讀取

  • 數(shù)據(jù)整理

  • 對職位數(shù)量在全國主要城市的分布情況進(jìn)行分析

  • 對全國范圍內(nèi)的職位月薪情況進(jìn)行分析

  • 對該職位招聘崗位要求描述進(jìn)行詞云圖分析,獲取頻率最高的關(guān)鍵字

  • 選取兩個城市,分別分析月薪分布情況以及招聘要求的詞云圖分析

二、具體分析過程

import pymongoimport pandas as pdimport matplotlib.pyplot as pltimport numpy as np
% matplotlib inline
plt.style.use('ggplot')
# 解決matplotlib顯示中文問題plt.rcParams['font.sans-ser