前言

從智聯(lián)招聘爬取相關(guān)信息后,我們關(guān)心的是如何對(duì)內(nèi)容進(jìn)行分析,獲取用用的信息。

本次以上篇文章“5分鐘掌握智聯(lián)招聘網(wǎng)站爬取并保存到MongoDB數(shù)據(jù)庫(kù)”中爬取的數(shù)據(jù)為基礎(chǔ),分析關(guān)鍵詞為“python”的爬取數(shù)據(jù)的情況,獲取包括全國(guó)python招聘數(shù)量Top10的城市列表以及其他相關(guān)信息。

一、主要分析步驟

  • 數(shù)據(jù)讀取

  • 數(shù)據(jù)整理

  • 對(duì)職位數(shù)量在全國(guó)主要城市的分布情況進(jìn)行分析

  • 對(duì)全國(guó)范圍內(nèi)的職位月薪情況進(jìn)行分析

  • 對(duì)該職位招聘崗位要求描述進(jìn)行詞云圖分析,獲取頻率最高的關(guān)鍵字

  • 選取兩個(gè)城市,分別分析月薪分布情況以及招聘要求的詞云圖分析

二、具體分析過(guò)程

import pymongoimport pandas as pdimport matplotlib.pyplot as pltimport numpy as np
% matplotlib inline
plt.style.use('ggplot')
# 解決matplotlib顯示中文問(wèn)題plt.rcParams['font.sans-ser
        
		

網(wǎng)友評(píng)論