寫在前面:

      好久沒有登錄博客了,意外看到之前的幾篇文章都有不錯的閱讀量,開心極了,不過沒有什么點(diǎn)贊和評論,大概是沒有給大家?guī)硎裁辞袑?shí)的幫助吧。o(*////▽////*)q。

      最近在NTU負(fù)責(zé)一個(gè)國家研究基金委支持的智能城市交通的項(xiàng)目,第一步就是獲取道路交通各種信息,收集分析數(shù)據(jù)。因?yàn)楦鞣N原因這次選擇了Scrapy這個(gè)框架,也是我自己第一次接觸python爬蟲,圓滿完成需求數(shù)據(jù)爬取之后,我在四臺電腦上搭建了Scrapy環(huán)境,遇到了各種各樣的問題,借此寫一篇總結(jié),也希望能夠給大家提供一絲絲的幫助,更希望能幫助大家,流暢的搭建完成。

 

———————————————————————————————————————————————————————————

 

一、安裝python

根據(jù)自己的需求,到官網(wǎng)下載適合自己電腦的版本,https://www.python.org/downloads/,這里我選擇的是較為穩(wěn)定的2.7版本

鏈接: http://pan.baidu.com/s/1i5hZPS5%20 密碼: e6qi

安裝過程十分簡單,除了選擇路徑,一路next到底即可。完成之后,別忘將python添加到環(huán)境變量里。

 

點(diǎn)擊“我的電腦”右鍵“屬性”,進(jìn)入到如下界面,左上角選擇“高級系統(tǒng)設(shè)置”:

photoshop培訓(xùn),電腦培訓(xùn),電腦維修培訓(xùn),移動軟件開發(fā)培訓(xùn),網(wǎng)站設(shè)計(jì)培訓(xùn),網(wǎng)站建設(shè)培訓(xùn)

彈出一個(gè)對話框,在對話框里找到并選擇“環(huán)境變量”選項(xiàng),進(jìn)入之后,下方找到“path”,之后編輯,用 ; 隔開,插入安裝python的文件路徑,這里為了之后安裝方便,也將python下的script路徑給添加進(jìn)來。

 

photoshop培訓(xùn),電腦培訓(xùn),電腦維修培訓(xùn),移動軟件開發(fā)培訓(xùn),網(wǎng)站設(shè)計(jì)培訓(xùn),網(wǎng)站建設(shè)培訓(xùn)                          photoshop培訓(xùn),電腦培訓(xùn),電腦維修培訓(xùn),移動軟件開發(fā)培訓(xùn),網(wǎng)站設(shè)計(jì)培訓(xùn),網(wǎng)站建設(shè)培訓(xùn)

 

添加到環(huán)境變量之后,打開命令行,輸入,python,如果出現(xiàn)如下界面則安裝成功,如果顯示不是內(nèi)部外部命令,回去檢查環(huán)境變量設(shè)置環(huán)節(jié)。很大可能是誤輸入中文輸入法之下的;檢查一遍,修改之后,重啟命令行再輸入一遍。

 

photoshop培訓(xùn),電腦培訓(xùn),電腦維修培訓(xùn),移動軟件開發(fā)培訓(xùn),網(wǎng)站設(shè)計(jì)培訓(xùn),網(wǎng)站建設(shè)培訓(xùn)

 

二、安裝pywin32

在Windows下,必須安裝pywin32,下載地址:https://sourceforge.net/projects/pywin32/,鏈接:http://pan.baidu.com/s/1hsmL92W 密碼: 3qnf

安裝過程也很簡單,一路next到底,安裝完畢之后在命令行先輸入python,之后輸入import win32com驗(yàn)證:   

如圖所示,如果沒有提示錯誤,則證明安裝成功,如果錯誤就再來一遍,這個(gè)步驟一般不會出現(xiàn)問題。

 

三、安裝pip

pip是一個(gè)安裝和管理python包的工具,可以替代easy_install。下載地址:https://bootstrap.pypa.io/get-pip.py 或http://pan.baidu.com/s/1dFKbFP3%20 密碼:m3ar

打開命令行進(jìn)入到保存get-pip的路徑進(jìn)行操作,可以用cd的命令,也可以shift+右鍵選擇用命令行打開。然后鍵入:

1
python get-pip.py

即可

安裝完成后在命令行輸入

pip --version

顯示即安裝成功

 

四、安裝pyOPENSSL

在Windows下,是沒有預(yù)裝pyOPENSSL的,而在Linux下是已經(jīng)安裝好的。

安裝地址:https://launchpad.net/pyopenssl 或 http://pan.baidu.com/s/1hrXS4Fa 密碼:25pd

下載后,雙擊,一路next就可以。

 

五、安裝 lxml

lxml是一種使用 Python 編寫的庫,可以迅速、靈活地處理 XML

直接執(zhí)行如下命令

1
pip install lxml

 然后,我們迎來了一個(gè)大坑,這里可能會報(bào)各種錯,比較常見的:

1.報(bào)錯說電腦沒有匹配的 Microsoft Visual C++庫,點(diǎn)擊官網(wǎng)下載安裝,點(diǎn)擊網(wǎng)盤下載安裝,密碼:37h2。安裝完成后重啟命令行再次執(zhí)行上述命令

2.報(bào)其他亂七八糟的錯,或者上述庫安裝完成以后依舊不成功。這個(gè)時(shí)候可以嘗試

1
easy_install lxml

 或者,下載集成的安裝包,直接雙擊一路next安裝。如果還是不行,一個(gè)屢試不爽的方法,下載lxml.wheel文件。然后在wheel目錄下鍵入

1
pip install lxml-3.6.4-cp27-cp27m-win_amd64.whl

 

六、安裝Scrapy框架

在命令行下

1
pip install Scrapy

 

安裝完畢后,在命令行輸入Scrapy,如果顯示如下圖所示,則安裝成功:

photoshop培訓(xùn),電腦培訓(xùn),電腦維修培訓(xùn),移動軟件開發(fā)培訓(xùn),網(wǎng)站設(shè)計(jì)培訓(xùn),網(wǎng)站建設(shè)培訓(xùn)

 

七、編譯程序的時(shí)候發(fā)現(xiàn),經(jīng)常報(bào)告缺失lib2,所以這里附上安裝httplib2的方法

下載,然后解壓,在httolib2目錄下,pip install httplib2 即可。