上一次很多朋友寫文字屏蔽說到要用正則表達(dá),其實(shí)不是我不想用(我正則用得不是很多,看過我之前爬蟲的都知道,我直接用BeautifulSoup的網(wǎng)頁標(biāo)簽去找內(nèi)容,因?yàn)槿菀桌斫庖卜奖悖?,而是正則用好用精通的很難(看過正則表的應(yīng)該都知道,里面符號(hào)對(duì)應(yīng)的方法規(guī)則有很多,很靈活),對(duì)于接觸編程不久的朋友們來說很可能在編程的過程上浪費(fèi)很多時(shí)間,今天我把經(jīng)常會(huì)用到正則簡單介紹下,如果不是很特殊基本都覆蓋使用。
1.正則的簡單介紹
首先你得導(dǎo)入正則方法 import re 正則表達(dá)式是用于處理字符串的強(qiáng)大工具,擁有自己獨(dú)立的處理機(jī)制,效率上可能不如str自帶的方法,但功能十分靈活給力。它的運(yùn)行過程是先定一個(gè)匹配規(guī)則("你想要的內(nèi)容+正則語法規(guī)則"),放入要匹配的字符串,通過正則內(nèi)部的機(jī)制就能檢索你想要的信息。
2.findall的常用幾種姿勢
基本結(jié)構(gòu)大致: nojoke = re.findall(r'匹配的規(guī)則','要檢索的愿字符串') nojoke就是我們最后通過正則返回的結(jié)果,re正則findall查找全部r標(biāo)識(shí)代表后面是正則的語句(這樣在代碼多的時(shí)候好查閱),下面我們看看幾個(gè)例子好深入了解