正則表達(dá)式處理文本有如疾風(fēng)掃秋葉,絕大部分編程語言都內(nèi)置支持正則表達(dá)式,它應(yīng)用在諸如表單驗(yàn)證、文本提取、替換等場景。爬蟲系統(tǒng)更是離不開正則表達(dá)式,用好正則表達(dá)式往往能收到事半功倍的效果。
介紹正則表達(dá)式前,先來看一個問題,下面這段文本來自豆瓣的某個網(wǎng)頁鏈接,我對內(nèi)容進(jìn)行了縮減。問:如何提取文本中所有郵箱地址呢?
html = """ <style> .qrcode-app{ display: block; background: url(/pics/qrcode_app4@2x.png) no-repeat; } </style> <div class="reply-doc content"> <p class="">34613453@qq.com,謝謝了</p> <p class="">30604259@qq.com麻煩樓主</p> </div> <p class="">490010464@163.com<br/>謝謝</p> """
延伸閱讀
學(xué)習(xí)是年輕人改變自己的最好方式