华南俳烁实业有限公司

python

當(dāng)前位置:中華考試網(wǎng) >> python >> python爬蟲 >> 文章內(nèi)容

Python爬蟲教程之利用正則表達(dá)式匹配網(wǎng)頁內(nèi)容

來源:中華考試網(wǎng)  [2020年12月28日]  【

  正則表達(dá)式是一種描述字符串排列的一種語法規(guī)則,通過該規(guī)則可以在一個大字符串中匹配出滿足規(guī)則的子字符串。簡單來說,就是給定了一個字符串,在字符串中找到想要的字符串,如一個電話號碼,一個IP地址,一個字段,在爬蟲過程中,如果靈活使用正則表達(dá)式,將極大地提升爬蟲效率。

  Python使用正則表達(dá)式

  re.match

  1

  2

  3

  4import restr1='123asdfa'mathch1 = re.match("^[0-9]",str1)print(mathch1.group())

  結(jié)果

  1

  如果要匹配12,則

  1

  2

  3

  4import restr1='12s3asdfa'mathch1 = re.findall("1[0-9]",str1)print(mathch1)

  結(jié)果

  ['12']

  修改[0-9]為[10-19]是無法匹配到的。

  因此,該語句將從頭到尾匹配字符,匹配到則結(jié)束,需要.group才能獲取到匹配到的值。

責(zé)編:zp032348

上一篇:Python3爬蟲里tesserocr該如何去安裝?

下一篇: 沒有了

  • 會計考試
  • 建筑工程
  • 職業(yè)資格
  • 醫(yī)藥考試
  • 外語考試
  • 學(xué)歷考試
马山县| 奉新县| 泰来县| 菏泽市| 宁陕县| 扬中市| 嘉定区| 汾阳市| 长寿区| 章丘市| 桐梓县| 株洲市| 客服| 将乐县| 长岭县| 冕宁县| 花莲县| 越西县| 泽库县| 罗山县| 吴川市| 专栏| 定襄县| 灌云县| 新邵县| 潮州市| 晋江市| 故城县| 卓尼县| 新龙县| 全州县| 东阿县| 新营市| 甘泉县| 仙居县| 托克逊县| 常宁市| 平阳县| 温宿县| 连平县| 舟曲县|