华南俳烁实业有限公司

python

當(dāng)前位置:中華考試網(wǎng) >> python >> pythonWeb前端開發(fā) >> 文章內(nèi)容

怎么用python正則獲取網(wǎng)頁(yè)內(nèi)容

來(lái)源:中華考試網(wǎng)  [2020年11月10日]  【

  相信很多小伙伴剛接觸正則這個(gè)詞語(yǔ),腦海中一點(diǎn)概念也沒有,其實(shí)從字面上我們稍微能夠揣摩到一點(diǎn),這需要去“接觸”內(nèi)容,由此,那就可以展開本章話題。

  先看一組后臺(tái)收到的代碼數(shù)據(jù),要求正則獲取網(wǎng)頁(yè)內(nèi)容:

  *以下為網(wǎng)頁(yè)源代碼,一個(gè)列表(12行),需要獲取 ID后面的數(shù)字和中文內(nèi)容,并保存到文本。

  1

  2

  3

  4

  5

  6

  7

  8

  9

  中文內(nèi)容試聽

  中文內(nèi)容2試聽

  中文內(nèi)容3試聽

  代碼演示:

  1

  2

  3

  4

  5

  6

  7

  8

  9

  10

  11

  12

  13

  14

  15

  16

  17

  #!/usr/bin/env python

  #coding=utf-8

  import re

  string = '''

  中文內(nèi)容試聽

  中文內(nèi)容2試聽

  中文內(nèi)容3試聽

  '''

  match = re.findall("

  (.*?)\<",string)

  for x,y in match:

  print x,y.decode('utf-8')

  認(rèn)識(shí)正則表達(dá)式:

  正則表達(dá)式就是對(duì)字符串進(jìn)行操作的邏輯公式,相當(dāng)于‘過濾’這個(gè)字符串。一開始學(xué)習(xí)可能是懵懂的,小編就是這樣,后來(lái)一直不停的復(fù)習(xí),總算是學(xué)會(huì)了。

python課程免費(fèi)試聽預(yù)約

  • 地區(qū):
  • 姓名:
  • 手機(jī):

  常用正則表達(dá)式:

  單字符:

  . : 除換行以外所有字符

  [] :[aoe] [a-w] 匹配集合中任意一個(gè)字符

  \d :數(shù)字 [0-9]

  \D : 非數(shù)字

  \w :數(shù)字、字母、下劃線、中文

  \W : 非\w

  \s :所有的空白字符包,括空格、制表符、換頁(yè)符等等。等價(jià)于 [ \f\n\r\t\v]。

  \S : 非空白

  數(shù)量修飾:

  * : 任意多次 >=0

  + : 至少1次 >=1

  ? : 可有可無(wú) 0次或者1次

  {m} :固定m次 hello{3,}

  {m,} :至少m次

  {m,n} :m-n次

  邊界:

  $ : 以某某結(jié)尾

  ^ : 以某某開頭

責(zé)編:fushihao

上一篇:認(rèn)識(shí)pythonweb框架--Django

下一篇: 沒有了

  • 會(huì)計(jì)考試
  • 建筑工程
  • 職業(yè)資格
  • 醫(yī)藥考試
  • 外語(yǔ)考試
  • 學(xué)歷考試
湟中县| 丹阳市| 永胜县| 齐齐哈尔市| 外汇| 宁陕县| 武汉市| 漳平市| 嘉义市| 许昌市| 股票| 云南省| 河曲县| 防城港市| 封开县| 岳阳县| 青河县| 长宁区| 金门县| 凤凰县| 长沙县| 罗江县| 昌宁县| 美姑县| 建瓯市| 磴口县| 康乐县| 禄丰县| 雷州市| 佳木斯市| 新竹县| 化州市| 石家庄市| 泾川县| 梁山县| 沧州市| 河源市| 府谷县| 五家渠市| 沂南县| 鄂州市|