发布网友
共2个回答
热心网友
import re
pattern = '<a.*?href="(.+)".*?>(.*?)</a>'
with open("test.html", "r") as fp:
for line in fp:
ret = re.search(pattern, line)
if ret:
for x in ret.groups(): print x
不知道具体格式是怎样的,我这里也就简单举个例子。
groups获取到的就是正则pattern里面( )中的内容,以元组形式返回。
热心网友
<a.*?href="([^"]*)".*?>([\S\s]*?)</a>