Python获取html的div标签内容问题

# 因为我没有学习过html,所以标题可能不准确
因为在Github(https://github.com/jiaweihli/manga_downloader)上看到了一个漫画下载脚本,不过只支持英文漫画网站,因为是Python脚本,在我能力之内,我打算自己写一个XinxinParser.熟悉了一下自定义函数之后,打算开始动手.虽然我没有学过html(计划在<Learning Python>之后),不过只要会正则表达式就大致可以查找到图片地址.可是新新的漫画图片地址,简单右键"查看网页源代码"是隐藏的?测试网址是:http://www.77mh.com/201305/247410.html(见图)

import re

reg = re.compile(r'<div id="comicImg"宽凯穗>慎卜<img.+id="drag"孙仿.+src="(.+)".+')
try:
img_source = reg.findall(you_html_content)[0]
except IndexError:
print "Empty img_url!!"

知识宝库

Python获取html的div标签内容问题

相关内容

最新更新