北京中科医院好不好 http://pf.39.net/bdfyy/bdfjc/170317/5252031.html接上节内容,我们对实现项目的流程函数功能进行了分析,这节主要实现不动产登记流程优化了用Python爬取具体优化流程(一)中涉及的几个函数。get_html(url,reg):传入网址和正则表达式,输出查找到的网页信息。get_html实现过程down_load(file_name,res_url):传入资源网址和存储名称,将资源(图片、pdf文件)下载到本地create_floder(floder_name):创建一个文件夹,用于存储资源文件parent_floder():从资源文件夹中跳入上一级目录,用于下一次下载et_html_pro(url):传入网址,根据类型对各个网址进行处理,输入包含各个资源网址的字典down_load\create_floder\parent_flodeformat_dict(r_dict):对信息网址格式进行处理format_dict实现过程get_html_pro(url):利用BeautifulSoup对信息进行提取(提取具体图片内容,个人感觉比re稍微好用一点)get_html_pro实现过程几个函数实现了,我们如何将这些函数拼接成轮子,这个我们下节课探讨。有兴趣的童鞋可以敲到电脑上看一下哦。下一节我们附上源代码。欢迎留言讨论,转载请注明出处(百家号:Python高手养成)
转载请注明:http://www.aierlanlan.com/cyrz/7491.html