正则表达式是一种用于文本模式匹配的工具,匹配具有某种模式的内容无非是出于两个目的:1.提取匹配的内容;2.替换匹配的内容。在Python中是通过re模块来支持正则表达式操作。在之前的文章中,主要介绍的是findall函数。而在re模块中,有着大量的支持正则表达式的函数,如下是其中的核心函数:
函数参数中的pattern就是匹配规则,这个规则本身也是字符串类型。函数就是通过这个规则去匹配文本中能对应上的字符串,有多个匹配上的对象则返回多个对象。匹配符有以下的常见的类型:
对于Python入门的同学来说,简单了解这一块内容即可,除非是需要经常性地使用正则表达式,否则这些匹配规则也不用去背,用到了就查就行。对于做算法(非文本处理和挖掘)的同学来说,这块内容可能几乎不会涉及,了解就行。