Python 正则表达式
Python 正则表达式
速查
1 | import sys |
匹配次数
1 | . 匹配任意字符一次 |
常用语法
1 | re.S 匹配所有的字符 |
常用功能
创建正则表达式对象
1 | compile(pattern[, flags]) |
#根据包含正则表达式的字符串创建模式对象
全文查找符合表达式的对象
1 | search(pattern, string[, flags]) |
从头开始查找符合表达式的对象
1 | match(pattern, string[, flags]) |
分割字符串
1 | split(pattern, string[, maxsplit=0,flags]) |
寻找所有符合表达式的对象
1 | findall(pattern, string,flags) |
替换字符串
1 | sub(pat,repl, string[,count=0,flags]) |
注意 表 示 字 符 串 的 结 尾 , 所 以 加 上 表示字符串的结尾,所以加上 表示字符串的结尾,所以加上表示匹配的内容必须在字符串的结尾
匹配整个字符串还要加上字符串开始标记^
注意写爬出的时候可以用正则表达式匹配多个对象,然后遍历的时候使用yield生成器,可以组合成字典的形式,然后把字典给json.dumps()转换成json的格式,最后保存在本地文本中。
常规匹配的正则语法
1 | 汉字:[\u4e00-\u9fa5]{0,} |
All articles in this blog are licensed under CC BY-NC-SA 4.0 unless stating additionally.