通八洲科技

Python正则表达式实战案例_文本匹配与替换技巧【教程】

日期:2025-12-18 00:00 / 作者:冷炫風刃
Python正则表达式重在解决实际文本问题:1.手机号提取需兼顾格式与防误匹配;2.日志清洗用re.sub去除时间戳和IP;3.文件重命名靠捕获组调换顺序;4.邮箱识别需边界控制并生成mailto链接。

Python正则表达式不是背语法,而是解决实际文本问题的工具。掌握几个典型场景的写法,比记满页符号更有用。

提取手机号:兼顾常见格式和防误匹配

国内手机号通常为11位,以1开头,第二位常见3-9;但要注意避开“110”“119”等特殊号段,也别把带分隔符的字符串(如138-1234-5678)错当有效号码。

清洗日志行:去掉时间戳和IP,保留核心信息

服务器日志常形如 [2025-03-15 14:22:08] 192.168.1.100 "GET /api/user HTTP/1.1" 200,想只留请求路径和状态码。

批量重命名文件:从“report_20250315_v2.txt”改成“2025-03-15-report-v2.txt”

关键在捕获年月日并插入分隔符,同时调换字段顺序。

识别并高亮邮箱:在HTML中给邮箱加mailto链接

不是简单找@,要确保前后是合理字符边界,避免匹配到“abc@def@ghi”或“email@test.”这种无效串。