教程归类:第14章、正则表达式

Python中的正则表达式(第1节)


正则表达式的英文为“Regular Expression”,在计算机编程中简写为regex、regexp或RE,其中“Regular”翻译为“正则”、“正规”、“常规”、“规则”、“规律”,“Regular Expression”可以理解为“描述某种规则的表达式”。

在Python中,正则表达式是一种强大的文本处理工具,它能够以某个规则匹配、搜索、替换或拆分复杂的字符串,被广泛运用于字符串处理、文本分析、数据挖掘等领域。正则表达式在程序开发中会经常用到,比如在登录页面对输入的字符串进行合法性验证,在输入邮箱用户名时,系统会对输入的内容进行合法性验证,邮箱用户名可以包含字母、数字、点号“....

......

阅读全文

Python中的re模块(第2节)


re模块

Python标准库中的re模块提供了正则表达式相关的操作,re模块提供了不少有用的函数,比如:re.match()函数、re.compile()函数、re.search()函数、re.findall()函数、re.finditer()函数、re.split()函数、re.sub()函数、re.subn()函数等。re模块使Python语言拥有全部的正则表达式功能。

在前面的教程中,我们已经讲解过,反斜杠“\”在字符串中用作转义字符,可以和其它字母形成转义字符,比如Python会识别字符串中“\n”转义字符并自动转换成“换行符”,所以想要表示一个反斜杠“\”就必须写成“\\”这种...

......

阅读全文

Python中re模块之分组匹配与断言(第3节)


1、分组匹配

Python中进行匹配操作时,在正则表达式中加入括号“()”,可以对匹配到的字符串进行分组,目的是分离我们匹配到的字符串。使用group()方法可以获取匹配的所有内容,也可以获取匹配结果中指定分组的内容,另外,还可以通过groups()方法把所有匹配出来的分组加入到元组中。例如:

动手练一练:

import re

a1 = r"(\w+)\s+(\d+)"  # 分离姓名和电话号码
b1 = "Maria 123456789"

result = re.match(a1, b1)

name = result.group(1)
ph...
......

阅读全文