重庆分公司,新征程启航
为企业提供网站建设、域名注册、服务器等服务
1、打开JUPYTER NOTEBOOK,新建一个空白的PY文档。
创新互联公司专业为企业提供定州网站建设、定州做网站、定州网站设计、定州网站制作等企业网站建设、网页设计与制作、定州企业网站模板建站服务,10余年定州做网站经验,不只是建网站,更提供有价值的思路和整体网络服务。
2、import re首先必须要做的是引入regular expression。
3、a = re.compile(r' ')a.sub(r' ', 'my name is Peter.')可以定义两个空格的情况下变成一个空格。
4、也可以定义多个重复单词的时候,变成一个。
5、用+就可以代替一个或者多个的意思。
6、\s表示空格,可以定义两个或者两个以上就变成一个。
7、c = re.compile(r'\s{2,}'),c.sub(' ', 'My name is Peter.'),后续只能直接输入改成的字符。
python中提供了3种通过正则表达式匹配字符串的方法。种通过正则表达式匹配字符串的方法有以下三种。
1、贪婪匹配与非贪婪匹配:在定义用于匹配的模式串时,使用.*,则为贪婪匹配。使用.*,则为非贪婪匹配。
2、indall与search的选取问题:自己定义的模式串只能匹配到一个结果,使用search方法结合group方法可以直接得到这个字符串。自己定义的模式串能匹配到多个结果,则使用findall方法可以得到存储多个结果字符串的列表。
3、匹配时"()"和[]的用法:目标字符串‘abcde’[…]会匹配在[]内的任意一个字符,而不会匹配整个字符串。(…)会匹配在()内的整个字符串。使用search方法时则正常匹配(相当于没有()),使用findall方法时则只会匹配(…)的内容。)[]同时出现,考虑(…)式的字符串与[…]式内的字符和顺序,使用findall方法时结果会舍弃[…]内容,使用search方法时则正常匹配(相当于没有()和[])。
Regex 对象有一个 findall() 方法,它会返回包含所查找字符串的所有匹配。这与 search() 方法明显不同,search() 将返回一个 Match 对象,其中包含被查找字符串中的 “ 第一次 ” 匹配文本。请看以下示例,注意区分:
运行结果:
如果调用 findall 的正则表达式不存在分组(比如上例),那么方法 findall() 将返回一个匹配字符串的列表,例如上例的 ['0591-83822032', '0591-83822033']。
如果调用 findall 的正则表达式存在分组,那么方法 findall() 将返回一个字符串元组的列表(每个分组对应一个字符串),请看下例:
运行结果:
python正则匹配以xx开头以xx结尾的单词的步骤:
1、假设需要匹配的字符串为:site sea sue sweet see case sse ssee loses 需要匹配的为以s开头以e 结尾的单词。 正确的正则式为:\bs\S*?e\b
2、使用python中re.findall函数表示匹配字符串中所有的可能选项,re是python里的正则表达式模块。findall是其中一个方法,用来按照提供的正则表达式,去匹配文本中的所有符合条件的字符串。
3、代码和结果如下:
text ='site sea sue sweet see case sse ssee loses'
re.findall(r'\bs\S*?e\b',text)
结果为:['site', 'sue', 'see', 'sse', 'ssee']
扩展资料:
python正则匹配,以某某开头某某结尾的最长子串匹配
代码如下:
regVersions = re.search(r'(V|v)[0-9].*[0-9]', filename)
if regVersions:
print regVersions.group()