# 课程 11:捕获组
正则表达式不仅允许我们匹配文本,还允许我们提取信息以便进一步处理。这是通过定义字符组 (groups of characters) 并使用特殊的圆括号 ( 和 ) 元字符捕获它们来实现的。一对括号内的任何子模式 (subpattern) 都将被捕获 (capture) 为一个组 (group)。实际上,它可以用来从各种数据中提取诸如电话号码或电子邮件之类的信息。
例如,假设您有一个命令行工具来列出云中的所有图像文件,您可以使用 ^(IMG\d+\.png)$
等模式来捕获和提取完整的文件名。但如果只想捕获不带扩展名的文件名,您可以使用模式 ^(IMG\d+)\.png$
,该模式只捕获句点之前的部分。
尝试使用圆括号来编写一个正则表达式,匹配下面 PDF 文件的文件名 (不包括扩展名)。
练习 11:捕获组
Task | Text | Capture Groups | Result |
capture | file_record_transcript.pdf | file_record_transcript | |
capture | file_07241999.pdf | file_07241999 | |
skip | testfile_fake.pdf.tmp |
解决上述任务以继续下一个问题,或者查看答案。
← 课程 10:开始与结束 课程 12:嵌套组 →