​    学习正则匹配的一些经验     ​

正则在爬虫领域使用很广泛,用来把网页中有价值的文本提取出来。这个提取技术就是用正则匹配。

我感觉正则匹配就是类型匹配,当你能认识清楚字符里面所有包含的类型和结构,那么你写出正则也就不难了。如何认识清楚文本中会有什么类型,看如下链接

​https://www.zhihu.com/question/48219401/answer/742444326​

在这篇文章中,我建议你认识好 这些基本的:

  • 1.元字符
  • 2.限定符
  • 3.分组
  • 4.条件或

认识完这些基础类型之后,写正则还是有点难,

建议跟着如下链接,把里面的练习都做一下,我包你会有新的感悟

把练习都做完后,一些正常难度的(初、中级)的正则你都能写了。

高级或进阶,自行学习吧。

​https://deerchao.cn/tutorials/regex/regex.htm#regexoptions​


工具

拥有一个好的调试工具,会让你能方便快捷的调试你的正则语句,这种及时的反馈感很重要,特别是新手的你。

bbedit下载地址

​https://apps.apple.com/cn/story/跟-bbedit-学正则表达式/id1485320067​

使用截图:

学习正则匹配的一些经验_数据库

学习正则匹配的一些经验_数据库_02