提升处理文本的效率《学习正则表达式》

Broadcasted at October 1, 2015 at 04:35PM:

Introducing-regular-expressions

原名: Introducing regular expressions
作者: 菲茨杰拉德
译者: 王热宇

对于经常处理文本、代码的人来说,对文本、字符的处理应该是最常见的操作了,虽然一般的文本处理软件如 Word、写字板、记事本都提供了基本的查找、替换功能,可以完成对规则的、能够完全匹配的字词进行修改,但是对于很多不规则、不能完全匹配却又一定规律的字词,就无能为力了。比如在一个文档中,有“第一章、第二章、第三章……”这种并非完全匹配但是却有一定规律的词,如果想把它改成“第 1 章、第 2 章、第 3 章……”,甚至改成“Chapter 1、Chapter 2、Chapter 3……”,使用普通的查找功能就捉襟见肘了,这时候需要祭出利器“正则表达式”了。

正则表达式,是计算机科学的一个概念,是指用单个字符串来描述、匹配一系列符合某个句法规则的字符串,在支持正则表达式文本编辑器里,可以用它来检索、替换那些符合某个模式的文本。如果对这个定义感觉无所适从,那就重新用“人话”说一遍。正则表达式并不能成为一种语言,它只是一种对字符串操作的一种逻辑公式,用事先定义好的一些特定字符、及这些特定字符的组合,组成一个“规则字符串”,这个“规则字符串”用来表达对字符串的一种过滤逻辑。

对于程序员来说,这是一个很常用的也很好用的工具。但对于非程序圈的人可能看到“正则表达式”这五个字就会习惯性的认为这是程序猿们的玩意儿,就直接无视了,但每当处理内容较多的文档时,不得不人工查找修改那些本能使用一句正则表达式就能批量搞定的字词。干嘛不学两句正则表达式呢?虽然正则表达式的名字看起来不像 Baymax 那么亲和,但是对字词的处理效率那是刚刚的。不论你是程序员、文员、学生、创业者,不需要精通,哪怕是掌握那么几条正则表达式,都能让你处理文本的效率上升几十上百倍。你要做的只是静下心来,跟它稍稍做一下接触。

《学习正则表达式》是一本十分“入门”的讲解正则表达式的书,它从正则表达式的基本概念讲起,到编写完整的 sed 和 Perl 脚本,再到转换HTML文件,将这种强大的工具解释得清晰且透彻。更重要的是,书里面还贯穿了大量简洁明了可以跟着操作的示例,以便更轻松地掌握正则表达式。此外,书中各在线和桌面工具一应俱全。虽然学习正则表达式更适合程序员和互联网从业者,但是我认为所有需要处理大量文本工作的人都可以学习一二,不用完全和精通,只需要掌握一点点就能让工作效率有极大的提升。

——————–

电子书下载:mobi格式 | azw3格式 | epub格式


以上内容由IFTTT自动发布,原文地址:http://kindlefere.com/post/190.html

Related Articles

Quote Of The Day