这篇博文很简单,只是因为我对Perl语言实在不熟悉,所以这里简单记录一下。

今天在写实验代码的时候,突然有了这样一个需求,就是用Perl将包含换行(或回车)的字符串变成一行,并且每一行用空格分隔,经过搜索,网友介绍了这样的写法:

$string=~ s/[\n\r]/ /g;

其实也很好理解,这里把网友的解释摘抄过来:=~ s/A/B/g  可以起到替换的作用,就是将内容A替换成内容B,后面的g是全局的意思,也就“全部替换”的意思。

[AB]意为A或者B两种情况。

Perl的转义字符和C很相似:

\n 换行
\r 回车
\t 水平制表符(Tab)
\b 退格
\e Esc (ASCII编码的转义字符)
\\ 反斜线
\" 双引号

所以上面这种写法就很好理解了。

另外在Perl中删除字符串前后空格的方法:

$string =~ s/^\s+//;
$string =~ s/\s+$//;

再举两个例子:
$str =~ s/\s\s+//g;  #-----全局替换2个以上的空格为空
$AAA =~ s/[\n\r]*//g
[ AB ]表示出现在中括号的是任意的其中一个,\n和\r是换行符 ,[\n\r]*中的*号表示0个或以上
总结起来,上面这条语句的含义是:将$AAA中的所有的换行符全部替换为空,也就是将所有换行去掉。

另外转载一下网友介绍的Perl正则表达式匹配规则:

++++++++++++++++++++++++++++++++++++++++++

对于一些常用的匹配方式有时候不需要去编写复杂的匹配模式,正则表达式的\w \s \d \b与量词的组合能帮我们解决很多事情。
\w 匹配一个字母、数字或下划线字符,相当于[a-zA-Z_0-9]
\s 匹配一个空字符
\d 匹配一个数字
\b 匹配单词的首尾
这些修饰符的大写形式为它们匹配的相反情况。


这样我们要匹配连续的字符串可以用 \w+    匹配一个单词用 \b\w+\b    匹配空白用\s+
匹配所有字符用[\d\D],匹配除换行符之外的所有字符用“.”

最开始我说过, Perl 的最强大之处在于处理 文本 。然而,在前两篇(一、二) ,我只介绍了如何来匹配模式。本文 我将演示如何通过模式来改变 字符串 ,即如何使用正则表达式来处理 文本 替换 s///:如果将m//看作“查询”,那s///操作则类似于“查询并 替换 ”,它将 替换 模式所匹配上的部分。m//可以和任何 字符串 表达式进行比配,但显然s///只能修改被称为左值的数据, 其它一些编程语言 ,有函数ltrim和rtrim分别用于从 字符串 开头和末尾 删除 空格 和制表符。 也有的提供了函数trim来 删除 字符串 两端的空白字符。 Perl 里没这些函数因为简单的正则表达式 替换 就能实现这个目的(不过我确信CPAN有很多模块实现了这些函数)。 事实上这太简单了以至于成了帕金森琐碎定理里的一个显著主题。 使用正则表达式分两步走:先去掉前面的: $a=~s/^ +//;在去掉后面的: $a=~s/ +$//;一步就可以:s/(^s+|s+$)//g; 删除 字符串 末尾的换行:chomp函数通常会 删除 变量里包含的 字符串 尾部的换行符。它是chop函数的一个略微安全些的版本,因为它对没有换行符的 字符串 没有影响。更准确地说,它根据了解$/的当前值 删除 字符串 终止符,而不只是最后一个字符。和chop不同,... <br /><br /> 替换 文件 的字符<br />将以下文件 的RF*****,<br /><br />>RF00001;5S_rRNA;DQ397844.1/16860-16979   414005:Cenarchaeum symbiosum B<br />CAAGCCGGCCAUAGCGUCAGGGUGCGACCCAAUCCCAUUCCGAACUUGGA<br />AGUCAAACCUGAUGUCGCUGUUGUGUUACUAAGAUGCGAGAGCUCUUGGG<br />AAGCAACAGUGCU m//模式用来匹配 文本 ,也就是说用来找数据。而s///用来查找并 替换 文本 ,所以可以用来处理 文本 文件。在有了正则的基础之后,s///用起来会简单很多。 用法格式为: $str =~ s/reg/replacement/FLAGS; 它表示用reg去搜索$str 的内容,并将搜索出来的内容 替换 为replacement。 1.s///的斜线可以 替换 为其他对称的符号(括号类)或相同的符号。 例如...