阅读内容 

利用Perl开发Internet/Intranet应用之二(2)

[日期:2005-04-17] 来源:中国站长学院  作者:郁郁小蝎 [字体: ]
----2 强大的字串处理功能

----在前面已提过perl具有非常强大的字串处理功能,它除了提供一些字符运算比较符(eq,ne,le...)外,还提供了大量针对字符串匹配的参数。这是其它一些CGI编写语言所不具有的。

----我们经常会遇到,传递的参数是中文信息,但接收到后却都是乱码。这是什么原因呢?我们都知道,一个中文占用2个字节,而一个英文字母只占用1个字节,unicode编码除外(unicode是Microsoft提出的标准,采用16位同时对中英日韩等多国文字进行编码的机制)。server接收到参数信息后,会以字节为单位把每单位信息转换为两个十六进制数,这时候,中文的高字节会被转换为"%**",而低字节也被转换为"%**"。如果使用perl,该参数信息非常容易就能被还原出来。

...
$info=$ENV{'QUERY_STRING'};
#读取参数信息到变量$info中
$info=~s/%([\dA-Fa-f][\dA-Fa-f])
/pack("c",hex($1))/eg;

----该语句的语法含义是:s是取代的意思;"/"中的内容是要找的格式(“=~”是一些特殊字符,具体含义见表一);%([\dA-Fa-f][\dA-Fa-f])表示以%开始,后连续跟着两个十六进制数的字串(\dA是一些字符匹配格式,具体含义见表二),找到该字串后,系统把该值存放在$1中;pack("c",hex($1))表示把$1中的数转换为真正的十六进制字串;e表示把整个要替换的字串当做表达式;g表示整个字串都要做相应的查找替换。

----除了转换中文参数外,我们还经常要面对查找、替代诸如log文件、邮件等大量信息的困难;如果使用perl提供的一系列参数,将省去很多不必要的麻烦。限于篇幅关系,下面仅列出一些常用的参数。

----表一:

=~寻找给定字串的特殊格式
m取消//内“^”、“$”的特殊含义
i字串匹配时不考虑大小写
x字串匹配时不考虑空格
s取代的意思

表二:
\w匹配一个文字或数字字符,包括“_”
\W匹配一个非文字/数字字符
\s匹配一个空白字符,包括“space”、“tab”键入的字符
\S匹配一个非空白字符
\d匹配一个数字字符
\D匹配一个非数字字符
\b匹配一个二进制字符
\B匹配一个非二进制字符
\A仅从字串开始进行匹配
\Z仅从字串最后进行匹配
\G表示m/结束
阅读:
录入:

推荐 】 【 打印
相关新闻      
本文评论       全部评论
发表评论
  • 尊重网上道德,遵守中华人民共和国的各项有关法律法规
  • 承担一切因您的行为而直接或间接导致的民事或刑事法律责任
  • 本站管理人员有权保留或删除其管辖留言中的任意内容
  • 本站有权在网站内转载或引用您的评论
  • 参与本评论即表明您已经阅读并接受上述条款


点评: 字数
姓名:
Advertisement
内容查询


Advertisement