Perl关联数组用法详解

本文和大家重点讨论一下Perl关联数组的概念,Perl关联数组的下标可以为任何简单/标量值,访问单个元素时以$符号打头,下标用大括号围起来。想了解Perl关联数组的具体内容请看本文详细介绍。

Perl关联数组

一、Perl关联数组变量的限制

在前面讲的数组变量中,可以通过下标访问其中的元素。例如,下列语句访问数组@array的第三个元素:
$scalar=$array[2];
虽然数组很有用,但它们有一个显著缺陷,即很难记住哪个元素存贮的什么内容。假如我们来写一个程序计算某文件中首字母大写的单词出现的次数,用数组来实现就比较困难,程序代码如下:

1:#!/usr/local/bin/perl  


2:  



3:while($inputline=){  




4:while($inputline=~/\b[A-Z]\S+/g){  




5:$word=$&;  




6:$word=~s/[;.,:-]$//;#removepunctuation  




7:for($count=1;$count<=@wordlist;  



8:$count++){  



9:$found=0;  



10:if($wordlist[$count-1]eq$word){  



11:$found=1;  



12:$wordcount[$count-1]+=1;  


13:last;  


14:}  


15:}  



16:if($found==0){  




17:$oldlength=@wordlist;  



18:$wordlist[$oldlength]=$word;  


19:$wordcount[$oldlength]=1;  


20:}  


21:}  


22:}  


23:print("Capitalizedwordsandnumberofoccurrences:\n");  



24:for($count=1;$count<=@wordlist;$count++){  



25:print("$wordlist[$count-1]:$wordcount[$count-1]\n");  


26:}  

运行结果如下:

HereisalineofInput.  


ThisInputcontainssomeCapitalizedwords.  


^D  


Capitalizedwordsandnumberofoccurrences:  


Here:1  


Input:2  


This:1  


Capitalized:1  


 

这个程序每次从标准输入文件读一行文字,第四行起的循环匹配每行中首字母大写的单词,每找到一个循环一次,赋给简单变量$word。在第六行中去掉标点后,查看该单词是否曾出现过,7~15行中在@wordlist中挨个元素做此检查,如果某个元素与$word相等,@wordcount中相应的元素就增加一个数。如果没有出现过,即@wordlist中没有元素与$word相等,16~20行给@wordlist和@wordcount增加一个新元素。

二、Perl关联数组定义

正如你所看到的,使用数组元素产生了一些问题。首先,@wordlist中哪个元素对应着哪个单词并不明显;更糟的是,每读进一个新单词,程序必须检查整个列表才能知道该单词是否曾经出现过,当列表变得较大时,这是很耗费时间的。
这些问题产生的原因是数组元素通过数字下标访问,为了解决这类问题,Perl定义了另一种数组,可以用任意简单变量值来访问其元素,这种数组叫做Perl关联数组,也叫哈希表。
为了区分Perl关联数组变量与普通的数组变量,Perl使用%作为其首字符,而数组变量以@打头。与其它变量名一样,%后的第一个字符必须为字母,后续字符可以为字母、数字或下划线。

三、访问Perl关联数组的元素

Perl关联数组的下标可以为任何简单/标量值,访问单个元素时以$符号打头,下标用大括号围起来。例如:
$fruit{"bananas"}
$number{3.14159}
$integer{-7}
简单变量也可作为下标,如:
$fruit{$my_fruit}

四、增加元素

创建一个Perl关联数组元素最简单的方法是赋值,如语句$fruit{"bananas"}=1;把1赋给Perl关联数组%fruit下标为bananas的元素,如果该元素不存在,则被创建,如果数组%fruit从未使用过,也被创建。
这一特性使得Perl关联数组很容易用于计数。下面我们用Perl关联数组改写上面的程序,注意实现同样的功能此程序简化了许多。

1:#!/usr/local/bin/perl  


2:  



3:while($inputline=){  




4:while($inputline=~/\b[A-Z]\S+/g){  




5:$word=$&;  




6:$word=~s/[;.,:-]$//;#removepunctuation  



7:$wordlist{$word}+=1;  


8:}  


9:}  


10:print("Capitalizedwordsandnumberofoccurrences:\n");  


11:foreach$capword(keys(%wordlist)){  


12:print("$capword:$wordlist{$capword}\n");  


13:}  


 

运行结果如下:

HereisalineofInput.  


ThisInputcontainssomeCapitalizedwords.  


^D  


Capitalizedwordsandnumberofoccurrences:  


This:1  


Input:2  


Here:1  


Capitalized:1  


 

相关推荐