STL组件之算法

STL提供了大量的模板类和函数,可以在OOP和常规编程中使用。所有的STL的大约50个算法都是完全通用的,而且不依赖于任何特定的数据类型。下面的小节说明了三个基本的STL组件:

1)迭代器提供了访问容器中对象的方法。例如,可以使用一对迭代器指定list或vector中的一定范围的对象。迭代器就如同一个指针。事实上,C++的指针也是一种迭代器。但是,迭代器也可以是那些定义了operator*()以及其他类似于指针的操作符地方法的类对象。

2)容器是一种数据结构,如list,vector,和deques ,以模板类的方法提供。为了访问容器中的数据,可以使用由容器类输出的迭代器。

3)算法是用来操作容器中的数据的模板函数。例如,STL用sort()来对一个vector中的数据进行排序,用find()来搜索一个list中的对象。函数本身与他们操作的数据的结构和类型无关,因此他们可以在从简单数组到高度复杂容器的任何数据结构上使用。

函数和函数对象

STL中,函数被称为算法,也就是说它们和标准C库函数相比,它们更为通用。STL算法通过重载operator()函数实现为模板类或模板函数。这些类用于创建函数对象,对容器中的数据进行各种各样的操作。下面的几节解释如何使用函数和函数对象。

函数和断言

经常需要对容器中的数据进行用户自定义的操作。例如,你可能希望遍历一个容器中所有对象的STL算法能够回调自己的函数。例如

#include <iostream.h>  



#include <stdlib.h> // Need random(), srandom()  




#include <time.h> // Need time()  




#include <vector> // Need vector  




#include <algorithm> // Need for_each()  



 



#define VSIZE 24 // Size of vector  




vector<long> v(VSIZE); // Vector object  



 



// Function prototypes  




void initialize(long &ri);  




void show(const long &ri);  




bool isMinus(const long &ri); // Predicate function  



 



int main()  



{  



srandom( time(NULL) ); // Seed random generator  



 



for_each(v.begin(), v.end(), initialize);//调用普通函数  




cout << "Vector of signed long integers" << endl;  



for_each(v.begin(), v.end(), show);  


cout << endl;  


 



// Use predicate function to count negative values  




//  




int count = 0;  




vector<long>::iterator p;  




p = find_if(v.begin(), v.end(), isMinus);//调用断言函数  




while (p != v.end()) {  



count++;  


p = find_if(p + 1, v.end(), isMinus);  


}  



cout << "Number of values: " << VSIZE << endl;  




cout << "Negative values : " << count << endl;  



 



return 0;  



}  


 



// Set ri to a signed integer value  




void initialize(long &ri)  



{  


ri = ( random() - (RAND_MAX / 2) );  



// ri = random();  



}  


 



// Display value of ri  




void show(const long &ri)  



{  



cout << ri << " ";  



}  


 



// Returns true if ri is less than 0  




bool isMinus(const long &ri)  



{  



return (ri < 0);  



} 

所谓断言函数,就是返回bool值的函数。

函数对象

除了给STL算法传递一个回调函数,你还可能需要传递一个类对象以便执行更复杂的操作。这样的一个对象就叫做函数对象。实际上函数对象就是一个类,但它和回调函数一样可以被回调。例如,在函数对象每次被for_each()或find_if()函数调用时可以保留统计信息。函数对象是通过重载 operator()()实现的。如果TanyClass定义了opeator()(),那么就可以这么使用:

TAnyClass object; // Construct object  



object(); // Calls TAnyClass::operator()() function  



for_each(v.begin(), v.end(), object); 

STL定义了几个函数对象。由于它们是模板,所以能够用于任何类型,包括C/C++固有的数据类型,如long。有些函数对象从名字中就可以看出它的用途,如plus()和multiplies()。类似的greater()和less-equal()用于比较两个值。

注意

有些版本的ANSI C++定义了times()函数对象,而GNU C++把它命名为multiplies()。使用时必须包含头文件<functional>。

一个有用的函数对象的应用是accumulate() 算法。该函数计算容器中所有值的总和。记住这样的值不一定是简单的类型,通过重载operator+(),也可以是类对象。

Listing 8. accum.cpp

#include <iostream.h>  



#include <numeric> // Need accumulate()  




#include <vector> // Need vector  




#include <functional> // Need multiplies() (or times())  




#define MAX 10  




vector<long> v(MAX); // Vector object  




int main()  



{  



// Fill vector using conventional loop  




//  




for (int i = 0; i < MAX; i++)  



v[i] = i + 1;  



// Accumulate the sum of contained values  




//  




long sum =  



accumulate(v.begin(), v.end(), 0);  



cout << "Sum of values == " << sum << endl;  




// Accumulate the product of contained values  




//  




long product =  




accumulate(v.begin(), v.end(), 1, multiplies<long>());//注意这行  




cout << "Product of values == " << product << endl;  




return 0;  



} 

编译输出如下:

$ g++ accum.cpp  


$ ./a.out  



Sum of values == 55  




Product of values == 3628800 

『注意使用了函数对象的accumulate()的用法。accumulate() 在内部将每个容器中的对象和第三个参数作为multiplies函数对象的参数,multiplies(1,v)计算乘积。VC中的这些模板的源代码如下:

// TEMPLATE FUNCTION accumulate  



template<class _II, class _Ty> inline 



_Ty accumulate(_II _F, _II _L, _Ty _V)  



{for (; _F != _L; ++_F)  



_V = _V + *_F;  



return (_V); }  




// TEMPLATE FUNCTION accumulate WITH BINOP  




template<class _II, class _Ty, class _Bop> inline 



_Ty accumulate(_II _F, _II _L, _Ty _V, _Bop _B)  



{for (; _F != _L; ++_F)  



_V = _B(_V, *_F);  



return (_V); }  




// TEMPLATE STRUCT binary_function  




template<class _A1, class _A2, class _R>  




struct binary_function {  




typedef _A1 first_argument_type;  




typedef _A2 second_argument_type;  




typedef _R result_type;  



};  



// TEMPLATE STRUCT multiplies  




template<class _Ty>  




struct multiplies : binary_function<_Ty, _Ty, _Ty> {  




_Ty operator()(const _Ty& _X, const _Ty& _Y) const 




{return (_X * _Y); }  



}; 

引言:如果你想深入了解STL到底是怎么实现的,最好的办法是写个简单的程序,将程序中涉及到的模板源码给copy下来,稍作整理,就能看懂了。所以没有必要去买什么《STL源码剖析》之类的书籍,那些书可能反而浪费时间。』

(1)发生器函数对象

有一类有用的函数对象是“发生器”(generator)。这类函数有自己的内存,也就是说它能够从先前的调用中记住一个值。例如随机数发生器函数。

普通的C程序员使用静态或全局变量 “记忆”上次调用的结果。但这样做的缺点是该函数无法和它的数据相分离『还有个缺点是要用TLS才能线程安全』。显然,使用类来封装一块:“内存”更安全可靠。先看一下例子:

Listing 9. randfunc.cpp

#include <iostream.h>  



#include <stdlib.h> // Need random(), srandom()  




#include <time.h> // Need time()  




#include <algorithm> // Need random_shuffle()  




#include <vector> // Need vector  




#include <functional> // Need ptr_fun()  




using namespace std;  




// Data to randomize  




int iarray[10] = {1, 2, 3, 4, 5, 6, 7, 8, 9, 10};  




vector<int> v(iarray, iarray + 10);  




// Function prototypes  




void Display(vector<int>& vr, const char *s);  




unsigned int RandInt(const unsigned int n);  




int main()  



{  



srandom( time(NULL) ); // Seed random generator  




Display(v, "Before shuffle:");  




pinter_to_unary_function<unsigned int, unsigned int>  




ptr_RandInt = ptr_fun(RandInt); // Pointer to RandInt()//注意这行  



random_shuffle(v.begin(), v.end(), ptr_RandInt);  



Display(v, "After shuffle:");  




return 0;  



}  



// Display contents of vector vr  




void Display(vector<int>& vr, const char *s)  



{  


cout << endl << s << endl;  



copy(vr.begin(), vr.end(), ostream_iterator<int>(cout, " "));  



cout << endl;  


}  



// Return next random value in sequence modulo n  




unsigned int RandInt(const unsigned int n)  



{  



return random() % n;  



} 

编译运行结果如下:

$ g++ randfunc.cpp  


$ ./a.out  


Before shuffle:  


1 2 3 4 5 6 7 8 9 10  


After shuffle:  


6 7 2 8 3 5 10 1 9 4 

首先用下面的语句申明一个对象:

pointer_to_unary_function<unsigned int, unsigned int>  


ptr_RandInt = ptr_fun(RandInt); 

这儿使用STL的单目函数模板定义了一个变量ptr_RandInt,并将地址初始化到我们的函数RandInt()。单目函数接受一个参数,并返回一个值。现在random_shuffle()可以如下调用:

random_shuffle(v.begin(), v.end(), ptr_RandInt); 

在本例子中,发生器只是简单的调用rand()函数。

关于常量引用的一点小麻烦(不翻译了,VC下将例子中的const去掉)

(2)发生器函数类对象

下面的例子说明发生器函数类对象的使用。

Listing 10. fiborand.cpp

#include <iostream.h>  



#include <algorithm> // Need random_shuffle()  




#include <vector> // Need vector  




#include <functional> // Need unary_function  




using namespace std;  




// Data to randomize  




int iarray[10] = {1, 2, 3, 4, 5, 6, 7, 8, 9, 10};  




vector<int> v(iarray, iarray + 10);  




// Function prototype  




void Display(vector<int>& vr, const char *s);  




// The FiboRand template function-object class  




template <class Arg>  




class FiboRand : public unary_function<Arg, Arg> {  




int i, j;  



Arg sequence[18];  



public:  



FiboRand();  



Arg operator()(const Arg& arg);  



};  



void main()  



{  



FiboRand<int> fibogen; // Construct generator object  




cout << "Fibonacci random number generator" << endl;  




cout << "using random_shuffle and a function object" << endl;  




Display(v, "Before shuffle:");  



random_shuffle(v.begin(), v.end(), fibogen);  



Display(v, "After shuffle:");  



}  



// Display contents of vector vr  




void Display(vector<int>& vr, const char *s)  



{  


cout << endl << s << endl;  


copy(vr.begin(), vr.end(),  



ostream_iterator<int>(cout, " "));  



cout << endl;  


}  



// FiboRand class constructor  




template<class Arg>  



FiboRand<Arg>::FiboRand()  


{  


sequence[17] = 1;  


sequence[16] = 2;  



for (int n = 15; n > 0; n—)  



sequence[n] = sequence[n + 1] + sequence[n + 2];  


i = 17;  


j = 5;  


}  



// FiboRand class function operator  




template<class Arg>  




Arg FiboRand<Arg>::operator()(const Arg& arg)  



{  


Arg k = sequence[i] + sequence[j];  


sequence[i] = k;  


i--;  


j--;  



if (i == 0) i = 17;  




if (j == 0) j = 17;  




return k % arg;  



} 

编译运行输出如下:

$ g++ fiborand.cpp  


$ ./a.out  


Fibonacci random number generator  


using random_shuffle and a function object  


Before shuffle:  


1 2 3 4 5 6 7 8 9 10  


After shuffle:  


6 8 5 4 3 7 10 1 9 

该程序用完全不通的方法使用使用rand_shuffle。Fibonacci 发生器封装在一个类中,该类能从先前的“使用”中记忆运行结果。在本例中,类FiboRand 维护了一个数组和两个索引变量I和j。

FiboRand类继承自unary_function() 模板:

template <class Arg>  



class FiboRand : public unary_function<Arg, Arg> {... 

Arg是用户自定义数据类型。该类还定以了两个成员函数,一个是构造函数,另一个是operator()()函数,该操作符允许random_shuffle()算法象一个函数一样“调用”一个FiboRand对象。

(3)绑定器函数对象

一个绑定器使用另一个函数对象f()和参数值V创建一个函数对象。被绑定函数对象必须为双目函数,也就是说有两个参数,A和B。STL 中的帮定器有:

  • bind1st() 创建一个函数对象,该函数对象将值V作为第一个参数A。
  • bind2nd()创建一个函数对象,该函数对象将值V作为第二个参数B。

举例如下:

Listing 11. binder.cpp

#include <iostream.h>  



#include <algorithm>  




#include <functional>  




#include <list>  




using namespace std;  




// Data  




int iarray[10] = {1, 2, 3, 4, 5, 6, 7, 8, 9, 10};  




list<int> aList(iarray, iarray + 10);  




int main()  



{  



int k = 0;  



count_if(aList.begin(), aList.end(),  



bind1st(greater<int>(), 8), k);  




cout << "Number elements < 8 == " << k << endl;  




return 0;  



} 

Algorithm count_if()计算满足特定条件的元素的数目。 这是通过将一个函数对象和一个参数捆绑到为一个对象,并将该对象作为算法的第三个参数实现的。 注意这个表达式:

bind1st(greater<int>(), 8) 

该表达式将greater<int>()和一个参数值8捆绑为一个函数对象。由于使用了bind1st(),所以该函数相当于计算下述表达式:

8 > q

表达式中的q是容器中的对象。因此,完整的表达式

count_if(aList.begin(), aList.end(),  



bind1st(greater<int>(), 8), k); 

计算所有小于或等于8的对象的数目。

(4)否定函数对象

所谓否定(negator)函数对象,就是它从另一个函数对象创建而来,如果原先的函数返回真,则否定函数对象返回假。有两个否定函数对象:not1()和 not2()。not1()接受单目函数对象,not2()接受双目函数对象。否定函数对象通常和帮定器一起使用。例如,上节中用bind1nd来搜索 q<=8的值:

count_if(aList.begin(), aList.end(),  



bind1st(greater<int>(), 8), k); 

如果要搜索q>8的对象,则用bind2st。而现在可以这样写:

start = find_if(aList.begin(), aList.end(),  



not1(bind1nd(greater<int>(), 6))); 

你必须使用not1,因为bind1nd返回单目函数。

总结:使用标准模板库 (STL)

尽管很多程序员仍然在使用标准C函数,但是这就好像骑着毛驴寻找Mercedes一样。你当然最终也会到达目标,但是你浪费了很多时间。

尽管有时候使用标准C函数确实方便(如使用sprintf()进行格式化输出)。但是C函数不使用异常机制来报告错误,也不适合处理新的数据类型。而且标准C函数经常使用内存分配技术,没有经验的程序员很容易写出bug来。.

相关推荐