第一章為程序設計基礎,本文為1.6.3泛型編程。
>>>>1.泛型編程
下面將進一步以一個簡單的循環查找為例,全面考察算法的泛化問題。假設要編寫一個findValue()函數,在array數組中尋找一個特定的int值,詳見程序清單 1.29。
程序清單 1.29 findValue()查找函數(1)
1 int *findValue(int *arrayHead, int arraySize, int value)
2 {
3 for(int i =0; i < arraySize; ++i)?
4 if(arrayHead[i] == value)
5 break;
6 return &(arrayHead[i]);
7 }
該函數在某個范圍內查找value,返回的是一個指針,指向它所找到的第一個符合條件的元素。如果沒有找到,則返回最后一個元素的下一個位置(地址)。“最后元素的下一個位置”稱為end,其作用是返回end表示“查找無結果”,為何不返回null呢?因為end指針可以對其它種類的數據結構帶來泛化的效果,這是null做不到的。
在學習數組時,我們就被告誡,千萬不要超越其下標范圍,但事實上一個指向array元素的指針,不但可以合法地指向array的任何位置,也可以指向array尾端以外的任何位置。只不過,當指針指向array尾端以外的位置時,它只能用于與其它array指針相比較,不能間接引用其值。findValue()函數的使用方式如下:
const int arraySize = 7;
int array[arraySize] = {0, 1, 2, 3, 4, 5, 6};
int *end = array + arraySize;
int *ip = findValue(array, sizeof(array) / sizeof(int), 4);
if(ip == end)
return false;
else
return true;
顯然,findValue()函數暴露了數組的實現細節,比如,arraySize,太過于依賴特定的數據結構。那么,如何設計一個算法,使它適用于大多數數據結構呢?或者說,如何在即將處理的未知的數據結構上,正確地實現所有的操作呢?事實上,一個序列有開始和結尾,既可以使用++得到下一個元素,也可以使用“*”得到當前元素的值。
顯然,讓閱讀代碼的人理解你的本意,至關重要是取一個不會讓人產生誤解的名字。對于包含范圍,常用first和last。對于包含/排序范圍,常用begin和end。比如,對于大多數需要分片的數組,使用begin和end表示包含/排除范圍是最好的選擇。遺憾的是,類似limit、filter和length這樣具有多義性的英文單詞會帶來一定的困惑,而定義一個值的上限或下限時,max_和min_就是很好的前綴。
為了讓findValue()函數適用于所有類型的數據結構,其操作應該更抽象化,讓findValue()函數接受兩個指針作為參數,表示一個操作范圍,詳見程序清單 1.30。
程序清單1.30findValue()查找函數(2)
1 int *findValue(int *begin, int *end, int value)
2 {
3 while(begin != end && *begin != value)
4 ++begin;
5 return begin;
6 }
由于findValue函數的返回值begin是一個指針,因此該函數是一個返回指針的函數,即指針函數。這個函數在“前閉后開”范圍[begin, end)內(包含了begin迭代器的當前元素,而到end迭代器的前一個元素為止)查找value,并返回一個指針,指向它所找到的第一個符合條件的元素,如果沒有找到就返回end。這里之所以用“!=”,而不是用“<”判斷是否到達數組的尾部,因為這樣處理更精確。findValue()函數的使用方式如下:
const int arraySize = 7;
int array[arraySize] = {0, 1, 2, 3, 4, 5, 6};
int *end = array + arraySize;
int *ip = findValue(array, end, 4);
if(ip == end)
return false;
else
return true;
當然,findValue()函數也可以方便地用于查找array的子范圍:
int *ip = findValue(array + 2, array + 5, 3);
if(ip == end)
return false;
else
return ture;
由此可見,findValue()函數中并無任何操作是針對特定的整數array的,即只要將操作對象的類型加以抽象化,且將操作對象的表示法和范圍目標的移動行為抽象化,則整個算法就可以工作在同一個抽象層面上了。通常將整個算法的過程稱為算法的泛型化,簡稱泛化。泛化的目的旨在使用同一個findValue()函數處理各種數據結構,通過抽象創建可重用代碼。
如果一個序列是有序的,則不需要用finValue()從開始位置查找,可以使用標準C提供的bsearch()二分查找算法。對于一個更長的序列,二分查找也比findValue()線性查找法的速度更快。即使序列中只有10個元素,也足以體現二分查找的比較優勢。對于一個有1000個元素的序列,最多需要進行10次比較,其查找的速度要快200倍。
顯然,求數組中元素的最大值,其最好的方法是通過傳遞2個指針指定元素范圍。一個指針標識數組的開頭,另一個指針標識數組的尾部。比如:
int iMax(const int *begin, const int *end);
顯然,如果只是傳遞指針,數據就有被修改的可能。如果不希望數據被修改,就要傳遞指向整數常量的指針。使用for循環的示例如下:
for(ptr = begin; ptr != end; ptr++)
total = total +*ptr;
將ptr設置為待處理的第一個元素(begin指向的元素)的指針,并將*ptr(元素的值)加入到total中。然后循環通過遞增操作來更新ptr,使之指向下一個元素。只要ptr不等于end,這一過程將繼續下去。當ptr等于end時,它將指向范圍中的最后一個元素后面的位置,此時循環結束。其次,請注意不同的函數調用是如何指定數組中不同的范圍的。比如:
int array[] = {39, 33, 18, 64, 73, 30, 49, 51, 81};
int n = sizeof(array) / sizeof(array[0]);
int *past = array + n;
int max = iMax(array, array + n);
int max = iMax(array, array + 3);
int max = iMax(array +3, array + 8);
指針array+n指向最后一個元素后面的一個位置(數組只有n個元素,最后一個元素的地址為array+n-1),因此范圍[array,array+n]指定的是整個數組。同樣array,array+3指定了前3個元素,依此類推。注意,根據指針減法規則,表達式end–begin是一個整數值,等于數組的元素個數。
-
算法
+關注
關注
23文章
4607瀏覽量
92840 -
軟件設計
+關注
關注
3文章
58瀏覽量
17770 -
周立功
+關注
關注
38文章
130瀏覽量
37616
原文標題:周立功:算法的泛化問題,你應該知道
文章出處:【微信號:ZLG_zhiyuan,微信公眾號:ZLG致遠電子】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論