并行搜索
文章目錄
- 1 并行搜索
- 1.1 并發(fā)的基本概念
- 1.2 并行搜索
1 并行搜索
1.1 并發(fā)的基本概念
所謂并發(fā)是在同一實體上的多個事件同時發(fā)生。并發(fā)編程是指在在同一臺計算機上“同時”處理多個任務。
要理解并發(fā)編程,我們必須要理解如下一些基本概念:
- 計算機就像一座工廠,時刻在運行,為人類服務。它的核心是 CPU,它承擔了所有的計算任務,就像工廠的一個現(xiàn)場指揮官。
- 進程就像工廠里的車間,承擔“工廠”里的各項具體的“生產(chǎn)任務”,通常每個進程對應一個在運行中的執(zhí)行程序,比如,QQ 和微信運行的時候,他們分別是不同的進程。
因為特殊原因,現(xiàn)場指揮官人才短缺,整個工廠只有一個指揮官,一次只能指導一個車間生產(chǎn),而所有的車間都必須要有現(xiàn)場指揮官在場才能生產(chǎn)。也就是說,一個車間開工的時候,其他車間都必須停工。
背后的含義:任一時刻,單個 CPU 一次只能運行一個進程,此時其他進程處于非運行狀態(tài)。
一個車間(進程)可以包括多條生產(chǎn)線,線程就好比車間(進程)里的生產(chǎn)線。所有生產(chǎn)線(設備和人)都屬于同一車間的資源,受車間統(tǒng)一調(diào)度和調(diào)配,并共享車間所有資源(如空間或洗手間)。
背后的含義:一個進程可以擁有多個線程,每個線程可以可以獨立并行執(zhí)行,多個線程共享同一進程的資源,受進程管理。
1.2 并行搜索
理解了以上這些概念后,我們接下來再繼續(xù)講解并行搜索的概念:
- 假設我們要從很大的一個無序的數(shù)據(jù)集中進行搜索,假設我們的機器可以一次性容納這么多數(shù)據(jù)。從理論上講,對于無序數(shù)據(jù),如果不考慮排序,已經(jīng)很難從算法層面優(yōu)化了。而利用上面我們提到的并行處理思想,我們可以很輕松地將檢索效率提升多倍。具體實現(xiàn)思路如下:將數(shù)據(jù)分成 N 個塊,每個塊由一個 線程來并行搜索。
創(chuàng)建線程的演示代碼:
#include <Windows.h> #include <stdio.h> #include <iostream> #include <time.h>#define TEST_SIZE (1024*1024*200) #define NUMBER 20DWORD WINAPI ThreadProc(void* lpParam) {for (int i = 0; i < 5; i++) {printf("進程老爸,我來了!\n");Sleep(1000);}return 0; }int main(void) {DWORD threadID1;//線程 1 的身份證HANDLE hThread1;//線程 1 的句柄DWORD threadID2;//線程 2 的身份證HANDLE hThread2;//線程 2 的句柄printf("創(chuàng)建線程... ... \n");//創(chuàng)建線程 1hThread1 = CreateThread(NULL, 0, ThreadProc, NULL, 0, &threadID1);//創(chuàng)建線程 2hThread2 = CreateThread(NULL, 0, ThreadProc, NULL, 0, &threadID2);WaitForSingleObject(hThread1, INFINITE);WaitForSingleObject(hThread2, INFINITE);printf("進程老爸歡迎線程歸來!\n");system("pause");return 0; }并行搜索的演示代碼:
#include <Windows.h> #include <stdio.h> #include <iostream> #include <time.h>#define TEST_SIZE (1024*1024*200) #define NUMBER 20typedef struct _search {int* data;//搜索的數(shù)據(jù)集size_t start; //搜索的開始位置size_t end; //搜索的終止位置size_t count; //搜索結(jié)果 }search;DWORD WINAPI ThreadProc(void* lpParam) {search* s = (search*)lpParam;time_t start, end;printf("新的線程開始執(zhí)行...\n");time(&start);for (int j = 0; j < 10; j++) {for (size_t i = s->start; i <= s->end; i++) {if (s->data[i] == NUMBER) {s->count++;}}}time(&end);printf("查找數(shù)據(jù)所花時間: %lld\n", end - start);return 0; }int main02(void) {int* data = NULL;int count = 0;//記錄的數(shù)量int mid = 0;search s1, s2;data = new int[TEST_SIZE];for (int i = 0; i < TEST_SIZE; i++) {data[i] = i;}mid = TEST_SIZE / 2;s1.data = data;s1.start = 0;s1.end = mid;s1.count = 0;s2.data = data;s2.start = mid + 1;s2.end = TEST_SIZE - 1;s2.count = 0;DWORD threadID1;//線程 1 的身份證HANDLE hThread1;//線程 1 的句柄DWORD threadID2;//線程 2 的身份證HANDLE hThread2;//線程 2 的句柄printf("創(chuàng)建線程... ... \n");//創(chuàng)建線程 1hThread1 = CreateThread(NULL, 0, ThreadProc, &s1, 0, &threadID1);//創(chuàng)建線程 2hThread2 = CreateThread(NULL, 0, ThreadProc, &s2, 0, &threadID2);WaitForSingleObject(hThread1, INFINITE);WaitForSingleObject(hThread2, INFINITE);printf("進程老爸歡迎線程歸來!count: %d\n", s1.count + s2.count);system("pause");return 0; }int main(void) {int* data = NULL;int count = 0;//記錄的數(shù)量data = new int[TEST_SIZE];for (int i = 0; i < TEST_SIZE; i++) {data[i] = i;}time_t start = 0, end = 0;//記錄開始和結(jié)束的時間戳time(&start);for (int j = 0; j < 10; j++) {for (int i = 0; i < TEST_SIZE; i++) {if (data[i] == NUMBER) {count++;}}}time(&end);printf("查找數(shù)據(jù)所花時間: %lld, count: %d\n", end - start, count);system("pause");return 0; }參考資料:
總結(jié)