Algorithmes parallles auto-adaptatifs et applications.ppt
《Algorithmes parallles auto-adaptatifs et applications.ppt》由会员分享,可在线阅读,更多相关《Algorithmes parallles auto-adaptatifs et applications.ppt(81页珍藏版)》请在麦多课文档分享上搜索。
1、Algorithmes parallles auto-adaptatifs et applications,Daouda TRAORDirecteurs de thse Jean-Louis ROCH & Denis TRYSTRAM Projet MOAIS Laboratoire dInformatique de Grenoble (UMR 5217), FranceVendredi 19 Dcembre 2008,Motivations,Evolution des machines parallles: de machines avec processeurs identiques ve
2、rs: Grilles de calcul = ressources htrognes et dynamiquesSystmes multi-processus (Processeurs multi-curs, SMP, MPsoc) applications concurrentes sur une mme unit = les curs apparaissent comme de vitesses variablesProcesseurs graphiques : GPUs + CPUs= htrognit, frquences et oprations diffrentesQuestio
3、ns: Est-ce quun algorithme parallle peut fonctionner dans ce contexte? Avec quelles garanties de performance ? Sous quelles hypothses?,2/52,Evolution de la programmation parallle,Grille,Multi-coeurs, SMP,GPU,Google MapReduce,OpenMP, Cilk+, intel TBB,Cuda,Athapascan/Kaapi,Initialement: processeurs id
4、entiques (MPI)Aujourdhui: Interfaces de haut-niveau permettant dabstraire larchitecture.,3/52,Construction dalgorithmes parallles adaptatifsSadaptent la plate-forme dexcution Inconscients du nombre de processeurs (en anglais, processor oblivious) Adaptation la charge de la plate-forme Avec des garan
5、ties defficacit Temps dexcution si possible optimal p/r aux ressources (dynamiquement) allouesContexte: LIG / EP INRIA Moais:Thme sur la conception dalgorithmes adaptatifs Roch&al gzip2001, TSI2005,.Master ROCO D. Traor 2005 : un algorithme de prfixe adaptatif (mais clairvoyant),4/52,Objectif de la
6、thse,Introduction objectifs et contributions, organisationProgrammation parallle notionsAlgorithmes parallles adaptatifsdfinitionsUn algorithme adaptatif pour le calcul parallle des prfixes EUROPAR06, CARI06Algorithmes adaptatifs de tri parallle RENPAR08Schma gnrique des algorithmes parallles adapta
7、tifs PDP08, EUROPAR08Application du schma la librairie standard STL EUROPAR08, MSAS08Conclusion et perspectives,5/52,Plan du mmoire et contributions,Algorithmes pour processeurs identiques: illustration sur le calcul parallle des prfixes Ordonnancement par vol de travailSchma gnrique adaptatifAlgori
8、thme adaptatif pour le calcul parallle des PrfixesApplication du schma la STLConclusion et perspectives,6/52,Plan de la prsentation,Algorithmes pour processeurs identiques: illustration sur le calcul parallle des prfixes,Calcul des prfixes Entre : x0, x1, , xn Sortie : p0, p1, ., pn avec Application
9、s : paralllisation de boucles, additions modulaires Blelloch89Algorithme squentiel :for(p0=x0, i=1; i = n; i+) pi=pi-1*xi; / n oprationsBorne infrieure sur p processeurs identiques : Paralllisation optimale sur p processeurs identiques Snir86, Nicolau-Wang96,7/52,Fich83,Algorithmes pour processeurs
10、identiques: illustration sur le calcul parallle des prfixes,Un nouvel algorithme optimal pour le calcul des prfixes chap. 3, pages 27-36- Soit s et q le quotient et le reste de la division de n+1 par p+1:n+1 = s(p+1) + qDivision du tableau initial en p+1 blocs de taille ventuellement diffrentes,8/52
11、,Algorithmes pour processeurs identiques: illustration sur le calcul parallle des prfixes,s+1,s+1,s+2,s+2,Algorithme statique en p+1 blocs,9/52,10/52,Algorithmes pour processeurs identiques: illustration sur le calcul parallle des prfixes,Analyse thorique du temps dexcution de lalgorithme propos et
12、le nombre doprations vrifie :Remarque: Une variante donne un temps toujours optimal, mais na pas t programme,Si 0 q 1 et (p+3)/2 q p, alors le temps dexcution de lalgorithme (optimal) sur p processeurs identiques vrifie,Thorme chap. 3, page 30,Si 2 q (p+3)/2, alors le temps dexcution de lalgorithme
13、1 de loptimal sur p processeurs identiques vrifie,Thorme chap. 3, pages 31 et 32,Algorithmes pour processeurs identiques: illustration sur le calcul parallle des prfixes,11/52,taille,temps,acclration,taille,Machine AMD Opteron,n petit, temps dune opration assez lev,n grand, temps dune opration trs p
14、etit (temps daddition de deux Doubles par exemple). Dans lalgorithme de Nicolau-Wang On a 2n/(p+1) synchronisations,4 processeurs,1 processeur,Algorithmes pour processeurs identiques: illustration sur le calcul parallle des prfixes,Inconvnients de la paralllisation sur des processeurs identiquesNomb
15、re doprations : toujours le mme si les p processeurs initialement prvus pour lexcution ne sont pas disponibles. Exemple : si on suppose que Un seul processeur excute lalgorithme parallle Les autres tant mobiliss pour dautres calculs= le nombre doprations effectues par un seul processeur est Lalgorit
16、hme optimal sur processeurs identiques nest pas performant Si les processeurs sont de vitesses diffrentes (temps dexcution final = temps dexcution du processeur le plus lent) Si le temps de lopration * est variable,12/52,Algorithmes pour processeurs identiques: illustration sur le calcul parallle de
17、s prfixes Ordonnancement par vol de travailSchma gnrique adaptatifAlgorithme adaptatif pour le calcul parallle des PrfixesApplication du schma la STLConclusion et perspectives,13/52,Plan de la prsentation,Principe Suit le principe glouton : tout instant o il existe une tche prte non encore ordonnanc
18、e, tous les processeurs sont actifs. Algorithme distribu Chaque processeur gre localement une pile des tches quil a rendues prtes (cres, ou dbloques).,tches,P0,P1,P2,Lorsquun processeur devient inactif, il choisit (au hasard) un processeur dont la pile en cours dexcution contient une tche prte et lu
19、i vole une tche (la plus ancienne, en haut de la pile (FIFO).,steal,14/52,Ordonnancement par vol de travail,Blelloch90, , Leiserson & Kuszmaul 2001,Modle de cot associ au vol de travail (1/2),Notations W = travail = le nombre doprations de lalgorithme parallle sur 1 processeur Tp = la dure dexcution
20、 de lalgorithme parallle sur p processeurs D = la profondeur de lalgorithme parallle (le nombre doprations sur le chemin critique)Pave = la vitesse moyenne des p processeurs :ThormeArora, Blumofe, Plaxton 02, Bender, Rabin 02Avec une grande probabilit; Le temps dexcution Tp dun programme utilisant l
21、ordonnancement par vol de travail est major par : Le nombre de vols (russis ou chous) est infrieure O(p.D),15/52,Modle de cot associ au vol de travail (2/2),Efficacit de la paralllisation Wseq = travail de l algorithme squentiel Tseq = temps dexcution de lalgorithme squentiel : Intrt : Si W Wseq et
22、D trs petit, En gnral W c1Wseq, c1 mesure le surcot d lordonnancement et au paralllisme. Surcot de paralllisme Gestion des tches : tches empiles dans une pile Exemple : algorithme rcursif,Grain fin : surcot arithmtique (rcursivit)Minimisation du surcot dordonnancement Principe du travail dabordFrigo
23、 et al98, Roch01Ce principe consiste minimiser le surcot de cration de tches de lordonnancement par vol de travail. Appels de cration de tches traduits en appel local de fonction squentielle.,16/52,Cilk Frigo et al 98 Cration de tches : spawn Synchronisation : sync Architectures cibles : mmoires par
- 1.请仔细阅读文档,确保文档完整性,对于不预览、不比对内容而直接下载带来的问题本站不予受理。
- 2.下载的文档,不会出现我们的网址水印。
- 3、该文档所得收入(下载+内容+预览)归上传者、原创作者;如果您是本文档原作者,请点此认领!既往收益都归您。
下载文档到电脑,查找使用更方便
2000 积分 0人已下载
下载 | 加入VIP,交流精品资源 |
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- ALGORITHMESPARALLLESAUTOADAPTATIFSETAPPLICATIONSPPT

链接地址:http://www.mydoc123.com/p-378180.html