Исследование и реализация эффективных методов анализа производительности параллельных программ
Диссертация
Также необходимо заметить, что большинство существующих инструментов используют ручной метод анализа, где пользователь должен самостоятельно выполнять поиск узких мест производительности приложения на основе представленных диаграмм, графиков, таблиц и методов манипулирования ими (масштабирование и поиск). Представление информации о производительности программы в графическом виде может быть мощным… Читать ещё >
Список литературы
- Андреев Н. Е. Методы автоматизированного анализа производительности параллельных программ / / Вестник Новосибирского государственного университета. 2009. Т. 7, № 1. С. 16−25.
- Андреев Н. Е. Обзор методов автоматизированной оценки эффективности выполнения параллельных программ / / Деп. в ВИНИТИ 22.06.09, № 390-В2009. 2009. С. 34.
- Андреев Н. Е., Афанасьев К. Е. Организация сбора и подготовки данных для анализа производительности ИРС-программ // Вестник Кемеровского государственного университета. 2011. № 4 (44). С. 4−10.
- Андреев Н. Е., Афанасьев К. Е. Реализация инструментального средства автоматизированного анализа производительности иРС-программ // Вычислительные методы и программирование. 2011. Раздел 2. С. 46−57. (http://num-meth.srcc.msu.ru/).
- Андреев Н. Е., Афанасьев К. Е. Использование пакета 8са1азса в качестве основы для анализа производительности иРС-программ // Научное творчество молодежи: Материалы XV Всероссийской научно-практической конференции. Анжеро-Судженск, 2011. С. 98−100.
- Андреев Н. Е. Инструментальное средство автоматизированного анализа производительности UPC-программ / / Материалы XLIX Международной научной студенческой конференции «Студент и научно-технический прогресс». Новосибирск, 2011. С. 219−219.
- Андреев Н. Е. Архитектура системы автоматизированного анализа UPC-программ // Материалы XVII всероссийской научно-методической конференции «Телематика'2010». Санкт-Петербург, 2010. С. 164−166.
- Андреев Н. Е. Система автоматизированного поиска шаблонов неэффективного поведения UPC-программ // Тезисы докладов Пятой Сибирской конференции по параллельным и высокопроизводительным вычислениям. Томск, 2009. С. 81−82.
- Воеводин В. В., Воеводин Вл. В. Параллельные вычисления. СПб.: БХВ, 2002. С. 608.
- Вычислительные кластерные системы производства ОАО НИЦЭВТ Электронный ресурс. URL: http://www.nicevt.ru/techniques/81/86/ (дата обращения: 30.08.2010).
- Межрегиональный супервычислительный центр ТГУ Электронный ресурс. URL: http://skif.tsu.ru/ (дата обращения: 30.08.2010).
- Проекты университета George Washington University Электронный ресурс. URL: http://hpcl2.hpcl.gwu.edu/index.php/projects (дата обращения: 30.08.2010).
- Сайт суперкомпыотерного центра коллективного пользования ИДСТУ СО РАН Электронный ресурс. URL: http://mvs.icc.ru/ (дата обращения: 30.08.2010).
- Сапронов А. Обзор некоторых пакетов измерения производительности кластерных систем Электронный ресурс. URL: http: //www. ixbt. com/cpu/cluster-benchtheory. shtml (дата обращения: 30.08.2010).
- Слуцкин А., Эйсымонт JI. Российский суперкомпьютер с глобально адресуемой памятью // Открытые системы. 2007. № 9. С. 42−51.
- Сущенко С. Параллельные вычисления. Томск: ТГУ, 2003. С. 196.
- Allen Е., Chase D., Flood С. et al. Project Fortress: A multicore language for multicore processors // Linux Magazine. 2007. Pp. 38−43.
- Almasi G., Cascaval C. Proposal to extend UPC array types with multiple blocking factors Electronic resource., URL: http://www2.hpcl.gwu.edu/pgas09/upct iledproposal. pdf (дата обращения: 30.08.2010).
- Amdahl G. M. Validity of the single processor approach to achieving large scale computing capabilities // AFIPS '67 (Spring): Proceedings of the April 18−20, 1967, spring joint computer conference. New York, NY, USA: ACM, 1967. Pp. 483−485.
- Bailey D., Barszcz E., Barton J. et al. The NAS Parallel Benchmarks: Tech. Rep. RNR-94−007: NASA Ames Research Center, 1994.
- Bailey D., Harris Т., Saphir W. et al. The NAS Parallel Benchmarks 2.0: Tech. Rep. NAS-95−020: NASA Ames Research Center, 1995.
- Barton C., Casgaval C., Almasi G. et al. Shared memory programming for large scale machines // PLDI '06: Proceedings of the 2006 ACM SIGPLAN conference on Programming language design and implementation. New York, NY, USA: ACM, 2006. Pp. 108−117.
- Beech-Brandt J. Applications of UPC Electronic resource. URL: http://www.nesc.ac.uk/talks/892/applicationsofupc.pdf (дата обращения: 30.08.2010).
- Bell С., Bonachea D., Nishtala R., Yelick K. Optimizing bandwidth limited problems using one-sided communication and overlap //In 20th International Parallel and Distributed Processing Symposium (IPDPS). 2006.
- Berkeley UPC Home Page Electronic resource., URL: http://upc.lbl.gov/ (дата обращения: 30.08.2010).
- Bonachea D. Proposal for Extending the UPC Memory Copy Library Functions Electronic resource. URL: http: //upc. lbl. gov/publications/upcmemcpy. pdf (дата обращения: 30.08.2010).
- Bonachea D. Proposal for Extending the UPC Memory Copy Library Functions, v2.0 Electronic resource. URL: http: //upc. lbl. gov/publications/upcmemcpy. pdf (дата обращения: 30.08.2010).
- Bonachea D. Proposal for High-Performance Clock Timers in UPC Electronic resource., https://upc-wiki.lbl.gov/images/9/9b/Upctick0.2.pdf обращения: 30.08.2010).1. WallURL: (дата
- Bonachea D. UPC Collectives Value Interface Electronic resource., URL: http://upc.lbl.gov/docs/user/README-collectivev.txt (дата обращения: 30.08.2010).
- Bonachea D., Datta K., Gay D. et al. Titanium Language Reference Manual Electronic resource., URL: http ://titanium.es.berkeley.edu/doc/lang-ref.pdf (дата обращения: 30.08.2010).
- Bonachea G. Proposal for Extending the UPC Libraries with Explicit Point-to-Point Synchronization Support Electronic resource. URL: http://www2.hpcl.gwu.edu/pgas09/upcsem.pdf (дата обращения: 30.08.2010).
- Cascaval С., Almasi G., Saraswat V. Proposal to Extend UPC with Asynchronous Execution Electronic resource. URL: http: //www2. hpcl. gwu. edu/pgas09/upcAsync. pdf (дата обращения: 30.08.2010).
- Chamberlain В. L., Callahan D., Zima H. P. Parallel programmability and the chapel language // International Journal of High Performance Computing Applications. 2007. Vol. 21. Pp. 291−312.
- Chandy K. M., Misra J. Distributed computation on graphs: shortest path algorithms // Commun. ACM. 1982. Vol. 25, no. 11. Pp. 833−837.
- Co-Array Fortran Home Page. URL: http://www.co-array.org/ (дата обращения: 30.08.2010).
- DeRose L., Hoover T. The Dynamic Probe Class Library An Infrastructure for Developing Instrumentation for Performance Tools //In International Parallel and Distributed Processing Symposium. 2001.
- Eclipse РТР Home Page Electronic resource., URL: http://www.eclipse.org/ptp/ (дата обращения: 30.08.2010).
- El-Ghazawi Т. UPC Language Specifications Electronic resource. URL: http: //www. gwu. edu/~upc/documentation. html (дата обращения: 30.08.2010).
- El-Ghazawi Т., Cantonnet F. UPC Performance and Potential: A NPB Experimental Study //In Sup er computing2002 (SC2002). IEEE Computer Society, 2002. Pp. 1−26.
- El-Ghazawi Т., Cantonnet F., Saha P., Yao Y. UPC-IO: A Parallel I/O API for UPC Electronic resource. URL: http://upc.gwu.edu/docs/upciol. 0.2. pdf (дата обращения: 30.08.2010).
- El-Ghazawi Т., Serres О., Bahra S. et al. Parallel Programming of HighPerformance Reconfigurable Computing Systems with Unified Parallel С // Proceedings of the Fourth Annual Reconfigurable Systems Summer Institute (RSSI'08). 2008.-July.
- Flaviu C. Probabilistic Clock Synchronization // Distributed Computing. 1989. Vol. 3, no. 3. Pp. 146−158.
- Gonzalez-Dominguez J., J. Martin M., Taboada G. L. et al. A Parallel Numerical Library for UPC // Euro-Par '09: Proceedings of the 15th International Euro-Par Conference on Parallel Processing. Berlin, Heidelberg: Springer-Verlag, 2009. Pp. 630−641.
- Gordon В., Nguyen N. Overview and Analysis of UPC as a Tool in Cryptanalysis Electronic resource. URL: http://www.hcs.uf1.edu/upc/archive/UPCCryptanalysisReport-310CT03.pdf (дата обращения: 30.08.2010).
- GWU UPC Benchmark Electronic resource. URL: http: //www. gwu. edu/~upc/downloads/upcbench. tar. gz (дата обращения: 30.08.2010).
- Helm В. R., Malony A. D., Fickas S. Capturing and automating performance diagnosis: the Poirot approach // Proceedings of the 9th International Parallel Processing Symposium (IPPS '95). IEEE Computer Society, 1995. Pp. 606−613.
- High Productivity Computing Systems Program Electronic resource., URL: http://www.highproductivity.org/ (дата обращения: 30.08.2010).
- Intrepid UPC Home Page Electronic resource., URL: http://www.gccupc.org/ (дата обращения: 30.08.2010).
- CRAY Research. Introducing the MPP Apprentice Tool, 1994.
- Johnson A. A. CFD on the Cray X1E using Unified Parallel С Electronic resource. URL: http://upc.gwu.edu/upcworkshop05/ahpcrc-UPCUserForum.pdf (дата обращения: 30.08.2010).
- Jose J., Luo M., Sur S., Panda D. K. Unifying UPC and MPI Runtimes: Experience with MVAPICH // Proc. of Int’l Workshop on Partitioned Global Address Space (PGAS '10). 2010.
- Krasnov A., Schultz A.- Wawrzynek J. et al. Ramp blue: a message-passing manycore system in FPGAs //In 2007 International Conference on Field Programmable Logic and Applications, FPL 2007. 2007. Pp. 27−29.
- Leko A. Performance Analysis Strategies Electronic resource. URL: http://www.hcs.uf1.edu/prj/upcgroup/upcperf/documents/-20 050 302-AnalysisDraft.pdf (дата обращения: 30.08.2010).
- Leko A., Bonachea D., Su H.-H., George A. GASP: A Performance Analysis Tool Interface for Global Address Space Programming Models: Tech. Rep. LBNL-61 606: Lawrence Berkeley National Lab, 2006.
- Leko, А, Sherburne H., Su II. et al. Practical Experiences with Modern Parallel Performance Analysis Tools: An Evaluation Electronic resource. URL: http://www.hcs.ufl.edu/upc/archive/toolevals/WhitepaperEval-Summary.pdf (дата обращения: 30.08.2010).
- Luecke G. R., Coyle J., Hoekstra J. et al. Evaluating error detection capabilities of UPC run-time systems // PGAS '09: Proceedings of the Third Conference on Partitioned Global Address Space Programing Models. New York, NY, USA: ACM, 2009. Pp. 1−4.
- Mesh generation using Delaunay triangulation in UPC Electronic resource., URL: http://upc.lbl.gov/demos/delaunay.shtml (дата обращения: 30.08.2010).
- Miller В. P., Clark M., Hollingsworth J. et al. IPS-2: The Second Generation of a Parallel Program Measurement System // IEEE Transactions on Parallel and Distributed Systems. 1990. Vol. 1. Pp. 206−217.
- MPI NAS Parallel Benchmarks Project Page Electronic resource., URL: http://www.nas.nasa.gov/Resources/Software/npb.html (дата обращения: 30.08.2010).
- Numrich R. W. Co-Array Fortran for parallel programming // ACM Fortran Forum. 1998. Vol. 17. Pp. 1−31.
- Oliker L., Canning A., Carter J. et al. Scientific application performance on candidate petascale platforms //In Proc. of the International Parallel & Distributed Processing Symposium (IPDPS). 2007.
- Rabenseifner R. The controlled logical clock a global time for trace based software monitoring of parallel applications in workstation clusters // In
- Proc. of the 5th EUROMICRO Workshop on Parallel and Distributed Processing (PDP). 1997. Pp. 477−484.
- Berkeley UPC Team. The 'bupcatomic*' function family Electronic resource., URL: http: //upc. lbl. gov/docs/user/index. shtml#atomics (дата обращения: 30.08.2010).
- Berkeley UPC Team. Runtime thread layout query for hierarchical systems Electronic resource. URL: http://upc.lbl.g0v/d0cs/user/#threaddist (дата обращения: 30.08.2010).
- Cray Inc. Cray С and С++ Reference Manual Electronic resource., URL: http://docs.cray.com/books/S-2179−72 (дата обращения: 30.08.2010).
- Hewlett-Packard Company. HP UPC/HP SHMEM User’s Guide Electronic resource., URL: http://www.hp.com/go/upc (дата обращения: 30.08.2010).
- High-End Computing Revitalization Task Force. Federal Plan for High-End Computing Electronic resource. URL: http://www.nitrd.gov/pubs/2004hecrtf/2 004 0702hecrtf.pdf (дата обращения: 30.08.2010).
- High-End Computing Revitalization Task Force. Federal Plan for High-End Computing Electronic resource. URL: http://www.nitrd.gov/pubs/2004hecrtf/2 004 0702hecrtf.pdf (дата обращения: 30.08.2010).
- Intel Corporation. Intel Trace Analyzer Reference Guide Electronic resource., URL: http://software.intel.com/sites/products/documentation/-hpc/itac/itareferenceguide.pdf (дата обращения: 30.08.2010).
- LBNL, UC Berkeley. Berkeley UPC User’s Guide Electronic resource., URL: http://upc.lbl.gov/docs/user/index.shtml (дата обращения: 30.08.2010).
- Message Passing Interface Forum. MPI: A Message-Passing Interface Standard Electronic resource., URL: http://www.mpi-forum.org (дата обращения: 30.08.2010).
- The Scalasca Development Team. CUBE 3.3 User Guide: Generic Display for Application Performance Data Electronic resource. URL: http://www.fz-juelich.de/jsc/datapool/scalasca/cube3-wx.pdf (дата обращения: 30.08.2010).
- RMIT HPC Resources Wiki Electronic resource., URL: http://its-ru-hpc-mgmt.cs.rmit.edu.au/doku.php (дата обращения: 30.08.2010).
- Serres О., Kayi A., Anbar A., El-Ghazawi T. A UPC Specification Extension Proposal for Hierarchical Parallelism Electronic resource. URL: http://www2.hpcl.gwu.edu/pgas09/hierarchicalparallelism.pdf (дата обращения: 30.08.2010).
- SGI Unified Parallel С (UPC) User’s Guide Electronic resource., URL: http://techpubs.sgi.com/library/manuals/5000/007−5604−002/pdf/007−5604−002.pdf (дата обращения: 30.08.2010).
- Shende S. S. The role of instrumentation and mapping in performance measurement: Ph.D. thesis / University of Oregon. 2001.
- Shende S. S., Malony A. D. The Tau Parallel Performance System // The International Journal of High Performance Computing Applications. 2006. Vol. 20. Pp. 287−331.
- Su H. H., Billingsley M., George A. D. Parallel Performance Wizard: A Performance Analysis Tool for Partitioned Global-Address-Space Programming Models //In Proceedings, ACM/IEEE Conference on Supercomputing (SC 2006) Poster Session. 2006.
- Sunderam V. S. PVM: a framework for parallel distributed computing // Concurrency: Pract. Exper. 1990. Vol. 2, no. 4. Pp. 315−339.
- Thorsen A. Atomic Memory Operations proposal Electronic resource. URL: http://www.cs.mtu.edu/ athorsen/research/atomic/-atomicproposal.pdf (дата обращения: 30.08.2010).
- Titanium Home Page Electronic resource. URL: http://titanium.cs.berkeley.edu/ (дата обращения: 30.08.2010).
- TotalView Technologies Home Page Electronic resource. URL: http://www.totalviewtech.com/ (дата обращения: 30.08.2010).
- Truong H. L., Fahringer Т. Scalea a Performance Analysis System for Distributed and Parallel Programs //In 8th International Euro-Par Conference. Springer, 2002. Pp. 75−85.
- UPC CFD Visualization Electronic resource., URL: http: //upc. lbl. gov/demos/UPC-CFD. shtml (дата обращения: 30.08.2010).
- UPC NAS Parallel Benchmarks Project Page Electronic resource. URL: http://threads.hpcl.gwu.edu/sites/npb-upc (дата обращения: 30.08.2010).
- UPC Projects at MTU Electronic resource., URL: http://www.upc.mtu.edu/ (дата обращения: 30.08.2010).
- UUPC SSCA #3 Electronic resource., URL: http://threads.hpcl.gwu.edu/sites/ssca3 (дата обращения: 30.08.2010).
- Vetter J. Performance analysis of distributed applications using automatic classification of communication inefficiencies // ICS '00: Proceedings of the 14th international conference on Supercomputing. New York, NY, USA: ACM, 2000. Pp. 245−254.
- Wibecan B. F. UPC: Privatizing Functions Electronic resource. URL: http://www2.hpcl.gwu.edu/pgas09/HPUPCProposal.pdf (дата обращения: 30.08.2010).
- Wijngaart R. The NAS Parallel Benchmarks 2.4: Tech. Rep. NAS-02−007: NASA Ames Research Center, 2002.
- Wolf F. Automatic Performance Analysis on Parallel Computers with SMP Nodes: Ph. D. thesis / RWTH Aachen, Forschungszentrum Julich. 2003.
- Wolf F., Bhatia N. EARL API Documentation: High-Level Trace Access Library: Tech. Rep. ICL-UT-04−03: Forschungszentrum Julich, University of Tennessee, 2004.
- Wolf F., Mohr В. Automatic Performance Analysis of MPI Applications Based on Event Traces // Euro-Par '00: Proceedings from the 6th International Euro-Par Conference on Parallel Processing. London, UK: SpringerVerlag, 2000. Pp. 123−132.
- Wolf F., Mohr В. Specifying performance properties of parallel applications using compound events // On-line monitoring systems and computer tool interoperability. Commack, NY, USA: Nova Science Publishers, Inc., 2003. Pp. 91−110. ISBN: 1−59 033−888-X.
- Wolf F., Mohr В., Bhatia N. et al. EPILOG Binary Trace-Data Format: Tech. Rep. FZJ-ZAM-IB-2004−06: Forschungszentrum Julich, 2004.