Preview

Труды Института системного программирования РАН

Расширенный поиск

Разработка и реализация облачной системы для решения высокопроизводительных задач

Аннотация

В данной работе описаны основные проблемы, возникающие при переносе высокопроизводительных вычислений в облако. Рассматривается подход к организации высокопроизводительного облачного сервиса с использованием виртуализации. Описана архитектура разработанной системы «виртуальный суперкомпьютер», основанной на облачной платформе OpenStack и системе виртуализации KVM/QEMU. Компоненты системы ВСК доработаны для учета специфики высокопроизводительных вычислений, в частности, выполнена доводка и настройка системы виртуализации, что позволило достичь уровня накладных расходов не более 10% при использовании по крайней мере 1024 процессорных ядер.

Об авторах

А. О. Кудрявцев
ИСП РАН
Россия


В. К. Кошелев
ИСП РАН
Россия


А. О. Избышев
ИСП РАН
Россия


И. А. Дудина
ИСП РАН
Россия


Ш. Ф. Курмангалеев
ИСП РАН
Россия


А. И. Аветисян
ИСП РАН
Россия


В. П. Иванников
ИСП РАН
Россия


В. Е. Велихов
ИСП РАН
Россия


Е. А. Рябинкин
ИСП РАН
Россия


Список литературы

1. Michael Armbrust, Armando Fox, Rean Griffith, Anthony D. Joseph, Randy H. Katz, Andrew Konwinski, Gunho Lee, David A. Patterson, Ariel Rabkin, Ion Stoica, and Matei Zaharia. Above the Clouds: A Berkeley View of Cloud Computing. Technical Report UCB/EECS-2009-28, EECS Department, University of California, Berkeley, Feb 2009.

2. Peter Mell and Tim Grance. The NIST Definition of Cloud Computing. Technical report, July 2009.

3. xCAT – Extreme Cloud Administration Toolkit. http://xcat.sourceforge.net/, 1999. [Online; accessed 14-May-2013].

4. Moab Suite. http://www.adaptivecomputing.com/products/. [Online; accessed 14-May-2013].

5. D. Nurmi, R. Wolski, C. Grzegorczyk, G. Obertelli, S. Soman, L. Youseff, and D. Zagorodnov. The eucalyptus open-source cloud-computing system. In Cluster Computing and the Grid, 2009. CCGRID ’09. 9th IEEE/ACM International Symposium on, pages 124–131, 2009.

6. Katarzyna Keahey, Ian Foster, Tim Freeman, and Xuehai Zhang. Virtual workspaces: Achieving quality of service and quality of life in the grid. Scientific Programming, 13(4):265–275, 2005.

7. J Fontán, T Vázquez, L Gonzalez, Ruben S Montero, and IM Llorente. Opennebula: The open source virtual machine manager for cluster computing. In Open Source Grid and Cluster Software Conference, 2008.

8. Apache CloudStack: Open Source Cloud Computing. http://cloudstack.apache.org/, 2010. [Online; accessed 14-May-2013].

9. OpenStack Open Source Cloud Computing Software. http://www.openstack.org/, 2010. [Online; accessed 14-May-2013].

10. Amazon Elastic Compute Cloud (Amazon EC2). http://aws.amazon.com/ec2/, 2006. [Online; accessed 14-May-2013].

11. Windows Azure: Microsoft’s Cloud Platform. http://www.windowsazure.com/en-us/, 2010. [Online; accessed 14-May-2013].

12. Google Compute Engine. https://¬cloud.google.com/¬products/¬compute-engine, 2012. [Online; accessed 14-May-2013].

13. Lavanya Ramakrishnan, Piotr T. Zbiegel, Scott Campbell, Rick Bradshaw, Richard Shane Canon, Susan Coghlan, Iwona Sakrejda, Narayan Desai, Tina Declerck, and Anping Liu. Magellan: experiences from a science cloud. In Proceedings of the 2nd international workshop on Scientific cloud computing, ScienceCloud ’11, pages 49–58, New York, NY, USA, 2011. ACM.

14. G. von Laszewski, G.C. Fox, Fugang Wang, A.J. Younge, A. Kulshrestha, G.G. Pike, W. Smith, J. Vöckler, R.J. Figueiredo, J. Fortes, and K. Keahey. Design of the futuregrid experiment management framework. In Gateway Computing Environments Workshop (GCE), 2010, pages 1–10, 2010.

15. Bcfg2 – A Configuration Management System. http://¬trac.mcs.anl.gov/¬projects/-bcfg2/¬, 2004. [Online; accessed 14-May-2013].

16. Paul Marshall, Henry Tufo, Kate Keahey, David LaBissoniere, and H.M. Woitaszek. Architecting a large-scale elastic environment – recontextualization and adaptive cloud services for scientific computing. In Proceedings of the 7th International Conference on Software Paradigm Trends (ICSOFT), Rome, Italy, 2012.

17. CEI Elastic Processing Unit (EPU) Services and Agents. https://¬github.com/¬ooici/-epu, 2011. [Online; accessed 14-May-2013].

18. TORQUE Resource Manager. http://¬www.adaptivecomputing.com/¬products/¬open-source/¬torque/¬, 2003. [Online; accessed 14-May-2013].

19. Chef Configuration Management. http://¬www.adaptivecomputing.com/¬products/¬, 2009. [Online; accessed 14-May-2013].

20. Kate Keahey, Patrick Armstrong, John Bresnahan, David LaBissoniere, and Pierre Riteau. Infrastructure outsourcing in multi-cloud environment. In Proceedings of the 2012 workshop on Cloud services, federation, and the 8th open cirrus summit, FederatedClouds ’12, pages 33–38, New York, NY, USA, 2012. ACM.

21. Jens-Sönke Vöckler, Gideon Juve, Ewa Deelman, Mats Rynge, and Bruce Berriman. Experiences using cloud computing for a scientific workflow application. In Proceedings of the 2nd international workshop on Scientific cloud computing, ScienceCloud ’11, pages 15–24, New York, NY, USA, 2011. ACM.

22. Ewa Deelman, Gurmeet Singh, Mei-Hui Su, James Blythe, Yolanda Gil, Carl Kesselman, Gaurang Mehta, Karan Vahi, G Bruce Berriman, John Good, Anastasia Laity, Joseph C. Jacob, and Daniel S. Katz. Pegasus: A framework for mapping complex scientific workflows onto distributed systems. Scientific Programming, 13(3):219–237, 2005.

23. K. Keahey, M. Tsugawa, A. Matsunaga, and J. A B Fortes. Sky computing. Internet Computing, IEEE, 13(5):43–51, 2009.

24. Sage A Weil, Scott A Brandt, Ethan L Miller, Darrell DE Long, and Carlos Maltzahn. Ceph: A scalable, high-performance distributed file system. In Proceedings of the 7th symposium on Operating systems design and implementation, pages 307–320. USENIX Association, 2006.

25. Avi Kivity, Yaniv Kamay, Dor Laor, Uri Lublin, and Anthony Liguori. kvm: the linux virtual machine monitor. In Proceedings of the Linux Symposium, volume 1, pages 225–230, 2007.

26. Paul Barham, Boris Dragovic, Keir Fraser, Steven Hand, Tim Harris, Alex Ho, Rolf Neugebauer, Ian Pratt, and Andrew Warfield. Xen and the art of virtualization. ACM SIGOPS Operating Systems Review, 37(5):164–177, 2003.

27. Fabrice Bellard. Qemu, a fast and portable dynamic translator. USENIX, 2005.

28. А. О. Кудрявцев, В. К. Кошелев, А. И. Аветисян. Перспективы виртуализации высокопроизводительных систем архитектуры x64. Труды Института системного программирования РАН, том 22, c. 189–209, 2012.

29. Alexander Kudryavtsev, Vladimir Koshelev, and Arutyun Avetisyan. Modern HPC cluster virtualization using KVM and palacios. In High Performance Computing (HiPC), 2012 19th International Conference on, pages 1–9, 2012.

30. Alexander Kudryavtsev, Vladimir Koshelev, Boris Pavlovic, and Arutyun Avetisyan. Virtualizing HPC applications using modern hypervisors. In Proceedings of the 2012 workshop on Cloud services, federation, and the 8th open cirrus summit, FederatedClouds ’12, pages 7–12, New York, NY, USA, 2012. ACM.

31. А.О. Кудрявцев, В.К. Кошелев, А.О. Избышев, А.И. Аветисян. Высокопроизводительные вычисления как облачный сервис: ключевые проблемы. Параллельные вычислительные технологии (ПаВТ’2013): труды международной научной конференции, с. 432–438, 2013.

32. Rob F Van der Wijngaart and Parkson Wong. Nas parallel benchmarks version 2.4. Technical report, NAS technical report, NAS-02-007, 2002.

33. Piotr R Luszczek, David H Bailey, Jack J Dongarra, Jeremy Kepner, Robert F Lucas, Rolf Rabenseifner, and Daisuke Takahashi. The hpc challenge (hpcc) benchmark suite. In Proceedings of the 2006 ACM/IEEE conference on Supercomputing, page 213. Citeseer, 2006.

34. Matthias S Müller, Matthijs van Waveren, Ron Lieberman, Brian Whitney, Hideki Saito, Kalyan Kumaran, John Baron, William C Brantley, Chris Parrott, Tom Elken, et al. Spec mpi2007—an application benchmark suite for parallel systems using mpi. Concurrency and Computation: Practice and Experience, 22(2):191–205, 2010.

35. Kurt B. Ferreira, Patrick Bridges, and Ron Brightwell. Characterizing application sensitivity to OS interference using kernel-level noise injection. In Proceedings of the 2008 ACM/IEEE conference on Supercomputing, SC ’08, pages 19:1–19:12, Piscataway, NJ, USA, 2008. IEEE Press.

36. S. Vinoski. Advanced Message Queuing Protocol. Internet Computing, IEEE, 10(6):87–89, 2006.

37. И.А. Дудина, А.О. Кудрявцев. Разработка и реализация облачного планировщика, учитывающего топологию коммуникационной среды при высокопроизводительных вычислениях. Труды Института системного программирования РАН, том 24, принято к публикации, 2013.

38. Katarzyna Keahey and Tim Freeman. Contextualization: Providing One-Click Virtual Clusters. In Proceedings of the 2008 Fourth IEEE International Conference on eScience, ESCIENCE ’08, pages 301–308, Washington, DC, USA, 2008. IEEE Computer Society.


Рецензия

Для цитирования:


Кудрявцев А.О., Кошелев В.К., Избышев А.О., Дудина И.А., Курмангалеев Ш.Ф., Аветисян А.И., Иванников В.П., Велихов В.Е., Рябинкин Е.А. Разработка и реализация облачной системы для решения высокопроизводительных задач. Труды Института системного программирования РАН. 2013;24.

For citation:


Kudryavtsev A.O., Koshelev V.K., Izbyshev A.O., Dudina I.A., Kurmangaleev Sh.F., Avetisyan A.I., Ivannikov V.P., Velikhov V.E., Ryabinkin E.A. HPC cloud system design and implementation. Proceedings of the Institute for System Programming of the RAS (Proceedings of ISP RAS). 2013;24. (In Russ.)



Creative Commons License
Контент доступен под лицензией Creative Commons Attribution 4.0 License.


ISSN 2079-8156 (Print)
ISSN 2220-6426 (Online)