<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE article PUBLIC "-//NLM//DTD JATS (Z39.96) Journal Publishing DTD v1.3 20210610//EN" "JATS-journalpublishing1-3.dtd">
<article article-type="research-article" dtd-version="1.3" xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xml:lang="ru"><front><journal-meta><journal-id journal-id-type="publisher-id">izvestswsu</journal-id><journal-title-group><journal-title xml:lang="ru">Известия Юго-Западного государственного университета</journal-title><trans-title-group xml:lang="en"><trans-title>Proceedings of the Southwest State University</trans-title></trans-title-group></journal-title-group><issn pub-type="ppub">2223-1560</issn><issn pub-type="epub">2686-6757</issn><publisher><publisher-name>ЮЗГУ</publisher-name></publisher></journal-meta><article-meta><article-id pub-id-type="doi">10.21869/2223-1560-2025-29-2-201-220</article-id><article-id custom-type="elpub" pub-id-type="custom">izvestswsu-1464</article-id><article-categories><subj-group subj-group-type="heading"><subject>Research Article</subject></subj-group><subj-group subj-group-type="section-heading" xml:lang="ru"><subject>Информатика, вычислительная техника и управление</subject></subj-group><subj-group subj-group-type="section-heading" xml:lang="en"><subject>Computer science, computer engineering and IT managment</subject></subj-group></article-categories><title-group><article-title>Оценка производительности вычислительной системы</article-title><trans-title-group xml:lang="en"><trans-title>Computational system performance evaluation</trans-title></trans-title-group></title-group><contrib-group><contrib contrib-type="author" corresp="yes"><name-alternatives><name name-style="eastern" xml:lang="ru"><surname>Петушков</surname><given-names>Г. В.</given-names></name><name name-style="western" xml:lang="en"><surname>Petushkov</surname><given-names>G. V.</given-names></name></name-alternatives><bio xml:lang="ru"><p>Петушков Григорий Валерьевич, младший научный сотрудник Центра  популяризации науки и высшего образования, Институт молодежной политики  и международных отношений,</p><p>пр. Вернадского, д. 78, Москва 119454.</p><p> </p></bio><bio xml:lang="en"><p>Grigory V. Petushkov, Junior Researcher, Centre for Popularisation of Science and Higher Education, Institute of Youth Policy and International Relations, </p><p>78, Vernadskogo str., Moscow 119454.</p></bio><email xlink:type="simple">petushkov@mirea.ru</email><xref ref-type="aff" rid="aff-1"/></contrib></contrib-group><aff-alternatives id="aff-1"><aff xml:lang="ru"><institution>Российский технологический университет «РТУ МИРЭА»</institution></aff><aff xml:lang="en"><institution>MIREA – Russian Technological University</institution></aff></aff-alternatives><pub-date pub-type="collection"><year>2025</year></pub-date><pub-date pub-type="epub"><day>01</day><month>10</month><year>2025</year></pub-date><volume>29</volume><issue>2</issue><fpage>201</fpage><lpage>220</lpage><permissions><copyright-statement>Copyright &amp;#x00A9; Петушков Г.В., 2025</copyright-statement><copyright-year>2025</copyright-year><copyright-holder xml:lang="ru">Петушков Г.В.</copyright-holder><copyright-holder xml:lang="en">Petushkov G.V.</copyright-holder><license xml:lang="ru" license-type="creative-commons-attribution" xlink:href="https://creativecommons.org/licenses/by/4.0/" xlink:type="simple"><license-p>Данная работа распространяется под лицензией Creative Commons Attribution 4.0.</license-p></license><license xml:lang="en" license-type="creative-commons-attribution" xlink:href="https://creativecommons.org/licenses/by/4.0/" xlink:type="simple"><license-p>This work is licensed under a Creative Commons Attribution 4.0 License.</license-p></license></permissions><self-uri xlink:href="https://izvestswsu.elpub.ru/jour/article/view/1464">https://izvestswsu.elpub.ru/jour/article/view/1464</self-uri><abstract><sec><title>Цель работы</title><p>Цель работы. Провести анализ и моделирование производительности вычислительных систем, включая расчет и сравнение различных показателей, таких как загрузка системы, пиковая и асимптотическая производительность, ускорение системы и ее реальная производительность, с использованием математических моделей для оценки эффективности работы систем в условиях динамичных задач и многозадачности. Особое внимание уделяется влиянию различных параметров системы на ее способность эффективно выполнять вычислительные операции и управлять ресурсами.</p></sec><sec><title>Методы</title><p>Методы. В данной работе были использованы методы математического моделирования для анализа характеристик вычислительных систем, расчет загрузки системы как среднего арифметического загрузок всех устройств, определение пиковой производительности системы через количество устройств и производительность каждого, вычисление ускорения системы как суммы загрузок устройств и соотношения выполненных операций и времени, оценку реальной и асимптотической производительности через минимальные пиковые значения, сравнение различных систем по показателям производительности и ускорения, симуляция и анализ для оценки влияния параметров на общую эффективность системы.</p></sec><sec><title>Результаты</title><p>Результаты. В ходе исследования проведен анализ производительности гетерогенных вычислительных систем, включающих процессоры Intel Xeon и сопроцессоры Intel Xeon Phi. Было выявлено, что классическая модель оценки производительности, основанная на простой сумме возможностей узлов, существенно переоценивает реальные показатели из-за игнорирования архитектурных и системных особенностей, таких как задержки передачи данных и пропускная способность межсоединений. Современная модель, учитывающая векторизацию AVX-512, многоуровневую память и ограничение шины PCIe 4.0, позволила получить более точную оценку – около 1.99 ТФлопс для однородной конфигурации CPU+GPU. При этом пропускная способность PCIe выступает ограничением в совместной работе CPU и GPU. Анализ гетерогенных конфигураций с Xeon Phi 7120P и Xeon E5-2683 v4 показал значительный прирост производительности – до 2.67 ТФлопс, что превышает возможности однородных систем. Ключевым параметром, влияющим на эффективность, стал коэффициент размера очереди выгрузки mmm, определяющий максимальный размер обрабатываемого блока данных. Эксперименты показали, что при малых значениях mmm издержки передачи данных увеличивают общее время расчета, тогда как при оптимальном диапазоне m=25–35m = 25\text{–}35m=25–35 достигается минимальное время выполнения за счет баланса между размером очереди и накладными расходами на коммуникацию. Дальнейшее увеличение mmm приводит к стабилизации или незначительному росту времени работы из-за усложнения балансировки нагрузки и задержек. Полученные данные подтверждают, что правильный подбор параметров очереди является важным фактором оптимизации гетерогенных систем.</p></sec><sec><title>Заключение</title><p>Заключение. Проведенное исследование подтвердило необходимость использования современных моделей оценки производительности, учитывающих архитектурные особенности, пропускную способность, межсоединений и системные ограничения, для точного прогнозирования вычислительных возможностей гетерогенных платформ. Классические методы оценки оказываются недостаточными, так как не учитывают задержки передачи данных, особенности памяти и параллелизм, что приводит к завышенным и нереалистичным прогнозам. Современные модели с учетом AVX-векторизации, многоуровневой памяти и пропускной способности PCIe позволяют получить адекватную оценку и выявить ограничения, важные для оптимизации.  </p></sec></abstract><trans-abstract xml:lang="en"><sec><title>Purpose of research</title><p>Purpose of research.  To analyze and model the performance of computing systems, including the calculation and comparison of various metrics such as system utilization, peak and asymptotic performance, system acceleration and real performance, using mathematical models to evaluate the performance of systems under dynamic tasks and multitasking. Special attention is given to the effect of various system parameters on the system's ability to perform computational operations and resource management efficiently.</p></sec><sec><title>Methods</title><p>Methods. In this paper, mathematical modeling techniques were used to analyze the performance of computing systems, calculating the system load as the arithmetic average of the loads of all devices, determining the peak performance of the system through the number of devices and the performance of each, calculating the system acceleration as the sum of device loads and the ratio of operations performed to time, estimating the real and asymptotic performance through minimum peak values, comparing different systems in terms.</p></sec><sec><title>Results</title><p>Results. The study analyzes the performance of heterogeneous computing systems including Intel Xeon processors and Intel Xeon Phi coprocessors. It was revealed that the classical performance evaluation model based on a simple sum of nodes' capabilities significantly overestimates real performance due to ignoring architectural and system peculiarities such as data transfer latency and interconnect bandwidth. A modern model that takes into account AVX512 vectorization, multi-level memory, and PCIe 4.0 bus limitation resulted in a more accurate estimate of about 1.99 TFLops for a homogeneous CPU+GPU configuration. In this case, the PCIe bandwidth acts as a bottleneck in the joint operation of CPU and GPU. Analysis of heterogeneous configurations with Xeon Phi 7120P and Xeon E5-2683 v4 showed a significant performance gain of up to 2.67 TFLops, which exceeds the capabilities of homogeneous systems. The key parameter affecting the performance was the unload queue size factor mmm, which determines the maximum size of the processed data block. Experiments have shown that for small values of mmm, the communication overhead increases the total computation time, whereas the optimal range of m=25-35m = 25\text{}35m=25-35 achieves the minimum execution time due to the balance between queue size and communication overhead. Further increase in mmm leads to stabilization or slight increase in runtime due to increased complexity of load balancing and delays. The obtained data confirm that proper selection of queueing parameters is an important factor in the optimization of heterogeneous systems.</p></sec><sec><title>Conclusion</title><p>Conclusion. This research has confirmed the necessity of using modern performance evaluation models that take into account architectural features, bandwidth, interconnects and system limitations to accurately predict the computational capabilities of heterogeneous platforms. Classical evaluation methods prove to be insufficient as they do not take into account data transfer latency, memory features and parallelism, resulting in overestimated and unrealistic predictions. Modern models taking into account AVX vectorization, multi-level memory and PCIe bandwidth allow us to obtain an adequate evaluation and identify real bottlenecks important for optimization.</p></sec></trans-abstract><kwd-group xml:lang="ru"><kwd>вычислительные системы</kwd><kwd>производительность</kwd><kwd>реальная производительность</kwd><kwd>пиковая производительность</kwd><kwd>загрузка</kwd></kwd-group><kwd-group xml:lang="en"><kwd>computational systems</kwd><kwd>performance</kwd><kwd>real performance</kwd><kwd>peak performance</kwd><kwd>utilization</kwd></kwd-group></article-meta></front><back><ref-list><title>References</title><ref id="cit1"><label>1</label><citation-alternatives><mixed-citation xml:lang="ru">Леонтьева О.Ю., Климанова Е.Ю., Зеленко Б.В. Оценка производительности вычислительных систем // Вестник технологического университета. 2015. Т.18, № 24. С. 102-105.</mixed-citation><mixed-citation xml:lang="en">Leontieva O.Yu., Klimanova E.Yu., Zelenko B.V. Performance evaluation of computing systems. Vestnik tekhnologicheskogo universiteta = Bulletin of the Technological University. 2015; 18(24): 102-105. (In Russ.).</mixed-citation></citation-alternatives></ref><ref id="cit2"><label>2</label><citation-alternatives><mixed-citation xml:lang="ru">Сорокин А.П., Бененсон М.З., Методики оценки производительности гетерогенных вычислительных систем // Russian Technological Journal. 2017. №5(6). С. 11-19.</mixed-citation><mixed-citation xml:lang="en">Sorokin A.P., Benenson M.Z. Methodologies for performance evaluation of heterogeneous computing systems. Russian Technological Journal. 2017; (5): 11-19. (In Russ.).</mixed-citation></citation-alternatives></ref><ref id="cit3"><label>3</label><citation-alternatives><mixed-citation xml:lang="ru">Bahnam B.S., Dawwod S.A. Younis M.C. Optimizing software reliability growth models through simulated annealing algorithm: parameters estimation and performance analysis // The Journal of Supercomputing. April 2024. DOI: 10.1007/s11227-024-06046-4</mixed-citation><mixed-citation xml:lang="en">Bahnam B.S., Dawwod S.A., Younis M.C. Optimizing software reliability growth models through simulated annealing algorithm: parameter estimation and performance analysis. The Journal of Supercomputing. April 2024. DOI: 10.1007/s11227-024-06046-4</mixed-citation></citation-alternatives></ref><ref id="cit4"><label>4</label><citation-alternatives><mixed-citation xml:lang="ru">Вепаев Ш.В. Исследование Марковских моделей обслуживания // Молодой ученый. 2022. № 49 (444). С. 26–28.</mixed-citation><mixed-citation xml:lang="en">Vepaev Sh.V. Study of Markov service models. Molodoi uchenyi = Young Scientist. 2022; (49): 26–28. (In Russ.).</mixed-citation></citation-alternatives></ref><ref id="cit5"><label>5</label><citation-alternatives><mixed-citation xml:lang="ru">Гачаев А.М., Датаев А.А., Вазкаева С.С.-А. Исследование надежности программного обеспечения компьютерных информационных технологий // Прикладные экономические исследования. 2023. №2. С. 80-84. https://doi.org/10.47576/2949-1908_2023_2_80.</mixed-citation><mixed-citation xml:lang="en">Gachaev A.M., Dataev A.A., Vazkaeva S.S.-A. Study of software reliability in computer information technologies. Prikladnye ekonomicheskie issledovaniya = Applied economic research. 2023; (2):80-84. (In Russ.). https://doi.org/10.47576/2949-1908_2023_2_80.</mixed-citation></citation-alternatives></ref><ref id="cit6"><label>6</label><citation-alternatives><mixed-citation xml:lang="ru">Вадейко В.С., Манько А.В. Марковская модель надежности. Минск: БНТУ, 2022. С. 222–22.</mixed-citation><mixed-citation xml:lang="en">Vadeyko V.S., Manko A.V. Markov reliability model. Minsk; 2022. P. 222–22. (In Russ.).</mixed-citation></citation-alternatives></ref><ref id="cit7"><label>7</label><citation-alternatives><mixed-citation xml:lang="ru">Терсков В.А., Сакаш И.Ю. Математическая модель оценки надежности функционирования многопроцессорных вычислительных комплексов // Computational Nanotechnology. 2024. Т. 11, № 2. С. 22–28. DOI: 10.33693/2313-223X-2024-11-2-22-28. EDN: MHZWBU</mixed-citation><mixed-citation xml:lang="en">Terskov V.A., Sakash I.Yu. Mathematical model for reliability evaluation of multiprocessor computing complexes. Computational Nanotechnology. 2024; 11(2): 22–28. (In Russ.). https://doi.org/10.33693/2313-223X-2024-11-2-22-28. EDN: MHZWBU</mixed-citation></citation-alternatives></ref><ref id="cit8"><label>8</label><citation-alternatives><mixed-citation xml:lang="ru">Михалок В.В. Технические требования к программно-аппаратному комплексу (ПАК) исполнителя. URL: https://intellectexport.ru/site/assets/files/1035/prilozhenie_2.doc</mixed-citation><mixed-citation xml:lang="en">Mikhalok V.V. Technical requirements for the software-hardware complex (SHC) of the executor. (In Russ.). Available at: https://intellectexport.ru/site/assets/files/1035/prilozhenie_2.doc</mixed-citation></citation-alternatives></ref><ref id="cit9"><label>9</label><citation-alternatives><mixed-citation xml:lang="ru">Оценка производительности вычислительных систем / Е.Ю. Климанова, А.Р. Субханкулова, Б.В. Зеленко, О.Ю. Леонтьева // Вестник технологического университета. 2015. Т.18, № 24. С. 102-105</mixed-citation><mixed-citation xml:lang="en">Klimanova E.Yu., Subkhankulova A.R., Zelenko B.V., Leontieva O.Yu. Performance evaluation of computing systems. Vestnik tekhnologicheskogo universiteta = Bulletin of the Technological University. 2015; 18(24):102-105. (In Russ.).</mixed-citation></citation-alternatives></ref><ref id="cit10"><label>10</label><citation-alternatives><mixed-citation xml:lang="ru">Гоголевский А.С., Романов А.В., Трепкова С.А. Методика оценки производительности аппаратно-программного комплекса информационно-управляющей системы // Известия ТулГУ. Технические науки. 2022. Т 10. С. 87-91.</mixed-citation><mixed-citation xml:lang="en">Gogolevsky A.S., Romanov A.V., Trepkova S.A. Methodology for performance evaluation of hardware-software complex of information control system. Izvestiya TulGU. Tekhnicheskie nauki = Izvestiya Tula State University. Technical Sciences. 2022; 10: 87-91. (In Russ.).</mixed-citation></citation-alternatives></ref><ref id="cit11"><label>11</label><citation-alternatives><mixed-citation xml:lang="ru">Ларионов А.М., Майоров С.А., Новиков Г.И. Вычислительные комплексы, системы и сети. Л.: Энергоатомиздат. Ленингр. отд-ние, 1987. 288 с.</mixed-citation><mixed-citation xml:lang="en">Larionov A.M., Mayorov S.A., Novikov G.I. Computing complexes, systems and networks. Leningrad: Energoatomizdat; 1987. 288 p. (In Russ.).</mixed-citation></citation-alternatives></ref><ref id="cit12"><label>12</label><citation-alternatives><mixed-citation xml:lang="ru">Сравнительный анализ методов оценки производительности узлов в распределенных системах / Мин Тху Кхаинг, С.А. Лупин, Ай Мин Тайк, Д.А. Федяшин // Международный журнал открытых информационных технологий. 2023. Т 11, №6.</mixed-citation><mixed-citation xml:lang="en">Min Thu Khaing, Lupin S.A., Ai Min Taik, Fedyashin D.A. Comparative analysis of node performance evaluation methods in distributed systems. Mezhdunarodnyi zhurnal otkrytykh informatsionnykh tekhnologii = International Journal of Open Information Technologies. 2023; 11(6). (In Russ.).</mixed-citation></citation-alternatives></ref><ref id="cit13"><label>13</label><citation-alternatives><mixed-citation xml:lang="ru">Lorenzo Luciano , Imre Kiss, Peter William Beardshear, Esther Kadosh, A. Ben Hamza WISE: a computer system performance index scoring framework // Journal of Cloud Computing: Advances, Systems and Applications. 2021. 10:8.</mixed-citation><mixed-citation xml:lang="en">Lorenzo Luciano, Imre Kiss, Peter William Beardshear, Esther Kadosh, A. Ben Hamza WISE: a computer system performance index scoring framework. Journal of Cloud Computing: Advances, Systems and Applications. 2021; 10:8.</mixed-citation></citation-alternatives></ref><ref id="cit14"><label>14</label><citation-alternatives><mixed-citation xml:lang="ru">Альбертьян А.М., Курочкин И.И., Ватутин Э.И. Использование гетерогенных вычислительных узлов в грид-системах при решении комбинарных задач // Известия ЮФУ. 2022. C. 142-153.</mixed-citation><mixed-citation xml:lang="en">Albertyan A.M., Kurochkin I.I., Vatutin E.I. Use of heterogeneous computing nodes in grid systems for solving combinatorial problems. Izvestiya YuFU = Izvestiya of Southern Federal University. 2022: 142-153. (In Russ.).</mixed-citation></citation-alternatives></ref><ref id="cit15"><label>15</label><citation-alternatives><mixed-citation xml:lang="ru">Jim Holtmana, Neil J. Gunther Getting in the Zone for Successful Scalability // Performance Dynamcis Company, Castro Valley, California, USA, 2018.</mixed-citation><mixed-citation xml:lang="en">Jim Holtman, Neil J. Gunther Getting in the Zone for Successful Scalability. Performance Dynamics Company, Castro Valley, California, USA, 2018.</mixed-citation></citation-alternatives></ref><ref id="cit16"><label>16</label><citation-alternatives><mixed-citation xml:lang="ru">Xin Li Scalability: strong and weak scaling // Royal Institute of Technology. 2018.</mixed-citation><mixed-citation xml:lang="en">Xin Li Scalability: strong and weak scaling. Royal Institute of Technology, 2018.</mixed-citation></citation-alternatives></ref><ref id="cit17"><label>17</label><citation-alternatives><mixed-citation xml:lang="ru">Rupak Roy, JaeHyuk Kwack Intel Analyzers // Argonne Leadership Computing Facility. 2025.</mixed-citation><mixed-citation xml:lang="en">Rupak Roy, JaeHyuk Kwack Intel Analyzers. Argonne Leadership Computing Facility. 2025.</mixed-citation></citation-alternatives></ref><ref id="cit18"><label>18</label><citation-alternatives><mixed-citation xml:lang="ru">Brendan Gregg Visualizing Performance: The Developer's Guide to Flame Graphs // Communications of the ACM. 2022.</mixed-citation><mixed-citation xml:lang="en">Brendan Gregg Visualizing Performance: The Developer's Guide to Flame Graphs. Communications of the ACM. 2022.</mixed-citation></citation-alternatives></ref><ref id="cit19"><label>19</label><citation-alternatives><mixed-citation xml:lang="ru">Мартышкин А. И., Кирюткин И. А., Мереняшева Е. А. Автотестирование встраиваемой реконфигурируемой вычислительной системы // Известия Юго-Западного государственного университета. 2023; 27(1): 140-152. https://doi.org/10.21869/2223-1560-2023-27-1-140-152.</mixed-citation><mixed-citation xml:lang="en">Martyshkin А. I., Kiryutkin I. А., Merenyasheva Е. А. Autotesting an Embedded Reconfigurable Computing System. Izvestiya Yugo-Zapadnogo gosudarstvennogo universiteta = Proceedings of the Southwest State University. 2023; 27(1): 140-152 (In Russ.). https://doi.org/10.21869/2223-1560-2023-27-1-140-152.</mixed-citation></citation-alternatives></ref></ref-list><fn-group><fn fn-type="conflict"><p>The authors declare that there are no conflicts of interest present.</p></fn></fn-group></back></article>
