高性能计算(HPC)技术在工业领域、科学研究等各个领域发挥着越来越重要的作用。在实际应用中,如何有效地管理大规模的计算资源和任务调度是一个不容忽视的问题。这时,PBS Works就可以成为解决方案之一。
(资料图)
Altair是一家全球性公司,拥有遍布世界各地的分支机构,为各个行业的客户提供优质的软件技术、工程咨询服务和高性能计算技术。除了出色的CAE解决方案——HyperWorks,公司的高性能计算资源智能管理平台——PBS Works也备受瞩目。这个开放性强的智能化“按需计算”管理平台,能够最大化计算资源的优化管理和作业调度,从而提升航空航天企业、研究所的高性能计算资源利用效率。
PBS Works产品套件包括Computer Manager门户、PBS Professional及PBS Analytics等模块,为客户提供了智慧化、可靠的算力资源管理方案。Altair公司在多年PBS Works开发及应用方面积累了丰富经验,在易用性、稳健性、可扩展性、安全性及绿色计算等方面都展现出了卓越表现。公司深刻理解IT部门的需求,了解客户希望如何管理自己的HPC系统。
作为HPC领域的领军企业之一,Altair精通高性能计算技术,并在HPC系统设计、开发和管理方面发挥着重要作用。PBS Works是Altair公司推出的一款企业级工作负载管理软件套件,旨在使企业客户充分利用其IT基础设施、提高生产力和降低成本。
通过PBS Works,用户能够有效掌握大规模计算资源的管理和任务调度。该软件套件具备高度可定制性和可靠性,以满足各种不同结构的企业、科研机构和超算中心的需求。同时,PBS Works还提供了丰富的功能,包括任务优先级管理、多级别预算控制、实时监控等,以确保任务的高效完成和系统资源的最佳利用。此外,PBS Works还支持多个HPC操作系统和基础设施集成,并具备丰富的协议和API,方便用户进行自定义设置和扩展。
Altair公司的PBS Works还具备其他一些令人印象深刻的功能。比如,它可以根据任务的预测性能和真实性能分析来评估计算资源和未来运行时间,以便任务能及时完成,以及让系统资源得到最大的利用。PBS Works 还支持大规模企业级应用程序、复杂仿真任务、大型数据集等多种场景,(为企业)提供高度灵活的集成方式,满足用户的特殊需求。
2001年,Boeing Enterprise Servers在其Cray T90系统和SGI Origin 3800服务器系统上运行网络队列环境(NQE, Network Queuing Environment)。在评估包括PBS Professional在内的计算任务管理系统可行性之后,波音认为PBS Professional的超大优势在于它的开放性即二次开发易于定制的功能。Boeing Enterprise Servers希望能够深入掌握任务管理工具,以便在出现问题时可以制定临时的解决方法。“总之”波音公司的高级软件工程师Barry Sharp先生说,“我们非常满意Altair对我们反馈做出的积极响应。”
波音描述他们用于HPC仿真的混合硬件系统:“我们关注可以管理这种混合硬件组合的系统已有数年,” Barry Sharp先生说,“之前我们的做法是将不同系统的使用成本告知给我们的工程师,他们可以根据不同平台的使用成本进行选择,我们以集群为单位进行务管理,虽然它们通过网络联系在一起,工程师们能够向任一个集群提交批处理作业,但每个作业必须在一个单独的集群中完成,无法实现跨集群操作。PBS Professional的并行调度功能能够将我们的任务分配到五个集群中。”并行调度功能允许优化几种资源去高效完成一个任务队列。波音公司的系统管理员Jim Glidewell先生还描述了PBS Professional对SGI Origin的多CPU集的支持带来的显著的性能提升。随着PBS Professional在SGI和Cray平台的顺利运行,波音开始向更多集群推广应用。此外,PBS Professional完全支持新版本的GPGPU系统。PBS Professional能够捕捉GPGPUs与新近的GPUs之间的物理关系因而可以优化处理GPGPU系统,这将确保分配物理资源时使用新近的GPGPUs和CPUs,通过减少组件间的延迟时间达到缩短执行时间的效果。PBS Professional能将复杂的系统分解成较小的对象以便运行任务,这为内存共享和GPGPU系统的高效使用提供了便利。
目前大多数企业和组织正在寻求HPC系统运行的节能方案,实现绿色计算。随着行业向超大规模计算方向发展,降低能源成本或将能源消耗保持在极高限额内是至关重要的。智能供电和冷却系统的使用将逐步成为强制性的政策。PBS Professional利用其绿色计算Green Provisioning技术进行能源调度,自动监测到处于空闲状态的计算结点,并将其自动休眠或关闭,当有计算任务需要时再将其自动开启,大大降低了高性能计算系统的电能消耗。该技术通过对系统的完全配置以避免系统出现异常,因而各计算节点可以频繁的通、断电。即使在使用率非常高的系统上仍能从PBS Works的自动通、断电解决方案中获益。
Altair精通高性能计算技术,同时借助于Altair的高级CAE仿真技术,这使得航空航天公司的产品研发团队可以更好地利用计算机辅助工程的仿真技术探索创新的设计理念并研发有效、安全可靠的设计方案。高性能计算系统的使用能够大大提高这些仿真的效率,而PBS Works的使用能够提高高性能计算系统的效率。随着这两方面的效率提升,航空航天行业将继续开发创新的、振奋人心的产品。
总体而言,PBS Works 为HPC系统的用户提供了一个高效、可靠的工作负载管理平台,帮助他们更好地管理计算资源,提高了任务执行效率、减轻了IT运维管理负担和降低了使用成本。作为Altair在HPC领域的重要产品,PBS Works的功能和可靠性都得到了广泛的认可,并赢得了全球范围内的用户的青睐。
标签: