今天,英特尔宣布了2023年发布的Intel®oneAPI工具-可在Intel®开发者云并通过常规分销渠道推出。新的oneAPI 2023工具支持即将推出的第四代Intel®Xeon®可扩展处理器、Intel®Xeon®CPU Max系列和Intel®数据中心gpu,包括Flex系列和新的Max系列。这些工具增强了性能和生产力,还增加了对新的Codeplay的支持1插件使开发人员比以往任何时候都更容易为非英特尔GPU架构编写SYCL代码。这些基于标准的工具提供了硬件选择,并易于开发运行在多体系结构系统上的高性能应用程序。
读也:英特尔和宾夕法尼亚大学医学院宣布了最大的医疗联合学习研究结果
“我们在使用英特尔Max系列GPU加速器(使用英特尔的oneAPI编译器和库构建的应用程序)的开发系统上看到了令人鼓舞的早期应用程序性能结果。对于领导级计算科学,我们重视来自多供应商、多架构编程标准(如SYCL)和Python AI框架(如PyTorch)的代码可移植性的好处,这些框架由英特尔库加速。我们期待着明年在极光系统上利用这些技术进行第一次百亿亿次科学发现。”万博体育登录首页
——蒂莫西·威廉姆斯,阿贡计算科学部副主任
oneAPI工具提供什么:
英特尔2023年的开发人员工具包括一套全面的最新编译器和库、分析和移植工具,以及优化的人工智能(AI)和机器学习框架,用于为cpu、gpu和fpga构建高性能的多架构应用程序,由一个api提供支持。这些工具使开发人员能够通过使用单一的代码库快速达到性能目标并节省时间,从而有更多的时间进行创新。
这个新的oneAPI工具版本可以帮助开发人员利用英特尔硬件的高级功能:
- 第四代英特尔至强可扩展和至强CPU Max系列处理器,具有英特尔®高级矩阵扩展(英特尔®AMX),英特尔®快速辅助技术(英特尔®QAT),英特尔®AVX-512, bfloat16等。万博体育登录首页
- 英特尔®数据中心gpu,包括具有基于硬件的AV1编码器的Flex系列,以及具有数据类型灵活性的Max系列gpu,英特尔®Xe矩阵扩展(Intel®XMX),向量引擎,Intel®Xe链接和其他功能。
示例基准:
- MLPerfTM使用Xeon Max CPU的DeepCAM深度学习推理和训练性能比Nvidia(2.4倍)和AMD(1.0基线)的性能提高了3.6倍,使用Intel®onapi深度神经网络库(oneDNN)支持的Intel®AMX。2
- LAMMPS(大规模原子/分子大规模并行模拟器)工作负载运行在Xeon Max CPU上,内核卸载到6个Max系列gpu上,并通过一个api工具进行优化,结果比第三代英特尔Xeon或AMD Milan的性能提升高达16倍。3.
先进的软件性能:
- Intel®Fortran Compiler提供了完整的Fortran语言标准支持,并扩展了OpenMP GPU卸载支持,加快了标准兼容应用程序的开发。
- Intel®oneAPI数学内核库(oneMKL)具有扩展的OpenMP卸载能力,提高了可移植性。
- Intel®oneAPI深度神经网络库(oneDNN)支持第四代Intel Xeon和Max系列CPU处理器的高级深度学习功能,包括Intel®AMX, Intel AVX-512, VNNI和bfloat16。
为了提高开发人员的工作效率,丰富的SYCL支持和健壮的代码迁移和分析工具使得为多架构系统开发代码变得更加容易。
- Intel®oneAPI DPC++/ c++编译器为Nvidia和AMD gpu增加了Codeplay Software的新插件支持,以简化SYCL代码的编写,并扩展跨这些处理器架构的代码可移植性。这为跨平台生产力提供了一个统一的构建环境和集成的工具。作为该解决方案的一部分,英特尔和Codeplay将从Nvidia gpu的oneAPI插件开始提供商业优先级支持。
- 基于开源SYCLomatic的Intel®DPC++兼容工具中添加了超过100个CUDA api,使CUDA到sycl的代码迁移更加容易。
- 用户可以通过Intel®VTune大规模识别MPI不平衡TM分析器。
- Intel®Advisor为Intel数据中心GPU Max系列添加了自动车顶分析,以识别内存、缓存或计算瓶颈和原因并进行优先级排序,并提供可操作的见解,以优化cpu到GPU卸载的数据传输重用成本。
为什么重要:
48%的开发人员瞄准使用多种处理器的异构系统4在美国,需要更高效的多架构编程来解决日益增长的实际工作负载范围和规模。使用oneAPI开放的统一编程模型和英特尔基于标准的多架构工具,可以在cpu和加速器的硬件、性能、生产力和代码可移植性方面提供自由选择。为专有编程模型(如CUDA)编写的代码缺乏对其他硬件的可移植性,从而产生了一种孤立的开发实践,将组织锁定在一个封闭的生态系统中。
关于oneAPI生态系统的采用:
生态系统对oneAPI的持续采用正在进行中,新的卓越中心正在建立。其中之一是剑桥大学的开放Zettascale实验室,专注于将重要的百亿亿次候选代码移植到一个api,包括CASTEP、FEniCS和AREPO。该中心提供课程和研讨会,专家教授onapi方法和工具,用于编译和移植代码以及优化性能。总共30个oneAPI卓越中心已经建立。
相关文章:英特尔提供关键技术支持Verizon的万博体育登录首页vRAN网络扩展