(资料图片)
Intel近日更新了开源的C++头文件库,正式支持AVX-512 SIMD指令集,相比此前的AVX-2指令集,可以提供更高性能的SIMD排序。
基于AVX-512指令集,C++头文件库可以对16位、64位数据类型进行快速排序,实测在一套Intel Tiger Lake 11代酷睿系统上,NumPy Python的性能提升了多达10-17倍。
具体来说,16位数据排序性能提升了17倍,32位数据也有12-13倍,64位浮点数据则可以提速10倍。
这证明,AVX-512只要适配优化得当,带来的性能提升是十分显著的,而且不一定非得吃掉多高功耗。
不过,Intel 12/13代酷睿因为引入混合架构,不得不牺牲了AVX-512,自然无法从中受益,AMD Zen4架构的锐龙7000系列则首次加入了AVX-512。
这就有点尴尬了。
标签: Intel

天天速看:案例分享:KST3420 和 KST3220用ST 的 FlightSenseToF传感器和STM32快速开发原型
解析电动汽车充电基础设施及技术的发展趋势 今头条
欧洲首个开放RAN天线测试中心于2023年3月启用
环球今热点:EMC对策产品: TDK推出用于车载电源线路的业内最高额定电流积层贴片磁珠
全球快看点丨分区电子电气架构如何支持软件定义汽车
Teledyne 用于 360° 高精度全景成像的新型相机Ladybug6现已开始交付_当前速读
美光再回应裁员传闻:人员精简是艰难但不可避免的决定






闽公网安备 35010302000168号