TensorFlow 2.9上线:oneDNN改进实现CPU性能优化,WSL2开箱即用
TensorFlow 2.9 已发布,还没有更新的小伙伴现在可以更新了。
昨日,TensorFlow 官方宣布:TensorFlow 2.9 来了!距离上次 2.8 版本的更新仅仅过去三个月。
新版本亮点包括如下:
oneDNN 的性能改进;
DTensor 的发布,这是一种新 API,可用于从数据并行无缝迁移到模型并行;
对核心库进行了改进,包括 Eigen、tf.function 统一以及对 Windows 的 WSL2 的新支持;
还为 tf.function retracing 和 Keras 优化器发布了新的实验性 API。
下面让我们来看看 TensorFlow 2.9 具体的改进都有哪些。
TensorFlow 2.9 新特性
提高 CPU 性能:oneDNN
TensorFlow 已经与英特尔合作,将 oneDNN 性能库与 TensorFlow 集成,以实现在英特尔 CPU 上的最高性能。从 TensorFlow 2.5 以来,TensorFlow 已经对 oneDNN 进行了实验性支持,它可以提供高达 4 倍的性能提升。在 TensorFlow 2.9 中,默认在 Linux x86 包和具有神经网络硬件功能(如 AVX512_VNNI、AVX512_BF16、AMX 等)的 CPU 上启用 oneDNN 优化,这些功能可在 Intel Cascade Lake 和更新的 CPU 上找到。
英特尔表示:我们很高兴与 GoogleAI 合作,将 oneDNN 库作为 TensorFlow 2.9 中的默认后端 CPU 优化!TensorFlow 用户现在将看到由我们的开放软件优化驱动的 AI 性能加速,无需更改代码!
在启用 oneDNN 优化的情况下运行 TensorFlow 的用户,可能会观察到与关闭优化时略有不同的数值结果,这是因为浮点舍入方法和顺序不同,可能会产生轻微的误差。
如果上述情况给你带来麻烦,请在运行 TensorFlow 程序之前通过设置 TF_ENABLE_ONEDNN_OPTS=0 来关闭优化。假如你要重新启用它们,请在运行 TensorFlow 程序之前设置 TF_ENABLE_ONEDNN_OPTS=1。要验证优化是否启用,请在程序日志中查找以 oneDNN custom operations are on 开头的消息。
2022 IBM博士生奖学金揭晓:8位华人入选,上交大、电子科大校友在列
这些获奖博士生将赢得高达 9.5 万美元的奖金。
七十年来,IBM 通过极具竞争力的博士生奖学金(IBM PhD Fellowship Award)计划认可并表彰了来自全球各地的优秀博士生。
2022 年 IBM 博士生奖学金计划共收到了来自全球 32 个国家 183 所大学的数百申请。最终,本年度博士生奖学金共授予了 19 位获得者,他(她)们展示了在人工智能、混合云技术、量子计算、数据科学、安全以及下一代尖端处理器等前沿研究领域的专业知识。
下图为 19 位获奖博士生的完整名单和院校信息。
2022 年 IBM 博士生奖学金分为两年发放,其中美国地区的获奖者第一年将得到 6 万美元(约合人民币 40.5 万),第二年将得到 3.5 万美元(约合人民币 23.6 万)。其他国家和地区的获得者每年将获得 6000 美元至 2.5 万美元不等的奖金。
02 # 程序员专区D语言/DLang 2.100.0发布
不久前,D语言/DLang 2.100.0已正式发布。此版本附带了22个主要更改和179个已修复的Bugzilla问题。从此版本开始alias this不能用于左侧 *** 作数的部分赋值,任何此类的赋值都会导致编译器错误。从D 2.099.0版本开始,用户可以通过__import关键字直接将D代码模块导入C文件。
Python 3.9.13 发布
该版本是Python 3.9的最后一个维护版本,包含了166次commit,该版本只接受安全修复,在2025年10月之前,这些修复程序将以仅源码的形式发布。该版本的主要变化有:PEP 573,C 扩展方法中的模块状态访问、PEP 584 , dict 中的 Union Operators、PEP 585 , 标准集合中的类型提示泛型等。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)