多年以来,英伟达为 GPU 开发的 CUDA 软件工具包始终缺少原生 Python 支持,现如今这种情况终于有所转变。在近期的 GTC 大会上,英伟达宣布其 CUDA 工具包将为 Python 提供原生支持并全面与之集成。也就是说,开发人员能够使用 Python 直接在 GPU 上执行算法式计算。 据悉,2025 年被英伟达视为“CUDA Python ...
机器之心报道机器之心编辑部几个小时前,NVIDIA CUDA Toolkit 13.1 正式发布,英伟达官方表示:「这是 20 年来最大的一次更新。」这个自 2006 年 CUDA 平台诞生以来规模最大、最全面的更新包括:NVIDIA CUDA Tile 的发布,这是英伟达基于 tile 的编程模型,可用于抽象化专用硬件,包括张量核心。Runtime API exposure of ...
最多可支持 10000+ 个并发线程。 经过近 10 年的不懈努力,对计算机科学核心的深入研究,人们终于实现了一个梦想:在 GPU 上运行高级语言。 上周末,一种名为 Bend 的编程语言在开源社区引发了热烈的讨论,GitHub 的 Star 量已经超过了 8500。 作为一种大规模并行 ...
1. 软件生态的「地基」重塑:NVIDIA CUDA 13.1正式推出。这是CUDA平台诞生二十年来 最大、最全面的一次更新。它引入了CUDA Tile编程模型,旨在屏蔽底层硬件细节,让开发者能更轻松地驾驭下一代GPU(如Blackwell)的恐怖性能。
在中国举办的 2025 年 RISC-V 峰会上,Nvidia 宣布其 CUDA 软件平台将在 CPU 方面与 RISC-V 指令集架构(ISA)兼容。这一消息在 RISC-V 活动期间的一个演示中得到了证实 。这是在性能要求高的应用中启用基于 RISC-V ISA 的 CPU 的重要一步。 这项宣布表明,RISC-V 现在可以 ...
近日举办的2025 RISC-V中国峰会上,NVIDIA硬件工程副总裁Frans Sijstermans宣布,CUDA软件平台将支持RISC-V指令集架构处理器,为开源架构RISC-V开启进入数据中心与AI市场的大门。 据了解,过去x86与Arm架构在AI与HPC领域居于主导地位,主要原因就是和CUDA的高度整合。
DeepSeek-R1火遍海内外,但推理服务器频频宕机,专享版按GPU小时计费的天价成本更让中小团队望而却步。 而市面上所谓“本地部署”方案,多为参数量缩水90%的蒸馏版,背后原因是671B参数的MoE架构对显存要求极高——即便用8卡A100也难以负荷。因此,想在本地小 ...
在昨天测试了丽台的Cell核心视频加速卡后,今天日本PCWatch网站又放出了一篇视频处理性能测试文章。这一次的主角也是近期的热门人物,NVIDIA CUDA加速。他们分别使用了三款目前支持CUDA加速的视频处理软件:Badaboom Media Converter、TMPGEnc 4.0 XPress和PowerDirector威力 ...