英伟达扎紧生态藩篱 国内GPU厂商加速自主生态之路
近期,英伟达宣布禁止在其他GPU上通过转译层运行CUDA软件的消息引起业内广泛讨论。 GPU的核心竞争力在于架构等因素决定的性能先进性和计算生态壁垒。众所周知,英伟达凭借先发优势,以及大幅降低开发门槛的CUDA架构,稳稳圈住了大批用户,不仅使GPU在通用计算中逐渐成为主角,也成就了自身的护城河。 “在工具链层面兼容CUDA的GPU厂商会受到影响,但影响本身在技术层面还是比较复杂的。英伟达其实发出了一个非常强烈的信号,就是他正在扎紧自己生态的篱笆。”某GPU业内人士对第一财经表示。 “独立自主和开放兼容并不矛盾” 中信证券表示,由于CUDA的闭源特性,以及快速的更新,后来者很难通过指令翻译等方式完美兼容,即使部分兼容也会有较大的性能损失,导致在性价比上持续落后英伟达。同时,CUDA是英伟达的专属软件栈,包含了许多英伟达GPU硬件的专有特性,这部分在其他厂商的芯片上并不能得到体现。 这正是国内厂商面临的困境。当前国内GPU厂商纷纷大力投入研发迭代架构,谋求构建自主软硬件生态。华安嘉业投资管理有限公司相关负责人此前也对第一财经表示,国产GPU在起步阶段兼容现有生态更容易发展,但长期还是要摆脱兼容思路,发展自有核心技术。 “我们经常讲兼容,但兼容不代表要和英伟达做得完全一样,而是说你做的东西可以去承载所有技术的生态,可以把英伟达的生态吸收过来、直接利用。但要做功能全面对标英伟达的GPU芯片难度很大,目前大多数厂商采取的策略是仅实现英伟达GPU人工智能加速的部分功能。”摩尔线程CTO张钰勃告诉第一财经,“但摩尔线程能够实现英伟达系统架构里的四大主要功能,包括通用计算、人工智能加速、图形渲染和视频编解码。” 摩尔线程成立于2020年,是一家以全功能GPU芯片设计为主的集成电路企业。据悉,摩尔线程推出了全面对标CUDA的MUSA架构,用户能够将CUDA写的应用程序通过摩尔线程的编译器重新编译成MUSA的应用,从而实现接近零成本迁移,同时也能够通过标准编程语言开发新的应用。“所以说MUSA本身是一套独立自主的生态,同时也是个开放的、可以吸收现有生态的全新生态。”张钰勃称。 “独立自主和开放兼容并不矛盾。我们一方面可以独立自主发展实现可控,一方面也可以开放兼容现有CUDA优势。”张钰勃告诉第一财经,“只有硬件功能完全对标,才能够有效地把CUDA生态的应用吸收过来。如果没有办法吸收现有生态,另建一个新生态,真要建成也是十几二十年的事。” “寻找志同道合的客户” 事实上,客户迁移成本是推动国内GPU厂商加速生态建设的重要因素之一。目前,国内也存在一些坚持“难而正确”理念的厂商,选择了自建生态、不兼容的道路,燧原科技就是其一。 燧原科技专注于人工智能领域云端和边缘算力产品,致力于为通用人工智能打造算力底座,提供原始创新、具备自主知识产权的AI加速卡、系统集群和软硬件解决方案。 对于燧原这类算力厂商来说,客户迁移成本始终存在,因此需要寻找志同道合的客户。“燧原希望与产业合作伙伴一起构建一个开放开源的生态系统,我们的客户也愿意跟那些有长期主义的合作伙伴一起去打磨产品。”燧原科技首席生态官李星宇告诉第一财经。 随着技术的发展,国内厂商的自建生态之路有望越走越宽。 “技术生态的范式转移,给像燧原这样的初创公司自建生态带来一个新的契机。”李星宇认为,随着大模型时代的到来,模型的架构底座趋向于一致,即Transformer,这收敛了对于硬件的需求,让硬件设计的方向更加聚焦和明确,减轻了碎片化程度;与此同时,越来越流行的开源框架和编程语言,让芯片公司有更好的基础去适配不同模型,让开发者更容易在开发工具层面去适配不同的硬件。 “客户的迁移成本取决于很多因素,但整体的趋势是越来越便捷。”李星宇表示,“比如说我们兼容PyTorch的主流算子,采用这些主流算子的模型理论上可以直接迁移而不需要改源代码。同时未来我们也会支持更多主流的开源编程语言,让客户开发新的模型时,也会变得更加容易。” 目前,国内有多家人工智能芯片厂商选择自建生态,但并未形成统一生态,各家正处于跑马圈地、各自发展的时期。诚然,在技术发展的早期和技术快速迭代的时期,很难制定一套统一的标准。正如海外GPU发展的早期,行业存在四十多家企业,但大浪淘沙后,仅留存几家企业做大做强。在快速变化的技术趋势面前,每个人都有自己不同的理解,让市场去选择,让客户去选择,可能是一个更好的方式。 “技术的提升最终是靠市场和客户的需求牵引,中国真正的优势在于拥有全球最大的市场,以及众多开发者愿意去拥抱新技术。”李星宇表示。 英伟达此次禁止在其他GPU上通过转译层运行CUDA软件,或许将给部分仅依靠兼容路径的厂商敲响警钟。在上述GPU业内人士看来,英伟达此次“象征性限制措施”还是比较克制的,并没有对应用程序接口采取限制,“可是对于一个创业者来讲,他要思考的不是简单的现状,而更应该是趋势。这意味着不能止于第一步的限制是什么,还得去思考第二、第三步的限制是什么。”
近期,英伟达宣布禁止在其他GPU上通过转译层运行CUDA软件的消息引起业内广泛讨论。
GPU的核心竞争力在于架构等因素决定的性能先进性和计算生态壁垒。众所周知,英伟达凭借先发优势,以及大幅降低开发门槛的CUDA架构,稳稳圈住了大批用户,不仅使GPU在通用计算中逐渐成为主角,也成就了自身的护城河。
“在工具链层面兼容CUDA的GPU厂商会受到影响,但影响本身在技术层面还是比较复杂的。英伟达其实发出了一个非常强烈的信号,就是他正在扎紧自己生态的篱笆。”某GPU业内人士对第一财经表示。
“独立自主和开放兼容并不矛盾”
中信证券表示,由于CUDA的闭源特性,以及快速的更新,后来者很难通过指令翻译等方式完美兼容,即使部分兼容也会有较大的性能损失,导致在性价比上持续落后英伟达。同时,CUDA是英伟达的专属软件栈,包含了许多英伟达GPU硬件的专有特性,这部分在其他厂商的芯片上并不能得到体现。
这正是国内厂商面临的困境。当前国内GPU厂商纷纷大力投入研发迭代架构,谋求构建自主软硬件生态。华安嘉业投资管理有限公司相关负责人此前也对第一财经表示,国产GPU在起步阶段兼容现有生态更容易发展,但长期还是要摆脱兼容思路,发展自有核心技术。
“我们经常讲兼容,但兼容不代表要和英伟达做得完全一样,而是说你做的东西可以去承载所有技术的生态,可以把英伟达的生态吸收过来、直接利用。但要做功能全面对标英伟达的GPU芯片难度很大,目前大多数厂商采取的策略是仅实现英伟达GPU人工智能加速的部分功能。”摩尔线程CTO张钰勃告诉第一财经,“但摩尔线程能够实现英伟达系统架构里的四大主要功能,包括通用计算、人工智能加速、图形渲染和视频编解码。”
摩尔线程成立于2020年,是一家以全功能GPU芯片设计为主的集成电路企业。据悉,摩尔线程推出了全面对标CUDA的MUSA架构,用户能够将CUDA写的应用程序通过摩尔线程的编译器重新编译成MUSA的应用,从而实现接近零成本迁移,同时也能够通过标准编程语言开发新的应用。“所以说MUSA本身是一套独立自主的生态,同时也是个开放的、可以吸收现有生态的全新生态。”张钰勃称。
“独立自主和开放兼容并不矛盾。我们一方面可以独立自主发展实现可控,一方面也可以开放兼容现有CUDA优势。”张钰勃告诉第一财经,“只有硬件功能完全对标,才能够有效地把CUDA生态的应用吸收过来。如果没有办法吸收现有生态,另建一个新生态,真要建成也是十几二十年的事。”
“寻找志同道合的客户”
事实上,客户迁移成本是推动国内GPU厂商加速生态建设的重要因素之一。目前,国内也存在一些坚持“难而正确”理念的厂商,选择了自建生态、不兼容的道路,燧原科技就是其一。
燧原科技专注于人工智能领域云端和边缘算力产品,致力于为通用人工智能打造算力底座,提供原始创新、具备自主知识产权的AI加速卡、系统集群和软硬件解决方案。
对于燧原这类算力厂商来说,客户迁移成本始终存在,因此需要寻找志同道合的客户。“燧原希望与产业合作伙伴一起构建一个开放开源的生态系统,我们的客户也愿意跟那些有长期主义的合作伙伴一起去打磨产品。”燧原科技首席生态官李星宇告诉第一财经。
随着技术的发展,国内厂商的自建生态之路有望越走越宽。
“技术生态的范式转移,给像燧原这样的初创公司自建生态带来一个新的契机。”李星宇认为,随着大模型时代的到来,模型的架构底座趋向于一致,即Transformer,这收敛了对于硬件的需求,让硬件设计的方向更加聚焦和明确,减轻了碎片化程度;与此同时,越来越流行的开源框架和编程语言,让芯片公司有更好的基础去适配不同模型,让开发者更容易在开发工具层面去适配不同的硬件。
“客户的迁移成本取决于很多因素,但整体的趋势是越来越便捷。”李星宇表示,“比如说我们兼容PyTorch的主流算子,采用这些主流算子的模型理论上可以直接迁移而不需要改源代码。同时未来我们也会支持更多主流的开源编程语言,让客户开发新的模型时,也会变得更加容易。”
目前,国内有多家人工智能芯片厂商选择自建生态,但并未形成统一生态,各家正处于跑马圈地、各自发展的时期。诚然,在技术发展的早期和技术快速迭代的时期,很难制定一套统一的标准。正如海外GPU发展的早期,行业存在四十多家企业,但大浪淘沙后,仅留存几家企业做大做强。在快速变化的技术趋势面前,每个人都有自己不同的理解,让市场去选择,让客户去选择,可能是一个更好的方式。
“技术的提升最终是靠市场和客户的需求牵引,中国真正的优势在于拥有全球最大的市场,以及众多开发者愿意去拥抱新技术。”李星宇表示。
英伟达此次禁止在其他GPU上通过转译层运行CUDA软件,或许将给部分仅依靠兼容路径的厂商敲响警钟。在上述GPU业内人士看来,英伟达此次“象征性限制措施”还是比较克制的,并没有对应用程序接口采取限制,“可是对于一个创业者来讲,他要思考的不是简单的现状,而更应该是趋势。这意味着不能止于第一步的限制是什么,还得去思考第二、第三步的限制是什么。”