DeepSeek绕过CUDA的重大意义
说一个炸锅消息!美国硬件媒体Tom‘s Hardware发表文章,称DeepSeek已经绕过了CUDA,使用更底层的编程语言做优化,也就是PTX语言。所以程序员都会使用CUDA编程,这也是英伟达最重要的护城河之一。如果DeepSeek真的绕开了CUDA,直接在PTX层面编程优化,那就意味着DeepSeek也有能力使用其他GPU、在汇编层面进行优化,从而摆脱对CUDA和英伟达的依赖。事实上,DeepSeek在v3模型的论文中,曾提到过PTX编程的细节。你老美现在不是连阉割版的H20芯片都要禁售吗?无所吊谓,市面上又不是只有n卡。比如AMD,已经在MI300X GPU中集成了DeekSeek v3模型,我相信华为也会这么做,因为市面上的GPU架构就那么几款,并不复杂。更炸裂的是:Llama.cpp项目中,有人使用DeekSeek-R1编写底层代码,从而把WeAssembly的速度提升了2倍,这意味着什么?这意味着以后要移植到不同的GPU平台上,DeepSeek甚至可以自己生成汇编代码,然后快速移植,从而使整个AI行业,都不再受英伟达CUDA的垄断,甚至还有可能使用LPU芯片,类似Gorg模型,从而彻底摆脱GPU的束缚。反正现在已经有人提示这种可能性了:Llama蒸馏的DeepSeek R1模型,在LPU上运行速度惊人,这意味着如果有更多的LPU方案,那AI黑马可能真的会颠覆英伟达的估值泡沫,下一个AI核弹,正在酝酿中。昨天鲍威尔还罕见的提到了美国股市,他说AI的抛售不可持续,等于直接开嘴炮护盘,不过他也指出,现阶段资产价格确实偏高。美联储主席直接出面稳定股市情绪,足以说明现在的资金有多恐慌,美股用OpenAI+英伟达精心构筑的资本泡沫,正在被另外一条未曾设想的道路所动摇,而这条由中国AI公司搭建的道路,才刚刚启程,各位可一定要心里有数!
内容来自网友分享,若违规或者侵犯您的权益,请联系我们
所有跟帖: ( 主贴楼主有权删除不文明回复,拉黑不受欢迎的用户 )
楼主前期社区热帖:
>>>>查看更多楼主社区动态...