2x6投资动态-投资建议来源 华泰证券: DeepSeek有望加快模子测验与CUDA解耦
你的位置:2x6投资动态 > 市场分析 > 投资建议来源 华泰证券: DeepSeek有望加快模子测验与CUDA解耦
投资建议来源 华泰证券: DeepSeek有望加快模子测验与CUDA解耦
发布日期:2025-02-22 08:14    点击次数:109

投资建议来源 华泰证券: DeepSeek有望加快模子测验与CUDA解耦

e公司讯,华泰证券征询以为,DeepSeek在V3中使用了比较CUDA更底层的PTX 来优化硬件算法,PTX是CUDA编译的中间代码,在CUDA和最终机器码之间起到桥梁作用。而NSA则使用了OpenAl提议的Triton编程言语高效编写GPU代码,Triton的底层可调用CUDA,也可调用其他GPU言语,包括AMD的rocm以及国产算力芯片言语,如寒武纪的想元590芯片和海光信息的深算一号(DCU)内置的HYGON ISA提示集。LLM的测验短期内虽未足够脱离CUDA 生态,但DeepSeek NSA的推出使其初步呈现出与CUDA解耦的趋势,并为后续适配更多类型的算力芯片奠定基础。以异腾为代表的国产算力也曾很好的适配了DeepSeek-R1 等国产模子,并获取了高效推理的效劳,华泰证券以为,陪同国外算力的受限,针对国产算力的优化或将有抓续发达,值得嗜好。