网站地图官方微信:
网站首页 秀林镇 芦溪县 葛坡镇 八角乡 剑峰乡 牟坪镇

当前位置: 首页 >

写CUDA到底难在哪?

对GPU进行性能优化时,cudagraph是绕不开的话题。

不仅是GPU,大部分的xpu都会提供类似graph mode的优化,相比于每次分别由CPU进行kernel launch的eager mode,graph mode通常都会有较大性能提升,然而也经常容易出现各种各样的奇怪问题。

NVIDIA有一个简单的 博客 介绍,其中只使用了stream capture的形式来构造cudagraph,而且本质上就是多个kernel前后提交,根本无法展示cudagraph的复杂性。

本文尝试从底层原理出发,根据文档 和 …。

写CUDA到底难在哪?

  • | 为什么腾讯云或者阿里云不让自建dns服务器? |

    公共DNS算电信业务,自建且不备案就是违规经营电信业务电信业...

    查看详情>>
  • | 为什么网络上都在说隋坡厉害? |

  • | 如何看待伊朗国家电视台发文称“今晚将会发生一件大事,让世界铭记几个世纪”? |

  • | 瑜伽裤和牛仔裤哪个更显身材? |

  • | 如果全球都停止出口粮食,中国能否自给自足? |

  • | 苹果为什么要给每代MacOS起个名字,真以为人们记得住分得清吗? |

  • | AutoCAD和SolidWorks有什么区别? |

  • | 评价一下Proxmox VE与ESXi的优劣? |

  • | 如何评价前端框架 Solid? |

  • | 为什么这么久了还是没有主流软件开发鸿蒙版? |

  • | Firefox是如何一步一步衰落的? |

  • 根据评论区的聊天情况,有人说我吹国产软件,那我还真想好好吹一...

    2025-06-20
  • Rust对C++的威胁不威胁先放在一边,rustdoc文档功...

    2025-06-20
  • 看着 uv 最近这么火,功能也挺全,又能当 pip 用还能管...

    2025-06-20
  • 2025.06.06 老仙刚去给一座大桥通车剪彩。 该桥三哥...

    2025-06-20

关注我们

添加微信好友,关注最新动态