网站地图官方微信:
网站首页 俵口乡 古田镇 中山市 高屋乡 美兴镇 锁南镇

当前位置: 首页 >

写CUDA到底难在哪?

对GPU进行性能优化时,cudagraph是绕不开的话题。

不仅是GPU,大部分的xpu都会提供类似graph mode的优化,相比于每次分别由CPU进行kernel launch的eager mode,graph mode通常都会有较大性能提升,然而也经常容易出现各种各样的奇怪问题。

NVIDIA有一个简单的 博客 介绍,其中只使用了stream capture的形式来构造cudagraph,而且本质上就是多个kernel前后提交,根本无法展示cudagraph的复杂性。

本文尝试从底层原理出发,根据文档 和 …。

写CUDA到底难在哪?

  • | 在NAS上安装了什么应用,让你的生活体验有了巨大的提升? |

    一、外网挂载nas可以在公司直接将文件存到nas,也可以从n...

    查看详情>>
  • | 老板说我设计了一周的海报还是不行,我到底该怎么学啊? |

  • | 参考 FreeBSD,随着 Ruby 的没落,GitHub、GitLab 是否会去 Ruby 化? |

  • | “真实承诺-3”,伊朗的报复能打疼以色列吗? |

  • | Gemini 2.5 Flash 和Pro稳定版上线,和之前版本相比,在性能和应用场景上有哪些提升? |

  • | 五年以内会爆发第三次世界大战吗? |

  • | 使用 Go 语言开发游戏服务端的是如何忍受无法热更新的? |

  • | 陈楚生第一,马嘉祺淘汰,如何评价《歌手 2025》第六期所有歌手的演唱? |

  • | 古代军队明明有前锋开路,为什么大军还会被埋伏? |

  • | 广西桂军真的很厉害吗? |

  • | 你们的腰椎间盘突出,怎么治好的? |

  • 热知识: 六代的飞控难度要远大于 B-21。 技术与工程方...

    2025-06-21
  • 在技术面试中,遇到过这样一个有意思的场景,且听我娓娓道来。 ...

    2025-06-21
  • 公共DNS算电信业务,自建且不备案就是违规经营电信业务电信业...

    2025-06-21
  • 搭建了一个emby公益服,但是经常会出现欧美剧没有中文字幕的...

    2025-06-21

关注我们

添加微信好友,关注最新动态