网站地图官方微信:
网站首页 阅览室桌椅 圆规 荧光笔 眼镜架 验钞机 学校家具

当前位置: 首页 >

写CUDA到底难在哪?

对GPU进行性能优化时,cudagraph是绕不开的话题。

不仅是GPU,大部分的xpu都会提供类似graph mode的优化,相比于每次分别由CPU进行kernel launch的eager mode,graph mode通常都会有较大性能提升,然而也经常容易出现各种各样的奇怪问题。

NVIDIA有一个简单的 博客 介绍,其中只使用了stream capture的形式来构造cudagraph,而且本质上就是多个kernel前后提交,根本无法展示cudagraph的复杂性。

本文尝试从底层原理出发,根据文档 和 …。

写CUDA到底难在哪?

  • | 慈禧为什么要反对戊戌变法? |

    别说慈禧,任何一个看过《戊戌变法》内容的现代人都会秒变“守旧...

    查看详情>>
  • | 和女生旅游开一间房有什么注意事项? |

  • | 为什么欧美影视喜欢露点? |

  • | 山姆超市是怎么在中国火起来的? |

  • | 为什么中国主机带宽比美国贵5倍(原来错误的10000倍),比如阿里云? |

  • | 异性同办公室久了会不会日久生情? |

  • | 谷歌云服务宕机导致 OpenAI、Shopify 等服务中断,此次宕机的具体技术原因是什么? |

  • | 为什么一部分 Go 布道师的博客不更新了? |

  • | 有一个乌克兰的朋友问我,中国人凭什么能享受和平,我该怎么说? |

  • | 大模型 Agent 是不是就是各种 Prompt 的堆叠? |

  • | 以军称已打死伊朗最高军事指挥官阿里·沙德马尼,具体情况如何?这会对伊朗军方造成怎样的影响? |

  • 2024年9月24,刚被裁,我感觉我的基本情况还行,211,...

    2025-06-18
  • hw是市场上唯一合法的集资公司,每年需要拿出销售额的十分之一...

    2025-06-18
  • 原回答: 杭州110问:你在干什么? 被***女子:我在开车...

    2025-06-18
  • 熬了几年建的独立站,被人1:1复刻了! 从产品到网站布局设计...

    2025-06-18

关注我们

添加微信好友,关注最新动态