Skip to content

Latest commit

 

History

History

05Kernel

Kernel 优化

在上层应用或者 AI 网络模型中,看到的是算子;但是在推理引擎实际执行的是具体的 Kernel,而推理引擎中 CNN 占据了主要是得执行时间,因此其 Kernel 优化尤为重要。

希望这个系列能够给大家、朋友们带来一些些帮助,也希望自己能够继续坚持完成所有内容哈!

内容大纲

PPT字幕需要到 Github 下载,网页课程版链接会失效哦~

建议优先下载 PDF 版本,PPT 版本会因为字体缺失等原因导致版本很丑哦~

大纲 小节 链接
Kernel 优化 01 Kernel 优化架构 slide, video
Kernel 优化 02 卷积操作基础原理 slide,video
Kernel 优化 03 Im2Col 算法 slide,video
Kernel 优化 04 Winograd 算法 slide,video
Kernel 优化 05 QNNPack 算法 slide,video
Kernel 优化 06 推理内存布局 slide,video
Kernel 优化 07 nc4hw4 内存排布 slide
Kernel 优化 08 汇编与循环优化 slide

备注

文字课程内容正在一节节补充更新,每晚会抽空继续更新正在 AISys ,希望您多多鼓励和参与进来!!!

文字课程开源在 AISys,系列视频托管B 站油管,PPT 开源在github,欢迎取用!!!

非常希望您也参与到这个开源项目中,B 站给 ZOMI 留言哦!

欢迎大家使用的过程中发现 bug 或者勘误直接提交代码 PR 到开源社区哦!

希望这个系列能够给大家、朋友们带来一些些帮助,也希望自己能够继续坚持完成所有内容哈!