在上层应用或者 AI 网络模型中,看到的是算子;但是在推理引擎实际执行的是具体的 Kernel,而推理引擎中 CNN 占据了主要是得执行时间,因此其 Kernel 优化尤为重要。
希望这个系列能够给大家、朋友们带来一些些帮助,也希望自己能够继续坚持完成所有内容哈!
内容大纲
PPT
和字幕
需要到 Github 下载,网页课程版链接会失效哦~建议优先下载 PDF 版本,PPT 版本会因为字体缺失等原因导致版本很丑哦~
大纲 | 小节 | 链接 |
---|---|---|
Kernel 优化 | 01 Kernel 优化架构 | slide, video |
Kernel 优化 | 02 卷积操作基础原理 | slide,video |
Kernel 优化 | 03 Im2Col 算法 | slide,video |
Kernel 优化 | 04 Winograd 算法 | slide,video |
Kernel 优化 | 05 QNNPack 算法 | slide,video |
Kernel 优化 | 06 推理内存布局 | slide,video |
Kernel 优化 | 07 nc4hw4 内存排布 | slide |
Kernel 优化 | 08 汇编与循环优化 | slide |
文字课程内容正在一节节补充更新,每晚会抽空继续更新正在 AISys ,希望您多多鼓励和参与进来!!!
文字课程开源在 AISys,系列视频托管B 站和油管,PPT 开源在github,欢迎取用!!!
非常希望您也参与到这个开源项目中,B 站给 ZOMI 留言哦!
欢迎大家使用的过程中发现 bug 或者勘误直接提交代码 PR 到开源社区哦!
希望这个系列能够给大家、朋友们带来一些些帮助,也希望自己能够继续坚持完成所有内容哈!