当前位置: 首页 > news >正文

5. Warp and Bank

本篇介绍数据的合并访问和非合并访问。

线程束

image
在一个线程束(warp)中的线程执行指令的方式是SIMT,即单指令多线程,单指令表明线程束中的线程执行相同的指令,如果因为条件语句导致线程束内的线程选择了不同分支,就会出现线程束分化。
warp是并行执行的一个独立单位,warp内所有线程是在同一个时钟周期内执行指令的。

Bank Conflict

共享内存被划分为多个大小相等的bank,其组织方式如下所示。
image
同一warp的不同线程访问同一bank的不同地址时,会产生bank conflict,此时这些线程会顺序执行,而失去了并行性。
对于不同warp,不存在bank conflict,假设有两个warp的线程同时访问同一个bank,那么他们会通过调度来决定先后,这个过程本身不属于bank conflict,而是调度问题。(在一个SM上,不同warp严格来说是并发执行的,而不是真正并行)

参考资料

https://face2ai.com/CUDA-F-3-2-理解线程束执行的本质-P1/
https://www.cnblogs.com/zhcnfyy/p/15184405.html
https://segmentfault.com/a/1190000007533157

http://www.sczhlp.com/news/1399/

相关文章:

  • WiFiManager 项目
  • 5. Coalesced and Uncoalesced
  • 第八天
  • 【AI语音-小智】xiaozhi-esp32实现源码分析
  • 【笔记】Visual Studio 2022 入门指南
  • Visual Studio 2022 入门指南
  • 20250729 之所思 - 人生如梦
  • 2025牛客暑期多校训练营5
  • 【esp32-s3】如何进行WiFi配网
  • 【ESP8266】小电视项目进展记录
  • 【LeetCode 138】力扣算法:随机链表的复制
  • Rocky Linux使用nginx时启用图片压缩
  • 7.29随笔
  • kali安装maven-cnblog
  • 【ESP8266】模组对比(ESP-12F)以及拆盖图
  • log4j2 远程代码执行漏洞复现(CVE-2021-44228)-cnblog
  • 第四天
  • Luogu-P3455 [POI 2007] ZAP-Queries
  • PDF转Word免费工具!批量处理PDF压缩,合并, OCR识别, 去水印, 签名等全功能详解
  • npm构建公共组件库
  • 空间复杂度 O(1) 解决力扣的困难算法:k个一组翻转链表
  • HotSpot虚拟机对象探秘
  • 6
  • 【设计模式】创建者模式——1.简单工厂模式
  • 智谱 GLM-4.5 也支持了Claude Code
  • 做题记录
  • 若依
  • Rust 性能优化秘籍:write! 宏让字符串构建提速 75%
  • 基于文件对比的技术写作内容碎片统一与上下文还原方法论
  • Rust 编译优化指南:如何让你的代码更小更快?