这可以追溯到早期的CPU设计。处理位图位的最快方法是从扫描线的起点开始一次读取32位。当扫描线的第一个字节在32位地址边界上对齐时,效果最佳。换句话说,地址是4的倍数。在早期的CPU上,第一个字节未对齐的情况将花费额外的CPU周期,以便从RAM中读取两个32位字并混洗字节以创建32位值。确保每条扫描线都从对齐的地址开始(如果跨度为4的倍数,则为自动)可以避免这种情况。
在现代CPU上,这不再是真正的问题,现在对齐缓存行边界变得更加重要。尽管如此,由于应用程序的原因,跨度要求的4的倍数仍然存在。
顺便说一句,您可以使用此格式和宽度轻松计算步幅:
int bitsPerPixel = ((int)format & 0xff00) >> 8; int bytesPerPixel = (bitsPerPixel + 7) / 8; int stride = 4 * ((width * bytesPerPixel + 3) / 4);
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)