Python位掩码(可变长度)

Python位掩码(可变长度),第1张

概述为了解决一个研究问题,我们必须在 python中组织位掩码搜索. 作为输入,我们有一个原始数据(我们将其表示为一系列位).尺寸约为1,5Gb. 作为输出,我们必须得到特定位掩码的出现次数. 让我举一个例子来描述这种情况 input: sequence of bits, a bitmask to search(mask length: 12bits) 第一个想法(不是有效的)就是像这样使用XO 为了解决一个研究问题,我们必须在 python中组织位掩码搜索.
作为输入,我们有一个原始数据(我们将其表示为一系列位).尺寸约为1,5Gb.
作为输出,我们必须得到特定位掩码的出现次数.
让我举一个例子来描述这种情况

input:    sequence of bits,a bitmask to search(mask length: 12bits)

第一个想法(不是有效的)就是像这样使用XOR:

1step: from input we take 12 first bits(position 0 to 11) and make XOR with mask 2step: from input we take bits from 1 to 12 position and XOR with mask ...

让我们继续前进2步:

input sequence 100100011110101010110110011010100101010110101010mask to search: 100100011110step 1: take first 12 bits from input: 100100011110 and XOR it with mask.step 2: teke bits from 1 to 12position: 001000111101 and XOR it with mask....

问题是:如何组织从输入中取位?
我们能够取前12位,但是如何从1到12位获取我们需要继续下一次迭代的位?

在我们使用python BitString包之前,我们花在搜索所有掩码上的时间都很高.
还有一个.掩码的大小可以是12位到256位.
有什么建议吗?任务必须在python中实现

解决方法 你的算法是在数据中搜索“字符串”的天真方式,但幸运的是有更好的算法.
一个例子是 KMP algorithm,但还有其他一些可能更适合您的用例.

使用更好的算法,您可以从O(n * m)的复杂度到O(n m).

总结

以上是内存溢出为你收集整理的Python位掩码(可变长度)全部内容,希望文章能够帮你解决Python位掩码(可变长度)所遇到的程序开发问题。

如果觉得内存溢出网站内容还不错,欢迎将内存溢出网站推荐给程序员好友。

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/langs/1192503.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-06-03
下一篇 2022-06-03

发表评论

登录后才能评论

评论列表(0条)

保存