用excel标注出一个数据在一列中总共重复出现的次数,具体步骤如下:
我们需要准备的材料分别是:电脑、Excel表格。
1、首先我们打开需要编辑的Excel表格,点击需要标注的后面一列单元格。
2、然后我们在单元格中输入:=if(countif(a$1:a1,a1)=1,countif(a:a,a1),"") ,之后回车确定。
3、然后鼠标左键双击B列第一个单元格右下角中的小正方形,就自动填充下面的单元格即可全部标注出一个数据在一列中总共重复出现的次数。
一列表格中,重复数据有多项,怎么能够获取,重复次数最多的前三的数 设检查A列数据,B列为空列,请在B1输入公式:
=COUNTIF(A:A,A1)
下拉填充,即可求出A1在A列的出现次数。
请在C1输入公式:
=IF(RANK(B1,B:B)>3,"",RANK(B1,B:B))
下拉填充,即可列出重复次数最多的前三的排序,对应的A列数即为重复次数最多的前三的数。
mysql 需要开启子查询
select tid,subject from 表 where tid in (
select tid from (
select tid,count() as C from 表 group by tid
)T
order by tid desc
) limit 0,5
比如b[i]=num,表示i出现了num次。
实现的代码也很简单。
初始化数组b全部为0
for(i=0; i<n; i++)
{
b[a[i]]++;
}
这样就可以了,直接找数组b中的最大值,就是出现次数,下表为出现的值。
比如找出A1:A100中重复次数最多的数据,你可以在B1输入公式
=INDEX(A:A,MAX(IF(COUNTIF(A:A,A1:A200)=MAX(COUNTIF(A:A,A1:A200)),ROW(1:200),)))
数组公式以ctrl+shift+enter三键组合结束输入
SELECT 某列, COUNT()
FROM 某表
GROUP BY 某列
ORDER BY COUNT()
高手是重复次数最多的人
我们大部分人都不是天生的高手,高手们都是通过每次不厌其烦的锻炼来提高自己这方面能力的
怎么在海量数据中找出重复次数最多的一个假设我们可以用的内存是64M,总的数据量是102464M即64G。 1、首先预设1024个文件作为“桶”,依次读取原始数据的记录,每读到一条记录就进行哈希计算,获得的哈希值余上1024,把这条记录放到那个桶里,即: bucket_num = hash(record) % 1024 2
假设我们可以用的内存是64M,总的数据量是102464M即64G。
1、首先预设1024个文件作为“桶”,依次读取原始数据的记录,每读到一条记录就进行哈希计算,获得的哈希值余上1024,把这条记录放到那个桶里,即:
bucket_num = hash(record) % 1024
2、由于相同的记录哈希值一定相同,所以重复数据一定落入同一个桶内,对于落入同一个桶内的数据,直接为该数据的数量加一,即桶内的条目都是唯一的,各自记录自己的总重复数量。
3、当一个桶的体积达到64M的时候(应该非常罕见),为该桶增加一个子桶,新的数据进来的时候先在父桶内找相同记录,没有的话在放入子桶,重复数设置为1。
4、当全部数据读取完之后,依次对1024个桶(及其子桶)进行内部排序,可以一次性把64M的数据读入内存快速排序即可,然后再归并父桶及其子桶,最终得到1024个桶内的最大重复记录。
5、对这1024个桶的最大值进行比较,获得一个最终的最大值。
评论 (2) • 链接 • 2012-12-19
0
这个答案看似很完美, 但是实际上有很多问题
1) "对于落入同一个桶内的数据,直接为该数据的数量加一": 数据存在于文件里,无序,怎么去定位"该数据"
2) "每读到一条记录就进行哈希计算,获得的哈希值余上1024,对于落入同一个桶内的数据,直接为该数据的数量加一": 就算1)的问题解决了, 对于每一条数据, 需要一次磁盘随机io读写 海量数据下此方案基本无法使用 – brayden 2013-07-01
1选中需要excel查找重复数据的所有单元格。
2在excel中选择条件格式-突出显示单元格规则-重复值。
3设置excel查找重复数据后突出显示方式,然后点击确定。
4此时excel查找重复数据便做好了,所有重复的数据都以浅红色填充显示。
不需要公式和宏,数据稳定可靠。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)