#include <stdio.h>
#include <string.h>
#include <stdlib.h>
#include <conio.h>
struct head
{
unsigned char b //记录字符在数组中的位置
long count//字符出现频率(权值)
long parent,lch,rch //定义哈夫曼树指针变量
char bits[256]//定义存储哈夫曼编码的数组
}
header[512],tmp
/*压缩*/
void compress()
{
char filename[255],outputfile[255],buf[512]
unsigned char c
long i,j,m,n,f
long min1,pt1,flength,length1,length2
double div
FILE *ifp,*ofp
printf("\t请您输入需要压缩的文件:")
gets(filename)
ifp=fopen(filename,"rb")
if(ifp==NULL)
{
printf("\n\t文件打开失败!\n\n")
return
}
printf("\t请您输入压缩后的文件名:")
gets(outputfile)
ofp=fopen(strcat(outputfile,".hub"),"wb")
if(ofp==NULL)
{
printf("\n\t压缩文件失败!\n\n")
return
}
flength=0
while(!feof(ifp))
{
fread(&c,1,1,ifp)
header[c].count++ //字符重复出现频率+1
flength++ //字符出现原文件长度+1
}
flength--
length1=flength //原文件长度用作求压缩率的分母
header[c].count--
for(i=0i<512i++)
{
if(header[i].count!=0) header[i].b=(unsigned char)i
/*将每个哈夫曼码值及其对应的ASCII码存放在一维数组header[i]中,
且编码表中的下标和ASCII码满足顺序存放关系*/
else header[i].b=0
header[i].parent=-1header[i].lch=header[i].rch=-1 //对结点进行初始化
}
for(i=0i<256i++)//根据频率(权值)大小,对结点进行排序,选择较小的结点进树
{
for(j=i+1j<256j++)
{
if(header[i].count<header[j].count)
{
tmp=header[i]
header[i]=header[j]
header[j]=tmp
}
}
}
for(i=0i<256i++) if(header[i].count==0) break
n=i //外部叶子结点数为n个时,内部结点数为n-1,整个哈夫曼树的需要的结点数为2*n-1.
m=2*n-1
for(i=ni<mi++) //构建哈夫曼树
{
min1=999999999 //预设的最大权值,即结点出现的最大次数
for(j=0j<ij++)
{
if(header[j].parent!=-1) continue
//parent!=-1说明该结点已存在哈夫曼树中,跳出循环重新选择新结点*/
if(min1>header[j].count)
{
pt1=j
min1=header[j].count
continue
}
}
header[i].count=header[pt1].count
header[pt1].parent=i //依据parent域值(结点层数)确定树中结点之间的关系
header[i].lch=pt1 //计算左分支权值大小
min1=999999999
for(j=0j<ij++)
{
if(header[j].parent!=-1) continue
if(min1>header[j].count)
{
pt1=j
min1=header[j].count
continue
}
}
header[i].count+=header[pt1].count
header[i].rch=pt1 //计算右分支权值大小
header[pt1].parent=i
}
for(i=0i<ni++) //哈夫曼无重复前缀编码
{
f=i
header[i].bits[0]=0 //根结点编码0
while(header[f].parent!=-1)
{
j=f
f=header[f].parent
if(header[f].lch==j) //置左分支编码0
{
j=strlen(header[i].bits)
memmove(header[i].bits+1,header[i].bits,j+1)
//依次存储连接“0”“1”编码
header[i].bits[0]='0'
}
else //置右分支编码1
{
j=strlen(header[i].bits)
memmove(header[i].bits+1,header[i].bits,j+1)
header[i].bits[0]='1'
}
}
}
fseek(ifp,0,SEEK_SET) //从文件开始位置向前移动0字节,即定位到文件开始位置
fwrite(&flength,sizeof(int),1,ofp)
/*用来将数据写入文件流中,参数flength指向欲写入的数据地址,
总共写入的字符数以参数size*int来决定,返回实际写入的int数目1*/
fseek(ofp,8,SEEK_SET)
buf[0]=0 //定义缓冲区,它的二进制表示00000000
f=0
pt1=8
/*假设原文件第一个字符是"A",8位2进制为01000001,编码后为0110识别编码第一个'0',
那么我们就可以将其左移一位,看起来没什么变化。下一个是'1',应该|1,结果00000001
同理4位都做完,应该是00000110,由于字节中的8位并没有全部用完,我们应该继续读下一个字符,
根据编码表继续拼完剩下的4位,如果字符的编码不足4位,还要继续读一个字符,
如果字符编码超过4位,那么我们将把剩下的位信息拼接到一个新的字节里*/
while(!feof(ifp))
{
c=fgetc(ifp)
f++
for(i=0i<ni++)
{
if(c==header[i].b) break
}
strcat(buf,header[i].bits)
j=strlen(buf)
c=0
while(j>=8) //对哈夫曼编码位 *** 作进行压缩存储
{
for(i=0i<8i++)
{
if(buf[i]=='1') c=(c<<1)|1
else c=c<<1
}
fwrite(&c,1,1,ofp)
pt1++ //统计压缩后文件的长度
strcpy(buf,buf+8) //一个字节一个字节拼接
j=strlen(buf)
}
if(f==flength) break
}
if(j>0)//对哈夫曼编码位 *** 作进行压缩存储
{
strcat(buf,"00000000")
for(i=0i<8i++)
{
if(buf[i]=='1') c=(c<<1)|1
else c=c<<1
}
fwrite(&c,1,1,ofp)
pt1++
}
fseek(ofp,4,SEEK_SET)
fwrite(&pt1,sizeof(long),1,ofp)
fseek(ofp,pt1,SEEK_SET)
fwrite(&n,sizeof(long),1,ofp)
for(i=0i<ni++)
{
fwrite(&(header[i].b),1,1,ofp)
c=strlen(header[i].bits)
fwrite(&c,1,1,ofp)
j=strlen(header[i].bits)
if(j%8!=0) //若存储的位数不是8的倍数,则补0
{
for(f=j%8f<8f++)
strcat(header[i].bits,"0")
}
while(header[i].bits[0]!=0)
{
c=0
for(j=0j<8j++) //字符的有效存储不超过8位,则对有效位数左移实现两字符编码的连接
{
if(header[i].bits[j]=='1') c=(c<<1)|1 //|1不改变原位置上的“0”“1”值
else c=c<<1
}
strcpy(header[i].bits,header[i].bits+8) //把字符的编码按原先存储顺序连接
fwrite(&c,1,1,ofp)
}
}
length2=pt1--
div=((double)length1-(double)length2)/(double)length1 //计算文件的压缩率
fclose(ifp)
fclose(ofp)
printf("\n\t压缩文件成功!\n")
printf("\t压缩率为 %f%%\n\n",div*100)
return
}
/*解压缩*/
void uncompress()
{
char filename[255],outputfile[255],buf[255],bx[255]
unsigned char c
long i,j,m,n,f,p,l
long flength
FILE *ifp,*ofp
printf("\t请您输入需要解压缩的文件:")
gets(filename)
ifp=fopen(strcat(filename,".hub"),"rb")
if(ifp==NULL)
{
printf("\n\t文件打开失败!\n")
return
}
printf("\t请您输入解压缩后的文件名:")
gets(outputfile)
ofp=fopen(outputfile,"wb")
if(ofp==NULL)
{
printf("\n\t解压缩文件失败!\n")
return
}
fread(&flength,sizeof(long),1,ifp) //读取原文件长度,对文件进行定位
fread(&f,sizeof(long),1,ifp)
fseek(ifp,f,SEEK_SET)
fread(&n,sizeof(long),1,ifp)
for(i=0i<ni++)
{
fread(&header[i].b,1,1,ifp)
fread(&c,1,1,ifp)
p=(long)c //读取原文件字符的权值
header[i].count=p
header[i].bits[0]=0
if(p%8>0) m=p/8+1
else m=p/8
for(j=0j<mj++)
{
fread(&c,1,1,ifp)
f=c
itoa(f,buf,2) //将f转换为二进制表示的字符串
f=strlen(buf)
for(l=8l>fl--)
{
strcat(header[i].bits,"0")
}
strcat(header[i].bits,buf)
}
header[i].bits[p]=0
}
for(i=0i<ni++) //根据哈夫曼编码的长短,对结点进行排序
{
for(j=i+1j<nj++)
{
if(strlen(header[i].bits)>strlen(header[j].bits))
{
tmp=header[i]
header[i]=header[j]
header[j]=tmp
}
}
}
p=strlen(header[n-1].bits)
fseek(ifp,8,SEEK_SET)
m=0
bx[0]=0
while(1)//通过哈夫曼编码的长短,依次解码,从原来的位存储还原到字节存储
{
while(strlen(bx)<(unsigned int)p)
{
fread(&c,1,1,ifp)
f=c
itoa(f,buf,2)
f=strlen(buf)
for(l=8l>fl--) //在单字节内对相应位置补0
{
strcat(bx,"0")
}
strcat(bx,buf)
}
for(i=0i<ni++)
{
if(memcmp(header[i].bits,bx,header[i].count)==0) break
}
strcpy(bx,bx+header[i].count) /*从压缩文件中的按位存储还原到按字节存储字符,
字符位置不改变*/
c=header[i].b
fwrite(&c,1,1,ofp)
m++ //统计解压缩后文件的长度
if(m==flength) break //flength是原文件长度
}
fclose(ifp)
fclose(ofp)
printf("\n\t解压缩文件成功!\n")
if(m==flength) //对解压缩后文件和原文件相同性比较进行判断(根据文件大小)
printf("\t解压缩文件与原文件相同!\n\n")
else printf("\t解压缩文件与原文件不同!\n\n")
return
}
/*主函数*/
int main()
{
int c
while(1) //菜单工具栏
{
printf("\t _______________________________________________\n")
printf("\n")
printf("\t * 压缩、解压缩 小工具 *\n")
printf("\t _______________________________________________\n")
printf("\t _______________________________________________\n")
printf("\t| |\n")
printf("\t| 1.压缩 |\n")
printf("\t| 2.解压缩 |\n")
printf("\t| 0.退出 |\n")
printf("\t|_______________________________________________|\n")
printf("\n")
printf("\t 说明:(1)采用哈夫曼编码\n")
printf("\t (2)适用于文本文件\n")
printf("\n")
do //对用户输入进行容错处理
{
printf("\n\t*请选择相应功能(0-2):")
c=getch()
printf("%c\n",c)
if(c!='0' &&c!='1' &&c!='2')
{
printf("\t@_@请检查您的输入在0~2之间!\n")
printf("\t请再输入一遍!\n")
}
}while(c!='0' &&c!='1' &&c!='2')
if(c=='1') compress() //调用压缩子函数
else if(c=='2') uncompress() //调用解压缩子函数
else
{
printf("\t欢迎您再次使用该工具^_^\n")
exit(0) //退出该工具
}
system("pause") //任意键继续
system("cls")//清屏
}
return 0
}
是用霍夫曼树做的#include <stdio.h>
#include <string.h>
#include <stdlib.h>
#include <conio.h>
struct head
{
unsigned char b/*the charactor*/
long count/*the frequency*/
long parent,lch,rch/*make a tree*/
char bits[256]/*the haffuman code*/
}
header[512],tmp
void compress()
{
char filename[255],outputfile[255],buf[512]
unsigned char c
long i,j,m,n,f
long min1,pt1,flength
FILE *ifp,*ofp
printf("source filename:")
gets(filename)
ifp=fopen(filename,"rb")
if(ifp==NULL)
{
printf("source file open error!\n")
return
}
printf("destination filename:")
gets(outputfile)
ofp=fopen(outputfile,"wb")
if(ofp==NULL)
{
printf("destination file open error!\n")
return
}
flength=0
while(!feof(ifp))
{
fread(&c,1,1,ifp)
header[c].count++
flength++
}
flength--
header[c].count--
for(i=0i<512i++)
{
if(header[i].count!=0) header[i].b=(unsigned char)i
else header[i].b=0
header[i].parent=-1
header[i].lch=header[i].rch=-1
}
for(i=0i<256i++)
{
for(j=i+1j<256j++)
{
if(header[i].count<header[j].count)
{
tmp=header[i]
header[i]=header[j]
header[j]=tmp
}
}
}
for(i=0i<256i++) if(header[i].count==0) break
n=i
m=2*n-1
for(i=ni<mi++)
{
min1=999999999
for(j=0j<ij++)
{
if(header[j].parent!=-1) continue
if(min1>header[j].count)
{
pt1=j
min1=header[j].count
continue
}
}
header[i].count=header[pt1].count
header[pt1].parent=i
header[i].lch=pt1
min1=999999999
for(j=0j<ij++)
{
if(header[j].parent!=-1) continue
if(min1>header[j].count)
{
pt1=j
min1=header[j].count
continue
}
}
header[i].count+=header[pt1].count
header[i].rch=pt1
header[pt1].parent=i
}
for(i=0i<ni++)
{
f=i
header[i].bits[0]=0
while(header[f].parent!=-1)
{
j=f
f=header[f].parent
if(header[f].lch==j)
{
j=strlen(header[i].bits)
memmove(header[i].bits+1,header[i].bits,j+1)
header[i].bits[0]='0'
}
else
{
j=strlen(header[i].bits)
memmove(header[i].bits+1,header[i].bits,j+1)
header[i].bits[0]='1'
}
}
}
fseek(ifp,0,SEEK_SET)
fwrite(&flength,sizeof(int),1,ofp)
fseek(ofp,8,SEEK_SET)
buf[0]=0
f=0
pt1=8
while(!feof(ifp))
{
c=fgetc(ifp)
f++
for(i=0i<ni++)
{
if(c==header[i].b) break
}
strcat(buf,header[i].bits)
j=strlen(buf)
c=0
while(j>=8)
{
for(i=0i<8i++)
{
if(buf[i]=='1') c=(c<<1)|1
else c=c<<1
}
fwrite(&c,1,1,ofp)
pt1++
strcpy(buf,buf+8)
j=strlen(buf)
}
if(f==flength) break
}
if(j>0)
{
strcat(buf,"00000000")
for(i=0i<8i++)
{
if(buf[i]=='1') c=(c<<1)|1
else c=c<<1
}
fwrite(&c,1,1,ofp)
pt1++
}
fseek(ofp,4,SEEK_SET)
fwrite(&pt1,sizeof(long),1,ofp)
fseek(ofp,pt1,SEEK_SET)
fwrite(&n,sizeof(long),1,ofp)
for(i=0i<ni++)
{
fwrite(&(header[i].b),1,1,ofp)
c=strlen(header[i].bits)
fwrite(&c,1,1,ofp)
j=strlen(header[i].bits)
if(j%8!=0)
{
for(f=j%8f<8f++)
strcat(header[i].bits,"0")
}
while(header[i].bits[0]!=0)
{
c=0
for(j=0j<8j++)
{
if(header[i].bits[j]=='1') c=(c<<1)|1
else c=c<<1
}
strcpy(header[i].bits,header[i].bits+8)
fwrite(&c,1,1,ofp)
}
}
fclose(ifp)
fclose(ofp)
printf("compress successfully!\n")
return
}
void uncompress()
{
char filename[255],outputfile[255],buf[255],bx[255]
unsigned char c
long i,j,m,n,f,p,l
long flength
FILE *ifp,*ofp
printf("source filename:")
gets(filename)
ifp=fopen(filename,"rb")
if(ifp==NULL)
{
printf("source file open error!\n")
return
}
printf("destination filename:")
gets(outputfile)
ofp=fopen(outputfile,"wb")
if(ofp==NULL)
{
printf("destination file open error!\n")
return
}
fread(&flength,sizeof(long),1,ifp)
fread(&f,sizeof(long),1,ifp)
fseek(ifp,f,SEEK_SET)
fread(&n,sizeof(long),1,ifp)
for(i=0i<ni++)
{
fread(&header[i].b,1,1,ifp)
fread(&c,1,1,ifp)
p=(long)c
header[i].count=p
header[i].bits[0]=0
if(p%8>0) m=p/8+1
else m=p/8
for(j=0j<mj++)
{
fread(&c,1,1,ifp)
f=c
itoa(f,buf,2)
f=strlen(buf)
for(l=8l>fl--)
{
strcat(header[i].bits,"0")
}
strcat(header[i].bits,buf)
}
header[i].bits[p]=0
}
for(i=0i<ni++)
{
for(j=i+1j<nj++)
{
if(strlen(header[i].bits)>strlen(header[j].bits))
{
tmp=header[i]
header[i]=header[j]
header[j]=tmp
}
}
}
p=strlen(header[n-1].bits)
fseek(ifp,8,SEEK_SET)
m=0
bx[0]=0
while(1)
{
while(strlen(bx)<(unsigned int)p)
{
fread(&c,1,1,ifp)
f=c
itoa(f,buf,2)
f=strlen(buf)
for(l=8l>fl--)
{
strcat(bx,"0")
}
strcat(bx,buf)
}
for(i=0i<ni++)
{
if(memcmp(header[i].bits,bx,header[i].count)==0) break
}
strcpy(bx,bx+header[i].count)
c=header[i].b
fwrite(&c,1,1,ofp)
m++
if(m==flength) break
}
fclose(ifp)
fclose(ofp)
printf("Uncompress successfully!\n")
return
}
int main()
{
int c
printf("1--Compress file\n")
printf("2--Uncompress file\n")
printf("Select 1 or 2:")
c=getch()
printf("%c\n",c)
if(c=='1') compress()
else if(c=='2') uncompress()
return 0
}
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)