python好玩的项目―色情图片识别代码分享

python好玩的项目―色情图片识别代码分享,第1张

概述一、实验简介本实验将使用Python3去识别图片是否为色情图片,我们会使用到PIL这个图像处理库,会编写算法来划分图像的皮肤区域

一、实验简介

本实验将使用 python3 去识别图片是否为色情图片,我们会使用到 PIL 这个图像处理库,会编写算法来划分图像的皮肤区域

1.1. 知识点

Python 3 的模块的安装
Python 3 基础知识
肤色像素检测与皮肤区域划分算法
Pillow 模块的使用
argparse 模块的使用

1.2. 效果展示

二、实验步骤

2.1. 安装包

PIL 2009年之后就没有更新了,也不支持 python3 ,于是有了 Alex Clark 领导的公益项目 Pillow,Pillow 是一个对 PIL 友好的分支,支持 python3,所以我们这里安装的是 Pillow,其官方文档

安装前更新源

$ sudo apt-get update

首先我们需要处理一个问题:当前实验楼的环境中 python3 命令使用的 python 版本为 3.5,但源中却没有 python3.5-dev,这会导致安装 Pillow 出错。所以我们必须将 python3 命令使用的 python 版本切换为 3.4,然后再安装 python3-dev 和 python3-setuptools。

$ sudo update-alternatives --install /usr/bin/python3 python3 /usr/bin/python3.4 70 --slave /usr/bin/python3m python3m /usr/bin/python3.4m$ sudo apt-get install python3-dev python3-setuptools

然后安装 Pillow 依赖包

$ sudo apt-get install libtiff5-dev libjpeg8-dev zlib1g-dev \ libfreetype6-dev liblCMS2-dev libwebp-dev tcl8.6-dev tk8.6-dev python-tk

安装 pip3,pip 是 Python2 的软件包管理系统,使用它来安装 Python2 的模块非常简便,而 pip3 则是对应于 python3 的版本

$ sudo apt-get install python3-pip

最后安装 Pillow:

$ sudo pip3 install Pillow

2.2. 程序原理

本程序根据颜色(肤色)找出图片中皮肤的区域,然后通过一些条件判断是否为色情图片

程序的关键步骤如下

遍历每个像素,检测像素颜色是否为肤色
将相邻的肤色像素归为一个皮肤区域,得到若干个皮肤区域
剔除像素数量极少的皮肤区域
我们定义非色情图片的判定规则如下(满足任意一个判定为真):

皮肤区域的个数小于 3 个
皮肤区域的像素与图像所有像素的比值小于 15%
最大皮肤区域小于总皮肤面积的 45%
皮肤区域数量超过60个
这些规则你可以尝试更改,直到程序效果让你满意为止

关于像素肤色判定这方面,公式可以在网上找到很多,但世界上不可能有正确率 100% 的公式

你可以用自己找到的公式,在程序完成后慢慢调试

RGB 颜色模式

第一种:r > 95 and g > 40 and g < 100 and b > 20 and max([r,g,b]) - min([r,b]) > 15 and abs(r - g) > 15 and r > g and r > b

第二种:nr = r / (r + g + b),ng = g / (r + g + b),nb = b / (r +g + b),nr / ng > 1.185 and r * b / (r + g + b) ** 2 > 0.107 and r * g / (r + g + b) ** 2 > 0.112

HSV 颜色模式

h > 0 and h < 35 and s > 0.23 and s < 0.68

ycbcr 颜色模式

97.5 <= cb <= 142.5 and 134 <= cr <= 176

一幅图像有零个到多个的皮肤区域,程序按发现顺序给它们编号,第一个发现的区域编号为 0,第 n 个发现的区域编号为 n-1

我们用一种类型来表示像素,我们给这个类型取名为 Skin,包含了像素的一些信息:唯一的 编号(ID),是/否肤色(skin),皮肤区域号(region),横坐标(x),纵坐标(y)

遍历所有像素时,我们为每个像素创建一个与之对应的 Skin 对象,并设置对象的所有属性

其中 region 属性即为像素所在的皮肤区域编号,创建对象时初始化为无意义的 None

关于每个像素的 ID 值,左上角为原点,像素的 ID 值按像素坐标排布,那么看起来如下图

其实 ID 的顺序也即遍历的顺序

遍历所有像素时,创建 Skin 对象后,如果当前像素为肤色,且相邻的像素有肤色的,那么我们把这些肤色像素归到一个皮肤区域

相邻像素的定义:通常都能想到是当前像素周围的 8 个像素,然而实际上只需要定义 4 个就可以了,位置分别在当前像素的左方,左上方,正上方,右上方;因为另外四个像素都在当前像素后面,我们还未给这4个像素创建对应的 Skin 对象

接下来实现细节部分

2.3. 实现脚本

导入所需要的模块

import sysimport osimport _iofrom collections import namedtuplefrom PIL import Image

我们将设计一个 Nude 类:

class Nude(object):

这个类里面我们首先使用 collections.namedtuple() 定义一个 Skin 类型

Skin = namedtuple("Skin","ID skin region x y")

collections.namedtuple() 函数实际上是一个返回Python中标准元组类型子类的一个工厂方法。 你需要传递一个类型名和你需要的字段给它,然后它就会返回一个类,你可以初始化这个类,为你定义的字段传递值等。 详情参见官方文档。

然后定义 Nude 类的初始化方法

def __init__(self,path_or_image): # 若 path_or_image 为 Image.Image 类型的实例,直接赋值 if isinstance(path_or_image,Image.Image):  self.image = path_or_image # 若 path_or_image 为 str 类型的实例,打开图片 elif isinstance(path_or_image,str):  self.image = Image.open(path_or_image) # 获得图片所有颜色通道 bands = self.image.getbands() # 判断是否为单通道图片(也即灰度图),是则将灰度图转换为 RGB 图 if len(bands) == 1:  # 新建相同大小的 RGB 图像  new_img = Image.new("RGB",self.image.size)  # 拷贝灰度图 self.image 到 RGB图 new_img.paste (PIL 自动进行颜色通道转换)  new_img.paste(self.image)  f = self.image.filename  # 替换 self.image  self.image = new_img  self.image.filename = f # 存储对应图像所有像素的全部 Skin 对象 self.skin_map = [] # 检测到的皮肤区域,元素的索引即为皮肤区域号,元素都是包含一些 Skin 对象的列表 self.detected_regions = [] # 元素都是包含一些 int 对象(区域号)的列表 # 这些元素中的区域号代表的区域都是待合并的区域 self.merge_regions = [] # 整合后的皮肤区域,元素的索引即为皮肤区域号,元素都是包含一些 Skin 对象的列表 self.skin_regions = [] # 最近合并的两个皮肤区域的区域号,初始化为 -1 self.last_from,self.last_to = -1,-1 # 色情图像判断结果 self.result = None # 处理得到的信息 self.message = None # 图像宽高 self.wIDth,self.height = self.image.size # 图像总像素 self.total_pixels = self.wIDth * self.height

本实验代码中使用到的模块中的函数均可以在其模块的文档中找到,一定要培养查阅文档的习惯

isinstane(object,classinfo) 如果参数 object 是参数 classinfo 的实例,返回真,否则假;参数 classinfo可以是一个包含若干 type 对象的元祖,如果参数 object 是其中任意一个类型的实例,返回真,否则假
涉及到效率问题,越大的图片所需要消耗的资源与时间越大,因此有时候可能需要对图片进行缩小

所以需要有图片缩小方法

def resize(self,maxwIDth=1000,maxheight=1000): """ 基于最大宽高按比例重设图片大小, 注意:这可能影响检测算法的结果 如果没有变化返回 0 原宽度大于 maxwIDth 返回 1 原高度大于 maxheight 返回 2 原宽高大于 maxwIDth,maxheight 返回 3 maxwIDth - 图片最大宽度 maxheight - 图片最大高度 传递参数时都可以设置为 False 来忽略 """ # 存储返回值 ret = 0 if maxwIDth:  if self.wIDth > maxwIDth:   wpercent = (maxwIDth / self.wIDth)   hsize = int((self.height * wpercent))   fname = self.image.filename   # Image.lanczos 是重采样滤波器,用于抗锯齿   self.image = self.image.resize((maxwIDth,hsize),Image.lanczos)   self.image.filename = fname   self.wIDth,self.height = self.image.size   self.total_pixels = self.wIDth * self.height   ret += 1 if maxheight:  if self.height > maxheight:   hpercent = (maxheight / float(self.height))   wsize = int((float(self.wIDth) * float(hpercent)))   fname = self.image.filename   self.image = self.image.resize((wsize,maxheight),self.height = self.image.size   self.total_pixels = self.wIDth * self.height   ret += 2 return ret

Image.resize(size,resample=0)

size C 包含宽高像素数的元祖 (wIDth,height) resample C 可选的重采样滤波器

返回 Image 对象

然后便是最关键之一的解析方法了

def parse(self): # 如果已有结果,返回本对象 if self.result is not None:  return self # 获得图片所有像素数据 pixels = self.image.load()

接着,遍历每个像素,为每个像素创建对应的 Skin 对象,代码见下

其中 self._classify_skin() 这个方法是检测像素颜色是否为肤色

 for y in range(self.height):  for x in range(self.wIDth):   # 得到像素的 RGB 三个通道的值   # [x,y] 是 [(x,y)] 的简便写法   r = pixels[x,y][0] # red   g = pixels[x,y][1] # green   b = pixels[x,y][2] # blue   # 判断当前像素是否为肤色像素   isSkin = True if self._classify_skin(r,b) else False   # 给每个像素分配唯一 ID 值(1,2,3...height*wIDth)   # 注意 x,y 的值从零开始   _ID = x + y * self.wIDth + 1   # 为每个像素创建一个对应的 Skin 对象,并添加到 self.skin_map 中   self.skin_map.append(self.Skin(_ID,isSkin,None,x,y))

若当前像素并不是肤色,那么跳过本次循环,继续遍历

   # 若当前像素不为肤色像素,跳过此次循环   if not isSkin:    continue

若当前像素是肤色像素,那么就需要处理了,先遍历其相邻像素

一定要注意相邻像素的索引值,因为像素的 ID 值是从 1 开始编起的,而索引是从 0 编起的。变量 _ID 是存有当前像素的ID 值, 所以当前像素在 self.skin_map 中的索引值为 _ID - 1,以此类推,那么其左方的相邻像素在 self.skin_map 中的索引值为 _ID - 1 - 1 ,左上方为 _ID - 1 - self.wIDth - 1,上方为 _ID - 1 - self.wIDth ,右上方为 _ID - 1 - self.wIDth + 1

   # 设左上角为原点,相邻像素为符号 *,当前像素为符号 ^,那么相互位置关系通常如下图   # ***   # *^   # 存有相邻像素索引的列表,存放顺序为由大到小,顺序改变有影响   # 注意 _ID 是从 1 开始的,对应的索引则是 _ID-1   check_indexes = [_ID - 2,# 当前像素左方的像素        _ID - self.wIDth - 2,# 当前像素左上方的像素        _ID - self.wIDth - 1,# 当前像素的上方的像素        _ID - self.wIDth] # 当前像素右上方的像素

说起来复杂,其实看上面代码并不复杂,说这么多是怕同学搞混,你要是觉得有点绕的话,你也可以把 ID 值从 0 编起

   # 用来记录相邻像素中肤色像素所在的区域号,初始化为 -1   region = -1   # 遍历每一个相邻像素的索引   for index in check_indexes:    # 尝试索引相邻像素的 Skin 对象,没有则跳出循环    try:     self.skin_map[index]    except IndexError:     break    # 相邻像素若为肤色像素:    if self.skin_map[index].skin:     # 若相邻像素与当前像素的 region 均为有效值,且二者不同,且尚未添加相同的合并任务     if (self.skin_map[index].region != None and       region != None and region != -1 and       self.skin_map[index].region != region and       self.last_from != region and       self.last_to != self.skin_map[index].region) :      # 那么这添加这两个区域的合并任务      self._add_merge(region,self.skin_map[index].region)     # 记录此相邻像素所在的区域号     region = self.skin_map[index].region

self._add_merge() 这个方法接收两个区域号,它将会把两个区域号添加到 self.merge_regions 中的元素中,self.merge_regions 的每一个元素都是一个列表,这些列表中存放了 1 到多个的区域号,区域号代表的区域是连通的,需要合并

检测的图像里,有些前几行的像素的相邻像素并没有 4 个,所以需要用 try “试错”

然后相邻像素的若是肤色像素,如果两个像素的皮肤区域号都为有效值且不同,因为两个区域中的像素相邻,那么其实这两个区域是连通的,说明需要合并这两个区域。记录下此相邻肤色像素的区域号,之后便可以将当前像素归到这个皮肤区域里了。

遍历完所有相邻像素后,分两种情况处理

所有相邻像素都不是肤色像素:发现了新的皮肤区域
存在区域号为有效值的相邻肤色像素:region 的中存储的值有用了,把当前像素归到这个相邻像素所在的区域

   # 遍历完所有相邻像素后,若 region 仍等于 -1,说明所有相邻像素都不是肤色像素   if region == -1:    # 更改属性为新的区域号,注意元祖是不可变类型,不能直接更改属性    _skin = self.skin_map[_ID - 1]._replace(region=len(self.detected_regions))    self.skin_map[_ID - 1] = _skin    # 将此肤色像素所在区域创建为新区域    self.detected_regions.append([self.skin_map[_ID - 1]])   # region 不等于 -1 的同时不等于 None,说明有区域号为有效值的相邻肤色像素   elif region != None:    # 将此像素的区域号更改为与相邻像素相同    _skin = self.skin_map[_ID - 1]._replace(region=region)    self.skin_map[_ID - 1] = _skin    # 向这个区域的像素列表中添加此像素    self.detected_regions[region].append(self.skin_map[_ID - 1])

somenamedtuple._replace(kwargs) 返回一个替换指定字段的值为参数的 namedtuple 实例

遍历完所有像素之后,图片的皮肤区域划分初步完成了,只是在变量 self.merge_regions 中还有一些连通的皮肤区域号,它们需要合并,合并之后就可以进行色情图片判定了

 # 完成所有区域合并任务,合并整理后的区域存储到 self.skin_regions self._merge(self.detected_regions,self.merge_regions) # 分析皮肤区域,得到判定结果 self._analyse_regions() return self

方法 self._merge() 便是用来合并这些连通的皮肤区域的

方法 self._analyse_regions(),运用之前在程序原理一节定义的非色情图像判定规则,从而得到判定结果

现在编写我们还没写过的调用过的 Nude 类的方法

首先是 self._classify_skin() 方法,这个方法是检测像素颜色是否为肤色,之前在程序原理一节已经把肤色判定该公式列举了出来,现在是用的时候了

# 基于像素的肤色检测技术def _classify_skin(self,r,b): # 根据RGB值判定 rgb_classifIEr = r > 95 and \  g > 40 and g < 100 and \  b > 20 and \  max([r,b]) > 15 and \  abs(r - g) > 15 and \  r > g and \  r > b # 根据处理后的 RGB 值判定 nr,ng,nb = self._to_normalized(r,b) norm_rgb_classifIEr = nr / ng > 1.185 and \  float(r * b) / ((r + g + b) ** 2) > 0.107 and \  float(r * g) / ((r + g + b) ** 2) > 0.112 # HSV 颜色模式下的判定 h,s,v = self._to_hsv(r,b) hsv_classifIEr = h > 0 and \  h < 35 and \  s > 0.23 and \  s < 0.68 # ycbcr 颜色模式下的判定 y,cb,cr = self._to_ycbcr(r,b) ycbcr_classifIEr = 97.5 <= cb <= 142.5 and 134 <= cr <= 176 # 效果不是很好,还需改公式 # return rgb_classifIEr or norm_rgb_classifIEr or hsv_classifIEr or ycbcr_classifIEr return ycbcr_classifIEr

颜色模式的转换并不是本实验的重点,转换公式可以在网上找到,这里我们直接拿来用就行

def _to_normalized(self,b): if r == 0:  r = 0.0001 if g == 0:  g = 0.0001 if b == 0:  b = 0.0001 _sum = float(r + g + b) return [r / _sum,g / _sum,b / _sum]def _to_ycbcr(self,b): # 公式来源: # http://stackoverflow.com/questions/19459831/rgb-to-ycbcr-conversion-problems y = .299*r + .587*g + .114*b cb = 128 - 0.168736*r - 0.331364*g + 0.5*b cr = 128 + 0.5*r - 0.418688*g - 0.081312*b return y,crdef _to_hsv(self,b): h = 0 _sum = float(r + g + b) _max = float(max([r,b])) _min = float(min([r,b])) diff = float(_max - _min) if _sum == 0:  _sum = 0.0001 if _max == r:  if diff == 0:   h = sys.maxsize  else:   h = (g - b) / diff elif _max == g:  h = 2 + ((g - r) / diff) else:  h = 4 + ((r - g) / diff) h *= 60 if h < 0:  h += 360 return [h,1.0 - (3.0 * (_min / _sum)),(1.0 / 3.0) * _max]

self._add_merge() 方法主要是对 self.merge_regions *** 作,而self.merge_regions 的元素都是包含一些 int 对象(区域号)的列表,列表中的区域号代表的区域都是待合并的区域

self._add_merge() 方法接收两个区域号,将之添加到 self.merge_regions 中

这两个区域号以怎样的形式添加,要分3种情况处理,

传入的两个区域号都存在于 self.merge_regions 中
传入的两个区域号有一个区域号存在于 self.merge_regions 中
传入的两个区域号都不存在于 self.merge_regions 中
具体的处理方法,见代码

def _add_merge(self,_from,_to): # 两个区域号赋值给类属性 self.last_from = _from self.last_to = _to # 记录 self.merge_regions 的某个索引值,初始化为 -1 from_index = -1 # 记录 self.merge_regions 的某个索引值,初始化为 -1 to_index = -1 # 遍历每个 self.merge_regions 的元素 for index,region in enumerate(self.merge_regions):  # 遍历元素中的每个区域号  for r_index in region:   if r_index == _from:    from_index = index   if r_index == _to:    to_index = index # 若两个区域号都存在于 self.merge_regions 中 if from_index != -1 and to_index != -1:  # 如果这两个区域号分别存在于两个列表中  # 那么合并这两个列表  if from_index != to_index:   self.merge_regions[from_index].extend(self.merge_regions[to_index])   del(self.merge_regions[to_index])  return # 若两个区域号都不存在于 self.merge_regions 中 if from_index == -1 and to_index == -1:  # 创建新的区域号列表  self.merge_regions.append([_from,_to])  return # 若两个区域号中有一个存在于 self.merge_regions 中 if from_index != -1 and to_index == -1:  # 将不存在于 self.merge_regions 中的那个区域号  # 添加到另一个区域号所在的列表  self.merge_regions[from_index].append(_to)  return # 若两个待合并的区域号中有一个存在于 self.merge_regions 中 if from_index == -1 and to_index != -1:  # 将不存在于 self.merge_regions 中的那个区域号  # 添加到另一个区域号所在的列表  self.merge_regions[to_index].append(_from)  return

在序列中循环时,索引位置和对应值可以使用 enumerate() 函数同时得到,在上面的代码中,索引位置即为 index ,对应值即为region

self._merge() 方法则是将 self.merge_regions 中的元素中的区域号所代表的区域合并,得到新的皮肤区域列表

def _merge(self,detected_regions,merge_regions): # 新建列表 new_detected_regions  # 其元素将是包含一些代表像素的 Skin 对象的列表 # new_detected_regions 的元素即代表皮肤区域,元素索引为区域号 new_detected_regions = [] # 将 merge_regions 中的元素中的区域号代表的所有区域合并 for index,region in enumerate(merge_regions):  try:   new_detected_regions[index]  except IndexError:   new_detected_regions.append([])  for r_index in region:   new_detected_regions[index].extend(detected_regions[r_index])   detected_regions[r_index] = [] # 添加剩下的其余皮肤区域到 new_detected_regions for region in detected_regions:  if len(region) > 0:   new_detected_regions.append(region) # 清理 new_detected_regions self._clear_regions(new_detected_regions)  # 添加剩下的其余皮肤区域到 new_detected_regions  for region in detected_regions:   if len(region) > 0:    new_detected_regions.append(region)  # 清理 new_detected_regions  self._clear_regions(new_detected_regions)

self._clear_regions() 方法只将像素数大于指定数量的皮肤区域保留到 self.skin_regions

# 皮肤区域清理函数# 只保存像素数大于指定数量的皮肤区域def _clear_regions(self,detected_regions): for region in detected_regions:  if len(region) > 30:   self.skin_regions.append(region)

self._analyse_regions() 是很简单的,它的工作只是进行一系列判断,得出图片是否色情的结论

# 分析区域def _analyse_regions(self): # 如果皮肤区域小于 3 个,不是色情 if len(self.skin_regions) < 3:  self.message = "Less than 3 skin regions ({_skin_regions_size})".format(   _skin_regions_size=len(self.skin_regions))  self.result = False  return self.result # 为皮肤区域排序 self.skin_regions = sorted(self.skin_regions,key=lambda s: len(s),reverse=True) # 计算皮肤总像素数 total_skin = float(sum([len(skin_region) for skin_region in self.skin_regions])) # 如果皮肤区域与整个图像的比值小于 15%,那么不是色情图片 if total_skin / self.total_pixels * 100 < 15:  self.message = "Total skin percentage lower than 15 ({:.2f})".format(total_skin / self.total_pixels * 100)  self.result = False  return self.result # 如果最大皮肤区域小于总皮肤面积的 45%,不是色情图片 if len(self.skin_regions[0]) / total_skin * 100 < 45:  self.message = "The biggest region contains less than 45 ({:.2f})".format(len(self.skin_regions[0]) / total_skin * 100)  self.result = False  return self.result # 皮肤区域数量超过 60个,不是色情图片 if len(self.skin_regions) > 60:  self.message = "More than 60 skin regions ({})".format(len(self.skin_regions))  self.result = False  return self.result # 其它情况为色情图片 self.message = "Nude!!" self.result = True return self.result

然后可以组织下分析得出的信息

def inspect(self): _image = '{} {} {}×{}'.format(self.image.filename,self.image.format,self.wIDth,self.height) return "{_image}: result={_result} message='{_message}'".format(_image=_image,_result=self.result,_message=self.message)

Nude 类如果就这样完成了,最后运行脚本时只能得到一些真或假的结果,我们需要更直观的感受程序的分析效果,我们可以生成一张原图的副本,不过这个副本图片中只有黑白色,白色代表皮肤区域,那么这样我们能直观感受到程序分析的效果了

前面的代码中我们有获得图像的像素的 RGB 值的 *** 作,设置像素的 RGB 值也就是其逆 *** 作,还是很简单的,不过注意设置像素的 RGB 值时不能在原图上 *** 作

# 将在源文件目录生成图片文件,将皮肤区域可视化def showSkinRegions(self): # 未得出结果时方法返回 if self.result is None:  return # 皮肤像素的 ID 的集合 skinIDSet = set() # 将原图做一份拷贝 simage = self.image # 加载数据 simageData = simage.load() # 将皮肤像素的 ID 存入 skinIDSet for sr in self.skin_regions:  for pixel in sr:   skinIDSet.add(pixel.ID) # 将图像中的皮肤像素设为白色,其余设为黑色 for pixel in self.skin_map:  if pixel.ID not in skinIDSet:   simageData[pixel.x,pixel.y] = 0,0  else:   simageData[pixel.x,pixel.y] = 255,255,255 # 源文件绝对路径 filePath = os.path.abspath(self.image.filename) # 源文件所在目录 fileDirectory = os.path.dirname(filePath) + '/' # 源文件的完整文件名 fileFullname = os.path.basename(filePath) # 分离源文件的完整文件名得到文件名和扩展名 filename,fileExtname = os.path.splitext(fileFullname) # 保存图片 simage.save('{}{}_{}{}'.format(fileDirectory,filename,'Nude' if self.result else 'normal',fileExtname))

变量 skinIDSet 使用集合而不是列表是有性能上的考量的,Python 中的集合是哈希表实现的,查询效率很高

最后支持一下命令行参数就大功告成啦!我们使用 argparse 这个模块来实现命令行的支持。argparse 模块使得编写用户友好的命令行接口非常容易。程序只需定义好它要求的参数,然后 argparse 将负责如何从 sys.argv 中解析出这些参数。argparse 模块还会@R_403_6796@帮助和使用信息并且当用户赋给程序非法的参数时产生错误信息

具体使用方法请查看argparse的 官方文档,这里就不多说了

if __name__ == "__main__": import argparse parser = argparse.ArgumentParser(description='Detect nudity in images.') parser.add_argument('files',Metavar='image',nargs='+',help='Images you wish to test') parser.add_argument('-r','--resize',action='store_true',help='Reduce image size to increase speed of scanning') parser.add_argument('-v','--visualization',help='Generating areas of skin image') args = parser.parse_args() for fname in args.files:  if os.path.isfile(fname):   n = Nude(fname)   if args.resize:    n.resize(maxheight=800,maxwIDth=600)   n.parse()   if args.visualization:    n.showSkinRegions()   print(n.result,n.inspect())  else:   print(fname,"is not a file")

2.4. 测试效果

使用 wget 把这两个测试用图片下载下来

$ wget http://labfile.oss.aliyuncs.com/courses/589/0.jpg$ wget http://labfile.oss.aliyuncs.com/courses/589/1.jpg

假设你的脚本名为 nude.py,运行下面的命令执行脚本,注意是 python3 而不是python

$ python3 nude.py -v 0.jpg 1.jpg

现在你可以等待程序结果,结果出来后,你还可以查看 -v 选项生成的效果展示图片

三、实验总结

本次实验熟悉了下 PIL 的使用,了解了色情图片检测的原理,整个实验难点是在皮肤区域的检测与整合这一方面,这方面不是很清楚的同学多多阅读思考,如果有什么疑问或者建议的话可以留言,实验楼会尽力解答你的问题,建议写下实验报告,将自己的思考过程记录下来是很有好处的

本实验还有许多可以改进的地方,比如肤色检测的公式,色情判定条件,还有性能问题,同学可以自己尝试改进,比如性能问题可以尝试多线程或多进程

四、完整代码

代码也可以下载下来

$ wget http://labfile.oss.aliyuncs.com/courses/589/nude.py

代码:

import sysimport osimport _iofrom collections import namedtuplefrom PIL import Imageclass Nude(object): Skin = namedtuple("Skin","ID skin region x y") def __init__(self,path_or_image):  # 若 path_or_image 为 Image.Image 类型的实例,直接赋值  if isinstance(path_or_image,Image.Image):   self.image = path_or_image  # 若 path_or_image 为 str 类型的实例,打开图片  elif isinstance(path_or_image,str):   self.image = Image.open(path_or_image)  # 获得图片所有颜色通道  bands = self.image.getbands()  # 判断是否为单通道图片(也即灰度图),是则将灰度图转换为 RGB 图  if len(bands) == 1:   # 新建相同大小的 RGB 图像   new_img = Image.new("RGB",self.image.size)   # 拷贝灰度图 self.image 到 RGB图 new_img.paste (PIL 自动进行颜色通道转换)   new_img.paste(self.image)   f = self.image.filename   # 替换 self.image   self.image = new_img   self.image.filename = f  # 存储对应图像所有像素的全部 Skin 对象  self.skin_map = []  # 检测到的皮肤区域,元素的索引即为皮肤区域号,元素都是包含一些 Skin 对象的列表  self.detected_regions = []  # 元素都是包含一些 int 对象(区域号)的列表  # 这些元素中的区域号代表的区域都是待合并的区域  self.merge_regions = []  # 整合后的皮肤区域,元素的索引即为皮肤区域号,元素都是包含一些 Skin 对象的列表  self.skin_regions = []  # 最近合并的两个皮肤区域的区域号,初始化为 -1  self.last_from,-1  # 色情图像判断结果  self.result = None  # 处理得到的信息  self.message = None  # 图像宽高  self.wIDth,self.height = self.image.size  # 图像总像素  self.total_pixels = self.wIDth * self.height def resize(self,maxheight=1000):  """  基于最大宽高按比例重设图片大小,  注意:这可能影响检测算法的结果  如果没有变化返回 0  原宽度大于 maxwIDth 返回 1  原高度大于 maxheight 返回 2  原宽高大于 maxwIDth,maxheight 返回 3  maxwIDth - 图片最大宽度  maxheight - 图片最大高度  传递参数时都可以设置为 False 来忽略  """  # 存储返回值  ret = 0  if maxwIDth:   if self.wIDth > maxwIDth:    wpercent = (maxwIDth / self.wIDth)    hsize = int((self.height * wpercent))    fname = self.image.filename    # Image.lanczos 是重采样滤波器,用于抗锯齿    self.image = self.image.resize((maxwIDth,Image.lanczos)    self.image.filename = fname    self.wIDth,self.height = self.image.size    self.total_pixels = self.wIDth * self.height    ret += 1  if maxheight:   if self.height > maxheight:    hpercent = (maxheight / float(self.height))    wsize = int((float(self.wIDth) * float(hpercent)))    fname = self.image.filename    self.image = self.image.resize((wsize,self.height = self.image.size    self.total_pixels = self.wIDth * self.height    ret += 2  return ret # 分析函数 def parse(self):  # 如果已有结果,返回本对象  if self.result is not None:   return self  # 获得图片所有像素数据  pixels = self.image.load()  # 遍历每个像素  for y in range(self.height):   for x in range(self.wIDth):    # 得到像素的 RGB 三个通道的值    # [x,y)] 的简便写法    r = pixels[x,y][0] # red    g = pixels[x,y][1] # green    b = pixels[x,y][2] # blue    # 判断当前像素是否为肤色像素    isSkin = True if self._classify_skin(r,b) else False    # 给每个像素分配唯一 ID 值(1,3...height*wIDth)    # 注意 x,y 的值从零开始    _ID = x + y * self.wIDth + 1    # 为每个像素创建一个对应的 Skin 对象,并添加到 self.skin_map 中    self.skin_map.append(self.Skin(_ID,y))    # 若当前像素不为肤色像素,跳过此次循环    if not isSkin:     continue    # 设左上角为原点,相邻像素为符号 *,当前像素为符号 ^,那么相互位置关系通常如下图    # ***    # *^    # 存有相邻像素索引的列表,存放顺序为由大到小,顺序改变有影响    # 注意 _ID 是从 1 开始的,对应的索引则是 _ID-1    check_indexes = [_ID - 2,# 当前像素左方的像素         _ID - self.wIDth - 2,# 当前像素左上方的像素         _ID - self.wIDth - 1,# 当前像素的上方的像素         _ID - self.wIDth] # 当前像素右上方的像素    # 用来记录相邻像素中肤色像素所在的区域号,初始化为 -1    region = -1    # 遍历每一个相邻像素的索引    for index in check_indexes:     # 尝试索引相邻像素的 Skin 对象,没有则跳出循环     try:      self.skin_map[index]     except IndexError:      break     # 相邻像素若为肤色像素:     if self.skin_map[index].skin:      # 若相邻像素与当前像素的 region 均为有效值,且二者不同,且尚未添加相同的合并任务      if (self.skin_map[index].region != None and        region != None and region != -1 and        self.skin_map[index].region != region and        self.last_from != region and        self.last_to != self.skin_map[index].region) :       # 那么这添加这两个区域的合并任务       self._add_merge(region,self.skin_map[index].region)      # 记录此相邻像素所在的区域号      region = self.skin_map[index].region    # 遍历完所有相邻像素后,若 region 仍等于 -1,说明所有相邻像素都不是肤色像素    if region == -1:     # 更改属性为新的区域号,注意元祖是不可变类型,不能直接更改属性     _skin = self.skin_map[_ID - 1]._replace(region=len(self.detected_regions))     self.skin_map[_ID - 1] = _skin     # 将此肤色像素所在区域创建为新区域     self.detected_regions.append([self.skin_map[_ID - 1]])    # region 不等于 -1 的同时不等于 None,说明有区域号为有效值的相邻肤色像素    elif region != None:     # 将此像素的区域号更改为与相邻像素相同     _skin = self.skin_map[_ID - 1]._replace(region=region)     self.skin_map[_ID - 1] = _skin     # 向这个区域的像素列表中添加此像素     self.detected_regions[region].append(self.skin_map[_ID - 1])  # 完成所有区域合并任务,合并整理后的区域存储到 self.skin_regions  self._merge(self.detected_regions,self.merge_regions)  # 分析皮肤区域,得到判定结果  self._analyse_regions()  return self # self.merge_regions 的元素都是包含一些 int 对象(区域号)的列表 # self.merge_regions 的元素中的区域号代表的区域都是待合并的区域 # 这个方法便是将两个待合并的区域号添加到 self.merge_regions 中 def _add_merge(self,_to):  # 两个区域号赋值给类属性  self.last_from = _from  self.last_to = _to  # 记录 self.merge_regions 的某个索引值,初始化为 -1  from_index = -1  # 记录 self.merge_regions 的某个索引值,初始化为 -1  to_index = -1  # 遍历每个 self.merge_regions 的元素  for index,region in enumerate(self.merge_regions):   # 遍历元素中的每个区域号   for r_index in region:    if r_index == _from:     from_index = index    if r_index == _to:     to_index = index  # 若两个区域号都存在于 self.merge_regions 中  if from_index != -1 and to_index != -1:   # 如果这两个区域号分别存在于两个列表中   # 那么合并这两个列表   if from_index != to_index:    self.merge_regions[from_index].extend(self.merge_regions[to_index])    del(self.merge_regions[to_index])   return  # 若两个区域号都不存在于 self.merge_regions 中  if from_index == -1 and to_index == -1:   # 创建新的区域号列表   self.merge_regions.append([_from,_to])   return  # 若两个区域号中有一个存在于 self.merge_regions 中  if from_index != -1 and to_index == -1:   # 将不存在于 self.merge_regions 中的那个区域号   # 添加到另一个区域号所在的列表   self.merge_regions[from_index].append(_to)   return  # 若两个待合并的区域号中有一个存在于 self.merge_regions 中  if from_index == -1 and to_index != -1:   # 将不存在于 self.merge_regions 中的那个区域号   # 添加到另一个区域号所在的列表   self.merge_regions[to_index].append(_from)   return # 合并该合并的皮肤区域 def _merge(self,merge_regions):  # 新建列表 new_detected_regions   # 其元素将是包含一些代表像素的 Skin 对象的列表  # new_detected_regions 的元素即代表皮肤区域,元素索引为区域号  new_detected_regions = []  # 将 merge_regions 中的元素中的区域号代表的所有区域合并  for index,region in enumerate(merge_regions):   try:    new_detected_regions[index]   except IndexError:    new_detected_regions.append([])   for r_index in region:    new_detected_regions[index].extend(detected_regions[r_index])    detected_regions[r_index] = []  # 添加剩下的其余皮肤区域到 new_detected_regions  for region in detected_regions:   if len(region) > 0:    new_detected_regions.append(region)  # 清理 new_detected_regions  self._clear_regions(new_detected_regions) # 皮肤区域清理函数 # 只保存像素数大于指定数量的皮肤区域 def _clear_regions(self,detected_regions):  for region in detected_regions:   if len(region) > 30:    self.skin_regions.append(region) # 分析区域 def _analyse_regions(self):  # 如果皮肤区域小于 3 个,不是色情  if len(self.skin_regions) < 3:   self.message = "Less than 3 skin regions ({_skin_regions_size})".format(    _skin_regions_size=len(self.skin_regions))   self.result = False   return self.result  # 为皮肤区域排序  self.skin_regions = sorted(self.skin_regions,reverse=True)  # 计算皮肤总像素数  total_skin = float(sum([len(skin_region) for skin_region in self.skin_regions]))  # 如果皮肤区域与整个图像的比值小于 15%,那么不是色情图片  if total_skin / self.total_pixels * 100 < 15:   self.message = "Total skin percentage lower than 15 ({:.2f})".format(total_skin / self.total_pixels * 100)   self.result = False   return self.result  # 如果最大皮肤区域小于总皮肤面积的 45%,不是色情图片  if len(self.skin_regions[0]) / total_skin * 100 < 45:   self.message = "The biggest region contains less than 45 ({:.2f})".format(len(self.skin_regions[0]) / total_skin * 100)   self.result = False   return self.result  # 皮肤区域数量超过 60个,不是色情图片  if len(self.skin_regions) > 60:   self.message = "More than 60 skin regions ({})".format(len(self.skin_regions))   self.result = False   return self.result  # 其它情况为色情图片  self.message = "Nude!!"  self.result = True  return self.result # 基于像素的肤色检测技术 def _classify_skin(self,b):  # 根据RGB值判定  rgb_classifIEr = r > 95 and \   g > 40 and g < 100 and \   b > 20 and \   max([r,b]) > 15 and \   abs(r - g) > 15 and \   r > g and \   r > b  # 根据处理后的 RGB 值判定  nr,b)  norm_rgb_classifIEr = nr / ng > 1.185 and \   float(r * b) / ((r + g + b) ** 2) > 0.107 and \   float(r * g) / ((r + g + b) ** 2) > 0.112  # HSV 颜色模式下的判定  h,b)  hsv_classifIEr = h > 0 and \   h < 35 and \   s > 0.23 and \   s < 0.68  # ycbcr 颜色模式下的判定  y,b)  ycbcr_classifIEr = 97.5 <= cb <= 142.5 and 134 <= cr <= 176  # 效果不是很好,还需改公式  # return rgb_classifIEr or norm_rgb_classifIEr or hsv_classifIEr or ycbcr_classifIEr  return ycbcr_classifIEr def _to_normalized(self,b):  if r == 0:   r = 0.0001  if g == 0:   g = 0.0001  if b == 0:   b = 0.0001  _sum = float(r + g + b)  return [r / _sum,b / _sum] def _to_ycbcr(self,b):  # 公式来源:  # http://stackoverflow.com/questions/19459831/rgb-to-ycbcr-conversion-problems  y = .299*r + .587*g + .114*b  cb = 128 - 0.168736*r - 0.331364*g + 0.5*b  cr = 128 + 0.5*r - 0.418688*g - 0.081312*b  return y,cr def _to_hsv(self,b):  h = 0  _sum = float(r + g + b)  _max = float(max([r,b]))  _min = float(min([r,b]))  diff = float(_max - _min)  if _sum == 0:   _sum = 0.0001  if _max == r:   if diff == 0:    h = sys.maxsize   else:    h = (g - b) / diff  elif _max == g:   h = 2 + ((g - r) / diff)  else:   h = 4 + ((r - g) / diff)  h *= 60  if h < 0:   h += 360  return [h,(1.0 / 3.0) * _max] def inspect(self):  _image = '{} {} {}×{}'.format(self.image.filename,self.height)  return "{_image}: result={_result} message='{_message}'".format(_image=_image,_message=self.message) # 将在源文件目录生成图片文件,将皮肤区域可视化 def showSkinRegions(self):  # 未得出结果时方法返回  if self.result is None:   return  # 皮肤像素的 ID 的集合  skinIDSet = set()  # 将原图做一份拷贝  simage = self.image  # 加载数据  simageData = simage.load()  # 将皮肤像素的 ID 存入 skinIDSet  for sr in self.skin_regions:   for pixel in sr:    skinIDSet.add(pixel.ID)  # 将图像中的皮肤像素设为白色,其余设为黑色  for pixel in self.skin_map:   if pixel.ID not in skinIDSet:    simageData[pixel.x,0   else:    simageData[pixel.x,255  # 源文件绝对路径  filePath = os.path.abspath(self.image.filename)  # 源文件所在目录  fileDirectory = os.path.dirname(filePath) + '/'  # 源文件的完整文件名  fileFullname = os.path.basename(filePath)  # 分离源文件的完整文件名得到文件名和扩展名  filename,fileExtname = os.path.splitext(fileFullname)  # 保存图片  simage.save('{}{}_{}{}'.format(fileDirectory,fileExtname))if __name__ == "__main__": import argparse parser = argparse.ArgumentParser(description='Detect nudity in images.') parser.add_argument('files',"is not a file")

总结

以上就是本文关于python好玩的项目―色情图片识别的全部内容,希望对大家有所帮助。感兴趣的朋友可以继续参阅本站:Python实现一个简单的验证码程序、Python编程django实现同一个ip十分钟内只能注册一次等,Python好玩的项目数不胜数,以后会继续向大家分享的,感谢朋友们对本站的支持!

总结

以上是内存溢出为你收集整理的python好玩的项目―色情图片识别代码分享全部内容,希望文章能够帮你解决python好玩的项目―色情图片识别代码分享所遇到的程序开发问题。

如果觉得内存溢出网站内容还不错,欢迎将内存溢出网站推荐给程序员好友。

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/langs/1201293.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-06-04
下一篇 2022-06-04

发表评论

登录后才能评论

评论列表(0条)

保存