的全文共8587个单词,预计需要20分钟或更长的时间来学习
韩国女子Twice
对于许多程/卢卡·布拉西来说,面盲绝对是一个致命的短板,尤其是对于那些年轻漂亮但长相相似的韩国明星...这时,需要图像识别中的人脸识别技术来帮助你。
亚马逊更新网站提供了许多有用的功能,如“对象和场景检测”、“人脸识别”、“人脸分析”和“名人识别”然而,在对韩国明星进行“名人识别”的经历中,亚马逊的重新认知偶尔会遇到麻烦:有时系统无法识别它,有时识别结果是错误的
是周子玉在女子组的照片,但亚马逊认出她是金雪炫(韩国女子组AOA的另一名成员)
。因此,本文将使用Amazon Rekognition编写一个简单的Python脚本来准确地识别两次的成员。
使用Amazon Rekognition
进行人脸检测为了在Jupyter Notebook上运行本文中的代码,您需要满足以下条件:
1。拥有亚马逊AWS账户
2。使用AWS命令行界面
3配置的AWS凭据。将Boto3更新到最新版本
首先,导入一些可用于下一步的包
从pil import image
% matplotlib inline
导入bot O3
现在需要找到要处理的图片让我们以上面看到的图片为例。将图片发送到更新初始化应用程序接口,获得图像识别结果。
显示(图像。open ('tzuyu。JPEG '))
我们可以给重新编码最基本的任务,即人脸识别。完成这项任务只需要几行代码。
import io
rekognition = boto 3 . client(‘rekognition’)
image = image . open(“Tzuyu . JPEG”)
stream = io。BytesIO
图像.保存(stream,format = " JPEG ")
Image _ binary = stream . get value
重新加密. detect _ faces(
Image = { ' Bytes ':Image _ binary },
attributes =[' all ']
)
您可以直接将图片作为内存中的二进制文件对象,从本地计算机将其发送到重新加密,或者将图片上传到S3,并在调用重新加密时将桶和密钥作为参数给出。检测人脸这里,将图片作为二进制对象发送。上述调用将需要很长时间您可以从Rekognition的检测人脸功能获得所有信息。
{ ' FaceDetails ':[{ ' Agrange ':{ ' High ':38,' Low': 20},< br> 'Beard': { '置信度':99.98848724365234,'值':False},
' BoundingBox ':{ ' Height ':0.1584049016237259,< br> 'Left': 0.4546355
‘地标’:[{‘类型':‘眼睛’,
‘X’:0.47338899970054626,
‘Y’:0.15436244010925293 },
{‘类型':‘眼睛’,‘X’:0.515273261070251,‘Y’:0.14743797 },
.
“x”:0.4817998707
从上面的detect_faces响应示例中可以看出,识别结果不仅包括图片中人脸边界框的位置,还包括更高级的特征,如情感、性别、年龄等。
人脸比较
亚马逊更新身份有助于比较两张图片中的人脸例如,如果将子余的图片设置为源图片,然后发送两次成员的图片作为目标图片,则Rekognition可以从目标图片中找到同源图片的最相似的脸我们需要的两次合影如下
如果您既不是亚洲人也不是“两次”迷,您可能无法完成这项任务,即使作为一个人。你可以猜猜这张照片中谁是玉子。现在让我们来看看Rekognition是如何完成任务的。
sourceFile = ' Tzuyu . JPEG '
targetFile = ' twents _ group . jpg '
ImageSource =打开(SourceFile,' rb')
ImageTarget =打开(TargetFile,' Rb ')
响应=重新加密. compare _ faces(SimilaritythresHoold = 80,
SourceImage = { ' Bytes ':ImageSource . read },
响应=重新加密. compare face(Similaritythr因此,我们将该指令专用于[“人脸匹配”]并要求重新编码只输入匹配的人脸信息从这张集体照中,Rekognition似乎发现了一张97%相似度的脸。让我们通过边界框信息来检查Rekognition是否正确识别了集体照片中的周子玉。
顺便说一下,BoundingBox给出的值是人脸与整个图像大小的比率。因此,为了使用BoundingBox的值绘制边框,您需要将图像的实际长度或宽度乘以比率来计算面框的大小。这可以使用下面的代码来完成
来自PIL导入图像绘制
图像=图像.打开(“两次_组. jpg”)
图像宽度,图像亮度=图像.尺寸
绘制=图像绘制。绘制(图像)
框=响应['面匹配'][0]['面']['边界框']
左= imgWidth *框['左']
顶= IMGhight *框['顶']
宽= imgWidth *框['宽']
高= IMGhight *框['高']
点= (
(左,顶),
(左+宽,顶),
(左+宽,顶+高),
(左+宽,顶+高)这的确是子瑜!
创建集合
现在我们可以从目标图像中识别图片中的人脸和源图像中的人脸然而,上述功能都是一次性的,我们还需要存储女性团队每个成员的面部信息和姓名。这样,每次发送新的两次照片时,系统都可以检索数据,识别成员的面部并显示成员的姓名
要实现这一目标,需要应用亚马逊的“基于存储的应用编程接口操作”这项操作包括亚马逊独有的两个专有术语“set”指的是Rekognition的虚拟数据库,它存储识别的面部信息通过使用集合,您可以“索引”这是指检测图像中的人脸,然后将信息存储在指定的集合中。应该提到的是,重新编码存储的信息不是实际的图像,而是由算法提取的特征向量接下来,让我们学习如何创建集合和添加索引。
collection id = ' test-collection '
重新编码。create _ collection(collection id = collection id)
是的,就这么简单因为这是一个新创建的集合,所以其中没有存储任何信息。然而,让我们再看一遍
reko gnition . describe _ collection(collection id = collection id)
可以在上面的响应中看到“FaceCount”的值是0如果面索引被添加并存储在集合中,则该值会发生变化
人脸索引
同样,人脸索引也很简单,只需要在Rekognition中添加一行代码
SourceFile = ' Tzuyu . JPEG '
ImageSource = open(SourceFile,Rb ')
reko gnition . index _ faces(image = { ' bytes ':imagesource . read },externalamageid =' tzuyu ',collection id = collection id)
如您所见,上面的代码设置了参数externalamageid并将值命名为“child Yu”当您试图从新图片中识别玉子的面部时,Rekognition会在索引中搜索面部信息。每当一个新面孔被索引时,重新命名会给它一个唯一的面孔标识。但是我们想在匹配的玉子的脸旁边显示她的名字。因此,参数ExternalImageId是必需的。现在,如果您查看集合,您会发现一个人的面部信息已经被添加到集合中。
reko gnition . description _ collection(collection id = collection id)
按图像搜索面部
现在玉子的面部信息已添加到集合中,并且然而,逐图像搜索功能有一个问题,即它一次只能检测一个面部(图像中面积最大的面部)因此,如果你想在两次集体照中找到玉子,你需要再加一步。在执行检测人脸之前,应该使用每个人脸的边界框信息逐个调用搜索人脸图像。首先,让我们检查每个成员的面部信息
imagesource = open(' twents _ group . jpg ',' Rb ')
resp = rekognition . detect _ faces(Image = { ' Bytes ':ImageSource . read })
all _ faces = resp[' faceDetails ']
len(all _ faces)
256很好接下来,裁剪这些照片,用一张一张地搜索。
image = image . open(" twins _ group . jpg ")
image _ Width,image_height = image.size
所有_ face中的人脸:
box = face[' BoundingBox ']
x1 = box[' Left ']* image _ Width
y1 = box[' Top ']* image _ Height
x2 = x1+box[' Width ']* image _ Width
y2 = y1+box[' HeightBytesIO
image _ crop . save(stream,format = " JEG ")
image _ crop _ binary = stream . get value
response = Rekognition . search _ faces _ by _ image(
CollectionId = CollectionId,
image = { ' bytes ':image _ crop _ binary }
)
打印(response)
打印(-' * 100)
9我们只设置了玉子指数,所以匹配的脸是玉子的在图片上显示边框和名称对于名称部分,将使用索引面时设置的外部图像。
顺便说一下,“面匹配”是所有搜索图像响应中的一个数组换句话说,如果集合中的多个面匹配,系统将显示所有匹配结果根据亚马逊的说法,这个数组是根据相似性得分排序的,最高相似性优先。数组中的第一项作为匹配度最高的结果。
从PIL导入图像Font
导入io
图像=图像.打开(“两次_组. jpg”)
图像_宽度,图像_高度=图像.尺寸< br>
所有_面中的面:
框=面[“边界框”]
x1 =框[“左”] *图像_宽度< br> y1 =框[“顶”] *图像_高度< br> x2 = x1 +框[“宽度”BytesIO
Image _ crop . save(stream,format = " JPEG ")
Image _ crop _ binary = stream . get value
response = rekognition . search _ faces _ by _ Image(
CollectionId = CollectionId,
Image = { ' Bytes ':Image _ crop _ binary }
)
如果len(response[' faceMatches '])& gt;0:
绘制=图像绘制。绘制(图像)
点= (
(x1,y1),< br> (x2,y1),< br> (x2,y2),< br> (x1,y2),< br>)
绘制线条(点,填充='#00d400 ',宽度=2)
fnt =图像字体. truetype('/Library/Fonts/Arial . TTF ',15)
绘制文本((x1,y2),响应['人脸匹配'] [0] ['人脸答案又是正确的!
标识了两次
的所有成员现在,让我们开发更多项目功能,使其能够标识群组照片中的所有成员为了实现这个目标,我们首先需要索引所有人的面部信息(总共9个成员)克里斯蒂安·皮特在亚马逊的一篇教程中提到:“给每个人添加多个参考图片将大大提高匹配的成功率。”“他的建议简单易懂因此,我们为每个成员准备了四张照片,并添加了同一成员的几张照片。
CollECTion Id = ' twents '
rekognition . create _ collection(CollECTion Id = CollECTion Id)
import OS
路径= ' Twice '
适用于操作系统中的r、d、f,漫游(路径):
适用于f中的文件:
如果=”。DS_Store':
源文件= os.path.join(r,file)
imageSource=open(源文件,' rb')
重新加密. index _ faces(Image = { ' Bytes ':ImageSource . read },ExternalImageID = file . split(' _ ')[0),集合id = collectionid)
重新加密. description _ Collection(Collection id = Collection id)
256所有36张照片现在都被编入“两次”收藏。现在是测试结果的时候了升级后的重生成能识别两次的所有成员吗?
来自PIL导入图像font
image = image . open(" twins _ group . jpg ")
image _ Width,image_height = image.size
所有_面中的面:
box = face[' BoundingBox ']
x1 = box[' Left ']* image _ Width
y1 = box[' Top ']* image _ Height
x2 = x1+box[BytesIO
Image _ crop . save(stream,format = " JPEG ")
Image _ crop _ binary = stream . get value
response = rekognition . search _ faces _ by _ Image(
CollectionId = CollectionId,
Image = { ' Bytes ':Image _ crop _ binary }
)
if len(response[' FaceMatches '])& gt;0:
绘制=图像绘制。绘制(图像)
点= (
(x1,y1),< br> (x2,y1),< br> (x2,y2),< br> (x1,y2),< br>)
绘制线条(点,填充='#00d400 ',宽度=2)
fnt =图像字体. truetype('/Library/Fonts/Arial . TTF ',15)
绘制文本((x1,y2),响应['人脸匹配'] [0] ['人脸它能正确识别所有成员!
评论表扬和关注
我们分享人工智能学习和发展的干货
欢迎关注全平台人工智能垂直自我媒体“核心阅读”