面向未来的通识课-05人工智能是怎么看见物体的?
上节课咱们跟大家介绍了人工智能啊它怎么分辨小猫、小狗,也介绍了卷积神经网络这种非常适合用来做图像识别的人工智能技术。不知道大家还想不想起来,卷积神经网络它到底厉害在哪里呢?让我们再回一下榨汁机那个比方啊,任何一张照片,比如一张狗狗照片在机器面前,这张照片它就像一个橙子。如果我们想要让机器呀把狗狗照片认出来,那就必须让他对这张照片做判断。比如他最终能够认出这只狗狗是金毛犬,还是拉布拉多。这个判断的结果就像我们从橙子里面榨出来的橙汁,那要得到这种橙汁呢,卷积神经网络实际上就像一个非常厉害,有很很多个层级的照片榨汁机,它可以把一张照片分成很多很多层,然后一层一层地来加工处理。
就像是那个榨汁机,它可以先把橙子切开。在挤出汁液,再用不同出气的过滤器去去除果肉籽和渣子,最后给咱们留下橙汁,是一个样的。不过上面这个比方呢它虽然很形象,但却并没有告诉我们这个榨汁机在中间一层又一层的榨汁,它到底是怎么完成的。从人工智能技术来看,就是说一张照片到底是怎么样被一层一层分解出来,最后变成一个机器能够看懂的照片了呢?为了解答这个问题,我们今天呢得再深入一层来聊聊人工智能到底是怎么看懂东西。在整个大的人工智能行业里呀,机器看懂东西这件事情呢被叫做机器视觉,也就是computer vision。所以接下来他们会用机器视觉这个专业术语来表示人工智能在视觉里的那些应用。
好,那下面事不宜迟,咱们就开始吧。如果你平时用数码相机或者手机去拍照,你一定能感觉到啊现在的电子设备。拍照方面已经非常厉害了,他们拍出来的那个清晰度和保真度真的是令人难以置信啊。其实今天机器的摄像头能看到这个世界的清晰度早就已经超过我们人类的眼睛了,但是机器能看到一个清晰的世界不等于它能够看懂这个世界,要看懂这个世界需要的技术含量就很高了。所以这里我们先解释一下计算机是如何识别图片的。首先我想邀请你观察一下家里的电脑或电视屏幕,如果你凑得很近去看,就会发现屏幕它是有一个一个很小的格子构成的,这些格子就叫做像素诶,像素这个概念就是今天这节课的重点了……