Facebook开源机器视觉工具带你从像素点中发现规律(3)

在脸书的人工智能研究中心(Facebook AI Research, FAIR)，我们正在将计算机视觉技术推向一个全新的阶段——我们的目标是让计算机能像人类一样，从像素的水平去分析图像和物体。

　　大范围的应用

　　视觉识别技术应用范围很广。在此基础上，计算机可以识别图片中的物体，比如，无须为每张照片加上标签，即可更容易地搜索某些图片。失去视觉的人们也可以理解他们的朋友所分享的图片中的内容，因为无论图片是否配有说明文字，系统都可以告诉他们。

　　最近，我们演示了为盲人用户开发的技术：评估照片，描述其内容。目前，视觉障碍的用户在脸书新信息推送中遇到图片时，只能听到照片发送者的名字，以及“图片”这个词。而我们的目的是提供更加丰富的描述，比如“图片包含海滩，树，和三个微笑的人”。

　　更进一步，放大我们正在开发的技术，我们的目标是更加沉浸式的虚拟体验：当用户用手指扫过图片时，系统为他们描述所触摸的内容，这样用户好像真的“看”到了照片一样。

继续前行，我们会继续改善检测和分割算法。你可以设想这种图像检测、分割、确认能力应用在商业、健康等其他增强现实领域的那一天。

　　另外，我们的下一个挑战是将这些技术应用在视频中。在视频中，物体是移动的，交互的，随时间变化的。对于观看视频，对其中的物体进行实时理解和分类，我们已经在计算机视觉方面取得了一些进展。实时分类能帮助发现相关和重要的直播视频，而应用更好的技术来检测场景、物体、时间和空间上的动作会使得实时解说在某一天成为现实。对于持续推进这些技术，为每个人提供更好的Facebook体验，我们非常兴奋。

首页上一页 1 2 3 共3页

提示：支持键盘“← →”键翻页

发表评论