Se trata de una tecnología que permite identificar lo que hay dentro de la foto y mostrar en texto la descripción de la escena, siendo algo fundamental para aumentar el poder de su buscador de imágenes (entre otras muchas utilidades). En su blog explican algunos detalles de este proyecto que aún está en fase inicial, donde destacan que uno de los retos es dar la descripción del contenido de la foto en lenguaje natural (“un perro saltando para coger un disco”, por ejemplo, nada de “perro, salto, disco”).