Interesante "lector de imágenes" al que preguntarle cosas al respecto, para que entre otras cosas nos diga lo que muestran. De su github: "LLaVA representa un novedoso gran modelo multimodal entrenado de extremo a extremo (...) para la comprensión visual y lingüística de propósito general (...)"
|
etiquetas: inteligencia artificial , llava , asistente , lector de imágenes , ia , ai