Midjourne V5. El nuevo motor cuenta según sus creadores con "mucha mayor calidad de imagen, salidas más diversas, rangos estilíticos más amplios, soporte para texturas, formatos de imagen más anchos, mejores prompts para imágenes, y rango dinámico más amplio", entre otras mejoras.
|
etiquetas: midjourney , arte , ia
pieles absolutamente uniformes, posturas e iluminaciones perfectas, pelo como si fuera un solido....
de momento, han mejorado, pero siguen siendo demasiado "perfectas"
aun así.... la uniformidad en las separaciones en las arrugas, la casi total uniformidad del tono de la piel, la iluminación casi perfecta y la casi ausencia de textura en los límites de zonas sobre iluminadas siguen cantando un poco..... aun así… » ver todo el comentario
ojo, sin desmerecer un gramo el mérito de haber llegado a este punto
twitter.com/SmokeAwayyy/status/1636170472181334017
Se ven todavía a menudo fallos, en plan dedos torcidos y proporciones un tanto de valle inquietante, pero desde luego el avance pinta ya espectacular, ya no son el desastre que se estaba viendo con personas de aspecto increible pero veias sus manos y parecian un grupo de chistorras mutantes anidadas.
Cómo Stable Diffusion es de código libre hay modelos y herramientas que te permiten hacer manos gracias al trabajo de la comunidad: www.reddit.com/r/StableDiffusion/comments/112naoe/almost_perfect_hands
#2 Tener que usar Discord para generar imágenes es estúpido por parte de la compañía.
Fe de ello que tienen la webapp aquí: www.midjourney.com/app pero sólo para gestionar la cuenta y ver galerías.
En cualquier caso, a mi me parece que utilizar Discord es un acierto.
Edit: Añado que probablemente estén computando en Azure o otro proveedor cloud.
Decir que montar una GUI es muy fácil, pues claro que lo es. Pero ese no es el problema.
Con montar, me refiero también a la infraestructura.
Y la infraestructura de correr una GUI para un millón de personas es un chiste comparado con la infraestructura necesaria para que un millón de personas creen imágenes cuando les apetezca. Sobre todo porque la creación de imágenes está basada en GPUs dedicadas.
Yo lo imagino como una GUI conectada vía websockets contra un backend que forma parte de la GUI "cliente" ... Cuando recibe una petición ha de publicar a un broker de mensajes la petición junto con a quién hay que responder .... Al otro lado del broker de mensajes está quien va procesando las peticiones y va publicando de vuelta también a través del broker… » ver todo el comentario
La aleatoriedad de pequeños defectos (una lata en el suelo, una hoja de arbol podrida, dos perros follando a lo lejos, una colilla en la acera) que sería complicada de describir verbalmente al algoritmo en el promt (le cuentas que quieres la foto de una chica en la calle con luz natural, pero no que en esa calle hay detrás un 260 rojo mal aparcado y con una rueda de emergencia delante a la derecha, con una mancha en la llanta de color purpura).
No será un metodo 100% fiable pero te dará cierto grado de confianza, si la foto es muy obvia y muy simple (solo una cara reconocible y todo lo demas bokeh) incrementará tu desconfianza por ser fake
Eso sí. Los dientes, siempre perfectos.
Sí, es deformación profesional, pero es que me me rechina muchísimo, más que la polidactilia.
No, a lo que me refiero es a la relación de número y tamaño que se ve en la fotografía. He visto muchos miles de bocas a lo largo de mi carrera y te aseguro que la de esta foto salta mucho a la vista por lo “rara” que es.
Como anécdota, una amiga de mi hermana tiene un brazo amputado a la altura del codo, ligeramente por encima de la articulación. No lleva prótesis y en verano suele ponerse una rebeca para disimularlo. Pues bien, mucha gente no se da cuenta cuando la conoce.
La calidad es bastante buena, y cuando empieces a ver cosas raras puedes sospechar, pero no puedes dejar de lado la posibilidad de que la foto sea rara por razones reales. Y si a eso sumamos los filtros de las cámaras, alguna que lo usa de forma automática (como pillaron a Samsung con la luna) ya tampoco puedes fiarte de que sea una foto falsa, una rara, o una mal retocada...
Entiendo que se puede retocar una foto bien, de modo que la persona tenga mejor aspecto sin dejar de ser natural, pero eso no es lo que solemos encontrar ya que la filtros automáticos no son tan buenos. Lo peor es que hoy día está tendencia se aplica también a los vídeos, da la sensación de estar viendo hablar a un muñeco en lugar de a una persona.
www.youtube.com/watch?v=lGOofzZOyl8
El manual es un lío.
Al final creo una en una especie de chat donde hay cientos de personas creando y no he podido encontrarla.
Tienen que currarse más toda la mierda de pantallas que tienen.
Algunas de las que yo he generado (estas en concreto, usando únicamente un párrafo de un relato, donde se describe a los personajes físicamente con cifras de peso y altura, descripción general de rasgos faciales y vestimenta, y el entorno de forma muy superficial, únicamente barrio, ciudad, país y noche fría):
Es una pregunta.
Tiene dos posibles respuestas: Si y No.
Los creadores de Google entendieron cómo funciona internet y diseñaron un algoritmo llamado Page rank, que ordena los resultados en función de los enlaces entre las páginas web, considerando más relevantes los sitios más enlazados por sitios que a su vez son relevantes.
Si te interesa el tema, hay bastantes artículos de teoría de grafos dedicados.
No sé qué tiene eso que ver con la noticia.
CC. #18
Para generar una imagen empiezas escribiendo /imagine pulsas intro y te saltará un input del estilo /imagine prompt. Ahí es donde tienes que escribir la imagen que quieres generar.
Pasará a la cola y te creará 4 imágenes diferentes pero del mismo estilo. Al finalizar puedes decidir ampliar una a 1024x1024 (U1, U2, U3, U4) o crear versiones similiares (V1, V2, V3, V4).
Aquí tienes uno poco más de detalles: docs.midjourney.com/docs/quick-start
A ver, usabilidad, joer, podian aprender del chat de openai.
Mira que es fácil hacer las cosas fáciles.
La mayoría de los informáticos no saben diseñar un sistema para un usuario.
Esto, guste o no, es una verdad como un templo.
Usabilidad.
El servidor te explica claramente cómo funciona todo: si no has sido capaz de entenderlo, el problema está en tu lado, siento decírtelo.
Aunque la de la derecha también
Juntas una IA para generar vídeo, otra para generar conversación, y le añades una de esas muñecas hiperrealistas para el desahogo final, y tienes unos cuantos millones de tíos encantados de dejarse cientos de euros al mes mientras no se arruinen.
¿Recuerdas cuando hace un par de años no sé quién (M$, G...) dejó que el público usara a su IA de chat y en menos de dos meses era absolutamente machista, xenófoba y sexualmente inapropiada?
Cogieron el resultado de ese aprendizaje y lo partieron en dos, una parte para ayudar a crear la siguiente versión que no se haga hija de puta y obscena, la otra para usar como chatbot para adultos. No recuerdo el nombre de la compañía de porno que está en el asunto, pero ya… » ver todo el comentario