Actualidad y sociedad
137 meneos
5659 clics
El nuevo Midjourney V5 se ha propuesto que no podamos diferenciar una foto real de una generada

El nuevo Midjourney V5 se ha propuesto que no podamos diferenciar una foto real de una generada

Midjourne V5. El nuevo motor cuenta según sus creadores con "mucha mayor calidad de imagen, salidas más diversas, rangos estilíticos más amplios, soporte para texturas, formatos de imagen más anchos, mejores prompts para imágenes, y rango dinámico más amplio", entre otras mejoras.

| etiquetas: midjourney , arte , ia
74 63 0 K 337
74 63 0 K 337
Comentarios destacados:                            
Las manos Juan, grabale las manos.  media
#1 por lo general les quedan horribles.
#1 #6 ya está casi arregladas
#26 sigue habiendo algo totalmente evidente en todas esas cosas (no se si llamarles fotos la verdad), y es la ausencia ABSOLUTA, de defectos.... incluso en fotos retocadas puedes apreciar algún cambio de tonalidad de la piel, algún lunar, alguna peca, algún pelo fuera de su sitio, si amplias lo suficiente, lo encuentras.... aqui nada.......... pero es que es lógico, no hay defectos por que no es real,
pieles absolutamente uniformes, posturas e iluminaciones perfectas, pelo como si fuera un solido....
de momento, han mejorado, pero siguen siendo demasiado "perfectas"
#35 justo esta versión nueva mete más "fallos" supongo que con el prompt se puede mejorar, pero tbn midjopurney está entrenado con fotos artísticas so... twitter.com/nickfloats/status/1636380856746139650 las gafas mira los cristales con rayones
#40 pues sí, razon llevas... los cristales, las flores de la izquierda, la textura de la tela de la chaqueta, pero sobre todo el vello entre el labio superior y la mejilla, ese podría ser un detalle que me hiciese decantarme por una foto natural....
aun así.... la uniformidad en las separaciones en las arrugas, la casi total uniformidad del tono de la piel, la iluminación casi perfecta y la casi ausencia de textura en los límites de zonas sobre iluminadas siguen cantando un poco..... aun así…   » ver todo el comentario
#52 como si no se retocaran las fotos digitales constantemente, las únicas fotos no retocadas son las analógicas cuando se procesan tradicionalmente y las ves en papel de revelado
#73 que si, obviamente que no digo que no se haga en las fotos, "tradicionales" digo que en estas imágenes todo parece demasiado "perfecto" incluso para los estándares del retoque a nivel comercial
#85 es muy extraño todo, da una sensación rara...
#52 #73 pero es que esta IA (midjhourney) está pensada para fotos artísticas, es así queriendo. Stable Diffusion por ejemplo es más mundana
#91 stable diffusion lo puedes descargar y entrenar , puedes descargarte extensiones y hacer lo que quieras
#73 la fotografía química también se puede retocar y manipular, como la famosa de Stalin.
#35 métele en el prompt las imperfecciones que quieres que tengan, y hecho.
#35 imagen generada con la V5.... Amplia, amplia  media
#62 que si, obviamente que son increíbles, pero, no se explicarlo, hay algo que los hace diferenciarse.... si me dices que eso es un dibujo hiper realista con lapices de colores o pintura, te diría que increible, pero sigue habiendo muchas cosas "demasiado perfectas..."
ojo, sin desmerecer un gramo el mérito de haber llegado a este punto  media
#62 Ya que no es un ser real, se puede decir melafo?
#62 sigue siendo rara, hay algo que no me cuadra.
#35 no son fotos.
#1 Ya le van cogiendo el truco twitter.com/romechenko/status/1636181045866561536 Ya sólo le falta que reparta los dedos por igual xD
#8 el truco es no dibujarlas, como en la miniatura xD
#8 Pues me impresionado, la de abajo a la derecha le ha quedado muy bien, muy pocos defectos, el más cantoso un dedo que es solo medio porque aparece difuminado, y una mancha justo arriba de ese dedo difuminado.
#1 en la propia noticia adjuntan un tweet que invita a la esperanza, en la linea del que adjunta #8 .
twitter.com/SmokeAwayyy/status/1636170472181334017

Se ven todavía a menudo fallos, en plan dedos torcidos y proporciones un tanto de valle inquietante, pero desde luego el avance pinta ya espectacular, ya no son el desastre que se estaba viendo con personas de aspecto increible pero veias sus manos y parecian un grupo de chistorras mutantes anidadas.
#1 Es lo que tiene Midjourney, que todavía están peleándose con las manos.
Cómo Stable Diffusion es de código libre hay modelos y herramientas que te permiten hacer manos gracias al trabajo de la comunidad: www.reddit.com/r/StableDiffusion/comments/112naoe/almost_perfect_hands

#2 Tener que usar Discord para generar imágenes es estúpido por parte de la compañía.
#11 ¿Y lo que se ahorran en almacenamiento y en infrastructura?
#14 Montar una GUI es una tontería comparado con montar toda la granja de GPUs necesaria para crear las imágenes.
#22 Sin duda, Escudo de Roble.

Fe de ello que tienen la webapp aquí: www.midjourney.com/app pero sólo para gestionar la cuenta y ver galerías.

En cualquier caso, a mi me parece que utilizar Discord es un acierto.

Edit: Añado que probablemente estén computando en Azure o otro proveedor cloud.
#24 discord me parece un rollo, a veces no veo mi foto
#28 Ocurre en ocasiones. Si vas a la webapp y te logueas con tu cuenta de discord es posible que la encuentresen en tu galeria.
#28 Hay que ser usuario de pago para poder hacer mensajes directos al bot. Así solo salen tus fotos en el hilo.
#24 Un acierto por qué? A mi simplemente me parece una moda y una forma de no ponerlo a disposición de cualquiera, metiendote por una app propietaria.
#36 Además es eso. Al ser propietaria Discord puede fastidiar el negocio de Midjourney en cualquier momento.
#41 hay alguna IA de estas que sea gratuita?
#36 En mi caso personal porque es una manera conveniente de almacenar las imágenes por categoria (canales), de compartir las imágenes y de acceder al servicio.
#36 stable diffusion esta disponible para descargar e instalar en un ordenador con una buena tarjeta grafica , puedes instalarle extensiones y entrenarlo en lo que quieras , stable-diffusion-ui.github.io/
#22 Sí, con 1 000 000 000 de usuarios seguro que es una tontería en dinero la infraestructura que necesitas. Nadie habla de la GUI, si no de la infraestructura necesaria.
#50 ¿Donde digo que la GUI se monte en ninguna infraestructura?
:shit:
#51 Es que la dificultad no es montar una GUI y ya, está en servirla a millones de personas, miles de forma concurrente.

Decir que montar una GUI es muy fácil, pues claro que lo es. Pero ese no es el problema.
#63 No sé cómo decirlo ya.

Con montar, me refiero también a la infraestructura.

Y la infraestructura de correr una GUI para un millón de personas es un chiste comparado con la infraestructura necesaria para que un millón de personas creen imágenes cuando les apetezca. Sobre todo porque la creación de imágenes está basada en GPUs dedicadas.
#64 Ahí es que estamos de acuerdo ... la infra para correr ese modelo de IA para atender a todas las peticiones de generado de imágenes me da vértigo. Quizá alguna queue y generarlas en asíncrono por multitud de instancias consumiendo la queue
#67 Si quieres ver cómo se puede hacer, Stable Horde es básicamente lo mismo que Midjourney y es de código abierto: stablehorde.net/
#71 Interesante, aunque para millones de usuarios toca construir capas adicionales. No puedes llamar al Rest API directamente ...

Yo lo imagino como una GUI conectada vía websockets contra un backend que forma parte de la GUI "cliente" ... Cuando recibe una petición ha de publicar a un broker de mensajes la petición junto con a quién hay que responder .... Al otro lado del broker de mensajes está quien va procesando las peticiones y va publicando de vuelta también a través del broker…   » ver todo el comentario
#11 Sí, o manos de varios dedos, o varias manos directamente. La cara al menos está mejorando bastante.
#11 Te puedes bajar el proyecto y ejecutarlo en tu pc sin limite ni censura
#11 Pero para ser justos a los humanos también es lo que más nos cuesta, las manos y las caras, no solo porque sean más difíciles de dibujar (que también) sino además porque tenemos una absurda proporción del cerebro dedicada a identificar manos y caras, así que cualquier mínimo defecto, cualquier proporción inusual es identificada al instante. Es absolutamente increíble que en pocos meses las imágenes hechas por IA hayan pasado a ser la maravilla que son ahora, no puedo ni imaginarme cómo será el mundo en unos años.
Al final creo que nos va a quedar buscar los defectos para intentar diferenciar que es real y que no.
La aleatoriedad de pequeños defectos (una lata en el suelo, una hoja de arbol podrida, dos perros follando a lo lejos, una colilla en la acera) que sería complicada de describir verbalmente al algoritmo en el promt (le cuentas que quieres la foto de una chica en la calle con luz natural, pero no que en esa calle hay detrás un 260 rojo mal aparcado y con una rueda de emergencia delante a la derecha, con una mancha en la llanta de color purpura).
No será un metodo 100% fiable pero te dará cierto grado de confianza, si la foto es muy obvia y muy simple (solo una cara reconocible y todo lo demas bokeh) incrementará tu desconfianza por ser fake
#9 #20 lo volvemos a hablar em 2 meses en la version v6 #12
#27 Encantado. Estoy convencido de que mejorará hasta el punto de hacerlo indistinguible. Imagina lo que se ahorrarán en actores en Hollywood.
#9 #12 #16 Me pillé un mes del pornpen pro y la verdad es que estoy flipando con algunos de los resultados.

Eso sí. Los dientes, siempre perfectos.  media
#46 Espera, esa mierda genera videos? Es para un amigo.
#12 No sé si funciona ese sistema. He visto muchas fotos artificiales que estaban repletas de detalles en el fondo y no se pedían en el prompt.
Solo tengo que mirar los dientes. No siguen el patrón normal. Ponen incisivos de más. No hay simetría ni armonía en la sonrisa.

Sí, es deformación profesional, pero es que me me rechina muchísimo, más que la polidactilia.
#9 Pues si fuera por eso, todas las fotos mías o de mi hermana te parecerían falsas; ambas tenemos un número anormal de incisivos. A mí lo que más me rechina es la textura de la piel, parecen fotos a las que les han pasado mil filtros, porque esa piel no se puede simular ni con maquillaje.
#13 Por número anormal de incisivos supongo que te refieres a agenesia de incisivos laterales, que es una de las anomalías de número más frecuentes y con componente genético. También hay casos de un incisivo extra en la arcada inferior, pero son más raros y, como no se suelen ver, pasan más desapercibidos.

No, a lo que me refiero es a la relación de número y tamaño que se ve en la fotografía. He visto muchos miles de bocas a lo largo de mi carrera y te aseguro que la de esta foto salta mucho a la vista por lo “rara” que es.
#23 Sí, a mí me falta el incisivo superior izquierdo, como a mi abuela paterna. Me resulta curioso que la mayoría de la gente no se dé cuenta si no se lo digo, porque es algo que se nota bastante, sobre todo porque la sonrisa no está "centrada". A mi hermana le falta un incisivo inferior, como a mi padre, pero es cierto que eso apenas se ve.
#31 A mi no me extraña tanto que no se note, al menso conscientemente no, simplemente porque te tienes que fijar. Es como la gente que lleva lunares en la cara, a menos que te fijes mucho, no te vas a dar cuenta si luego desaparece... o te puede pasar con tus propios lunares, si aparecen o desaparecen...
#31 yo me he decidido a ponerme una ortodoncia debido a un apiñamiento superior bastante marcado, que siempre me ha acomplejado, y cuando lo he hecho mis familiares no se lo explican porque dicen que tampoco es tanto. Es probable que yo no muestre mis dientes salvo lo imprescindible, y por ello la gente apenas lo note. Pero es curiosa la diferencia entre lo que percibimos de nosotros mismos y cómo nos ven los demás.
#55 Totalmente cierto. Yo sonrío muy a menudo y sin embargo ninguno de mis amigos se dio cuenta hasta que no se lo dije. Y hablamos de defectos visibles en la cara; si ya nos vamos a otras partes del cuerpo es aún más raro que alguien lo note.
Como anécdota, una amiga de mi hermana tiene un brazo amputado a la altura del codo, ligeramente por encima de la articulación. No lleva prótesis y en verano suele ponerse una rebeca para disimularlo. Pues bien, mucha gente no se da cuenta cuando la conoce.
#9 Aprovecho lo que pone #13, me parece que muchas IAs juegan con eso para intentar dar el corte. Ahora chatgpt lo hace bastante bien, pero los primeros intentos de hacer pasar a un bot por humano consistían en que aceptaras que chateabas con un niño que no sabía bien tu idioma, y pasaba. Y claro, así puedes pasar por aceptable muchas cosas...

La calidad es bastante buena, y cuando empieces a ver cosas raras puedes sospechar, pero no puedes dejar de lado la posibilidad de que la foto sea rara por razones reales. Y si a eso sumamos los filtros de las cámaras, alguna que lo usa de forma automática (como pillaron a Samsung con la luna) ya tampoco puedes fiarte de que sea una foto falsa, una rara, o una mal retocada...
#38 Justo. A mí la mayoría de fotos que pasan por filtros automáticos, sobre todo cuando se aplican a las caras, me rechinan muchísimo.
Entiendo que se puede retocar una foto bien, de modo que la persona tenga mejor aspecto sin dejar de ser natural, pero eso no es lo que solemos encontrar ya que la filtros automáticos no son tan buenos. Lo peor es que hoy día está tendencia se aplica también a los vídeos, da la sensación de estar viendo hablar a un muñeco en lugar de a una persona.
#42 Me has recordado el vídeo de "señor juez, no soy un gato". xD
www.youtube.com/watch?v=lGOofzZOyl8
#9 A mí también me perturban más las bocas de 78 dientes que las manos de 6 dedos.
Coño, parece que por fin pone una cantidad normal de dedos.
#7 Parece. Pero no.
Yo lo que no tengo claro es a que se refieren con una foto real. Porque hoy en día cualquier fotógrafo profesional le mete tal cantidad de post-procesado digital a sus fotos que no se yo hasta que punto es correcto decir que el resultado es una foto real.
#25 Que no parezca una ilustración.
#78 Jo, pero ¿qué os cuesta poner un big breast?
#87 pon big breakfast, a ver que sale
#87 las IA tienden a poner grandes tetas, pero a mí me salió en este caso average , con Lexica salen asi
#87 esto es en Lexica  media
Yo he entrado, y ni he sabido como crear una puta imagen.

El manual es un lío.
Al final creo una en una especie de chat donde hay cientos de personas creando y no he podido encontrarla.

Tienen que currarse más toda la mierda de pantallas que tienen.
#2 Yo lo intenté una vez y acabé en esa cosa monstruosa llamada Discord, donde todo me parecía caótico y no entendía nada. Pensé: "tío, te estás haciendo muy viejo para esto". Así que lo cerré todo y para otro día...
#15 Que rabia que cada vez sea más normal pedir ayuda en Discord en vez de fotos y lugares así. De esa manera se "pierde" la información y no es indexada por ningún servicio de búsqueda aparte del buscador de Discord (que no es lo mismo)
#15 pones un prompt como este "a very atractive 30 years old scandinavian woman with white hair , smiling ,hairstyle bun ,wearing a Tight Fitted Dresses Sleeveless Open Side Gold Fastening Bodycon Dress gold , window with showing urban neon lights, blade runner , cinematic lighting, Shot on ,50mm lense, Ultra- Wide Angle, Depth of Field, hyper-detailed, beautifully color-coded, beautifully color graded, Unreal Engine, Cinematic, Color Grading, Editorial Photography, Photography,…  media   » ver todo el comentario
#2 #15 yo creo que es más el interés que tengáis porque realmente son 2 minutos. Para mí también era nuevo discord y lo que hice fue crearme un canal, meter el bot de midjourney en ese canal y luego "/imagine" y ya lo que se te ocurra
#93 Lo de los 2 minutos ni de coña si no has usado antes esa caótica interficie.
#93 Venga lo voy a intentar. 2 minutos... Bueno que sean 22.
#2 Aunque conseguir buenas imágenes tiene cierta complejidad que los tutoriales de la web no tocan en mucha profundidad, las instrucciones para llegar a los canales donde producir imágenes, y cómo producirlas de forma sencilla, son fáciles de seguir.

Algunas de las que yo he generado (estas en concreto, usando únicamente un párrafo de un relato, donde se describe a los personajes físicamente con cifras de peso y altura, descripción general de rasgos faciales y vestimenta, y el entorno de forma muy superficial, únicamente barrio, ciudad, país y noche fría):  media
#16 La primera y la segunda de la fila de abajo están cojonudas.
#2 Puedes crear tu propio server, añadir al bot de Midjourney y jugar en él sin tener que entrar en las salas comunes.
#17 Para eso hay que ser usuario de pago
#2 Mi padre de 75 me dice lo mismo, pero sobre los teclados, que los hacen para que no se encuentren las teclas cuando las necesitas.
#18 Y tendria razon... El teclado qwerty viene de las antiguas máquinas de escribir, y se hizo asi a proposito para que no se escribiera demasiado rápido y que los "martillos" con las letras (no se como se llaman) no se atascaran entre ellos.
#18 ¿Tu sabes porqué Google arrasó con el resto de buscadores cuando salió hace algo mas de 20 años?
#68 Si quieres contar algo, hazlo directamente, no me vengas con preguntas retóricas.
#69 No es una pregunta retórica.
Es una pregunta.

Tiene dos posibles respuestas: Si y No.
#70 ¿Y tú qué dices? ¿Que sí o que no?
#68 Porque su algoritmo era mejor que el de sus competidores, ya que daba resultados más relevantes para el usuario.
Los creadores de Google entendieron cómo funciona internet y diseñaron un algoritmo llamado Page rank, que ordena los resultados en función de los enlaces entre las páginas web, considerando más relevantes los sitios más enlazados por sitios que a su vez son relevantes.
Si te interesa el tema, hay bastantes artículos de teoría de grafos dedicados.
No sé qué tiene eso que ver con la noticia.
CC. #18
#2 Entras en un canal cualquiera de newbies, como por ejemplo discord.com/channels/662267976984297473/1008571157592674431

Para generar una imagen empiezas escribiendo /imagine pulsas intro y te saltará un input del estilo /imagine prompt. Ahí es donde tienes que escribir la imagen que quieres generar.

Pasará a la cola y te creará 4 imágenes diferentes pero del mismo estilo. Al finalizar puedes decidir ampliar una a 1024x1024 (U1, U2, U3, U4) o crear versiones similiares (V1, V2, V3, V4).

Aquí tienes uno poco más de detalles: docs.midjourney.com/docs/quick-start
#21 Eso ya lo he hecho, pero como es un canal donde escribe mucha gente, la imagen se va par arriba y la pierdes.

A ver, usabilidad, joer, podian aprender del chat de openai.
Mira que es fácil hacer las cosas fáciles.
#66 pero tienes la notificación sobre tu imagen, así que puedes recuperarla cuando quieras (o usar el buscador).
#72 Repito: Usabilidad.
La mayoría de los informáticos no saben diseñar un sistema para un usuario.
Esto, guste o no, es una verdad como un templo.
#74 y a mí que me cuentas :-S
#75 Pasaba por aquí...
#66 me recuerdas a alguien hace unos 20 años en clase de CAD que perdía los dibujos, todo lo tuyo está aquí , te pongo una captura de pantalla  media
#81 Superevidente, vamos, que si no sabes como va, no sabes que significan los iconos, no sabes usarla.
Usabilidad.
#84 con dedicarle un poco de tiempo no es más, toneladas de videos sobre eso en youtube o simplemente buscas
#2 pagas la suscripción y puedes abrirle un chat privado al boy donde solo están tus imágenes.

El servidor te explica claramente cómo funciona todo: si no has sido capaz de entenderlo, el problema está en tu lado, siento decírtelo.
#56 Pongo la mano en el fuego a que a ti no te dejan tratar con los clientes el tema de la usabilidad de un software.
#65 hace mucho que no curro para clientes. Esa suerte que tengo.
#2 pues yo los hice en 5 minutos  media
La artificial es la de la izquierda
#3 La de la izquierda es V4, la de la derecha es V5
#4 pues tiene razón, la de la izquierda es artificial.
Aunque la de la derecha también
:troll:
¿Igual de bien que no podemos diferenciar un artículo normal de uno hecho en Xataka :troll:?
#83 Ya pero eso no da dinero, y por desgracia el avance tecnológico es por el porno o por videojuegos o por %_menor_de_otras_cosas_en_conjunto.
El porno esta que se frota la manos (y otras cosas). Pero como estamos en un mundo capitalista, los avances tecnológicos no son por los "fans del porno" si no por las "empresas del porno". ¿Se puede sacar dinero porno de esto?
#47 Cantidades brutales.
Juntas una IA para generar vídeo, otra para generar conversación, y le añades una de esas muñecas hiperrealistas para el desahogo final, y tienes unos cuantos millones de tíos encantados de dejarse cientos de euros al mes mientras no se arruinen.
#59 ¿Cuando montamos la empresa?
#88 Ya lo están haciendo.
¿Recuerdas cuando hace un par de años no sé quién (M$, G...) dejó que el público usara a su IA de chat y en menos de dos meses era absolutamente machista, xenófoba y sexualmente inapropiada?
Cogieron el resultado de ese aprendizaje y lo partieron en dos, una parte para ayudar a crear la siguiente versión que no se haga hija de puta y obscena, la otra para usar como chatbot para adultos. No recuerdo el nombre de la compañía de porno que está en el asunto, pero ya…   » ver todo el comentario
#97 yo creo que lo que tenían que hacer es IAS para generar porno infantil para que nunca nadie necesitara abusar de ningún niño real para generar el contenido que los pederastas buscan. Porque nunca dejarán de buscarlo y consumirlo, así que lo mejor sería sintetizarlo para que tengan contenido para aburrirse sin joder infancias de verdad.
#47 el porno está en stable difusion, te lo descargas y puedes hacer lo que quieras en tu ordenador , en discord tienen un canal NSFW
Pues para mí dinero gastado en nada, porque poca importancia me supone eso. Vale que para algún asunto valdrá, pero la mitad es tontería.
#92 pues yo ya he hecho trabajos de diseño con cosas de SD. No tal cuál me las da, pero entre bocetos para saber por donde tirar o trozos parciales que luego integro con otras cosas, a mi me parece brutal.
que enseñe las manos…
«12

menéame