búsqueda de «audi»

8 meneos

82 clics

Spotify HiFi: una filtración detalla el plan de audio sin pérdidas

La incursión de Spotify en el audio sin pérdidas ha sido una saga digna de una telenovela mexicana. Anunciado con mucha fanfarria en 2021, Spotify HiFi prometía una mejora significativa en calidad para los oídos más exigentes. A mayo de 2024, aún no hay señales de su disponibilidad, aunque las últimas filtraciones han reavivado la llama de la esperanza.

6 2 0 K 34

sin comentarios

6 2 0 K 34

2 meneos

3 clics

TikTok desarrolla una herramienta para clonar tu voz con Inteligencia Artificial

TikTok ha introducido una herramienta que permite a los usuarios clonar su propia voz utilizando inteligencia artificial. Esta función, aún en fase beta para la versión de Android, fue descubierta por el analista AssembleDebug, quien exploró las recientes actualizaciones de código de la popular red social. La función, denominada ‘Clonar tu voz con IA‘, promete replicar la voz de cualquier usuario con tan solo 10 segundos de grabación de audio.

1 1 4 K -22

2 comentarios

1 1 4 K -22

20 meneos

67 clics

¿Almacenan lo que digo las aplicaciones de conversión de voz a texto? ¿Pueden clonar mi voz o acceder a mis conversaciones privadas?

Las herramientas de transcripción son útiles para convertir audio a texto y algunas almacenan nuestras conversaciones en la nube. En esos casos hay riesgos de que se filtre esta información y se use para realizar un ataque informático o suplantar nuestra identidad o la de otra persona que aparezca en las grabaciones. Podemos reducir la cantidad de datos que compartimos con estas aplicaciones y también hay herramientas nos dan la opción de no guardar nuestros audios.

17 3 1 K 142

3 comentarios

17 3 1 K 142

10 meneos

201 clics

Microsoft levanta un bloqueo de dos años que impedía a estos usuarios de Windows 10 actualizarse a Windows 11

Desde que se lanzara Windows 11 al mercado han sido millones de equipos que no han podido actualizarse al nuevo sistema operativo por no cumplir una serie de requisitos. Pero también hay otra serie de usuarios con equipos incompatibles, que no pudieron dar el salto a Windows 11 por algún driver en particular. Ahora, Microsoft ha confirmado que finalmente ha dado por resuelto un error de más de dos años que impedía a estos usuarios de Windows 10 actualizarse a Windows 11.

8 2 1 K 30

7 comentarios

8 2 1 K 30

8 meneos

67 clics

OpenAI: Desafíos y oportunidades de las voces sintéticas [EN]

Hoy compartimos los resultados preliminares de una vista previa a pequeña escala de un modelo llamado Voice Engine, que utiliza texto y una única muestra de audio de 15 segundos para generar un habla natural que se asemeja mucho al hablante original. Es notable que un modelo pequeño con una sola muestra de 15 segundos pueda crear voces emotivas y realistas. Desarrollamos Voice Engine por primera vez a finales de 2022, y lo hemos utilizado para potenciar las voces preestablecidas disponibles en la API de texto a voz, así como ChatGPT Voice y Re

6 2 0 K 21

6 comentarios

6 2 0 K 21

6 meneos

42 clics

WhatsApp revoluciona los audios: la app prepara la inminente transcripción de las notas de voz

Los audios de WhatsApp tienen los días contados. Lo cierto es que o los odias o los amas, pero en algunos casos parecen auténticos podcasts. O, en otro caso, simplemente no podemos oír la nota de voz porque estamos reunidos o con amigos. Sin embargo, la aplicación de mensajería instantánea propiedad de Meta ya prepara la función de transcripción de mensajes de audio, que permitirá leerlos en vez de escucharlos.

5 1 0 K 9

18 comentarios

5 1 0 K 9

20 meneos

215 clics

Por qué ahora todos necesitamos subtítulos

No es tu culpa, los diálogos en la televisión y en las películas se han vuelto muy difíciles de entender.

18 2 1 K 305

17 comentarios

18 2 1 K 305

30 meneos

361 clics

Este envío tiene varios votos negativos. Asegúrate antes de menear

Iker Jiménez se pronuncia sobre el audio viral con su voz clonada por inteligencia artificial

En ‘Horizonte’ analizamos el audio con la voz clonada de Iker Jiménez que se ha realizado con inteligencia artificial y se ha hecho viral durante los últimos días. Así comienza el audio creado con inteligencia artificial con la voz de Iker Jiménez: “Hoy me gustaría acabar con una reflexión, a ver, para mí lo mejor de las maduras es que puedes comerles el roscón de reyes mientras te tienen al fuego unas lentejas de p*** madre. Yo recuerdo una que conocí en un Eroski y tenía unos hijos majísimos, menudos vicios echamos al crash bandicoot 2”.

27 3 7 K 5

33 comentarios

27 3 7 K 5

9 meneos

36 clics

AOMedia presenta el contenedor de audio Immersive Audio Model and Formats (IAMF) [ENG]

La Alliance for Open Media (AOMedia) anunció hoy el lanzamiento de la especificación de contenedor Immersive Audio Model and Formats (IAMF), la primera especificación de contenedor de audio de la organización que se ofrece bajo la licencia libre de regalías de AOMedia. IAMF está diseñado para permitir a los creativos revolucionar las experiencias de audio inmersivo en una gran variedad de aplicaciones, desde streaming y juegos hasta realidad aumentada y realidad virtual, así como la transmisión tradicional.

7 2 0 K 33

2 comentarios

7 2 0 K 33

5 meneos

67 clics

BattMAN, la revolucionaria innovación de Audi para conseguir fábricas neutras en emisiones

Hace ya bastante que las marcas de automóviles empezaron a preocuparse por su impacto en el medio ambiente, pero ha sido en los últimos años, sobre todo con la llegada de los coches eléctricos, cuando se ha puesto de mayor relevancia. Sin embargo, reducir las emisiones no importa solo en los automóviles, también es clave en las fábricas en las que se producen.

5 0 1 K 19

9 comentarios

5 0 1 K 19

134 meneos

1340 clics

Wavacity: Editor de audio en línea basado en Audacity [ENG]

Wavacity es una adaptación del editor de audio Audacity al navegador web. Es gratuito y de código abierto. No requiere instalación.

77 57 0 K 179

31 comentarios

77 57 0 K 179

39 meneos

82 clics

Un nuevo ataque roba datos mediante el análisis acústico de las pulsaciones del teclado con una precisión del 95% [ENG]

Un equipo de investigadores de universidades británicas ha entrenado un modelo de aprendizaje profundo que puede robar datos de las pulsaciones de teclado registradas con un micrófono con una precisión del 95 %. Cuando se utilizó Zoom para entrenar el algoritmo de clasificación de sonido, la precisión de la predicción se redujo al 93%, que sigue siendo peligrosamente alta. Un ataque de este tipo afecta gravemente a la seguridad de los datos del objetivo, ya que podría filtrar las contraseñas, conversaciones, mensajes,...

30 9 0 K 190

23 comentarios

30 9 0 K 190

264 meneos

5450 clics

Tres universitarios españoles inventan una lupa tecnológica que puede cambiar para siempre la vida de millones de personas

El proyecto 'LUP', impulsado por tres universitarios vascos ha logrado uno de los premios de la Fundación Mapfre a la Innovación Social entre 350 candidaturas de todo el mundo

105 159 4 K 360

36 comentarios

105 159 4 K 360

4 meneos

80 clics

Hace unos años era impensable, pero Tesla ya supera en ventas a una de las tres grandes alemanas

Si hace seis o siete años, le hubieran dicho a Elon Musk que en 2023 superaría en ventas a BMW, Mercedes-Benz o Audi, seguramente habría creído y apostado por ello. Quizá fuese el único en aquel momento, el resto del mundo siempre ha sido más escéptico. La situación productiva de Tesla empezó a despegar con buena salud hace tres años, aproximadamente, pero ahora ya va como un cohete de SpaceX.

3 1 1 K 19

9 comentarios

3 1 1 K 19

4 meneos

46 clics

¿Cómo mejorar la comunicación en aplicaciones de mensajería ante la avalancha de audios?

WhatsApp y Telegram, dos aplicaciones de mensajería sumamente populares, han experimentado un aumento considerable en el envío de mensajes de voz. Con más de 8.000 millones de audios enviados diariamente, esta forma de comunicación no es bien recibida por todos los usuarios. Ante esta situación, tanto las compañías como los usuarios buscan soluciones para manejar esta avalancha de audios, un problema que se extiende a otras plataformas como Messenger e Instagram.

3 1 0 K 28

8 comentarios

3 1 0 K 28

223 meneos

2980 clics

writeout.ai - Transcribe y traduce cualquier archivo de audio

Esta web con código fuente disponible (se puede alojar localmente) permite subir un fichero de audio cualquiera y recibir una transcripción y/o traducción en texto. Utiliza por detrás el API Whisper de OpenAI. Fuente en GitHub: github.com/beyondcode/writeout.ai

121 102 0 K 426

71 comentarios

121 102 0 K 426

21 meneos

75 clics

WhatsApp transformará audio en texto sin necesidad de aplicaciones externas

El audio de WhatsApp tiene partidarios y detractores a partes iguales. O visto de otra forma, es una herramienta cómoda cuando tienes que enviarlo y no tienes tiempo para escribir y sin embargo no es tan interesante cuando te toca a ti escuchar un minuto de audio.

19 2 0 K 228

30 comentarios

19 2 0 K 228

9 meneos

251 clics

Mantener un Audi te saldrá igual de caro que un Mercedes, pero visitarás mucho más el taller

Audi tiene dos títulos de los que no precisamente puede presumir. El primero, el de ser la marca más cara de mantener junto con Mercedes-Benz, según se puede ver en un informe de la Organización de Consumidores y Usuarios (OCU); y el segundo, el de ser una de las marcas que más visita el taller, también según la OCU. Estos dos méritos se pueden relacionar con algunos fallos endémicos de la marca.

7 2 1 K 34

8 comentarios

7 2 1 K 34

30 meneos

215 clics

Esta IA de Microsoft puede imitar la voz y emociones de una persona a partir de un audio de tres segundos: así funciona VALL-E

VALL-E (no confundirla con DALL-E) es un modelo de lenguaje capaz de generar audio con la misma voz y entonación que el interlocutor. Lo único que necesita la herramienta es un audio de como mínimo tres segundos para que pueda comenzar a procesar. Las capacidades de este modelo de lenguaje quedan detalladas en el informe publicado por los investigadores. VALL-E ha sido entrenado con más de 60.000 horas de audios en inglés. A través de esta tecnología el usuario puede sintetizar un audio personalizado a partir de la voz de una persona distinta.

26 4 0 K 189

17 comentarios

26 4 0 K 189

27 meneos

34 clics

La gigafactoría de Volkswagen, cada vez más cerca: la Generalitat saca a exposición pública el PAI

La Generalitat ha sacado a proceso de exposición pública el Proyecto de Actuación Integrada (PAI) de Parc Sagunt II para el desarrollo y urbanización del parque empresarial donde se ubicará la gigafactoría de fabricación de celdas de baterías para vehículos eléctricos de PowerCo, empresa del grupo Volkswagen.

23 4 0 K 42

5 comentarios

23 4 0 K 42

7 meneos

112 clics

¿Qué es un cable TRS y por qué debería importarte?

Un cable TRS es algo cotidiano y habitual para la vida del guitarrista. En este vídeo os explico y facilito todo lo que se puede (y se debe) hacer con él.

5 2 1 K 55

sin comentarios

5 2 1 K 55

93 meneos

1442 clics

Videogrep [ENG]

"Videogrep" es una herramienta basada en línea de comandos, escrita por Sam Lavigne, que busca diálogos en archivos de vídeo y realiza "supercortes" basados en lo que encuentra. Puede reconocer las pistas de subtítulos .srt o .vtt, o las transcripciones que se pueden generar con Vosk, Pocketsphinx, u otras aplicaciones. Para la instalación, instrucciones de uso y el código, véase: github.com/antiboredom/videogrep.

60 33 0 K 199

35 comentarios

60 33 0 K 199

121 meneos

2093 clics

Audio del disco de un gramófono extraído a partir de una fotografía [ING]

"Soy el robot atómico. Por favor, transmitid mis mejores deseos a todo el mundo". Éstas son las palabras pronunciadas por Tommy, un robot de juguete de mi infancia. Ya había echado un vistazo a su mecanismo de sonido de disco de vinilo en miniatura unas cuantas veces, en un intento de recuperar la señal de audio analógica utilizando sólo una cámara digital. Los resultados fueron ruidosos en el mejor de los casos, [...] lo que me inspiró a probar suerte con un método ligeramente mejorado. (Traducción en comentarios)

66 55 0 K 392

22 comentarios

66 55 0 K 392

4 meneos

150 clics

Estos investigadores han creado el “DALL-E” del audio: así es AudioGen

Los generadores de imágenes a partir de texto parecen haber llegado para quedarse. Si queremos “una pintura de un lindo gatito negro en una ciudad con estilo cyberpunk” y no queremos ponernos manos a la obra con lápices o pinceles, podemos resignar parte del proceso creativo tradicional y pedirle a DALL-E, Midjourney o Stable Diffusion que haga el trabajo por nosotros.

3 1 0 K 33

12 comentarios

3 1 0 K 33

66 meneos

1097 clics

Este envío tiene varios votos negativos. Asegúrate antes de menear

Este nuevo malware de Android puede robar tus datos y grabar audio sin que lo sepas

Se ha descubierto un nuevo malware para Android, bautizado como 'RatMilad' que puede robar tus datos y grabar audio. Es un software espía y que se usa para espiar a las víctimas y robar datos. La firma de seguridad móvil Zimperium ha sido la encargada de alertar de este malware. "Al igual que otros programas espía para móviles que hemos visto, los datos robados de estos dispositivos podrían utilizarse para acceder a sistemas corporativos privados, chantajear a la víctima y mucho más", según Zimperium que dice que, tras robar información, los...

25 41 12 K 13

11 comentarios

25 41 12 K 13

suscripciones por RSS

Spotify HiFi: una filtración detalla el plan de audio sin pérdidas

TikTok desarrolla una herramienta para clonar tu voz con Inteligencia Artificial

¿Almacenan lo que digo las aplicaciones de conversión de voz a texto? ¿Pueden clonar mi voz o acceder a mis conversaciones privadas?

Microsoft levanta un bloqueo de dos años que impedía a estos usuarios de Windows 10 actualizarse a Windows 11

OpenAI: Desafíos y oportunidades de las voces sintéticas [EN]

WhatsApp revoluciona los audios: la app prepara la inminente transcripción de las notas de voz

Por qué ahora todos necesitamos subtítulos

Iker Jiménez se pronuncia sobre el audio viral con su voz clonada por inteligencia artificial

AOMedia presenta el contenedor de audio Immersive Audio Model and Formats (IAMF) [ENG]

BattMAN, la revolucionaria innovación de Audi para conseguir fábricas neutras en emisiones

Wavacity: Editor de audio en línea basado en Audacity [ENG]

Un nuevo ataque roba datos mediante el análisis acústico de las pulsaciones del teclado con una precisión del 95% [ENG]

Tres universitarios españoles inventan una lupa tecnológica que puede cambiar para siempre la vida de millones de personas

Hace unos años era impensable, pero Tesla ya supera en ventas a una de las tres grandes alemanas

¿Cómo mejorar la comunicación en aplicaciones de mensajería ante la avalancha de audios?

writeout.ai - Transcribe y traduce cualquier archivo de audio

WhatsApp transformará audio en texto sin necesidad de aplicaciones externas

Mantener un Audi te saldrá igual de caro que un Mercedes, pero visitarás mucho más el taller

Esta IA de Microsoft puede imitar la voz y emociones de una persona a partir de un audio de tres segundos: así funciona VALL-E

La gigafactoría de Volkswagen, cada vez más cerca: la Generalitat saca a exposición pública el PAI

¿Qué es un cable TRS y por qué debería importarte?

Videogrep [ENG]

Audio del disco de un gramófono extraído a partir de una fotografía [ING]

Estos investigadores han creado el “DALL-E” del audio: así es AudioGen

Este nuevo malware de Android puede robar tus datos y grabar audio sin que lo sepas

suscripciones por RSS

ayuda

+menéame

estadísticas