Si no respetas la propiedad privada de los "ricos", no respetas la de los "pobres". Respeto es respeto. Quitar a alguien para dar a otro es robo. Que vengan a quitarte a ti para igualar tu nivel del vida con el promedio africano y luego me cuentas. #5#7#8
#4 lo aprendió de la Rusia IMPERIALISTA, y gracias a Putin estratega ajedrecista 5d Ruso IMPERIALISTA condecora NANZIS se va a extender, mínimo a todo el este de Europa....
#78 ¿Pero estás hablando de la arquitectura o de los pesos? ¿O es que te refieres a los datos de entrenamiento como un "código fuente" que se compila en los pesos? La verdad, antes de mirar ahí, si lo que me preocupasen fueran los sesgos, miraría el fine tuning y el RLHF, ahí es donde se ajusta la "personalidad" del modelo.
#76> No comprendo tu postura de apoyar el uso una IA opaca.
Es que el motivo por el que la IA es opaca no es que no se conozcan los datos de entrenamiento. De hecho, se conocen en gran parte y sigue siendo opaca. Pero vamos, que estás comentando en una "noticia" que no es más que un bulo para gente que no conoce bien esta tecnología, y parece que con eso no tienes ningún problema.
¿Prefieres que se usen IAs tipo Llama en el sector público? Genial. Pero eso no va a cambiar apenas la dirección en la que vamos. Es de una ingenuidad atroz creer otra cosa.
#4 Eso es solo un efecto, en realidad el fin de ésta organización es más simple si ves que está firmada por las productoras de envases mayoritarias... CocaCola, Pepsi, ...
#23 Si el modelo fuese abierto, se podría modificar/remodelar.
Eso se hace con todos los Llama, Qwen, Mixtral y demás (salen versiones mejoradas)
No es necesario saber su entrenamiento, solo modificarlos "al gusto".
Y eso lo puede hacer cada uno en su casa (con el equipo adecuado)
#5 Pues hazlo tú. Nadie te lo impide. Es más, si 10.000 anarquistas montan una cooperativa de inteligencia artificial y se dedican en cuerpo y alma a ello, probablemente se conviertan en una de las principales empresas en ese ámbito.
#29En cualquier caso el entrenamiento debe ser publico.
No necesariamente, el sector de aviación tiene todo tipo de regulaciones que las empresas deben cumplir pero eso no les obliga a que la construcción de un avión se haga de forma pública.
Si hay motivos fundados para sospechar que incumplen las regulaciones se puede auditar el proceso y buscar responsabilidades, en ese sentido no sería distinto.
#17#18 Creo que es un mal ejemplo. Las decisiones tipo "otorgar ayudas" están totalmente objetivadas (Generalmente tener una renta menor de X, ponderada por miembros de unidad familiar, patrimonio u otros requisitos específicos, como por ejemplo las notas en caso de becas). La regulación de las ayudas suele consistir básicamente en la descripción de un algoritmo. Tiene todo el sentido que se programe este sencillo algoritmo para resolver estos casos, y muy poco sentido sumarle todo el ruido que añade una IA.
Lo que es fascinante son los casos en lo que esto se ha aplicado malamente, como con el bono eléctrico, se tenga los huevazos de no querer publicar el código.
#25 El proceso de entrenamiento incluye aleatoriedad en varias de sus partes, empezando por la inicialización y la modificación de los pesos, a su vez se hace en procesos distribuidos con muchas máquinas participando y entregando su parte del trabajo en tiempos distintos. Cada una de esas piezas del sistema tiene su aleatoriedad en cálculos de coma flotante y el hardware no tiene en absoluto por qué ser homogéneo.
La aleatoriedad de un único equipo puede ser determinista, pretender que lo sea en todo el conjunto no es realista.
#23 No he negado en ningún momento que tengan el conjunto de datos de entrenamiento, lo que digo es que publicarlo no aporta realmente nada útil, es un volumen tan ingente que es ingestionable para ningún humano, y debido al proceso que se suele utilizar para el entrenamiento usando el mismo set de datos no te garantiza el mismo resultado.
No sería demasiado distinto a que para cada trabajador que se contrata se publicase la lista de libros de texto que se usaron durante su educación. Eso no te garantiza un resultado específico.
Con la IA son los datos los que determinan el resultado y cuando hablamos de ChatGPT estamos hablando de básicamente todo Internet. Ni siquiera los de OpenAI conocen todos los datos con los que han alimentado a ChatGPT por que es una tarea humanamente inalcanzable. Aunque nadie en OpenAI sepa catalán ChatGPT se comunica en catalán sin problemas, y hay contenidos en catalán que aunque nadie los sepa entender dentro de OpenAI ChatGPT sí los tiene incorporados y los usa en sus respuestas.
El código libre tiene su relevancia en muchos ámbitos, en la IA es completamente secundario.
#17¿Te parece aceptable que esa IA sea propiedad de una empresa privada y que no publiquen su entrenamiento?
Sí.
Si hay sospechas de mala praxis, de algo deliberado, la legislación debería permitir hacer la investigación correspondiente para depurar responsabilidades si las hubiera.
A todo ello nada impide que la IA sea propiedad del estado si eso se considera como mejor alternativa. Ni que sea el estado quien la cree desde cero con su propia selección de datos de entrenamiento. Ni que eso ocurra a cada cambio de legislatura, de la misma forma que se cambia de fiscal1 del estado que se cambie de IA gestora.
La solucion es el codigo libre.
El código libre no te resuelve apenas nada cuando son los datos de entrenamiento los que determinan el resultado del proceso.
No tengo nada en contra del código libre pero tampoco lo veo como solución a nada relevante en este ámbito específico.
A día de hoy las empresas privadas contratan a personas que tienen sus sesgos, el proceso de contratación puede contener sesgos también, y así puede ocurrir también en empresas públicas. Y luego son esas personas las que toman las decisiones que te preocupan. Los sesgos ya están ahí, si son exagerados se investiga y se sanciona si corresponde, tanto si son personas como si son IA, no veo especial diferencias entre ellos.