cultura y tecnología
143 meneos
743 clics
Como una plaga de langostas: los bots de IA de OpenAI y Anthropic causan estragos y aumentan los costes de las páginas web

Como una plaga de langostas: los bots de IA de OpenAI y Anthropic causan estragos y aumentan los costes de las páginas web

La base de datos de Edd Coates, Game UI, se vio paralizada por el tráfico de una dirección IP de OpenAI. Las empresas de inteligencia artificial están rastreando agresivamente internet, causando estragos a su paso. Los propietarios de páginas web están viendo cómo se disparan sus facturas de computación en la nube por culpa del tráfico que generan los bots de IA.

| etiquetas: ia , openaim , anthropic , bots , computación
En un foro que administro está siendo un verdadero coñazo. Tenemos Cloudflare y una nueva (la anunciaron en julio, blog.cloudflare.com/declaring-your-aindependence-block-ai-bots-scraper) funcionalidad para cortarle el acceso a todos los bots conocidos, y eso nos ha salvado el culo. Antes de eso teníamos el número de conexiones al tope en casi todo momento (1200, casi todos de Facebook/Meta, que pasaban de robots.txt) y el foro era casi inaccesible para los usuarios normales. Y sin el tope ese nos habría arruinado por el consumo de ancho de banda.
#2 Yo a un cliente le estaba destruyendo el rendimiento de la web los Bytespider de Bytedance (la dueña de Tiktok). Intentaban cargar un montón de URLs en paralelo y al dueño le suponía tener que quedarse 15 minutos más allá del cierre para poder grabar las ventas del día.

Hacen estragos afectando al mundo real ya.
#7 Y el consumo de electricidad... El foro del que yo hablo es uno de un jueguecito de 4x galáctico de código abierto (que por supuesto el github está más que destripado por Copilot). Meten una cantidad de mierda en el conjunto de entrenamiento de estas IAs que tira de culo.
#12 que juego? Tengo ganas de un 4X. El foro es en Español?
#32 En inglés. FreeOrion.

Yo me vicio a ese (solo en multiplayer con colegas porque la IA es demasiado tonta una vez que le pillas el tranquillo) y a Stellaris (de Paradox, de pago), que es un micromanagement hell pero bueno.
#2 mejor que el WAF de AWS?
#14 No puedo comparar. Como es un proyecto de código libre financiado por donativos hay poca pasta, así que nada de Amazon.
Lo que te puedo decir es que en el foro nos saltaba el mensaje de "demasiadas conexiones concurrentes" (>1200) más del 90% de los intentos de conexión, y que cuando sí entraba era lentísimo y de todas formas te tiraba el mensaje de error al siguiente botón que pulsases. Fue escribirnos con los de Cloudflare para que habilitaran el antibots y voilà, todo suave como la seda otra vez.
#2 últimamente ya estaba viendo cloudflare hasta en la sopa, pero es que no queda otra, al final todas estas macroempresas actuan como masivas redes pesqueras de arrastre que tasan internet de mala manera para su recogida de datos. A mas de un admin despistado le van a reventar el negocio.
#37 Años antes en el foro no teníamos Cloudflare y cuando se pusieron de moda los web scrappers nos llegó una factura de más de 1000 euros, y porque lo pillamos a tiempo y bloqueamos el foro hasta encontrar una solución (que fue Cloudflare). No veas el roto en la cuenta del proyecto...
Algún día algún economista o historiador describirá esta época como una nueva iteración de la Acumulación Originaria marxista pero aplicada a la IA Generativa y el siglo XXI. Y para entonces ya habrá calado en el común de los mortales, como antaño, la mistificación ideológica sobre los orígenes de la era de la Inteligencia Artificial.
Ojalá sirva para curar el cáncer, y no para hacer un deepfake de tu vecina en pelotas o resultados falsos de ChatGPT, quemando media selva amazónica (o la cremación masiva de capitales vitales para industrias productivas) en el camino.
#1 el proceso de acumulación originaria en España fueron las desamortizaciones, donde las tierras comunales principalmente y en menor medida las de iglesia y nobleza pasaron a manos de la clase burguesa. Los datos que recopilan l IAs no dejan de estar disponibles para otros, las tierras sí.
#3 "Los datos que recopilan l IAs no dejan de estar disponibles para otros"

De momento. Ya hay sectores que están empezando a dejar de compartir contenidos tan alegremente en la red frente a un leviatán que mercantiliza y uniformiza cualquier atisbo de creatividad borrando autores. E incluso por ejemplo algunas empresas de software de diseño (como Adobe o Procreate) están reculando (aunque sea de cara a la galería) porque el saqueo generalizado a sus clientes se ha salido de madre.
#24 pues de momento no hay alguien que esté acumulando, en exclusiva, los datos. Incluso como dices hay fricciones y algunos reculan, ahora mismo se está dirimiendo cómo va a funcionar esto, pero no ha habido ningún proceso de acumulación aún similar al de Marx. Que podría haberlo, pero tendría que venir desde el estado, vía alguna regulación que de eso como resultado.
#1 mientras sea bajo un sistema capitalista que no te quepa duda de que será quemando el amazonas y mostrando tías en pelotas.
#5 al final la balanza queda equilibrada, entonces: la nobleza de una causa compensa la vileza de la otra :troll:
#4 Internet hace más de una década que murió.
#4 Ya habrá bots basados en IA defendiendo dicha teoría en X, seguro.
#20 Y la llamaremos "SecretarIA"... :troll:
Pues va a ir a más... ahora ha salido una IA a la que le dices a qué ciudad vas y qué día, y se dedica a llamar a todos los hoteles de la ciudad para intentar pedirles algún descuento. Si los hoteles se saturan de llamadas, tendrán que poner a una IA para que las conteste.

Seguramente se extenderá a los individuos, nadie llamará directamente a otra persona, mi IA llamará a tu IA, entre ellas se pondrán de acuerdo y nos darán un resumen de la conversación.
#6. Los acuerdos entre IAs no deberian tener valor legal alguno. En menudos lios nos podrian meter a todos ese tipo de "acuerdos".
#9 y sin tanta IA. Eso pasa hace mucho con las compras automáticas de valores en bolsa..y con total validez
#13 Sí, si usas bots para operar en bolsa, el responsable de las operaciones no es el que programó los bots, es el que los usa, el dueño de la cuenta. Con la IA no habría diferencia, ella hace algo en tu nombre pero el responsable serías tú que eres el que le ha pedido que lo haga.
#9 A priori no lo tendrían, la aplicación que digo no llega a hacer la reserva, llama a todos los hoteles, regatea el precio con ellos y luego te dice cuáles son los más baratos y en cuáles ha conseguido mejores descuentos. Luego tú tienes que llamar.

Pero el siguiente paso está claro, podrás delegar en la IA la facultad de llegar a acuerdos legales, para que sea ella la que te contrate directamente lo que necesites. Imagina por ejemplo que tienes una IA que todos los meses te busca la tarifa eléctrica más barata y te cambia de compañía.
#6 Eso la mafia lo llama, pagar por "proteccion". (tener que contratar un servicio de ia para bloquear o gestionar los "ataques" por ia)
#10 No pierdas la ocasión de escribir mafIA, hombreh
#16 Botando la tenía. Qué ocasión desperdiciada... xD
#6 HipertrofIA?
#6 Mi propia IA me va ahorrar tener que comunicarme con la gente?!? COMPRO!!! :troll:
#6 No sabía yo que se podía negociar con los hoteles.
#33 Claro que sí. Lo mejor suele ser buscarlo en booking, y luego contratarlo llamando directamente al hotel, te lo agradecen porque se ahorran una buena comisión, y a veces te hacen descuento.

Pero claro, si todo el mundo se pone a usar una aplicación así, los hoteles dejarán de coger el teléfono y pondrán a una IA que no dará descuentos.

Lo más curioso de esta aplicación es que es capaz de mentir, quizás habría que legislar para que las IAs no pudieran mentir a humanos, en una de las…   » ver todo el comentario
Existen multitud de filtros en el mercado contra tales bots, cualquier administrador o programador debería estar al corriente. Por ejemplo, en cloudflare (gratis). Adjunto captura de pantalla de unos cuantos bots bloqueados de mi web personal sólo en las últimas 24 horas, casi sin tráfico xD  media
#17 Es que si la gente pensara, los asusta viejas se quedaban sin titulares con el que alarmar a la población del intelné
#17 Desde mi total ignorancia... en el artículo hablan precisamente de lo que has comentado (aplicado a robots.txt eso sí), y como muchos se los saltan en según qué contextos (como Meta/Facebook).
#17 Cloudflare no es "gratis". Si lo usas, le estás "regalando" tu tráfico.

Recuerda: Cuando un producto es gratis, el producto eres tú.
#22 Y cuando pagas también.
Seria como un DDOS no? y un DDOS se persigue legalmente...
#11 los bots esos, ¿Se pasan el robots.txt por el forro?
#40 Evidentemente... xD
Este es un aspecto de las IA, pero mucho peor es el tema del consumo de energía. Es demasiado alto para ser sostenible, por lo que opino que la cosa bajará mucho cuando la IA se caiga del hype.
Así que ese es el modelo de negocio de las IAs, un proveedor de servicios en la nube las contrata para que estresen los portales web y así ellos puedan facturar más a dichas webs :-O

menéame