Tecnología, Internet y juegos

encontrados: 6, tiempo total: 0.007 segundos rss2
13 meneos
136 clics

Google publica el código fuente de su analizador de robots.txt (ENG)

Durante 25 años, el Protocolo de Exclusión de Robots (REP) fue sólo un estándar de facto. Esto tenía implicaciones frustrantes a veces. Por un lado, para los webmasters, significaba incertidumbre en casos límite, como cuando su editor de texto incluía caracteres BOM en sus archivos robots.txt. Por otro lado, para los desarrolladores de crawlers y herramientas, también trajo incertidumbre; por ejemplo, ¿cómo deberían tratar con archivos robots.txt que tienen cientos de megabytes de tamaño?
598 meneos
2619 clics
Google condenada a indemnizar con 8000 euros por indexar un indulto publicado en el BOE

Google condenada a indemnizar con 8000 euros por indexar un indulto publicado en el BOE

Durante un periodo de al menos 10 meses, Google mantuvo indexado un indulto publicado en el BOE en el año 1999 a pesar de que existía una Resolución de la Agencia de Protección de Datos que le obligaba a retirarlo y de que la web del Boletín Oficial había utilizado el fichero robots.txt para evitar la indexación de ese concreto indulto. Google es ahora condenada a indemnizar al afectado con 8000 euros.
236 362 0 K 584
236 362 0 K 584
16 meneos
71 clics
Este envío tiene varios votos negativos. Asegúrate antes de menear

¿Aceptaría AEDE ampliar el protocolo ROBOTS para cobrar la cantidad exacta por los artículos de enlace remunerado?

Estoy seguro de que todas las empresas y usuarios de internet aceptarían, diseñarían y respetarían una extensión del protocolo robots.txt que indicase cuales son los contenidos por cuyos enlaces hay que pagar, a quién y cuánto.
48 meneos
50 clics

El Boletín Oficial de Alicante decide no ser indexado por los buscadores

El Boletín Oficial de Alicante ha decidido que todo lo que se publique en su Boletín no aparezca en los buscadores de Internet. Hace uso del fichero robots.txt: ov.dip-alicante.es/robots.txt para indicar que todo el boletín al completo no sea indexado. La consecuencia es que nada de lo que se ha publicado en el BO de Alicante aparece ya en Google: www.google.es/search?q=site:ov.dip-alicante.es&oq=site:ov.dip-alic Relacionada: www.meneame.net/story/robots-txt-boe-google-no-indexe-condenas-indulto
3 meneos
25 clics

La Casa Real aún sigue intentando eliminar a Iñaki Urdangarin

Como curiosidad, quitando la parte técnica del artículo que enlazo, exponen un caso de la Casa Real en el que se muestra que siguen intentando eliminar el rastro de Iñaki Urdangarin de su página web.
2 1 11 K -119
2 1 11 K -119
22 meneos
567 clics
Este envío tiene varios votos negativos. Asegúrate antes de menear

Best robots.txt EVER

Best robots.txt EVER
18 4 12 K 45
18 4 12 K 45

menéame