Curlie

¿Quién es "Robozilla"?

Robozilla es un robot de rastreo que periódicamente visita todos los sitios listados en Curlie. Cuando una página ha sido movida o no es encontrada, Robozilla anota este hecho en Curlie. Puede haber varios motivos por los que una página no se encuentra por lo que puede tomar diferentes acciones dependiendo de cada uno de ellos.

¿Qué debería hacer yo respecto a los errores de Robozilla?

Su primera tarea es convertirse en Sherlock Holmes y averiguar porque la URL no está respondiendo. Debajo hay una lista de motivos frecuentes de errores y acciones que debería llevar a cabo.

ProblemaSolución
Hay una errata en la URL. Un editor escribió mal la URL. Simplemente corrija la URL. Pruebe a añadir (o eliminar) finales habituales, como default.html, default.htm, default.asp, index.html, index.htm, index.cgi, index.mv, index.asp, index.php, main.html, main.htm, inicio.html, inicio.htm, etc.
A mí la URL me funciona.El servidor pudo estar caído cuando Robozilla rastreo el sitio. Luego de verificar que el contenido del sitio corresponde con el actual título y descripción (en caso contrario editelo si corresponde a la actual categoría), pulse el botón "La URL me funciona, limpiar error".
La URL está muerta.Puede que la página fuese movida. Vaya a buscarla. Pruebe a buscar en Google; ellos pueden tener almacenada una versión del sitio con una indicación de la nueva localización. También, puede buscar en Bing o cualquier otro motor de búsqueda el título del sitio o algunas palabras clave específicas(una oración) de ese sitio para ver si existe una nueva URL disponible.
La URL está muerta, la busqué, y no tengo idea donde puede estar ahora. Déjela en la lista de pendientes de tu categoría y si sigue sin funcionar la próxima semana, y no contiene información única, bórrela. Si el sitio es valioso para la categoría, lo puede dejar en pendientes todo el tiempo que crea necesario.

¿Qué significan los códigos de error?

Hay dos tipos de códigos de error presentes en el Open Directory. El primer grupo son números positivos mayores de 100. Estos números son errores del protocolo HTTP. Si ve uno de esos números, Robozilla pudo contactar con el servidor pero no fue capaz de conseguir el archivo por uno u otro motivo.

Códigos de error con valores menor que 0 son errores que ocurren cuando se está tratando de dialogar con el servidor (pero no se consigue). Esto puede ser debido a una errata en la URL, un error en la conexión o un servidor sobrecargado o caído. Los enlaces son comprobados dos veces antes de que sean marcados como erróneos, para tener en cuenta servidores que están temporalmente caídos.

A continuación están los códigos de error mas comunes generados por Robozilla. También está disponible una lista de todos los códigos de error, por si se encuentra con uno no listado, o simplemente por curiosidad.

CódigoSignificado
500Error interno del servidorA veces ocurre debido a un servidor mal configurado. Normalmente esto es transitorio, y desaparece, pero compruébelo primero.
410DesaparecidoEl recurso no existe. La página fue borrada por el webmaster.
404No encontradoEl recurso no existe en este servidor. La página probablemente ha sido borrada.
403ProhibidoNo puede acceder a este recurso en el servidor. Puede que el administrador quitara las páginas debido a la carga del servidor o alguna otra razón.
401No autorizadoNo puede ver este recurso en el servidor. Es posible que se requiera una contraseña, o el recurso que busca ha sido movido.
400Petición erróneaNormalmente ocurre debido a un espacio en la URL u otro error de sintáxis en la URL. Trate de cambiar los espacios por %20 y pruebe a ver si eso arregla el error.
302Redirección temporalLa página tiene temporalmente una nueva URL (en teoría; en la práctica, esto suele ser usado como un sinónimo del código 301). Actualice el listado con la nueva URL.
301Redirección permanenteLa página tiene una nueva URL. Actualice el listado con la nueva URL.
0Error desconocidoProbablemente un error de DNS.
-1Incapaz de resolver la direcciónProbablemente una errata en el nombre o que no pagaron la cuenta de su nombre de dominio.
-4No pudo conectarNo fue posible contactar con el servidor. El servidor está ahí pero no desea hablar con Robozilla en el puerto especificado.
-5Tiempo límiteRobozilla se conecto corractamente, y envió la petición pero Robozilla agotó el tiempo límite esperando a recibir la página. Esto ocurre algunas veces en servidores muy ocupados.
-6Mala URLHay un error con el formato de la URL. ¿Puede ser que falte http://? Nota: cuando pinchas en el botón [edit] de una URL a la que le falte http://, en la página de edición para ese sitio viene con el http:// añadido gracias al software de Curlie, y por tanto el enlace a la URL funciona. Debe darle al botón de Actualizar (no en "La URL me funciona") para que el cambio tome efecto.
-7Error del servidorEl servidor devolvió un código de error desconocido, y probablemente esté mal configurado. La página puede mostrarse correctamente, pero es una buena idea comprobarlo por si acaso.
-8Nombre de dominio expiróEn relación al nombre de dominio, pueden ser muchas cosas, como que haya expirado, que no funcione, que esté en parking (tiempo de gracia para que el dueño pueda retomarlo,o hace relación también a la actividad de empresas que se adueñan de dominios expirados para colocar publicidad), hijacked (el dominio tiene nuevo dueño, que puede usarlo para un propósito distinto, manteniendo o no, el mismo contenido, lo utilizan para mostrar anuncios o subir el ranking de otros sitios [SEO]). Es bueno que te fijes en la información de registro para sitios con este código; hay herramientas como domaintools.com; y más allá de todo siempre asegúrate que el contenido pertenezca a la categoría y su título y descripción mantengan valides antes de publicarlo. Si no es así, puede moverlo y editarlo.
Tenga en cuenta que, con el RGPD y otras medidas de privacidad, el servicio Whois ya no identifica a los propietarios, pero si el sitio en cuestión se encuentra en el mismo servidor que miles de otros sitios, suele significar que está aparcado. Algunos esquemas de aparcamiento recrean contenido con un estilo similar al del sitio original, pero aún se consideran no publicables; en esencia, ahora son sitios MFA.

Marcas

Cuando una lista de errores también está marcada (a menudo con una Automarca), también es necesario borrarla, idealmente justo antes de publicar la lista reparada o eliminar una irreparable.