Blekko cuadras más dominios “Spam”: 1,1 millones de ellos

A+ A-

Motor de búsqueda Blekko ha anunciado que ha bloqueado ahora 1,1 millones de sitios web de sus resultados de búsqueda con un nuevo sistema que llama “AdSpam,” y las nuevas páginas de cualquier sitio web no se añadirán si no pasan la prueba.

El bloqueo de spam antes de que A

De la nota de prensa Blekko:

“Esta nueva tecnología bloquear el spam antes de que alguna vez se muestra en una página de resultados de búsqueda”, dijo Rich Skrenta, CEO de Blekko. “Hemos identificado mediante algoritmos múltiples señales de spam para cada página en nuestro índice. La eliminación de los dominios de nuestro índice ha limpiado de manera espectacular los resultados de búsqueda “.

Y desde el blog de la compañía:

Hoy en día, estamos tomando el siguiente paso gigante hacia adelante con el lanzamiento del nuevo algoritmo AdSpam de Blekko. Esta nueva tecnología cambiará drásticamente búsqueda. Es el primer algoritmo de búsqueda jamás creado para encontrar el spam en lugar de resultados de rango. El algoritmo está diseñado específicamente para reconocer páginas que son spam y eliminarlos antes de que nunca aparecen en los resultados de búsqueda.

Eso es interesante, esta idea de bloquear páginas de spam antes de que se añaden a un índice de búsqueda. Puede haber sido hecho antes, pero si es así, no recuerdo por qué servicio. Ciertamente, nunca fue algo suficiente para que yo recuerdo digno de mención. Si se mantiene el correo basura por completo, lo que potencialmente que hace que para obtener resultados más limpios.

Por otra parte, también es algo que es mucho más probable que se beneficien Blekko de Google o Bing. La razón es que tanto los motores de búsqueda tienen mucho más maduros algoritmos de búsqueda que Blekko, por lo que ya podría hacer un mejor trabajo de mantener el spam fuera de los primeros resultados, a pesar de las páginas de spam mismos se incluyen en el índice de búsqueda global - que es como un gran libro de todas las páginas web que han recogido.

Más importante, tanto Google y Bing tienen enormes recursos donde la indexación de un millón o incluso unos mil millones de páginas de spam en realidad no se dejan menos “espacio” para almacenar la “buena” cosas. Ellos tienen miles de servidores. Almacenamiento para ellos es relativamente barato. Pero para Blekko, todas las páginas de correo no deseado que el índice es potencialmente más costoso.

En cuanto al nombre “AdSpam” - eso es terrible. Tengo entendido que proviene de la idea de que se trata de páginas cargadas de anuncios - pero me resulta bastante confuso.

Anteriormente En “Vetado en Blekko”

El mes pasado, Blekko ha recibido atención mediante la prohibición de 20 sitios de “spam” de su índice. Desde nuestra cobertura a continuación:

Rich Skrenta, CEO de Blekko confirmó la prohibición con nosotros hoy. Nos dijo Blekko ha decidido prohibir los “20 mejores sitios de spam del índice de blekko por completo, sobre la base de nuestros usuarios haga clic / correo no deseado en los resultados.” Esto incluye ehow.com, uno de los sitios de generación de ingresos superior web bajo demanda de los medios de comunicación.

¿Los sitios?

  • ehow.com
  • experts-exchange.com
  • naymz.com
  • activehotels.com
  • robtex.com
  • encyclopedia.com
  • fixya.com
  • chacha.com
  • 123people.com
  • download3k.com
  • petitionspot.com
  • thefreedictionary.com
  • networkedblogs.com
  • buzzillions.com
  • shopwiki.com
  • wowxos.com
  • answerbag.com
  • allexperts.com
  • freewebs.com
  • copygator.com.

Pero espera. Son estos los sitios de spam superior 20 o, como decía la liberación de Blekko hoy en día, el “top 20 granjas de contenido”. Tanto. Ninguno. Es confuso.

Correo no deseado está en el ojo del espectador del motor de búsqueda

el spam de motores de búsqueda es todo lo que un motor de búsqueda decide que sea. Por ejemplo, Google y Bing se consideran en general que las páginas “capa” - Mostrar contenido al usuario que es diferente a lo que sus rastreadores automatizados ver - como spam. Ambos están de acuerdo en muchas otras tácticas que serían considerados spam, pero que no pueden estar de acuerdo con precisión. Ni van a estar de acuerdo con Blekko.

Prácticamente ninguno de los sitios anteriores, desde mi revisión rápida, sería considerado correo no deseado, ya sea Google o Bing. Ciertamente Google hizo que algunos de ellos pierdan el ranking en su reciente actualización del granjero / Panda. Pero eso no era porque estaban Spam a Google. Que era porque tenían algún contenido que el nuevo algoritmo decidió no premiar al igual que en el pasado.

En resumen, el contenido de baja calidad no es igual a correo no deseado, no a Google o Bing. Es algo que no van a clasificar como altamente, que es exactamente lo que se supone que sus algoritmos para hacerlo.

Con lista de bloqueo inicial de Blekko, se decidió que los sitios eran spam en base a informes de los usuarios, independientemente de si estos sitios violan las pautas tradicionales de spam motor de búsqueda. Con el último movimiento, Blekko es decidir además que la baja calidad es igual spam. Una vez más, desde el mensaje:

Entonces, ¿qué es exactamente es AdSpam? En resumen, es un algoritmo de aprendizaje automático que analiza las páginas para las señales de spam específicos - la presencia de múltiples posiciones de visualización de anuncios en una sola página y delgada al contenido cero.

El resultado final del enfoque de Blekko frente de Google podría potencialmente ser el mismo. Google tiene como objetivo mantener el contenido de “superficial” para que no aparezcan para muchas búsquedas, a pesar de que las páginas se encuentran entre los que ha recogido. Blekko también tiene el objetivo de mantener el contenido de poca profundidad - pero a diferencia de Google, se aplica la etiqueta de “spam” a dicho contenido y está evitando que pueda ser indexado en el primer lugar.

Lo que se ha ido?

Más en el New York Times, Claire Caín Miller tuvo una buena parte sobre el movimiento de Blekko y si los buenos sitios podrían ser perjudicados. No, dice Blekko:

Aunque parece que muchos sitios legítimos podrían considerarse correo no deseado en virtud de este algoritmo - periódicos cubren una amplia variedad de temas, por ejemplo, y muchos bloggers puede haber escritores aficionados, pero son expertos en sus campos - Sr. Skrenta dijo que cuando se peinó a través de miles de sitios que el algoritmo prohibido, se encontró sólo dos falsos positivos.

Los ejemplos de los sitios Blekko ahora prohibiciones: cheap-refrigerators.net, best-weddinggifts y Boston.diningguide.com.

¿Ayuda?

No he hecho ninguna prueba generalizada. Pero darse cuenta de que el nombre del sitio web cheap-refrigerators.net anterior que fue confirmado como retirado - “Refrigeradores Consejos de compra” - pensé que una búsqueda sobre ese tema podría ser interesante:

Puede hacer clic para ampliar la imagen. He quitado el anuncio que estaba en la parte superior de los resultados de ambos Blekko y Google, para que pueda centrarse en las cinco mejores resultados editoriales. Mi toma:

blekko

  1. OK, pero corto y básico
  2. Irrelevante - usted tiene que buscar más en el sitio para obtener consejos
  3. Los buenos consejos básicos de los principales minoristas
  4. contenido delgado que sólo enlaces a otros contenidos más delgada
  5. Acerca de los filtros de agua para frigoríficos - irrelevantes

google

  1. Buena artículo sustancial, de varias partes
  2. consejos buenos, cortos conducen a nuevos exámenes
  3. Buenos consejos
  4. Los buenos consejos de Consumer Reports, una marca de confianza importante
  5. consejos OK, unos tres años de edad

Lo sentimos, Blekko - no puedo decir que el abandono de ese sitio refrigerador, y mucho menos los otros 1 millón o más sitios, que ayudó en absoluto en contra de Google para esta consulta en particular. Utilizando el / revisiones slashtag ayudó - consiguió uno de los buenos sitios que Google tuvo que ser en primer lugar. Pero los otros tres buenos sitios que Google tenía en los cinco primeros resultados no mostraron.

Por otra parte, la mayoría de los buscadores típicos no van a utilizar slashtags - e incluso hay menos razones para utilizarlos cuando la misma búsqueda en Google nos lleva a mejores resultados, sin slashtag requerido.

El factor humano

El post de blekko también dice:

A diferencia de otros algoritmos utilizados por los motores de búsqueda, AdSpam se utiliza en conjunción con la curaduría humana para detectar a continuar la guerra contra el spam.

Es cierto - Blekko está haciendo uso de los esfuerzos humanos para decidir lo que es bueno y malo. En particular, Blekko se asoció recientemente con la pila de cambio (antes Pila Overlow) sobre la conservación de la programación y temas técnicos.

Google esperar a empujar de nuevo en la totalidad “no tiene el ser humano” aspecto, sin embargo. Se ha hecho esto antes, la última vez cuando ambos Mahalo y Search Wikia trató ese ángulo. Google hizo hincapié en que tiene los colaboradores humanos, que sirven como una especie de “doble-check” en el algoritmo de la computadora cambia que hace, por ejemplo.

Google hizo hincapié en este nuevo recientemente cuando se hizo la actualización del granjero, para poner de relieve que el cambio basado en computadora parecía estar apoyado por los datos humana que trata de modelar. Google también sugirió que lo bloquean la gente usando su extensión Chrome Blocklist personales pueden ser datos que se utilizan en su algoritmo de búsqueda, en el futuro.

Sin embargo, Google tiene nada que ver con la curación slashtag que ofrece Blekko. Una vez dicho esto, Blekko todavía tiene que demostrar que esta curación se está convirtiendo en resultados de mayor calidad que están atrayendo a los usuarios importantes de Google, Bing mucho menos. Pero en la parte frontal de relaciones públicas, no hay duda de que se mueve de Blekko están manteniendo la presión sobre Google para mejorar también.

Más información

No he tenido la oportunidad de hablar con Blekko más sobre el sistema, como estoy actualmente en nuestra SMX West conferencia de marketing de búsqueda en San José. Blekko - junto con Google y Bing - participa en nuestra “La Policía Spam” y “Hacer los motores de búsqueda” sesiones de mañana, por lo que esperan más específica bajo el capó detalles surgirán de eso. Estén atentos (y también ver la cobertura relacionada en Techmeme). También vea los artículos siguientes para obtener más antecedentes sobre algunas de las cosas que he mencionado anteriormente.


Ads

Compartir

Reciente

La mente de su negocio: Nuestros columnas de búsqueda local de 2017

los practicantes de SEO locales tienen un papel cada vez má...

SearchCap: Seguimiento de Santa, Google API términos y métricas SEO

A continuación es lo que ocurrió en busca de hoy, según ha ...

Marlene Dietrich Google Doodle honores de la carrera de la legendaria actriz

Marlene Dietrich, la icónica actriz de origen alemán, se es...

resultados de búsqueda de imágenes de Google prueba un nuevo cuadro de búsquedas relacionadas

Google está probando un nuevo cuadro de “búsquedas relacion...

Comentarios