Mantenga sus caballos: El conocimiento de Vault es sólo un proyecto de investigación Por Ahora

A+ A-
paparazzis-Enge-1920

Es posible que haya oído hablar mucho de Conocimiento Bóveda de Google últimamente. Ha sido promovida por la prensa especializada como la próxima generación del gráfico de conocimiento, pero mantenga sus caballos!

En este momento, el conocimiento Vault es sólo un proyecto de investigación de la empresa. En este post, me va a transmitir lo que sabemos hasta ahora, cuáles son las implicaciones para usted, y por qué aún debe cuidar.

Haciendo un recuento de la historia

Nos presentaron primero en la idea del conocimiento Bóveda durante una presentación por parte de Google Kevin Murphy en la conferencia CIKM el 31 de octubre de 2013. Esta charla se llamó De grandes volúmenes de datos a grandes conocimientos.

En esta presentación, Murphy habló sobre las limitaciones del gráfico de conocimiento, y también acerca de los algoritmos que podrían ayudar a conseguir alrededor de algunas de esas limitaciones (más sobre esto más adelante).

Esta charla no recibió mucha atención de la prensa comercial de la industria de marketing digital, pero eso cambió en agosto de este año. Desde entonces, ha habido una gran cantidad zumbido más sobre ello, incluyendo estos tres artículos:

  1. robots de verificación de datos de Google se acumulan gran banco de conocimiento - New Scientist, 20 de Agosto, 2014
  2. Google “El conocimiento Vault” Para Poder futuro de la búsqueda - Search Engine Land 25 de agosto, 2014
  3. Adiós Gráfico de conocimiento, Hola conocimiento de Google Vault? - Go Fish digital 25 de Agosto, 2014

Greg Sterling añadió una posdata al artículo Search Engine Land después de haber sido contactado por Google, de la siguiente manera:

Posdata: Google ayer indicó que el “conocimiento Vault” fue falsificado o mal interpretado en el artículo de New Scientist anteriormente. Al parecer, este era un trabajo de investigación (mayo de 2014) y no es un producto activo en el desarrollo de Google. Google también indicó que existen numerosos modelos de la compañía y en otros lugares sobre la construcción de una base de conocimientos con máquinas o extraer el significado del texto.

El artículo de New Scientist, evidentemente, había recogido hasta que una nueva presentación fue planeada por Kevin Murphy en la conferencia sobre el descubrimiento de conocimiento y minería de datos en Nueva York el 25 de agosto de 2014 en Nueva York. Sin embargo, esto fue una presentación de un trabajo de investigación.

¿Por qué los conceptos están siendo de interés crítico

Hay dos grandes comida para llevar de esto:

1. El ámbito de aplicación del Gráfico de conocimiento es bastante limitada: De acuerdo con la presentación de Kevin Murphy, el gráfico de conocimiento proporciona Google con acceso a la información sobre los 500 millones de entidades (personas, lugares, etc.) y un total de 3,5 mil millones de hechos. Mientras que los que parecen como un gran número, su alcance total es pequeña si se compara con “todo el conocimiento.”

El gráfico de conocimiento es pequeña en comparación con todo el conocimiento

2. tomar nota de esta parte de Google Lo que dije Greg Sterling: “Existen numerosos modelos de la compañía y en otros lugares sobre la construcción de una base de conocimientos con máquinas o extraer el significado del texto.”

Básicamente, el proyecto Conocimiento Vault es una iniciativa que Google está llevando a cabo para ampliar el gráfico de conocimiento, pero hay otros en el juego, también.

En resumen, hay una gran cantidad de trabajo que se realiza para mejorar el conocimiento lo que Google puede capturar. Este trabajo es probable que ir en muchas direcciones diferentes, incluyendo los esfuerzos para construir un ordenador cuántico.

Muchos han posicionado el gráfico de conocimiento por estar basada únicamente en las bases de datos manualmente curada de información, e incluso la presentación Kevin Murphy en CIKM año pasado sólo menciona Freebase como fuente (aunque no sugirió que era la única fuente).

Sin embargo, esto es lo que dijo de Google Amit Singhal sobre esto en mayo de 2012 en su puesto, presentar el gráfico de conocimiento: las cosas, no cadenas:

Gráfico de conocimiento de Google no sólo está enraizada en fuentes públicas tales como Freebase, Wikipedia y la CIA World Factbook. También ha aumentado a una escala mucho mayor, ya que estamos enfocados en amplitud y profundidad completa. En la actualidad contiene más de 500 millones de objetos, así como más de 3,5 mil millones y hechos acerca de las relaciones entre estos diferentes objetos. Y está sintonizado en base a búsquedas de los usuarios, y lo que encuentran en la web.
Amit Singhal

Además, Google ya ha lanzado características que hacen más que extraer datos de este tipo de fuentes. Estos incluyen instrucciones paso a paso y algunos fragmentos estructurados, también.

Fragmento estructurado en los resultados de búsqueda

Estas iniciativas demuestran que Google ya está tratando algunas maneras de extraer el conocimiento de la web.

Impacto en su estrategia digital

Independientemente del tiempo, e independientemente de si o no los conceptos Conocimiento Vault son un conductor de dónde va todo esto, el aumento de la inteligencia artificial se va a transformar los trabajos de búsqueda y forma lo que se muestra.

Usted verá un montón de debate sobre la moralidad o legalidad, de Google presentando más respuestas directas en los resultados de búsqueda, sobre todo cuando se extrae de los sitios web de otros.

Mi consejo: Tune esa discusión entera, y establecer su negocio a prosperar a partir de la dirección de Google. Estos son algunos consejos clave a considerar:

  1. No confíe en los Datos de dominio público como un controlador de tráfico. Si esto es una parte clave de su negocio, que empezar a cambiar tan rápidamente como sea posible.
  2. Comenzar a pensar en maneras que la extracción de Datos clave de su sitio web puede mejorar su marca. Eso es correcto, lo abraza - y ponerla a trabajar para usted. Si Google empieza a tomar la información en su sitio y que lo muestra en las páginas de resultados del motor de búsqueda, que te hace ver como una autoridad para el tema. Encontrar maneras de tomar ventaja de eso.
  3. Comience a ver su sitio web en términos de las experiencias de los usuarios. Parte de su trabajo con su sitio web es para hacer el producto de Google mejor. Piense en ello como cualquier otro enlace editorialmente dada en la web. Si Google envía un usuario a una página en su sitio, tendrá que reflejan bien en Google? Será que el usuario sea satisfecho con el resultado de la búsqueda? Si se puede hacer que la respuesta “sí” con más frecuencia que otras páginas de la competencia, que va a ganar en busca en el largo plazo.
  4. No sea demasiado dependiente en Google como fuente de tráfico de búsqueda. Es posible que haya visto toneladas de prensa últimamente que le dice que su visibilidad en las plataformas de medios sociales es sobre bienes inmuebles alquilados. Así es su visibilidad en Google. Momento de tratarlo como tal.

Yo sé, algunos de ustedes van a querer luchar contra esto. Sin embargo, mi apuesta es que Google ya ha conseguido mucho más asesoramiento legal sobre este asunto que cualquiera de nosotros. Cuando construyo mi castillo de arena en la arena mojada en la playa, puedo estar muy seguro de que conseguirá lavado. Hemos estado jugando en la arena húmeda durante mucho tiempo.

Creo que la presión principal de Google es competitivo. Si se desvía demasiado lejos para convertirse en altamente comercial, y no ser una fuente de tráfico para otros sitios web, otro producto que es mucho más abierta puede ganar tracción real. Además, la tecnología aplicada en toda la discusión “conocimiento” es enorme, y vendrá poco a poco - probablemente más de una década o más.

Por lo tanto, tenemos más tiempo para jugar por el momento, pero la mayor (y antes) se empieza a prepararlos para el futuro, mejor.

Posdata: Más Papeles por Kevin Murphy

Para aquellos de ustedes que quieren el máster en donde va el concepto del conocimiento Vault, he aquí algo más material de lectura para usted!

Canonicalizing bases de conocimiento abierto
Luis Galarraga, Geremy Heitz, Kevin Murphy, Fabian Suchanek
CIKM 2014

A gran escala de clasificación de objetos utilizando Etiqueta Relación gráficos
Jia Deng, Nan Ding, Yangqing Jia, Andrea Frome, Kevin Murphy, Samy Bengio, Yuan Li, Hartmut Neven, Hartwig Adam
ECCV 2014 (Best Paper Award)

Cocinar con Semántica
Jon Malmaud, Earl Wagner, Nancy Chang, Kevin Murphy
ACL'14 semántica de análisis taller

Bóveda del conocimiento: un enfoque de escala Web a probabilístico conocimiento Fusión
Xin Dong Luna, Evgeniy Gabrilovich, Geremy Heitz, Wilko Horn, Ni Lao, Kevin Murphy, Thomas Strohmann, Shaohua Sun, Wei Zhang
'14 KDD

De Fusión de Datos de Conocimiento Fusión
Xin Dong Luna, Evgeniy Gabrilovich, Geremy Heitz, Wilko Horn, Kevin Murphy, Shaohua Sun, Wei Zhang
'14 VLDB

El conocimiento de Terminación Base a través Buscar-Basada de Respuestas
Robert West, Evgeniy Gabrilovich, Kevin Murphy, Shaohua Sol, Rahul Gupta, Dekang Lin
'14 WWW


Las opiniones expresadas en este artículo son las del autor y no necesariamente de invitados Search Engine Land. Autores del personal se enumeran aquí.


Ads

Compartir

Reciente

La mente de su negocio: Nuestros columnas de búsqueda local de 2017

los practicantes de SEO locales tienen un papel cada vez má...

SearchCap: Seguimiento de Santa, Google API términos y métricas SEO

A continuación es lo que ocurrió en busca de hoy, según ha ...

Marlene Dietrich Google Doodle honores de la carrera de la legendaria actriz

Marlene Dietrich, la icónica actriz de origen alemán, se es...

resultados de búsqueda de imágenes de Google prueba un nuevo cuadro de búsquedas relacionadas

Google está probando un nuevo cuadro de “búsquedas relacion...

Comentarios