Aquí podría ser tu PUBLICIDAD


Resultados de la puntuación Lucene

votos
37

En Lucene, si tenía varios índices que cubrían solo una partición cada uno. ¿Por qué la misma búsqueda en diferentes índices arroja resultados con puntajes diferentes? Los resultados de diferentes servidores coinciden exactamente.

es decir, si busqué:

  • Nombre - John Smith
  • Fecha de nacimiento: 11/11/1934

La partición 0 devolvería una puntuación de 0.345

Partition 1 devolvería un puntaje de 0.337

Ambos coinciden exactamente con el nombre y la fecha de nacimiento.

Publicado el 02/08/2008 a las 10:28
fuente por usuario Stephen Hendry
En otros idiomas...        العربية       

3 respuestas

votos
19

La puntuación contiene la Frecuencia inversa del documento (IDF). Si el término "John Smith" está en una partición, 0, 100 veces y en la partición 1, una vez. El puntaje para buscar a John Smith sería una búsqueda más alta en la partición 1 ya que el término es más escaso.

Para evitar esto, deberías dejar tu índice sobre todas las particiones, o necesitarías anular el IDF.

Respondida el 02/08/2008 a las 10:51
fuente por usuario Stephen Hendry


Aquí podría ser tu PUBLICIDAD


votos
13

Porque el puntaje se determina en el índice si no estoy completamente equivocado.

Si tiene índices diferentes (más / menos o datos diferentes que fueron indexados), la puntuación será diferente:

http://lucene.apache.org/core/3_6_0/scoring.html

(Advertencia: contiene matemática :-))

Respondida el 02/08/2008 a las 10:52
fuente por usuario Michael Stum

votos
8

También puede interesarle la salida del explain()método y el Explanationobjeto resultante , que le dará una idea de cómo se califican las cosas tal como son.

Respondida el 02/08/2008 a las 09:03
fuente por usuario Joe Shaw