Alire

From Mesdoc

(Difference between revisions)
(Lucene)
Line 1: Line 1:
 +
 +
==27 aout 2006==
 +
 +
http://www.codyx.org/snippet_extraction-chaine-caracteres-partir-occurence-separator_131.aspx
 +
 +
http://python.developpez.com/cours/yvesbailly/initiationpython/yb07/
 +
 +
http://www.ai.univ-paris8.fr/CSAR/sources/a1/C/index.html
 +
 +
 +
==Attente==
 +
* The Porter Stemming Algorithm
* The Porter Stemming Algorithm
http://www.tartarus.org/martin/PorterStemmer/
http://www.tartarus.org/martin/PorterStemmer/

Revision as of 00:26, 27 August 2006

27 aout 2006

http://www.codyx.org/snippet_extraction-chaine-caracteres-partir-occurence-separator_131.aspx

http://python.developpez.com/cours/yvesbailly/initiationpython/yb07/

http://www.ai.univ-paris8.fr/CSAR/sources/a1/C/index.html


Attente

  • The Porter Stemming Algorithm

http://www.tartarus.org/martin/PorterStemmer/


http://nutch.sourceforge.net/blog/cutting.html


http://keithdevens.com/weblog/archive/2005/Aug/10/PyLucene


http://www-igm.univ-mlv.fr/~dr/XPOSE2003/lucene/node1.html

Lucene

http://books.slashdot.org/article.pl?sid=05/08/24/1645211&tid=185&tid=95&tid=6

http://www.theserverside.com/tt/articles/article.tss?l=ILoveLucene

  • LIVRE

Building Search Applications With Lucene And Nutch (Broché) de Jon Shoberg http://www.amazon.fr/gp/product/1590596870/402-6807350-7208140?v=glance&n=52042011


Phase3 est le nom retenu pour le moteur de recherche Web qui a été développé. Celui-ci s’appuie sur deux logiciels libres existant : le moteur de balayage Nutch et le moteur de recherche Lucene. Il permet, dès à présent, d’effectuer des recherches sur la quasi totalité de la documentation juridique francophone disponible en ligne.


Toutefois, peu importe l’interface ou la section du site à l’origine d’une requête, l’affichage des résultats est toujours composés des mêmes éléments. Le tri des résultats y est déterminé par Lucene. Chacun d’entre eux est représenté par son titre, son URL, ainsi qu’un extrait du texte ayant contribué à sa sélection. Ce court extrait, permet de préciser le contenu du document affiché, ce qui qui facilite une présélection par l’usager sans même nécessiter une consultation. De plus, lorsque plusieurs résultats de recherche différents proviennent d’une seule et même ressource, seuls les deux documents les plus pertinents s’affichent. Il est alors possible de consulter les autres documents de ce site en suivant l’hyperlien prévu à cet effet. Enfin, si le nombre de résultats de recherche est supérieur à dix, ceux-ci sont découpés sur plusieurs pages, dans le but de faciliter la navigation entre eux. Tous ces éléments ont été développés dans l’objectif de fournir une interface graphique ressemblant le plus possible à celle de Google, qui est sans aucun doute le moteur de recherche Web le plus connu et utilisé. De cette façon, la recherche sur le Web juridique francophone devrait s’en trouver facilitée.

http://www.frlii.org/article.php3?id_article=168

Personal tools