Alire
From Mesdoc
Contents |
nov 2007
SPARQL http://www.w3.org/TR/rdf-sparql-query/
YAGO http://www2007.org/papers/paper391.pdf
FOAF http://xmlns.com/foaf/spec/
RDFS http://www.w3.org/TR/rdf-schema/
27 aout 2006
http://www.codyx.org/snippet_extraction-chaine-caracteres-partir-occurence-separator_131.aspx
http://python.developpez.com/cours/yvesbailly/initiationpython/yb07/
http://www.ai.univ-paris8.fr/CSAR/sources/a1/C/index.html
Attente
- The Porter Stemming Algorithm
http://www.tartarus.org/martin/PorterStemmer/
http://nutch.sourceforge.net/blog/cutting.html
http://keithdevens.com/weblog/archive/2005/Aug/10/PyLucene
http://www-igm.univ-mlv.fr/~dr/XPOSE2003/lucene/node1.html
Lucene
http://books.slashdot.org/article.pl?sid=05/08/24/1645211&tid=185&tid=95&tid=6
http://www.theserverside.com/tt/articles/article.tss?l=ILoveLucene
- LIVRE
Building Search Applications With Lucene And Nutch (Broché) de Jon Shoberg http://www.amazon.fr/gp/product/1590596870/402-6807350-7208140?v=glance&n=52042011
Phase3 est le nom retenu pour le moteur de recherche Web qui a été développé. Celui-ci s�appuie sur deux logiciels libres existant : le moteur de balayage Nutch et le moteur de recherche Lucene. Il permet, dès à présent, d�effectuer des recherches sur la quasi totalité de la documentation juridique francophone disponible en ligne.
Toutefois, peu importe l�interface ou la section du site à l�origine d�une requête, l�affichage des résultats est toujours composés des mêmes éléments. Le tri des résultats y est déterminé par Lucene. Chacun d�entre eux est représenté par son titre, son URL, ainsi qu�un extrait du texte ayant contribué à sa sélection. Ce court extrait, permet de préciser le contenu du document affiché, ce qui qui facilite une présélection par l�usager sans même nécessiter une consultation. De plus, lorsque plusieurs résultats de recherche différents proviennent d�une seule et même ressource, seuls les deux documents les plus pertinents s�affichent. Il est alors possible de consulter les autres documents de ce site en suivant l�hyperlien prévu à cet effet. Enfin, si le nombre de résultats de recherche est supérieur à dix, ceux-ci sont découpés sur plusieurs pages, dans le but de faciliter la navigation entre eux. Tous ces éléments ont été développés dans l�objectif de fournir une interface graphique ressemblant le plus possible à celle de Google, qui est sans aucun doute le moteur de recherche Web le plus connu et utilisé. De cette façon, la recherche sur le Web juridique francophone devrait s�en trouver facilitée.