Alire

From Mesdoc

(Difference between revisions)
Line 1: Line 1:
==nov 2007==
==nov 2007==
 +
 +
Generatin Gazeeters (Balie)
 +
 +
Verification of facts across document...
 +
 +
Language independant set expansion of named entities
 +
 +
Actes de la 14e conference sur le traitement automatique des langues
 +
 +
http://rali.iro.umontreal.ca/Technologies/Reacc.fr.html
SPARQL http://www.w3.org/TR/rdf-sparql-query/
SPARQL http://www.w3.org/TR/rdf-sparql-query/
Line 41: Line 51:
* LIVRE  
* LIVRE  
-
Building Search Applications With Lucene And Nutch (Broché)
+
Building Search Applications With Lucene And Nutch (Broch�©)
de Jon Shoberg  
de Jon Shoberg  
http://www.amazon.fr/gp/product/1590596870/402-6807350-7208140?v=glance&n=52042011
http://www.amazon.fr/gp/product/1590596870/402-6807350-7208140?v=glance&n=52042011
Line 47: Line 57:
-
Phase3 est le nom retenu pour le moteur de recherche Web qui a été développé. Celui-ci s�appuie sur deux logiciels libres existant : le moteur de balayage Nutch et le moteur de recherche Lucene. Il permet, dès à présent, d�effectuer des recherches sur la quasi totalité de la documentation juridique francophone disponible en ligne.
+
Phase3 est le nom retenu pour le moteur de recherche Web qui a Ã�©tÃ�© dÃ�©veloppÃ�©. Celui-ci s�appuie sur deux logiciels libres existant : le moteur de balayage Nutch et le moteur de recherche Lucene. Il permet, dÃ�¨s Ã�  prÃ�©sent, d�effectuer des recherches sur la quasi totalitÃ�© de la documentation juridique francophone disponible en ligne.
-
Toutefois, peu importe l�interface ou la section du site à l�origine d�une requête, l�affichage des résultats est toujours composés des mêmes éléments. Le tri des résultats y est déterminé par Lucene. Chacun d�entre eux est représenté par son titre, son URL, '''ainsi qu�un extrait du texte ayant contribué à sa sélection'''. Ce court extrait, permet de préciser le contenu du document affiché, ce qui qui facilite une présélection par l�usager sans même nécessiter une consultation. De plus, lorsque plusieurs résultats de recherche différents proviennent d�une seule et même ressource, seuls les deux documents les plus pertinents s�affichent. Il est alors possible de consulter les autres documents de ce site en suivant l�hyperlien prévu à cet effet. Enfin, si le nombre de résultats de recherche est supérieur à dix, ceux-ci sont découpés sur plusieurs pages, dans le but de faciliter la navigation entre eux. Tous ces éléments ont été développés dans l�objectif de fournir une interface graphique ressemblant le plus possible à celle de Google, qui est sans aucun doute le moteur de recherche Web le plus connu et utilisé. De cette façon, la recherche sur le Web juridique francophone devrait s�en trouver facilitée.
+
Toutefois, peu importe l�interface ou la section du site Ã�  l�origine d�une requÃ�ªte, l�affichage des rÃ�©sultats est toujours composÃ�©s des mÃ�ªmes Ã�©lÃ�©ments. Le tri des rÃ�©sultats y est dÃ�©terminÃ�© par Lucene. Chacun d�entre eux est reprÃ�©sentÃ�© par son titre, son URL, '''ainsi qu�un extrait du texte ayant contribuÃ�© Ã�  sa sÃ�©lection'''. Ce court extrait, permet de prÃ�©ciser le contenu du document affichÃ�©, ce qui qui facilite une prÃ�©sÃ�©lection par l�usager sans mÃ�ªme nÃ�©cessiter une consultation. De plus, lorsque plusieurs rÃ�©sultats de recherche diffÃ�©rents proviennent d�une seule et mÃ�ªme ressource, seuls les deux documents les plus pertinents s�affichent. Il est alors possible de consulter les autres documents de ce site en suivant l�hyperlien prÃ�©vu Ã�  cet effet. Enfin, si le nombre de rÃ�©sultats de recherche est supÃ�©rieur Ã�  dix, ceux-ci sont dÃ�©coupÃ�©s sur plusieurs pages, dans le but de faciliter la navigation entre eux. Tous ces Ã�©lÃ�©ments ont Ã�©tÃ�© dÃ�©veloppÃ�©s dans l�objectif de fournir une interface graphique ressemblant le plus possible Ã�  celle de Google, qui est sans aucun doute le moteur de recherche Web le plus connu et utilisÃ�©. De cette faÃ�§on, la recherche sur le Web juridique francophone devrait s�en trouver facilitÃ�©e.
http://www.frlii.org/article.php3?id_article=168
http://www.frlii.org/article.php3?id_article=168

Revision as of 12:33, 2 November 2007

Contents

nov 2007

Generatin Gazeeters (Balie)

Verification of facts across document...

Language independant set expansion of named entities

Actes de la 14e conference sur le traitement automatique des langues

http://rali.iro.umontreal.ca/Technologies/Reacc.fr.html

SPARQL http://www.w3.org/TR/rdf-sparql-query/

YAGO http://www2007.org/papers/paper391.pdf

FOAF http://xmlns.com/foaf/spec/

RDFS http://www.w3.org/TR/rdf-schema/


27 aout 2006

http://www.codyx.org/snippet_extraction-chaine-caracteres-partir-occurence-separator_131.aspx

http://python.developpez.com/cours/yvesbailly/initiationpython/yb07/

http://www.ai.univ-paris8.fr/CSAR/sources/a1/C/index.html


Attente

  • The Porter Stemming Algorithm

http://www.tartarus.org/martin/PorterStemmer/


http://nutch.sourceforge.net/blog/cutting.html


http://keithdevens.com/weblog/archive/2005/Aug/10/PyLucene


http://www-igm.univ-mlv.fr/~dr/XPOSE2003/lucene/node1.html

Lucene

http://books.slashdot.org/article.pl?sid=05/08/24/1645211&tid=185&tid=95&tid=6

http://www.theserverside.com/tt/articles/article.tss?l=ILoveLucene

  • LIVRE

Building Search Applications With Lucene And Nutch (Broch�©) de Jon Shoberg http://www.amazon.fr/gp/product/1590596870/402-6807350-7208140?v=glance&n=52042011


Phase3 est le nom retenu pour le moteur de recherche Web qui a Ã�©tÃ�© dÃ�©veloppÃ�©. Celui-ci s�appuie sur deux logiciels libres existant : le moteur de balayage Nutch et le moteur de recherche Lucene. Il permet, dÃ�¨s Ã� prÃ�©sent, d�effectuer des recherches sur la quasi totalitÃ�© de la documentation juridique francophone disponible en ligne.


Toutefois, peu importe lâ��interface ou la section du site � lâ��origine dâ��une requ�ªte, lâ��affichage des r�©sultats est toujours compos�©s des m�ªmes �©l�©ments. Le tri des r�©sultats y est d�©termin�© par Lucene. Chacun dâ��entre eux est repr�©sent�© par son titre, son URL, ainsi quâ��un extrait du texte ayant contribu�© � sa s�©lection. Ce court extrait, permet de pr�©ciser le contenu du document affich�©, ce qui qui facilite une pr�©s�©lection par lâ��usager sans m�ªme n�©cessiter une consultation. De plus, lorsque plusieurs r�©sultats de recherche diff�©rents proviennent dâ��une seule et m�ªme ressource, seuls les deux documents les plus pertinents sâ��affichent. Il est alors possible de consulter les autres documents de ce site en suivant lâ��hyperlien pr�©vu � cet effet. Enfin, si le nombre de r�©sultats de recherche est sup�©rieur � dix, ceux-ci sont d�©coup�©s sur plusieurs pages, dans le but de faciliter la navigation entre eux. Tous ces �©l�©ments ont �©t�© d�©velopp�©s dans lâ��objectif de fournir une interface graphique ressemblant le plus possible � celle de Google, qui est sans aucun doute le moteur de recherche Web le plus connu et utilis�©. De cette fa�§on, la recherche sur le Web juridique francophone devrait sâ��en trouver facilit�©e.

http://www.frlii.org/article.php3?id_article=168

Personal tools