From Mesdoc
Line 1: | Line 1: | ||
- | |||
Google n'utilise pas une base de donnée au sens SGBDR du terme ( mySql, PotsgreSQL, Oracle, etc... ). | Google n'utilise pas une base de donnée au sens SGBDR du terme ( mySql, PotsgreSQL, Oracle, etc... ). | ||
Line 14: | Line 13: | ||
Si tu veux en savoir plus sur la structure d'in index Lucene : | Si tu veux en savoir plus sur la structure d'in index Lucene : | ||
http://www-igm.univ-mlv.fr/~dr/XPOSE2003/lucene/ | http://www-igm.univ-mlv.fr/~dr/XPOSE2003/lucene/ | ||
+ | |||
+ | |||
+ | === | ||
+ | |||
+ | http://labs.google.com/papers/mapreduce.html | ||
+ | |||
+ | * GOOGLE RESEARCH PAPERS | ||
+ | http://labs.google.com/papers/ |
Revision as of 07:39, 22 August 2006
Google n'utilise pas une base de donnée au sens SGBDR du terme ( mySql, PotsgreSQL, Oracle, etc... ).
Il utilise un inverted index. Pour faire très simple et très schématique, il dispose d'un index qui est un peu l'équivalent des index que tu trouves à la fin d'un livre. Il distribue son index sur un système de fichier distribué que l'on nomme GFS ( Google File System ) à l'aide d'un algo : map-reduce.
Doug Dutting essaye de faire une implémentation Open Source d'une solution de recherche qui pourrait être comparable à Google. Se projet est porté par la fondation Apache sous le nom Lucene. Se projet se décompose aujourd'hui en trois sous-partie : - Lucene : l'indexeur - Nutch : un crawler qui intégre Lucène comme indexeur - Depuis peu Hadoop : qui est un portage Open Source de l'algo map-reduce
Si tu veux en savoir plus sur la structure d'in index Lucene : http://www-igm.univ-mlv.fr/~dr/XPOSE2003/lucene/
=
http://labs.google.com/papers/mapreduce.html
- GOOGLE RESEARCH PAPERS