Google

Gelose | Tous les portails | Portail Medecine | Portail Biologie | Portail Biochimie | Portail Microbiologie | Portail Ecologie | Portail Botanique | Biologie cellulaire | Portail Zoologie | Science de la terre | Portail Eau |


 Inscrivez votre site en haut de cette page Soumission direct par Allopass, obtenez 1 lien de qualite en haut de cette page Google ainsi que sur la page des nouveaux sites inscrits pour seulement 20 euros!


Google Inc.
Forme juridique : cotée en Bourse (NASDAQ : GOOG et LSE : GGEA)
Dates clés : 1998 : création à Menlo Park (Comté de San Mateo, Californie, USA)
Siège social : Mountain View (Comté de Santa Clara, Californie)
Personnes-clés : Eric E. Schmidt, directeur
Sergey Brin, directeur technique
Larry E. Page, directeur produits
George Reyes, directeur financier
Secteurs d’activité : Internet
Effectif : 9 348 (30 septembre 2006)
Chiffre d’affaires : 6,16 milliards USD (2005)
Bénéfice net : 1,465 milliards USD (2005)
Site Web : www.google.com

Google (NASDAQ : GOOG, LSE : GGEA) est une société fondée le 7 septembre 1998 dans la Silicon Valley en Californie par Larry Page et Sergey Brin, auteurs du moteur de recherche Google. Depuis 2001, Eric Schmidt en est le PDG (CEO). La société compte environ 10.000 employés dont la plupart travaillent au siège mondial : le Googleplex à Mountain View. Google s'est donné comme mission d'« organiser l'information à l'échelle mondiale et de la rendre universellement accessible et utile ».

Google aurait indexé plus de 8 milliards de pages Web, 1 milliard d'images et 1 milliard de messages Usenet. En novembre 2005, les créateurs de Google annonçaient avoir multiplié par mille le nombre de pages indexées depuis la création du moteur de recherche, soit un total de 24 milliards de pages.

D'après l'émission de télévision française Capital, Google vaudrait 140 milliards de dollars à la bourse de Wall Street. Google posséderait également le parc de serveurs le plus important du monde avec environ 450.000 machines localisées sur plus de 25 sites de par le monde[1].

Sommaire

[] Historique

En 1996 Google, alors baptisé Backrub, est le nom d'un projet de recherche sur lequel travaillent deux étudiants de l'université Stanford : Larry Page et Sergey Brin. Leur projet concerne les moteurs de recherche. Ils imaginent qu'un moteur de recherche qui analyserait les relations entre les sites Web pourrait donner de meilleurs résultats que ceux donnés par les moteurs de recherche de l'époque, Altavista notamment.

Le nom de domaine google.com est enregistré le 15 septembre 1997.

Les deux étudiants recherchent des fonds pour créer leur entreprise. Andy Bechtolsheim, un des fondateurs de Sun Microsystems, leur offre 100 000 dollars, après avoir vu ce dont était capable leur moteur de recherche. Grâce notamment à leurs familles et amis, ils arriveront à réunir un million de dollars et pourront lancer la société Google Inc. le 7 septembre 1998. Leur premier bureau sera un garage à Menlo Park, comme c'est souvent la tradition dans la Silicon Valley. À la fin de l'année 1998, Google qui ressemble à cela, répond à environ 10 000 requêtes par jour et a indexé 25 millions de pages.

En février 1999, c'est 500 000 requêtes par jour que Google doit gérer, puis en août 3 millions. En mars, la société déménage à Palo Alto. Le moteur de recherche qui était jusque là en version bêta, achève sa phase de test le 21 septembre.

En juin 2000, Google est le premier moteur de recherche à avoir référencé un demi-milliard de pages Web. Google signe cette année-là un partenariat avec Yahoo!, commence à proposer la publicité ciblée en fonction des mots-clés. À la fin de l'année, la Google Toolbar est proposée en téléchargement.

Larry Page et Sergey Brin font appel en mars 2001, à Eric Schmidt, le président de Novell, pour prendre la direction de l'entreprise. Le 4 septembre 2001, Google obtient la validation de son brevet concernant PageRank. Cette année là est aussi lancé le service Google Catalogs.

En mai 2002 : Google lance Google labs, le laboratoire des services et applications de la société. Le 12 juin 2002, Sergey Brin annonce officiellement à Paris l'ouverture de la filiale française. En décembre, lancement de Froogle, un service d'achat en ligne.

En février 2003 Google rachète Pyra Labs, le propriétaire de Blogger, un service de création de blogs. Google gère au quotidien 200 millions de requêtes par jour soit 56% des requêtes mondiales. En mai, Google News est décliné en version francophone.

L'année 2004 marque pour Google l'apogée de sa domination en matière de recherche : 84,9% des requêtes sur le Web sont faites auprès de Google. On peut expliquer cela grâce notamment à ses partenariats avec Yahoo, AOL et CNN. En effet ces sociétés ont signé des accords pour que Google soit le moteur de recherche de leurs sites. C'est justement en février 2004 que Yahoo se sépare de Google pour développer son propre moteur de recherche. Cette année-là Google lance Gmail et Google Desktop Search.

En 2006, Google, tout comme les autres moteurs de recherche, accepte de brider son moteur de recherche afin de mieux s'implanter en Chine. Ainsi à dater du 28 janvier 2006, une recherche images sur « Tiananmen » affiche dans Google.fr la célèbre photo d'un étudiant barrant la route des chars, symbole des manifestations de la place Tiananmen, tandis que sur Google.cn les résultats affichent des portraits de familles joyeuses ou photos de monuments. Il faut toutefois noter qu'une telle censure s'applique aussi à des sites racistes, islamistes ou révisionnistes dans les versions française et allemande de Google.

Le 9 octobre 2006, Google rachète YouTube pour un montant de 1,65 milliards de dollars en actions, ce qui constitue la plus grosse opération d'acquisition de Google[2].

Fin novembre 2006, Google ferme Google Answers.

[] Origine du nom

Un jour de 1938, le mathématicien américain Edward Kasner se demanda quel nom donner au nombre formé du chiffre 1 suivi de 100 zéros. Edward se tourna alors vers son neveu (9 ans) en visite à la maison et lui posa la question. Celui-ci répondit un mot de gamin : « un gogol », dont l'orthographe est devenue googol.

C'est ce mot que Kasner reporta fidèlement dans son traité Mathematics and the imagination, dont s'inspirèrent en 1998 Larry Page et Sergey Brin, quand ils créèrent Google. Par cette faute d'orthographe, Google à la place de googol, simple et facile à retenir deviendra célèbre dans le monde entier.

[] Principes et caractéristiques

[] Le système de classement PageRank

Le principe de fonctionnement de Google, qui a fait son succès, est fondé sur une invention de ses créateurs, le PageRank : lorsqu'un document est pointé par de nombreux hyperliens (popularité de liens), son PageRank augmente. Plus son PageRank est élevé, plus il aura de chance d'être affiché dans les premiers résultats d'une recherche. Ce système donne une indication de la popularité du document parmi les autres documents du web.
Ce principe a immédiatement été un succès, car il a permis des résultats plus pertinents que les autres moteurs de recherche qui se contentaient de comptabiliser les mots-clés insérés dans les pages des sites. Il a également permis ce que l'on appelle le bombardement Google.

[] Sobriété et valorisation des mots

En outre, ce moteur de recherche est aussi apprécié pour sa rapidité de recherche et sa sobriété : pas de Flash, pas de bandeau publicitaire clignotant, etc. Son interface a inspiré celle d'autres moteurs, comme Yahoo!.

Il utilise tout de même un système d'AdWords (« publicité de mots ») pour se rémunérer. Ce système est fondé sur une valeur par mot selon sa demande. Plus le mot sera demandé, plus il sera payé cher par clic.

[] Infrastructure

Vers 2002, Google affirmait distribuer la charge sur plus de 10 000 PC fonctionnant avec un noyau Linux modifié. Le chiffre de 1 000 requêtes simultanées en pointe a aussi été souvent évoqué. Les chiffres réels semblent 10 fois plus élevés. Ils sont cependant secrets, notamment pour ne pas permettre de calculer facilement l'investissement nécessaire pour concurrencer Google.

Google utilise des robots nommés Googlebot qui visitent à intervalle régulier l'ensemble des sites web ayant demandé à être référencés afin de maintenir à jour la base de données qui fournit les réponses aux requêtes des internautes.

[] Logos

Hormis le logo officiel [1], le site adopte des logos particuliers pour certaines fêtes et événements : les Google Doodles. Réalisés par Dennis Hwang, un designer américain d'origine coréenne de 23 ans, ils apparaissent régulièrement dès qu'une fête locale ou internationale (nouvelle année, fêtes nationales, etc) ou un événement marquant (Jeux Olympiques, commémoration d'une personne illustre, etc) le permet.

Tous les logos de fêtes et d'événements de www.google.com mis en ligne depuis 1999 sont disponibles ici et, plus spécifiquement, ceux qui sont apparus en France sont disponibles .

[] Version bêta

Une version bêta est habituellement une mention signifiant qu'un programme est en phase de finition. Chez Google c'est devenu une marque de fabrique apposé sur la plupart des services et logiciels à l'exception du moteur de recherche et des services publicitaires.

L'intérêt qui réside dans l'appellation « version bêta » est que, du point de vue de la qualité du service, elle n'engage à aucune obligation de résultat, étant donné que c'est une phase de développement. Cela peut également signifier que les services Google sont en perpétuelle phase d'amélioration.

Cette particularité propre à Google devient une mode qui se traduit chez ses concurrents par un usage plus ostensible de cette mention.

[] Arborescence

Structure du web autour de Google (cliquez pour agrandir)Structure du web autour de Google (cliquez pour agrandir)
Structure du web autour de Google (cliquez pour agrandir)


[] Services

Ce moteur de recherche est disponible en 35 langues et propose son interface en plus de 100 langues.

Google est à la base un moteur de recherche de pages web, il s'est étendu progressivement à divers types de documents (PDF, Microsoft Word, Flash, ...), aux images. Ainsi qu'aux forums Usenet, par Google Groups depuis le rachat de Deja News. Le web2news donne accès aux forums consacrés à Google.

Il possède maintenant une section répertoire qui permet de trouver des sites par catégorie, et un portail d'actualités regroupant les sites des journaux à grand tirage et des plus grandes agences de presse.

La grande popularité de Google et sa politique de développement très diversifiée (liens publicitaires, achats de bases de données et d'archives de forums) a fini par entraîner un certain nombre de craintes quant à la dérive potentielle de cette puissance : en effet, il suffit parfois de «googler» le nom d'une personne pour obtenir sur elle des informations personnelles et approfondies.

Google propose ainsi un nombre croissant de fonctions annexes, disponibles soit par le champ Google normal, soit sous forme d'application Web.

[] Services en ligne

Classement par date de lancement :

[] 2000

  • Google Mobile : Version de Google dans un format spécial plus adapté aux téléphones portables maintenant en version beta.

[] 2001

[] 2002

  • AdWords : Service payant offrant la possibilité de créer des annonces publicitaires basées sur les mots clés pour mieux cibler la clientèle.
  • Google Answers : Google répond à vos questions. Service payant et disponible uniquement en anglais.

[] 2003

  • AdSense : permet aux webmasters de vendre de l'espace publicitaire sur leurs site web (un des produits publicitaire les plus répandus sur l'Internet)
  • Blogger : Le service de blog de Google

[] 2004

  • Gmail : Messagerie en ligne offrant un grand espace de stockage et permettant l'envoi de pièces jointes volumineuses
  • Google Local : Annuaire d'informations locales
  • Google Print devenu Google Book Search : Projet de numérisation de livre très controversé, annoncé en 2004; en 2005, des projets semblables sont développés par Microsoft et Yahoo! [2][3].
  • Google Annuaire : Le Web présenté par sujets et par catégories (Open Directory Project modifié par Google)
  • Google Scholar : Recherche dans les publications scientifiques en ligne
  • Google Suggest : Permet d'avoir des suggestions de Google (avec le nombre d'occurrences) au fur et à mesure qu'on saisit le mot recherché

[] 2005

[] 2006

  • Google Payment : Solution de paiement par Internet.
  • Google Page Creator : Édition et création de pages perso.
  • Google Finance : Gestion de portefeuille boursier en temps réel.
  • Google Mars : L'équivalent martien de Google Maps.
  • Google Calendar : Calendrier et agenda en ligne interconnecté avec GMail.
  • Google Trends : Indique le taux d'utilisation et la popularité d'un mot clé.
  • Google Notebook : Prise de notes en ligne.
  • Google Checkout : Solution de paiement en ligne.
  • Google Code Hosting : Gestionnaire SVN de code Open Source avec gestionnaire de bug.
  • Google Base : Serveur FTP pour entreposer des données.
  • Google News Archive Search : Moteur de recherche d'archives d'articles de journaux numérisés et de contenus plus récents publiés en ligne, sur une période remontant à il y a 200 ans (en anglais uniquement à la date du lancement du service, 6 septembre 2006).
  • The Literacy Project Site pour l'alphabétisation en anglais et allemand, créé en partenariat avec LitCam, et l'UNESCO.
  • Searchmash : Site expérimental de recherche pour une nouvelle approche à interface utilisateur.
  • YouTube Site de dépôt et de visionnage libre pour la video.
  • Google Code search : Moteur de recherche pour le code informatique.
  • Google Docs : Fusion de google spreadsheets et de Writely. Solution en ligne directement concurrente de Microsoft Office mais gratuite et permettant en plus de créer des fichiers au format .pdf
  • Google Gapminder : Application Flash de comparaison d'indicateurs de développement pour tous les pays.

[] Programmes

  • Google Earth : Programme de recherche géographique lancé en 2005
  • Google Talk : Logiciel de messagerie instantanée lancé le 24 août 2005 disponible uniquement sous windows
  • Google Toolbar : Aide à la navigation, lancé en 2000
  • Google Desktop : Recherche d'informations sur son PC, lancé en 2004
  • Google Deskbar : Barre de recherche Google placée dans la barre des tâches
  • Gmail Notifier : Système d'alerte à la réception d'un mail dans Gmail, lancé en 2004
  • Picasa : Visionneuse d'image et logiciel de partage d'images, lancé en 2004
  • Google Web Accelerator : Accélérateur de chargement des pages Web par le préchargement de celles-ci suivant leurs popularités, lancé en 2005
  • Google Pack : Suite de 13 logiciels comprenant des logiciels Google et des logiciels de ses partenaires, lancé 2006
  • Google SketchUp : logiciel de création de dessins en 3D visualisables dans Google Earth
  • Google Browser Sync : Extension pour le navigateur Firefox permettant de synchroniser ses paramètres personnels (marques-pages, mots de passe, etc.) entre plusieurs ordinateurs
  • Google Notifier : Système d'alerte à la réception d'un mail dans Gmail, accompagné de notifications et de gestion de l'agenda google calendar lancé en 2006 disponible uniquement sur MacOS

[] Divers

  • Google Mini et Google Search Appliance : Serveurs Google dédié à la recherche de documents en entreprise
  • Google Space : Lieu où l'on peut utiliser et tester les services Google

[] La société

[] Données financières

Google est une des start-ups qui a franchi sans encombre le krach du NASDAQ en 2001, notamment du fait qu'elle n'était pas cotée. L'entreprise s'est introduite en bourse par un système peu usité d'enchères en mai 2004 qui a comprimé de 5,5 à 1,5% les commissions perçues par les banques d'affaires; introduite à 80 $, l'action cotait 250 $ un an plus tard, ce qui valorisait l'entreprise à près de 74 milliards de dollars. Début 2006, l'action cote 460 $ environ, ce qui fait de Google la 15e capitalisation boursière des USA avec 137,62 milliards de dollars. Le code de l'action au NASDAQ est GOOG.

Résultats (en millions de dollars)
Année 2002 2003 2004 2005
chiffre d'affaires 440 1466 3189 6139
bénéfices 100 106 399 1465

Le 20 décembre 2005, Time Warner annonçait que Google allait prendre 5% de participation dans le capital de sa filiale AOL.

[] Historique des rachats

La compagnie se spécialise dans la détection de petites sociétés jugées prometteuses et susceptibles d'être valorisées par une synergie avec ses activités

  • Deja News : Archive du Web créée en 1995. Achetée en février 2001 et rebaptisée Google Groups
  • Outride : spin-off du Xerox Palo Alto Research Center (PARC). Achat de propriété industrielle en septembre 2001 et incorporation dans le moteur de recherche Google. Outride.net renvoie actuellement vers Google.
  • Applied Semantics : Achat de cette société de publicité contextuelle en avril 2003 et usage dans le service Adwords.
  • Kaltix (3 employés) : compagnie de recherche acquise en septembre 2003. Kaltix.com renvoie aujourd'hui vers Google, qui a incorporé son savoir-faire.
  • Blogger (Pyra Labs) : Achat en mai 2004, reconception complète par les spécialistes de Google, devenue aujourd'hui (2005) l'un des principaux hébergeurs de blogs.
  • Picasa : Créateurs d'un programme de gestion de photos à 30$ lancé en octobre 2001. Intégré à Blogger en juillet 2004. Picasa devint alors un produit gratuit incorporant le fameux bouton Google "J'ai de la chance!". Ce logiciel reste régulièrement primé par différents magazines de micro-informatique aux USA.
  • Keyhole : Compagnie de cartographie fondée en 2001. Achetée en octobre 2004 dans le cadre du projet Google Maps. Réduction immédiate de son prix de 69,95 $ à 29,95 $, et intégration de ses photos satellite dans Google Maps.
  • Zipdash : Compagnie de gestion de trafic acquise en 2004 et incorporée discrètement dans Google Maps. Le nom de Zipdash n'est apparu que dans le rapport annuel 2004 de Google.
  • Where2 : Compagnie de cartographie australienne mentionnée également dans le rapport 2004, mais sans précisions. Probablement liée au développement de Google Maps.
  • Urchin Compagnie d'analyse statistique du Web, acquise en mars 2005.
  • Dodgeball (2 employés) : Compagnie d'analyse de cliques (voir Théorie des graphes) en matière de téléphonie mobile. La compagnie est venue spontanément chercher Google pour soutenir son développement financier. Liée aujourd'hui au projet Google Mobile.
  • dMarc Broadcasting : Firme spécialisée dans la diffusion de messages publicitaires à la radio. Achetée en janvier 2006.
  • Writely : éditeur de traitement de texte, en ligne, acquis en mars 2006.
  • @Last Software : société éditrice du logiciel SketchUp acquise en mars 2006.
  • Neven Vision : Firme spécialisée dans le développement de logiciels de reconnaissance photographique acquise en août 2006.
  • YouTube : Site web de diffusion vidéo acquise en octobre 2006 pour 1,65 milliard de dollars.
  • JotSpot : Site hébergeur de wikis intelligents (comportant des pages de tableurs et d'agendas collaboratifs, etc.) pour les particuliers et les entreprises, acquis fin octobre 2006 pour un montant non encore révélé à cette date.
  • iRows Tableur en ligne du type Google Spreadsheets

[] Utilisation avancée de Google

Google propose, en plus du service de base, une recherche avancée permettant d'exclure des mots ou de rechercher des expressions complètes (voir ici d'autres fonctions avancées).

[] Fonctions avancées

Google propose également des fonctions avancées :

  • À la une de l’actualité
  • Conversion de devises
  • Calculatrice Google
  • Traduction automatique (principe de fonctionnement)
  • Fichiers PDF
  • Pages en cache
  • Pages similaires
  • Pages liées
  • Opérateurs de ciblage : permet de faire sa recherche exclusivement sur une seule adresse Web. Syntaxe : « site:votre requête ».
  • J'ai de la chance
  • Définitions : permet d'obtenir une définition de mots. Cette fonction est désormais disponible en anglais, français, espagnol, allemand, chinois, italien et russe. Syntaxe : « define:mot à définir »

[] Caractères spéciaux

Google gère les accents écrits sous forme d'entités, mais pas les caractères Unicode. Par conséquent, rechercher « alcene » et « alcène » ne donne pas le même résultat tandis que rechercher « encyclopédie » ou « ENCYCLOPÉDIE » ne change rien.

Si vous tapez « recette de la soupe au * et à la tomate », Google vous proposera le basilic ou le potiron à la place de l'étoile. On peut élargir ses recherches aux synonymes d'un mot, en le précédant du symbole « ~ ». Le « + » permet de forcer le mot à être interprété tel quel par Google (ceci est notamment utile pour les accents en français).

[] Utilisation détournée de Google

Les nombreuses fonctionnalités de Google ont donné naissance à différentes utilisations ludiques par les internautes.

[] Concours de positionnement

De nombreux concours de positionnement ont vu le jour sur Google, puis sur d'autres moteurs. Le but est de placer une page sur un mot-clé plus ou moins fictif en première position des résultats de recherche sur celui-ci. Le premier concours important concernait la requête SERPS. En 2004, un concours francophone sur l'expression mangeur de cigogne a rassemblé 170 candidats et atteint 420 000 requêtes sur Google pour cette expression. Des controverses ont eu lieu sur les motivations de ces concours, qui sont pour les uns des outils d'expérience utiles au référencement, mais qui n'ont selon les autres que des motivations uniquement ludiques, faisant de Google un simple terrain de jeu.

[] Bombardement Google

Le bombardement Google (Google bombing) consiste à associer sur le plus de pages Web possible une expression à un site Web donné, de sorte qu'une recherche Google sur cette expression remonte le site en question dans les premiers résultats. Les campagnes de bombardement Google se font à travers les forums ou les blogs, en incitant les internautes à participer. Il suffit au participant d'ajouter sur un site Web ou un blog un lien vers le site visé en l'associant à l'expression.

L'un des premiers sites à avoir été visé par un bombardement est celui de la biographie du président des États-Unis George Walker Bush [4] sur le site de la Maison Blanche. Une recherche google sur l'expression « failure » ou « miserable failure » donne encore ce site comme premier résultat ([5]).

Au cours de l'automne 2005, et faisant suite à une campagne massive de courriels lancée par le parti politique de Nicolas Sarkozy, et en représailles, les Webmestres ont appelé à faire du Google Bombing sur le nom du ministre de l'Intérieur. Ainsi, quand vous tapiez Nicolas Sarkozy [6] dans Google, vous obteniez en deuxième position un lien pointant vers Iznogoud, le personnage de bande dessinée qui veut être calife à la place du calife. Le Google Bombing consiste à mettre sur la page d'un site Web un lien (Iznogood ou George Bush) et de l'associer à un texte (Nicolas Sarkozy ou miserable failure). Si l'opération est effectuée par un nombre certain de webmasters, le résultat est rapide : les liens fallacieux remontent dans les premiers résultats de Google.

[] Google fight

Le Google Fight consiste à comparer le nombre de résultats renvoyé par Google sur plusieurs expressions : est déclarée vainqueur l'expression ayant obtenu le plus de résultat. Les internautes s'amusent ainsi à comparer des noms, des idées politiques, etc. Un site web a même été créé pour offrir une interface à ce type de "combat" [7].

Depuis janvier 2006, l'équipe de Google intercepte les requêtes de Google Fight et renvoie des résultats fantaisistes. Vous pouvez le vérifier en interrogeant le site plusieurs fois de suite sur le même couple de noms.

[] Google Whacks

Le Google Whacks est un jeu qui consiste à trouver deux mots qui associés dans une recherche sur Google donnent un unique résultat. Les termes employés doivent exister dans le dictionnaire, et le site trouvé ne doit pas être une simple liste de mots. Les guillemets et tous signes de ponctuation ne doivent pas être utilisés. Le score est souvent calculé en multipliant le nombre de résultats du premier terme par le nombre de résultats du second mot. [8]

[] Les canulars de Google

Google s'est prêté aux canulars suivants depuis 2000, pour le premier avril.

[] Limites et erreurs de Google

La principale limite de Google est que le moteur ne parcourt que le web visible, laissant de côté toutes les bases de données professionnelles, parfois énormes, et souvent pertinentes, mais dont l’accès est limité (mais parfois gratuit). Exemple : Dialog (15 000 Go).

Plusieurs études parues sur le Web montrent des limites internes sérieuses de Google, comme un article de bases-publications (consultation gratuite).

[] La taille de la base

Plusieurs recherches ont montré que le nombre de pages réellement indexées ne serait que la moitié du nombre annoncé ; l’autre moitié serait des pages visitées par le robot de Google, mais dont seule une partie (l’en-tête, sans le corps de la page) serait indexée. Ces pages seraient essentiellement des pages non-anglophones, à cause de la technologie Adword, qui est utilisable seulement pour l’anglais, et qui est la principale source de financement de Google.

Cette notion de taille de l'index a été et reste un élément marketing majeur des moteurs de recherche. Fin 2005, suite à une analyse critique, démarrée en Janvier 2005, de la taille de son index, initiée par Jean Véronis, la firme Google a décidé de ne plus mettre cet argument en avant.
A titre d'exemple sur cette approche marketing, Google avait annoncé un doublement de la taille de son index annoncé, le lendemain du lancement de MSN Search.

[] L’efficacité des recherches

Lors d’une recherche d’une complexité moyenne (utilisation d’un opérateur booléen, c'est-à-dire d’un espace [opérateur ET]), les résultats varient du simple au triple dans la même journée ; dans certains cas, selon un ordre de grandeur allant de un à dix.

Quelquefois, le moteur de recherche ne tient pas compte des opérateurs demandés.

Cette variabilité dans le nombre de réponses apportées s’explique par l’architecture de Google. Il existe en effet plusieurs serveurs dispersés dans le monde, hébergeant l’index des pages visitées par Google. Selon l’endroit où se trouve un internaute (ou selon le site local de Google interrogé), sa requête est dirigée vers l’un ou l’autre de ces serveurs. Normalement, chaque index est identique aux autres ; mais comme ils ne sont pas synchronisés en temps réel (mais à des intervalles pouvant dépasser le mois), seul l’index principal, situé en Californie, est constamment à jour, et donne un maximum de réponses correctes. Le serveur principal peut donner ainsi dix fois plus de réponses qu’un serveur secondaire.

[] Évaluation du moteur

D'après Jean Véronis (« Etude comparative de six moteurs de recherche », février 2006), Yahoo! et Google sont les deux meilleurs moteurs (parmi six des principaux moteurs francophones). Pour l'auteur, ces deux moteurs ayant des performances équivalentes, la raison de la préférence massive des internautes pour Google n'est pas la pertinence des résultats.

Mais, Selon Trent, il pourrait être inférieur à Windows Live Search.

[] Controverses

[] Controverse sur l'influence du contenu des résultats affichés

En devenant le premier moteur de recherche en terme d'utilisation, Google est devenu le premier véhicule d'information sur Internet. Ce rôle - véhiculer l'information - est inhérent au métier des moteurs de recherche et les problèmes qui en découlent ne sont donc pas tous imputables à Google, qui n'est pas l'auteur du contenu des pages.

Au-delà des difficultés posées par l'importance stratégique du classement de Google dans le domaine économique, le véritable problème réside dans la forte influence idéologique que possèdent les pages qui apparaissent dans les premiers résultats et qui font figure de parole d'évangile. La popularité d'un moteur de recherche tel que Google peut être utilisé comme vecteur de désinformation, où l'influence d'un site est d'autant plus importante que le mot clé est populaire et qu'il se trouve en tête de liste. Les dirigeants de Google avouent [3] être impuissants face aux phénomènes d'intoxication et de diffamation qui s'affichent actuellement dans les premiers résultats de Google, la technique ne pouvant juger la sincérité de l'information.

[] Respect de la vie privée et informations personnelles

Google, associé à AOL, Amazon.com, CNet, eBay, Microsoft et Yahoo!, pratique aux États-Unis du lobbying contre une loi (le Spyware Control Act), obligeant explicitement de demander à l'utilisateur son autorisation pour activer des options de traçage de ses choix ou avant l'installation d'un logiciel espion (ou spyware). (article sur slashdot.org)

Au sujet des éventuelles techniques de traçage employées par Google, nous pouvons citer Google-Watch.org, site de l'activiste américain Daniel Brandt, tentant de démontrer les failles et le manque de neutralité de Google, qui proposait jusqu'il y a peu, un proxy permettant de soumettre une recherche Google sans être épié d'une quelconque façon. Le proxy n'est plus en ligne (?) mais le reste du site pourrait vous en apprendre plus. Et qui dénonce sa censure orientée, dans d'autres pays comme la Chine, ou les États-Unis, concernant l'invasion de l'Irak et la prison d'Abu Ghraib.

On notera que Google ne se plie pas aux injonctions du gouvernement américain début 2006 en ne lui donnant pas accès aux données de ses utilisateurs.

[] Affaire Google Livres

Google Books (en français, Google Livres), anciennement Google Print, est souvent perçu, en Europe, comme une monopolisation et une privatisation du savoir. En effet, en accumulant la plupart des livres du monde en un même point, les utilisateurs pourraient n'avoir pas d'autre choix que de passer par Google, qui contrôlerait ainsi la littérature. Si le système venait à se généraliser, la censure de tel ou tel livre pourrait n'être définie que par une seule entreprise : Google. C'est avant tout chez certains éditeurs de livres que le projet soulève le plus de contestations, pour des raisons touchant à leurs droits. Des éditeurs français et belges critiquent ainsi l'idée de l'opt-out avancé par Google, selon lequel ce serait aux éditeurs de demander le retrait de tel ouvrage de Google Book, plutôt qu'à l'entreprise de numérisation de demander l'accord préalable des éditeurs.

Une autre critique, en partie contradictoire avec la précédente, s'inquiète du biais culturel que constituerait l'entreprise, à cause de sa limitation aux États-Unis. En avril 2005, Jean-Noël Jeanneney, président de la Bibliothèque nationale de France, dans son livre Quand Google défie l'Europe attaque ce projet de numérisation et demande la mobilisation des Européens à ce sujet. Cet appel est entendu par la France et l'Europe qui décident de riposter avec le projet de bibliothèque numérique européenne ainsi qu'avec, dans un autre domaine, le moteur de recherche Quaero. Néanmoins, certains (petits) éditeurs se montrent plus favorables au projet Google Livres - sans pour autant se faire d'illusion sur ses objectifs - et reproche à Jean-Noël Jeanneney de:

  • brandir le spectre d’une « américanisation » et d’une « confusion » des savoirs, alors que Google n’a aucunement restreint son projet de numérisation aux bibliothèques du monde anglophone et que les bibliothèques associées définissent elles-mêmes les livres de leurs fonds qu’elles souhaitent numériser (et qu'il est paradoxal de reprocher à une bibliothèque de proposer à la consultation un maximum de documents, d’autant plus que le projet Google n’interdit aucunement la mise en place d’outils de discrimination entre différentes sources ou de classement des résultats selon d’autres critères que le nombre de citations dont un livre fait l’objet);
  • suggérer que les textes qui ne relèvent pas du domaine public seront intégralement et gratuitement disponibles, alors que la quantité de texte accessible à l’internaute pour un livre donné est limitée (d'après Google, conformément au droit de citation) et revient à permettre aux internautes de feuilleter un livre comme il le ferait en librairie ;
  • confondre le projet de numérisation du fonds des bibliothèques (programme "Bibliothèque"), dont une bonne part est difficilement accessible et indisponible dans le commerce, et la possibilité offerte aux éditeurs (programme "Partenaire") de mettre en ligne leurs catalogues et leurs nouveautés selon des modalités définies par eux-mêmes ;
  • accuser Google de préparer la mort de la petite librairie indépendante, alors que les éditeurs ont le loisir de proposer des liens vers des librairies en ligne de leur choix (notamment les plateformes d'éditeurs indépendants comme lekti-ecriture.com) et qu’un moteur de recherche permettra bientôt aux visiteurs de Google Livres de trouver les coordonnées des librairies les plus proches de leur lieu de résidence ;
  • affirmer que le projet de bibliothèque numérique de Google revient pour les bibliothèques traditionnelles à céder sans contrepartie leur patrimoine, alors que Google met à disposition des bibliothèques les fichiers des livres numérisés ;
  • ignorer tous les avantages (notamment en termes de visibilité) qu'offrent Google Livres et les projets équivalents aux (petits) éditeurs et aux libraires indépendants, à une époque où l'édition de philosophie, de sciences sociales et d'histoire voit son économie de plus en plus fragilisée.

Sur l'édition indépendante, le livre numérique et Google, on pourra lire: de Jérôme Vidal, Lire et penser ensemble - Sur l'avenir de l'édition indépendante et la publicité de la pensée critique (Paris, Editions Amsterdam, 2006, texte publié sous licence Creative Commons et dont sont extraits les points cités ci-dessus); de Lucien Polastron, La Grande Numérisation: Y-a-t-il une pensée après le papier? (Paris, Denoël, 2006); de Michel Valensi (éditions de L'Eclat), "Faut-il une grande cuillère pour signer avec Google?"; d'Alexandre Laumonier (éditions Kargo), "Les petits éditeurs votent Google" (Libération du 6 juin 2006) et "La non-affaire Google Livres"; et de Joël Faucilhon (lekti-ecriture.com et Contre-feux), "Lorsque la Bibliothèque numérique européenne pense aux livres sans les libraires".

[] Affaire AFP

En mars 2005, l'Agence France Presse décide d'attaquer Google en justice au sujet de Google Actualités. L'agence de presse accusait Google d'avoir violé le copyright sur ses dépêches et ses photos, en les diffusant sans son autorisation. L'AFP lui réclame 17,5 millions de dollars de dommages et d'intérêts. Avant le terme de cette affaire, Google prit la décision de retirer de son site tout le contenu AFP et de ne plus l'indexer dorénavant.

[] Affaire Gmail

Le système Adsense, qui insère des messages publicitaires ultra-ciblés dans les mails des utilisateurs de Gmail en fonction du contenu, a posé quelques problèmes juridiques à Google. L'organisation britannique Privacy International estime que ce principe est une «violation à grande échelle de la législation européenne» (Voir cet article sur ZDnet France) et a déposé plainte contre Google.

[] Affaire Tiananmen

Les dirigeants de Chine populaire gênés qu'une recherche sur Tiananmen dans Google Images renvoie des photos de chars réprimant la révolte étudiante, ont obtenu de Google que la requête "Tiananmen" sur le portail chinois de Google ne renvoie plus ces images. Ceci peut-être constaté en comparant la même requête sur google.com et google.cn:

Toutefois, si l'on écrit le même mot avec une graphie approximative (Tienanmen par exemple), le moteur de Google renvoit bien les photos de chars.

Attention : Avec l'orthographe précédente (Tiananmen), Google Chine (présenté ici en 2ème lien) affiche des photos de chars à la 4ème page

[] Affaire BMW Allemagne

Suite à des tentatives de BMW Allemagne et de son référenceur, d'augmentation de son PageRank (et donc du positionnement des liens vers BMW sur des requêtes comme voiture dans Google), la firme automobile a été blacklistée par Google qui l'a éliminée de son index en janvier 2006. Les recherches sur "BMW" ramèneront uniquement des références sur son site mondial [9].

[] Affaire des mots-clef en France

En 2005, l'UMP et plus particulièrement Nicolas Sarkozy ont été critiqués pour avoir acheté des dizaines de mots-clefs comme « émeute », « CPE », « Jack Lang »… renvoyant sur le site de l'UMP.

[] Controverse sur le nombre de résultats affichés

Lorsque le nombre de pages est trop important, seules les 1 000 premières pages sont affichables, ce qui est une limite raisonnable et adoptée par la plupart des moteurs de recherche. Cependant, certains internautes soupçonnent que le nombre de pages trouvées soit articiellement « gonflé » lorsque l'on dépasse cette limite. Cette hypothèse se base sur deux faits :

  • il affiche parfois un nombre de page plus important que le nombre de pages de la toile répertoriée par Google (par exemple avec une requête sur un mot utilisé dans la totalité des pages anglophones comme « the », article défini) ;
  • lorsque l'on fait plusieurs recherches successives sur le même mot-clef, le résultat varie.Ce résultat s'explique par le nombres de serveurs utilisés par google, chaque serveur n'ayant pas le même nombre de page enregistrées pour un même résultat.

Voir par exemple le message <449d92eb$0$1002$ba4acef3@news.orange.fr> sur le groupe usenet fr.sci.physique et [10]

[] Devise

La devise de la société est "don't be evil" (ne fais pas le mal).

[] References

  1. NY times, 14 juin 2006
  2. Google acquiert YouTube sur TechCrunch
  3. Interview de Eric Schmidt, documentaire télévisé Defining Google diffusé par CBSNews (janvier 2005)

[] Voir aussi

[] Bibliographie

  • Jean-Noël Jeanneney, Quand Google défie l'Europe, Paris, éd. Mille et Une Nuits, 2005, ISBN 2842059123 ; essai sur le projet de numérisation de bibliothèques universitaires par Google.
  • Boris Beaude, "Incontournable et sans contenu…", EspacesTemps.net, Mensuelles, 11.09.2004 http://espacestemps.net/document692.html
  • Johnny Long, Google hacking: mettez vos données sensibles à l'abri des moteurs de recherche, Dunod, Paris, 2005, ISBN 2-10-049421-X (traduit de Google hacking, ISBN 1-931836-36-1): ouvrage sur l'utilisation des moteurs de recherche, et de Google en particulier, pour trouver des failles dans la sécurité des sites web et des entreprises.
  • David A. Vise et Mark Malseed (traduit en français par Dominique Maniez), Google Story raconte l'ascension de la firme californienne. Ed. Dunod, 2006, ISBN 2100498940.
  • S.Balula, R.Langlade, C.Louis, P.Torloting, P.Tournier et F.Cazals, Le monde selon Google explore une vision différente et critique du géant des moteurs de recherche. Ed. Distriforce, Collection Cybersavoirs, 2006, ISBN 2952590915.

[] Liens internes

[] Liens externes

[] Google & services

[] Google

[] Centralisation de liens

[] À propos de Google

[] Easter eggs, fonctions cachées & parodies

[] Fonction cachées ou méconnues

[] Parodies


Google

Services : FroogleActualitésNotebookPaymentTransitVideoGmailCodeDocs & SpreadsheetsPicasa Web Album

Applications Web : AnalyticsBaseLabsMapsCreatorReader

Logiciels : EarthMoonMarsSpacePackTalkDesktopPicasa

Technique & outils : BombardementPageRankTrustRankGooglebotBarre d'outils (Googlebar)AnswersCalculatrice

Culture : GoogleplexDoodleNotoriété • « J'ai de la chance »

Google