PDA

Voir la version complète : [Astuce] Fouiller le cache de Google



Mimiche
06/01/2013, 19h37
Fouiller le cache de Google


http://www.linternaute.com/image/gen/pixel.gif


http://www.linternaute.com/hightech/internet/google_astuces/images/10.jpg




http://www.linternaute.com/image/gen/lintermailto.gif
Envoyer à un ami (http://sendinfo.linternaute.com/cgi/linternaute/)
|
http://www.linternaute.com/image/gen/_linterprinter.gif
Imprimer cet article (http://www.linternaute.com/imprimer/hightech/internet/google_astuces/astuces/10.shtml)









Outre son mode de fonctionnement qui lui assure à une plus grande pertinence que celle de ses concurrents, du moins à l'époque de son lancement, Google est le premier moteur de recherche à avoir introduit un système de cache. Cela signifie qu'à chaque fois qu'il référence une page, Google en archive une copie sur ses propres disques durs.
Avant l'apparition de cette fonctionnalité , il était fréquent que les moteurs de recherche suggèrent des pages web aux titres alléchants, mais au contenu inaccessible. Grâce au cache de Google, c'est un mauvais souvenir, car avec lui toute page référencée reste accessible, quand bien même le site d'origine aurait-il disparu.
Si en cliquant sur une réponse vous vous heurtez à un message d'erreur (erreur 404 si le fichier n'existe plus, erreur 500 si le serveur est momentanément indisponible) , si le chargement d'un site est insupportablement long, ou encore si le mot recherché ne figure plus sur la page parce qu'elle a fait l'objet d'une actualisation, pressez le bouton retour de votre navigateur, et au lieu de cliquer sur le titre du document, suivez le lien intitulé "en cache".
Autre possibilité, dont nous vous laissons trouver l'usage, il est possible de lancer d'entrée de jeu une recherche dans le cache de Google plutôt que sur le web proprement dit. Pour ce faire, utilisez la commande cache: suivi de l'adresse du site recherché.





Parmi les options avancées (http://www.google.com/advanced_search?hl=fr) facilement accessibles sur Google, il est un menu déroulant qui permet de limiter la recherche dans le temps. En usant de cette option, vous pourrez restreindre la liste des résultats aux pages référencées au cours des 12, des 6 ou des 3 derniers mois. C'est bien, mais il est possible de remonter beaucoup plus loin, ou de définir un laps de temps au jour prés.
Parce qu'elles font appel à un système de datation très particulier, il n'est pas aisé de définir une requête de ce type manuellement. Heureusement, certains sites proposent pour ce faire une interface graphique, par exemple Fagan Finder (http://www.faganfinder.com/engines/google.shtml). Grâce au formulaire dont nous vous donnons un aperçu ci-dessus, il est possible de définir une période au moyen de simples menus déroulants
Il y a quelques temps, Google a mis à disposition les informations permettant à des tiers d'exploiter sa technologie. Nombre d'éditeurs de logiciels ont exploité cette aubaine. Parfois en élaborant des outils si originaux qu'on se devait de vous les faire découvrir, même s'il faut bien l'avouer, leur utilité ne coule pas de source. C'est particulièrement vrai de CapeMail (http://www.capescience.com/google/), une passerelle qui permet de consulter Google par mail, sans jamais avoir à ouvrir son navigateur. Un comble pour un moteur de recherche !
Il vous suffit d'envoyer un mail vide à l'adresse google@capeclear. com (http://fr.mc1714.mail.yahoo.com/mc/[email protected]&subject=remplacer%20cette%20mention%20par%20vos%20 mots%20cl%E9s) en n'oubliant pas de spécifier les mots clés en guise d'objet du mail, pour que quelques minutes plus tard vous parviennent par retour de mail, les réponses fournies par le moteur de recherche.
Le service est assez bluffant. Quant à déterminer ce à quoi il peut bien servir, sachant que d'une façon ou d'une autre il vous faudra ouvrir votre navigateur pour visionner les sites répondants à votre requêtes... ma foi, on vous laisse l'imaginer.
Parce que certains sites ont plus de poids que d'autres ou parce qu'ils maîtrisent mieux les arcanes du référencement, il peut arriver que les liens listés dans les premières pages de résultats fournis par Google renvoient tous aux mêmes sites web, repoussant d'autant vos chances de tomber sur la page perso qui contient le renseignement opportun.
Cela n'arrive pas tous les jours heureusement, mais si à l'occasion vous vous heurtez à cet irritant problème, vous trouverez une façon élégante de contourner la difficulté grâce au service proposé sur staggernation. com (http://www.staggernation.com/gawsh/).
La page sur laquelle nous vous orientons ne comporte qu'un champs de saisie. Indiquez votre requête, exactement comme vous le feriez sur Google, et pressez le bouton "search".
Le temps pour l'application développée par staggernation. com (http://www.staggernation.com/gawsh/) de compiler les résultats, c'est à dire de les classer selon leur origine, et le service vous retourne une liste de sites web, chacun étant précédé d'un discret pictogramme triangulaire. C'est ce bouton qu'il convient de presser pour obtenir les résultats proprement dits.

Au moyen d'un formulaire quelconque, GoogleAlerts (http://www.googlealert.com/) permet de définir jusqu'à cinq requêtes. Tous les jours ou toutes les semaines selon votre choix, le service effectue automatiquement ces recherches sur Google, en ne retenant que les nouveaux liens, c'est à dire ceux qui sont apparus depuis votre dernière visite sur le site ou depuis le dernier mail d'alerte. BIen sûr, GoogleAlerts accomplit sa mission de veille en silence, et ne vous prévient qu'en cas de changement.

Bien utile pour les webmasters soucieux de la réputation de leur site, on peut imaginer toutes sortes d'utilisation de cet outil. Dans le cas qui nous sert d'exemple, sur la capture d'écran, nous lui avons demandé de nous informer au quotidien de toutes les publications sur le web ayant trait à des appareils photo numériques 5 MPixels.
Précisons que cette recherche ne présente guère d'intérêt vu la multitude de documents qui apparaissent chaque jour sur ce thème, mais sur des requêtes plus fines, comme le nom d'une page perso, ou un patronyme, GoogleAlerts s'avère diablement efficace.
N'oubliez pas vos noms d'utilisateur et mot de passe à l'inscription, faute de quoi le service n'aurait aucun intérêt. N'omettez pas non plus de communiquer une adresse mail valide, car c'est par ce biais que le service vous informe des nouveautés.