Google scutera les abysses du web

| Mise à jour
par bettina.tschumi@ictjournal.ch
Selon Computerworld.ch, Google a pour objectif de remonter les nombreux documents pdf scannés à la lumière du jour et ce, grâce à un logiciel de reconnaissance optique de caractères (Optical Character Recognition - COR). L’expression «Deep Web» désigne les zones d’internet qui restent inaccessibles au moyen d’un moteur de recherche usuel ; le Deep Web est composé en grande partie de bases de données spécialisées et de sites web qui ne sont générés que suite à des requêtes dynamiques. D’après Computerworld.ch, Google planifie une véritable offensive de reconnaissance de texte qui sera soutenue par des logiciels COR chargés d’analyser les contenus des dizaines de millions de documents scannés au format pdf.

Kommentare

« Plus