TechTarget
Accès rapide :
Definition

Web invisible

Le Web invisible, également appelé Web profond ou Web caché (en anglais, « deep web »), est la grande partie d'Internet qui reste inaccessible aux moteurs de recherche conventionnels. Il contient les courriers électroniques, les messages de chat, le contenu privé sur les sites des réseaux sociaux, les relevés des banques en ligne, les dossiers médicaux électroniques et d'autres contenus qui, bien qu'accessibles sur Internet, ne sont pas analysés et indexés par des moteurs de recherche tels que Google, Yahoo, Bing ou DuckDuckGo.

Les raisons pour lesquelles le contenu du Web invisible n'est pas indexé sont diverses. Dans certains cas, le contenu est propriétaire, donc seuls les visiteurs autorisés utilisant un réseau privé virtuel (VPN, Virtual Private Network) peuvent y accéder. Dans d'autres, le contenu est commercial et réside dans un univers clos auquel ne peuvent accéder que les clients qui ont payé une redevance. Parfois, le contenu contient des informations personnelles identifiables (IPI), auquel cas il est protégé par les réglementations en matière de conformité et seules les personnes disposant de privilèges d'accès peuvent y accéder par un portail. Lorsque des applications composites (mashups) ont été générées à la volée et que les composants n'ont pas d'URL permanente, elles font également partie du Web invisible.

La taille du Web invisible n'est pas connue, mais de nombreux spécialistes estiment que les moteurs de recherche analysent et indexent moins de 1 % de tout le contenu accessible sur Internet. Cette partie d'Internet qui est analysée et indexée par les moteurs de recherche est parfois appelée Web de surface. Le terme « deep web » (Web invisible) a été utilisé pour la première fois par BrightPlanet dans un livre blanc de 2001 intitulé « The Deep Web: Surfacing Hidden Value » (Le Web invisible : découverte d'une richesse cachée) et les médias le confondent souvent avec le terme dark Web. Or, si comme le Web invisible, le dark Web ne peut pas être parcouru par les moteurs de recherche conventionnels, c'est généralement parce que son contenu est illégal.

Cette définition a été mise à jour en mai 2018

- ANNONCES GOOGLE

LeMagIT

Close