Głęboki Internet

Wraz z rozwojem technologii webowych strony internetowe przestały być statycznymi dokumentami HTML o niezmiennej zawartości. Ich coraz większa interaktywność doprowadziła do tego, że znacząca cześć zasobów Internetu była pomijana przez tradycyjne silniki szukające (np. Google), ze względu na ich niemożność analizy i indeksowania dynamicznych, bądź opartych na niestandardowych formatach stron internetowych. Poważnym problemem okazało się również coraz szersze wykorzystanie baz danych, które okazały się barierą nie do pokonania dla wyszukiwarek. Według badań przeprowadzonych w 1999 roku przez Lawrence’a i Milesa żaden z ówczesnych silników nie był w stanie zaindeksować więcej niż jedną szóstą zasobów Internetu. To z kolei uniemożliwiło internautom korzystającym z tych silników uzyskać dostęp do ogromnej ilości wartościowych informacji zawartych w nieindeksowanej części sieci.

W strukturze WWW widocznej na rysunku poniżej wyróżnić można cztery podstawowe warstwy, które rozdzielają Internet powszechnie dostępny i łatwy do przeszukiwania od tego ukrytego. W pierwszej znajdują strony WWW o ogólnej tematyce oraz stałej, nie ulegającej zmianom zawartości. Warstwa druga zawiera strony tematyczne, zorientowane na jedno, konkretne zagadnienie. Część zasobów znajdujących się w tej warstwie można zaliczyć już do głębokiego Internetu.

W warstwie trzeciej rozpoczyna się już właściwa niewidzialna sieć. Znajdują się w niej bazy danych o dynamicznie zmieniającej się zawartości. Często wpływ na tę zawartość mają również bezpośredni użytkownicy tych baz. Tradycyjne wyszukiwarki mogą napotkać trudności w wyszukiwaniu informacji wśród zasobów tej warstwy

Warstwę czwartą stanowią prywatne witryny o dynamicznej zawartości. Uzyskać dostęp do ich zasobów można wyłącznie po wcześniejszej rejestracji w bazie użytkowników, bądź wniesieniu określonych opłat.

Istnieje kilka terminów określających część sieci niedostępną dla tradycyjnych wyszukiwarek. Najczęściej spotykane są trzy nazwy: niewidzialny Internet, ukryty Internet oraz głęboki Internet. Pierwsza z nich jest nadrzędna względem pozostałych i odnosi się do wszystkich zasobów które są słabo (lub wcale) indeksowane przez wyszukiwarki. Pozostałe dwa określenia są równorzędne i mogą być używane zamiennie, w zależności od upodobań.

Podziel się:
  • Facebook
  • Twitter
  • Wykop