Choć Google stał się synonimem wyszukiwania, warto pamiętać, że nie jest jedyny. Wiele serwisów, takich jak Wolfram Alpha czy DuckDuckGo, oferuje funkcje, których próżno szukać u giganta. Dlatego warto poznać możliwości alternatywnych wyszukiwarek i zacząć ich używać w codziennej pracy. BARTŁOMIEJ MROŻEWSKI
Google oraz alternatywne wyszukiwarki docierają do najdalszych zakątków internetu. Tam, dokąd nie dotarł jeszcze nikt, poza autorem danej strony.
Roboty indeksujące
Analizą internetu i wydobywaniem treści zajmują się wyspecjalizowane programy – roboty indeksujące, nazywane niekiedy pająkami. Po wejściu na stronę pobierają jej treści, potem wyszukują wszystkie linki i otwierają je. Powtarzając tę procedurę na każdej napotkanej stronie, są w stanie dotrzeć do najdalszych zakątków internetu, oczywiście tak długo, dopóki znajdujące się w nich strony są choć raz zlinkowane. Współczesne roboty indeksujące są inteligentne. Wiedzą na przykład, które strony są aktualizowane często, i te odwiedzają co kilka minut. Dzięki temu treść najnowszych artykułów jest dostępna w wyszukiwarce.
Czy zatem wszystko, co jest w sieci, jest dostępne w wyszukiwarce? Otóż nie. Każdy właściciel strony może utworzyć plik robots.txt, w którym określa, jakie obszary witryny mają być pominięte przez mechanizm indeksujący, a tym samym, co ma nie być dostępne w wyszukiwarce. Niektóre serwisy, takie jak Facebook czy Twitter, zazdrośnie strzegą swoich zasobów i nie są dostępne w wyszukiwarce. To samo dotyczy zawartości rozmaitych baz danych, które są dostępne za pośrednictwem interfejsu WWW, w którym można formułować kwerendy. Dotyczy to np. katalogów bibliotek czy baz z połączeniami lotniczymi i kolejowymi, które można przeszukiwać tylko za pomocą specjalnych wyszukiwarek.
Analiza treści
Gdy robot „przeczyta” stronę, od razu analizuje jej treść. Nie tylko wydobywa wszystkie słowa, ale także stara się odnaleźć ich kontekst. Sprawdza, czy tekst jest w tytule, nazwie linku, czy jest wyróżniony w inny sposób. Ważnym elementem analizy jest sprawdzanie metainformacji, czyli treści przeznaczonej tylko dla robotów oraz innych programów, ale niewidocznej dla użytkownika. Oprócz słów kluczowych umieszczonych w początkowej sekcji strony HTML, są to np. znaczniki semantyczne. W specyfikacji HTML 5 jest cały zbiór tagów semantycznych, takich jak , ,
Indeks i sortowanie
Duże wyszukiwarki, które mają rozbudowane zaplecze serwerowe (Google, Bing), analizując stronę, zapisują jej dokładną kopię, co pozwala na pokazanie na liście wyników wyszukiwania słów kluczowych w kontekście, w którym oryginalnie występują. Korzyścią z zapisania strony do pamięci cache wyszukiwarki jest także możliwość przejrzenia kopii w sytuacji awarii serwera hostującego witrynę.
Gdy indeks jest gotowy, wyszukiwarka potrzebuje jeszcze informacji o tym, jak posortować wyniki, by były jak najbliższe oczekiwaniom użytkownika. Google używa do tego celu mechanizmu Page Rank, który analizuje liczbę linków prowadzących do danej strony, uznając, że te z większą liczbą odniesień zawierają bardziej wiarygodne informacje niż te rzadziej polecane. Dodatkowo jest branych pod uwagę kilkaset innych czynników: pozycja stron linkujących, częstość klikania linków na liście wyników, charakter samej witryny (np. strony sklepów mają obniżony Page Rank, by wyeksponować serwisy informacyjne). Wśród kryteriów sortowania wyników są także indywidualne preferencje użytkownika, znane dzięki monitorowaniu jego aktywności.
Wyszukiwarki mobilne
Na platformach mobilnych rozpowszechniły się wyszukiwarki rozpoznające pytania zadawane głosowo. Najbardziej rozreklamowaną z nich jest Apple Siri, która jest zintegrowana z mobilnym systemem iOS. Użytkownicy Androida mogą skorzystać z podobnych aplikacji: Iris oraz Evi, które można zainstalować za darmo w sklepie Google Play. Programy te łączą kilka funkcji. Przede wszystkim potrafią przekonwertować mowę na tekst, a następnie zdecydować, za pomocą jakiego mechanizmu wyszukiwania rozpoznać dane pytanie. Dzięki temu spełniają rolę nie tylko wyszukiwarki, ale także osobistego asystenta użytkownika. Niedogodnością tych programów z punktu widzenia polskiego użytkownika jest fakt, że jak dotąd w pełni skutecznie obsługują tylko język angielski.
W numerze PC Format 6/2014 jest plyta z której chciałem zainstalować program Ashampoo Winoptimizer 2014. Po włożeniu płyty pokazał mi sie napis " brak tego pliku". Dobrze, ze udalo mi sie zainstalować starszy program z 2013 roku - ale czy o to chodzi, kuzwa??? Do tej pory nie miałem żadnych kłopotów z plytami PC Format, a tu taka wtopa!!! Wstyd, wstyd i nic więcej!!!Zawsze PC Format byl u mnie Nr 1, ale teraz...
Po założeniu konta otrzymujesz możliwość oceniania materiałów, uczestnictwa w życiu forum oraz komentowania artykułów i aktualności przy użyciu indywidualnego identyfikatora.