Предмет: Основы работы в интернете
Оглавление темы : Поиск информации в Интернет
1 Проблема поиска информации
2 Работа с поисковыми серверами
3 Работа с каталогами ресурсов
4 Правила поиска
Вопросы и задания:
1. Изучите работу поисковых серверов Яndex, Апорт, Rambler, Altervista. Создайте в "Избранном" вложенные папки, в которых сделайте подборку ссылок по темам: а) популярные средства массовой информации в Сети; б) лучшие финансовые сайты; в) сайты, посвященные Вашей профессиональной деятельности.
2. Познакомьтесь с каталогами ресурсов List.ru, 1000Stars, @Rus, Первый русский каталог , Yahoo
3. Используя поисковые средства и возможности сохранения страниц, создайте подборки информации по трем различным темам, например: а)Развитие Интернет в России; б) Кошки и другие кошачьи; в) Главные новости этого месяца.
1) Проблема поиска информации. Существует во многом справедливое мнение, что уже сегодня в Интернет “есть все” и проблема лишь в том, как найти нужную информацию. Сама открытая архитектура Сети способствует тому, что в ней отсутствует какая-либо централизация и ценнейшие для Вас данные, которые Вы безуспешно искали по всему свету, могут оказаться расположенными на сервере в одном городе с Вами. В этом разделе мы рассмотрим основные приемы целенаправленного поиска информации в Сети.
Можно выделить 2 взаимодополняющих подхода к сбору информации о ресурсах Интернет – создание индексов и создание каталогов:
При первом способе мощные поисковые серверы непрерывно “обыскивают” Интернет, создавая и пополняя базы данных, содержащие информацию о том, в каких документах Сети встречаются те или иные ключевые слова. Таким образом, реально поиск происходит не по серверам Internet, что было бы нереализуемо технически, а по базе данных поисковой машины, и отсутствие подходящей информации, найденной по запросу, еще не означает, что ее нет в Сети - можно попробовать воспользоваться другим поисковым средством или каталогом ресурсов. Базы данных поискового сервера пополняются не только автоматически. На любой крупной поисковой машине есть возможность проиндексировать свой сайт и добавить его в базу данных. Преимущество поискового сервера – простота работы с ним, недостаток – низкая степень отбора документов по запросу.
Во втором случае сервер организован как библиотечный каталог, содержащий иерархию разделов и подразделов, в которых хранятся ссылки на документы, соответствующие теме подраздела. Пополнение каталога обычно производится самими пользователями после проверки введенных ими данных администрацией сервера. Каталог ресурсов всегда лучше упорядочен и структурирован, но требуется время для поиска нужной категории, которую, к тому же, не всегда легко определить. Кроме того, объем каталога обычно меньше, чем количество сайтов, проиндексированное поисковой машиной.
2) Работа с поисковыми серверами. При входе на главную страницу поискового сервера достаточно набрать в поле ввода свой запрос в виде набора ключевых слов и нажать Enter или кнопку начала поиска.
Запросы могут содержать любые слова, причем, не обязательно заботиться о падежах и склонениях – например, запросы “реферат по философии” и “философия реферат” вполне корректны.
Современные поисковые сервера достаточно хорошо понимают естественный язык, однако, на многих из них сохранены возможности расширенного или специального поиска, позволяющие искать слова по маске, объединять слова запроса логическими операциями “И”, “ИЛИ”, и т.д.
Язык запросов поисковой машины Яndex описан по адресу http://www.yandex.ru/info/syntax.html - изучите этот документ!
После завершения поиска в базе данных сервер выводит на экран первую порцию из 10 или более документов, содержащих ключевые слова. Кроме ссылки, обычно приведено несколько строк текста описания документа или просто его начало. Открывая ссылки в новом или этом же окне браузера, можно переходить к выбранным документам, а строка ссылок внизу страницы позволяет перейти к следующей порции документов. Эта строка выглядит примерно так:
1 2 3 4 5 6 7 8 9 след
По отсутствию одной ссылки видно, что сейчас открыта вторая порция найденных документов.
Различные серверы сортируют найденные документы по разному – по дате создания, по посещаемости документа, по наличию в документе всех или части слов запроса (релевантности), некоторые серверы позволяют сузить область поиска, выбрав на главной странице категорию искомого документа – например, по запросу “банки” в категории “деловой мир” вряд ли будут найдены сведения о банках консервных.
Из популярных средств русскоязычного поиска можно назвать серверы wwwyandex.ru , wwwaport.ru и wwwrambler.ru, индексирующие десятки тысяч серверов и десятки миллионов документов. Из зарубежных серверов популярны wwwaltavista.com, wwwexcite.com, wwwHotbot.com, wwwLycos.com, wwwWebCrawler.com, wwwOpenText.com.
Наконец, в Интернет немало страниц для метапоиска, позволяющих обратиться сразу к нескольким популярным поисковым серверам с одним и тем же запросом – посмотрите, например, страницы wwwfind.ru или http://www.rinet.ru/buki.
3) Работа с каталогами ресурсов. При входе на главную страницу каталога мы попадаем в обширное меню или таблицу выбора категорий, каждая из которых может содержать вложенные подкатегории. Стандарта здесь нет, но все-таки структуры каталогов во многом похожи, везде можно найди разделы “бизнес” или “деловой мир”, “компьютеры”, “программирование” или “интернет”, “юмор” или “хобби” и т.д. Перемещаясь по категориям, можно добраться до ссылок на конкретные документы, которые, так же как на поисковом сервере, выдаются порциями и сопровождаются краткой информацией.
Сегодня существует множество крупных каталогов с десятками тысяч ссылок, из отечественных каталогов можно назвать wwwlist.ru, wwwweblist.ru, wwwstars.ru, wwwau.ru, wwwru, wwwulitka.ru, а из зарубежных - wwwYahoo.com, wwwMagellan.com
Часто в каталоге есть также форма для поиска по ключевым словам среди занесенных в него документов.
4) Правила поиска. В качестве резюме попробуем дать несколько простых советов, касающихся поиска в Сети.
заранее четко определите тему поиска, ключевые слова и время, которое Вы готовы на этот поиск потратить; выберите поисковый сервер – ссылки на лучшие из них полезно хранить в Избранном;
не бойтесь естественного языка, но проверяйте правильность написания слов, например, при помощи Microsoft Word;
используйте большие буквы только в именах и названиях. Многие поисковые сервера правильно обработают запрос “реферат”, но не “Реферат”;
не ставьте в запросах знаков препинания и избегайте “стоп-слов”, таких как “что”, “как”, “и”, “зачем” и т.д. Запрос “что такое когнитивная психология” нисколько не информативнее, чем запрос “когнитивная психология”;
пользуйтесь языком запросов, если поисковая машина его поддерживает. Например, по запросу +Грозный -Иван будут, скорее всего, найдены ссылки о городе, а не о царе;
локализуйте поиск – найдя сервер подходящей организации, перейдите на его главную страницу и попытайтесь поискать там;
в процессе поиска не отвлекайтесь на посторонние ссылки, какими бы интересными они ни казались.