Поиск на компьютере — теперь и от Яндекса.
8 января 2006
Рубрика: Интернет и сети.
Автор: .
pic
Я тебе, застолье, больше не тамада
Поищи другого дурачка с бубном.
Михаил Щербаков. Флейтист

Наш журнал писал уже о замечательных программах поиска по компьютеру (десктопу) от Гугля и Microsoft. При всех плюсах и технологических проработках оба эти поиска не имели важнейшей для нас черты – морфологического анализа, поиска с учетом вариантов написаний, склонений, спряжений и так далее. Это часто сводило на нет работу поиска – так как мы не всегда знаем Фому написания искомого, часто нужен «нежесткий» поиск всех форм нужного слова.

И вот, наконец, и Яндекс порадовал нас появлением своей программы поиска по настольному компьютеру, как подметили остроумные журналисты – «Яндеск» (обыграли слово десктоп). Главное, что теперь можно осуществлять с ее помощью полнотекстовый поиск с учётом морфологии русского языка по файлам разных форматов. Для начала скачайте дистрибутив программы с сайта http://desktop.yandex.ru (размер файла 2,3 Мб) и запустите инсталляционный файл. Потом начинается процесс индексации (в трее переливается серо-красная буква »Я») Первичная индексация – когда программа обрабатывает только документы, которые были недавно созданы, просмотрены или изменены пользователем, выполняется сразу после установки программы. Полная обработка всех файлов происходит тогда, когда компьютер не используется пользователем. Процесс полной индексации запускается автоматически, если в течение 30 секунд не происходит обращений к клавиатуре или мыши, и загрузка процессора составляет не более 35%. В тот момент, когда пользователь начинает работать с клавиатурой или мышью, индексация приостанавливается. В случае если пользователь включил режим принудительной индексации, загрузка процессора и работа с устройствами ввода не учитываются. После окончания индексации буква «Я» в трее становится красной и не переливается. Индексный файл моего компьютера имеет «вес» почти 250 Мб, на полную индексацию ушло два календарных дня.

В первой публичной версии (она имеет номер 0.9.7) список поддерживаемых форматов не очень велик, охвачены пока только самые распространенные форматы. Это, разумеется, текстовые и HTML-файлы (в том числе браузерный кэш), документы Microsoft Office, PDF, Macromedia Flash, музыка в формате MP3, почтовые базы Outlook и Outlook Express. Для остальных файлов индексируются только имена, но не содержимое или метаданные. При желании индексацию отдельных типов файлов можно отключить.

Это было введение. Теперь о работе программы поиска. Она дает просто потрясающие результаты! Вчера, например, понадобился срочно закон Ципфа, причем, я точно знаю, что у меня были материалы о нем, но где именно – не помню. Так вот – поиск от Гугля не нашел ни одного документа, а поиск от Яндекса нашел аж 37 документов – сохраненные из сети странички и упоминания в моих статьях. Так что сравнения при поиске в русских текстах, безусловно, в пользу Яндекса! Он же нашел и строки эпиграфа к этой части – другие поисковики эти строки из песни Щербакова на запрос «поищем» естественно не находили. Отлично подспорье в работе.

pic
pic

Как и Google Desktop, персональный поиск «Яндекса» работает через веб-интерфейс в любом браузере. Страница с результатами поиска имеет шесть закладок с категориями поиска (документы, музыка, письма и т.д.). По умолчанию задействована закладка «Мой компьютер», на которой выводятся первые результаты для остальных категорий. На вкладке «Документы» выводятся ссылки на документы Office, PDF, текстовые и HTML-файлы, вкладка «Музыка» отведена под MP3. Щелкнув на закладке «Письма» можно прочитать найденные в архиве Outlook электронные послания, а вкладка «Сохраненные страницы» служит для результатов из кэша браузера. Наконец, на вкладке «Файлы» выводятся ссылки на файлы всех остальных форматов и на папки, соответствующие запросу. Результаты поиска на этой вкладке группируются по папкам. Это относится как к обычным файлам, так и ко вложенным папкам. Причем, почти все эти параметры настраиваются, я, например, не работаю с Outlook’ом, поэтому поиск в нем отключаю.

pic
pic

В некоторых публикациях были сведения о том, что Яндексдесктоп пытается постоянно выйти в Сеть и передать какие-то данные. Разработчики в официальном «хелпе» говорят, что он просто проверяет наличие обновлений. У меня за все время локальной работы попытки выйти в Сеть не наблюдались.

И, напоследок, две фантастические идеи. Первая – связать через Сеть индексные файлы всех компьютеров… даже голова кружится от попыток продолжить развивать эту мысль дальше, оставим это фантастам. Хотя технически это уже возможно сейчас. Вторая – на основе анализа содержания нашего компьютера Гугль или Microsoft или Яндекс рисует себе портрет наших предпочтений и на основе их не только предлагает нам рекламу, но и проводит поиск в Сети, предоставляя в первую очередь именно то, что нам интересно. Если это будет не навязчиво и толково исполнено, то сделает работу с Сетью намного комфортней и более персонализированной.

Итак, сделан еще один шажок искусственного интеллекта прямо в наши компьютеры, мы должны встретить его достойно – полностью и с удовольствием использовать для своих нужд. Больше времени и возможностей для творчества.

Orphus system
Подписывайтесь на канал infoCOM.UZ в Telegram, чтобы первыми узнавать об ИКТ новостях Узбекистана
В Telegram
В Одноклассники
ВКонтакте