Программное обеспечение фильтрации нежелательного содержимого интернет-сайтов
3 августа 2006
Рубрика: Интернет и сети.
Автор: Мухсинжон Мухитдинов, Атхам Миразизов.

pic

В последнее время в нашем обществе все больше вопросов вызывает проблема влияния содержимого ресурсов cети Интернет на гармоничное формирование личности в условиях современных культурных, религиозных, моральных, социальных течений в мировом сообществе. Это, в свою очередь, вызывает необходимость пристального изучения этого явления и поиска путей предотвращения доступа к ресурсам, несущим в себе отклонения от мировоззрения цивилизованного общества.

Это обусловлено тем, что cеть Интернет наряду с многообразием и наполненностью информацией практически обо всех аспектах развития и достижений человечества вместе с этим имеет контент, который может отрицательно влиять на развитие личности.

Следует отметить, что в «зону риска» в первую очередь попадают несовершеннолетние лица, находящиеся на этапе становления своих личностных качеств и проводящие большое время в Интернете. Многогранность Сети приводит к разделению категорий пользователей на геймеров, ридеров, видеопользователей, меломанов и т.д. В целях привлечения посетителей владельцы веб-сайтов размещают рекламные банеры, которые поставляются автоматически с различных банерообменных сетей. Избегая дополнительных накладных расходов, некоторые создатели подобных сетей обмена рекламой сайтов не заинтересованы в проверке достоверности рекламных объявлений. Это приводит к появлению на веб-сайтах рекламных объявлений, щелкая по которым, пользователи попадают на веб-сайты с сомнительным с точки зрения общепринятой морали содержанием. Другой путь попадания на такие ресурсы возможен через результаты работы поисковых машин.

Приходится сталкиваться с тем, что ввод некоторых ключевых слов приводит к появлению массы ссылок на нежелательные веб-сайты. Свою лепту в это вносят спамеры, рассылающие электронные письма с подобного рода ссылками.

Согласно официальным данным, число пользователей Интернета в Узбекистане достигло 1,2 миллиона человек. В диаграмме (Рис. 1) приведена динамика роста числа пользователей в Узбекистане.

pic

Учитывая то, что большую часть населения составляет молодежь, можно предположить, что больше половины этих пользователей составляют люди, находящиеся на стадии становления. Традиционно главенствующую роль в нравственном воспитании молодежи имели родители, семья, общество. Однако бурное развитие Интернета за последние годы приводит к все большему влиянию интернет-культуры на сознание людей, позитивная роль которой несомненна. При этом следует иметь в виду, что наряду с этим имеет место и негативное воздействие.

Конечно, такие явления не остаются без внимания разработчиков программного обеспечения, предоставляющих различные инструменты блокирования доступа к нежелательному содержимому. Рассмотрим некоторые методы и аспекты функционирования такого рода программного обеспечения.

Как и в любых других системах, существуют два подхода к решению этих задач — централизованный с использованием программного обеспечения сервера посредника (PROXY) и децентрализованный с применением программного обеспечения конечного (клиентского) компьютера. В некоторых сегментах Сети могут применяться комбинированные методы. Схема на рис. 2 демонстрирует централизованный, так называемый серверный подход.

pic

Здесь мы замечаем наличие единой базы адресов сайтов, имеющих нежелательное содержимое, клиентские запросы, доступ к которым может быть соответствующим образом обработан со стороны владельцев этого сегмента Сети. При этом остается открытой возможность обхода этого ограничения через подключение, временное или постоянное, к другому поставщику. Следующим недостатком этого решения является то, что применение PROXY одностороннее, то есть отсутствует механизм обратной связи с пользователями сегмента Сети. Подобное программное обеспечение устанавливают администраторы корпоративных сетей, согласно принятым в организации правилам использования интернет-ресурсов. Это является необходимой мерой для бизнеса, который заинтересован в эффективном использовании информационных ресурсов только для решения своих задач и стремится обеспечить как информационную безопасность предприятия, так и ограничить доступ сотрудников к бесполезным с точки зрения организации интернет-сайтам.

Очевидно, что такое решение трудно применить для индивидуальных пользователей, предпочитающих настраивать доступ к определенным ресурсам в зависимости от предпочтений различных людей. Примером такой среды может быть семья, в которой родители хотели бы блокировать доступ своих детей к информации в Интернете, которая, по их мнению, может негативно повлиять на развитие ребенка, а с другой стороны — управлять поведением самой системы фильтрации. Кроме того, необходимо предоставить возможность дополнения или удаления ссылок в стандартные списки адресов сайтов с сомнительным содержанием. Для удовлетворения этого спроса уже существуют некоторые решения. Например, Internet Content Rating Association (ICRA) — международная некоммерческая организация, уже несколько лет продвигает систему классификации содержания сайтов на предмет наличия порнографии, насилия, пропаганды ненависти и наркотиков и других материалов, нежелательных для просмотра детьми. Система эта добровольная. Сайты сами по заданной форме описывают свой контент, на основании чего автоматически определяется их рейтинг, который в виде специального тега вносится в их html-код. Разработанная программа, ориентируясь по этим тегам, ограничивает доступ на сайты в соответствии с индивидуальными настройками.

Kid Safe — выполненный в виде отдельной программы просмотра Интернета (браузера), позволяет контролировать веб-серфинг детей дошкольного возраста.
Net Nanny — встраиваемое в браузер программное обеспечение, позволяющее блокировать доступ к веб-сайтам на основе встроенного словаря, содержащего ключевые слова.

Кстати, эти программы достаточно доступны по цене: фильтр Net Nanny стоит $39.95, а Kid Safe — $15.

В приведенной таблице 1 показаны основные характеристики этих программных продуктов.

pic
Таблица 1.

Одним из основных недостатков всех перечисленных программ фильтрации является англоязычная ориентированность на содержимое сайтов, ключевых слов, баз данных о нежелательных ресурсах. ICRA же полагается на ответственность самих издателей сомнительных сайтов, которые должны вносить в заголовки своих веб-страниц информацию о рейтинге своего ресурса. К сожалению, почти все владельцы сайтов этого не делают.

pic

Между прочим, по сообщениям ИТАР-ТАСС, министр образования и науки РФ Андрей Фурсенко предложил установить на каждом школьном компьютере систему фильтрации сайтов агрессивного содержания. По его словам, министерство уже разработало «систему контентной фильтрации (проверки на содержание), которая эффективно отсекает негативную информацию и обеспечивает безопасный доступ». По желанию родителей эта система может быть установлена и на домашнем компьютере. Андрей Фурсенко подчеркнул, что подобная система фильтрации негативной информации внедряется во всем мире.

Исходя из потребностей быстрорастущего узбекского сегмента сети Интернет и применяя современные методы разработки программного обеспечения, Центром подготовки и поддержки молодых программистов разработана система фильтрации доступа к нежелательному содержимому сайтов «Defender». Схематично принцип работы системы представлен на рис. 3.

pic

В ходе проектирования и разработки были учтены положительные стороны существующих зарубежных решений. Кроме того, данная система имеет единую базу данных стандартных списков адресов сайтов с сомнительным содержанием, на основе которых пользователи могут добавлять или удалять собственные ссылки. Это позволяет максимально оптимизировать систему фильтрации для отдельно взятых пользователей.

pic

Изображенный на рис. 4 алгоритм работы клиентской части фильтра позволяет при вводе строки запроса в браузер обратиться в локальную базу нежелательных ссылок на предмет совпадения введенного адреса со списком нежелательных (нерекомендованных) страниц сети Интернет. Блокировка происходит на уровне страниц, а не сайтов. Это позволяет вести «тонкую» фильтрацию содержимого одного и того же сайта. В случае совпадения выдается окно оповещения и отображение страницы прекращается. В противном случае процесс навигации для пользователя остается прозрачным.

При желании пользователь, обладающий правами, может ввести или удалить ссылки из локальной базы. Например, когда родители обнаружили ранее неизвестный сомнительный ресурс, им достаточно ввести его адрес в локальную БД. Или в обратном случае, удалить его.

При установке фильтра можно задать периодичность обновления локальной базы. Это позволяет иметь наиболее свежую информацию об адресах страниц с нежелательным содержимым, накопленным в центральной базе данных системы.
Следует отметить, что программное обеспечение «Defender» зарегистрировано в Государственном патентном ведомстве Республики Узбекистан за № DGU 01088. Демонстрационную версию этой программы можно скачать по ссылке http://project.cppmp.uz/index.php?action=software.

pic

Orphus system
В Telegram
В Одноклассники
ВКонтакте