Яндекс. Новости показывают карты

pic
С 23 июня 2006 года сюжеты Яндекс.Новостей, в которых упомянуты географические адреса, связанные с описываемыми событиями, иллюстрируются соответствующими фрагментами карты города. Поиск адресов в новостях и подбор необходимого фрагмента карты для иллюстрации основаны на технологии извлечения фактов, разработанной в Яндексе.

Адреса обычно упоминаются в региональных новостях: это может быть,
например, строительство нового дома, уличный концерт или ДТП. Увидеть,
как работает привязка события к карте, можно в новостях Москвы
( http://news.yandex.ru/Moscow/ ), Екатеринбурга
( http://news.yandex.ru/Yekaterinburg/ ), Киева
( http://news.yandex.ru/Kiev/ ) и прочих регионов. Всего сейчас
обрабатывается 10 городов ( http://maps.yandex.ru/?index=1 ).

«Бывает, что, читая новость, узнаешь, что в твоем городе что-то
происходит или планируется, и пытаешься мучительно догадаться, где же
этот переулок или проезд. Теперь пользователь сразу видит нужное место
на карте, — говорит Татьяна Платонова, руководитель службы
Яндекс.Новости. — А если он захочет рассмотреть подробнее, то одним
кликом сможет перейти на большую карту в “Яндекс в картах».

Весь процесс, от поиска и выделения адреса в тексте новости до
формирования иллюстрации к сюжету, происходит автоматически.
Используется словарь слов , обозначающих адресные объекты (улица,
площадь, набережная, мост и пр.). Такой подход позволил создать
универсальный инструмент, не зависящий от адресной базы конкретного города.

«С технологической точки зрения интересной задачей оказалось определение
города, к которому относится упомянутый в новости адрес. Дело в том, что
авторы новостных сообщений достаточно редко пишут город непосредственно
рядом с улицей, — говорит Лев Гершензон, ведущий разработчик компании
«Яндекс». — Для решения этой задачи пришлось из каждого новостного
сообщения выделять все названия населенных пунктов, а потом выбирать
самое «релевантное» — в зависимости от количества вхождений в документ,
от расположения в документе и т.п.»

Технология извлечения данных (fact extraction) в Яндекс.Новостях впервые
была применена почти год назад для автоматического выделения главных
действующих лиц новостных сюжетов и составления автоматических рейтингов
наиболее популярных персон («Яндекс.Новости в лицах»
http://news.yandex.ru/names/ ). Весной был открыт доступ к
пресс-портретам ( http://company.yandex.ru/news/2006/0404/ ) — справочной
информации о людях, автоматически извлеченной из новостей СМИ.
Автоматическое выделение и отождествление адресов построено на той же
технологии.

pic

Примечание: в этой новости нет ни одного адреса, кроме «интернет». А
если бы был упомянут, например, адрес офиса Яндекса в Москве: ул.
Самокатная д.1, то рядом появился бы такой фрагмент карты:
http://company.yandex.ru/i/karta_k_novosti.jpg

Orphus system