20406
Президент РФ Владимир Путин подписал закон, дающий авиакомпаниям право продавать билеты на самолет по невозвратным тарифам, что должно способствовать снижению стоимости авиаперелета, сообщает агентство Прайм со ссылкой на пресс-службу Кремля
22740
Президент РФ Владимир Путин подписал закон об упрощенной выдаче российского гражданства соотечественникам, которые свободно владеют русским языком и живут либо проживали на территории СССР или Российской империи в границах современной РФ, сообщает РИА Новости
12053
Комиссия Госдумы по этике по поручению спикера Сергея Нарышкина, предположительно, на следующей неделе рассмотрит инцидент с участием лидера ЛДПР Владимира Жириновского, который оскорбил журналистку МИА «Россия Сегодня», сообщает РИА Новости.
3803
Парламент Крыма утвердил назначение экс-главы самообороны вице-премьером республики
8086
Роспотребнадзор не ожидает проблем с прохождением летнего оздоровительного сезона в Крыму, сообщает РИА Новости со ссылкой на главу ведомства Анну Попову
6700
Крымские отряды самообороны уберут все заборы, незаконно преграждающие проход к пляжам, сообщило правительство региона в своем микроблоге в Twitter.
4033
Высшая школа экономики продолжает цикл лекций в музеях Москвы. 24 апреля в Центре современной культуры «Гараж» состоится лекция «Истинная роль брендов в обществе постмодерна».
2971
Министр природных ресурсов: Природные пожары в этом году застали Россию врасплох
12035
Сотрудники столичной Госавтоинспекции ограничат движение в центре Москвы в понедельник из-за репетиции военного парада, который пройдет на Красной площади 9 мая, сообщает РИА Новости
9494
Власти Москвы могут отказаться от строительства одной станции на «зеленой» ветке метро
7478
Военную технику для участия в Параде Победы этой ночью перебросят на Ходынское поле
7911
Федеральное агентство по туризму (Ростуризм) выражает озабоченность вмешательством политики в туристическую отрасль на примере отказа чешского отеля принять российских туристов в знак протеста против присоединения Крыма к РФ, сообщила РИА Новости руководитель пресс-службы ведомства Ирина Щеголькова.
5286
МВД Украины утверждает, что телевышки в Донецке никто не захватывал, и каналы транслируются в обычном режиме, сообщает РИА Новости со ссылкой на сайт ведомства.
4045
В украинском Славянске неизвестные обесточили телецентр, транслирующий российские каналы
3141
Компромисс по ситуации на Украине должен быть найден внутри нее, а не между третьими игроками, например между РФ и США, заявил президент РФ Владимир Путин во время прямой линии с россиянами
3067
ЦБ РФ с 17 апреля отозвал лицензию у дагестанского банка «Каспий»
4013
Торговый дом «Шатер» рассматривает возможность строительства сафари-парка в Подмосковье
2859
Лоукост-авиакомпания «Добролет», созданная «Аэрофлотом», будет базироваться в Шереметьево
2876
«Ростелеком» построил линию связи с Крымом по дну Керченского пролива
4380
Павел Дуров: Мы не будем удалять ни антикоррупционное сообщество Навального, ни сотни других сообществ
3814
Google не раскрывает данные о первом дне продаж «умных» очков в США
2683
Чиновники бронируют адреса в новых доменах .москва и .moscow
2306
Компания Google отделила Крым от Украины на своих картах
4353
Суд отклонил иск мордовской колонии к Толоконниковой из-за ее письма об условиях труда
4336
Мировой суд в Москве рассмотрит дело Алексея Навального о клевете
2857
Глава Мосгорсуда Ольга Егорова подала документы в квалификационную коллегию на повторное занятие этой должности; таким образом, Егорова не претендует на занятие вакантного места председателя объединенного Верховного суда РФ
2919
Прокуроры заинтересовались художником, приковавшим гениталии к Красной площади
3346
Здания в центре Москвы украсят репродукциями знаменитых картин
3121
Фильм о русской Жанне Д'Арк покажут на открытии киномарафона в Крыму
2967
Харуки Мураками впервые за девять лет выпустил сборник новелл
3169
В Мексике скончался писатель Габриэль Гарсиа Маркес, его тело будет кремировано
5568
Менеджер Шумахера сообщила, что его состояние немного улучшилось
4061
Олимпийские кольца из Сочи подарят Греции
3700
Новый логотип чемпионата России по футболу будут выбирать болельщики
3125
Официальную песню чемпионата мира-2014 по футболу представили на YouTube
00:05 14/02/2012 Алексей Тимошенко 0 89

От «Яндекса» до белков

Лауреат президентской премии обещает сократить количество спама

Владимир Родионов

Лауреат премии президента России для молодых ученых Андрей Райгородский возглавляет кафедру дискретной математики амбициозного факультета инноваций и высоких технологий Московского физико-технического института. Он также является профессором МГУ и главой исследовательского центра компании «Яндекс». «Только, пожалуйста, не пишите, что это Райгородский придумал поиск «Яндекса»! — просит он. — Мы немного улучшили поиск, а не создали его с нуля». В интервью «МН» лауреат рассказал о том, как фундаментальные математические проблемы помогают улучшать работу поисковика «Яндекс», какие задачи ученые решают почти сто лет, и о том, что общего между живой клеткой и московскими пробками на дорогах.

— Ваша работа, понятно, не сводится к оптимизации поиска в интернете?

— Даже в «Яндексе» мы ведем как прикладные, так и теоретические исследования. В частности, мы создаем модели веба, так называемые веб-графы. А вообще я занимаюсь теорией графов и дискретной математикой, в частности комбинаторикой.

Райгородский берет мел и рисует на доске несколько точек.

— Это сайты. Вот, к примеру, сайт номер один — пусть будет «Яндекс». Вот сайт номер два — МФТИ. Номер три — мой собственный; я ссылаюсь на первый и второй, — здесь ученый проводит две стрелки, соединяя точки друг с другом, — а МФТИ и «Яндекс» ссылаются друг на друга. Вся эта система из точек и стрелочек и есть граф, от греческого «рисунок», как «графика»; объект очень простой с виду и в то же время фундаментальный. Наша задача — создать такой веб-граф, который будет максимально соответствовать реальности.

— Рано или поздно проблема спама будет решена? То есть поисковые системы смогут искать действительно человеческие сайты, а не многократно скопированные тексты?

— Конечно, это еще и вечное противостояние брони и снаряда. Мы пытаемся делать более адекватный поиск, спамеры пытаются наши алгоритмы обмануть; об окончательном решении тут говорить не приходится. Но мы придумываем новые способы борьбы с черным SEO.

— Например?

— Подробно рассказать про новые методы не могу, это же секрет «Яндекса». Но вот один из простых методов: можно анализировать число определенных букв или слогов на странице, это очень простой показатель, который часть спама отсекает.

— И это, как я понимаю, уже не совсем графы, то есть вам важны не только ссылки со страницы и на нее?

— У нас занимаются и машинной обработкой текста, и много чем еще — правда, это уже без моего участия.

— А есть ли среди них такие, которые были бы понятны и не математикам? Или пусть уже решенные, но объясняющие, почему такой вроде бы простой объект, как граф, так долго изучается?

— Пожалуйста: задача о четырех красках. Есть карта мира, нам ее надо раскрасить в разные цвета четырьмя красками, и очевидным образом соседние страны надо красить в разные цвета. Вопрос: для любой ли карты задача решаема? То есть может ли быть такая конфигурация стран, при которой две соседние неизбежно будут одного цвета? Эту задачу решали почти сто лет, а ее решение в итоге заняло десятки страниц, сложнейшая теорема, между прочим.

— И каков ответ?

— Можно раскрасить.

— В чем, кроме чистой математики, состоит ваша работа? То есть чем еще приходится заниматься, кроме доказательства теорем?

— Мы ставим эксперименты.

— Какие могут быть опыты в математике?

— Мы меняем модель веба и смотрим, будет ли она соответствовать реальности. Или меняем настройки поисковой машины и проверяем, как это повлияло на качество поиска.

— То есть это снова моделирование, и для занятия этим, получается, кроме специальных знаний требуется только компьютер?

— Нет. Лишь некоторые простые вещи можно смоделировать с использованием простого ноутбука. Если мы говорим об изменении механики поиска или больших расчетах, то приходится переходить к расчетам на кластерах, то есть практически суперкомпьютерах. В «Яндексе» все это есть, но со стороны выглядит все точно так же — сидят люди за компьютерами, что-то делают.

— Насколько радикально при этом меняется поиск? То есть вам приходится переделывать все заново или это скорее тонкая настройка?

— Изменить все радикально, переписать с нуля — это фактически уже невозможно. Вероятно, сейчас алгоритмы далеко не идеальны, но мы не можем взять и создать все сначала, слишком уж сложная задача. А вот немного улучшать вполне реально.

— Какие еще у фундаментальных математических результатов могут быть практические приложения?

— Это лучшее моделирование белок-белковых взаимодействий, например. Или городское планирование. Мы этим не занимаемся просто в силу того, что нельзя делать все сразу, хотя это все очень интересно. И главным нашим достижением я считаю создание школы.

— Школа анализа данных, проект «Яндекса»?

— Нет, я не про школу анализа данных, хотя я там действительно преподаю. Речь идет о научной школе, самовоспроизводящейся группе людей, которая занимается современной и интересной математикой, которая в свою очередь помогает решать и вполне конкретные задачи. Это и в Физтехе, и в «Яндексе». И премия, я думаю, конечно, должна рассматриваться как премия нашей группе в целом.

 

Поиск жизни в интернете

Search Engine Optimisation (SEO) — оптимизация страниц под поисковые машины, совокупность приемов, позволяющих сделать сайт более заметным для «Яндекса» или Google. Честные методы включают в себя, например, задание подробных описаний для иллюстраций: картинку с видимой поисковику аннотацией «тройной стеклопакет в разрезе» по запросу «окна» найти проще, чем безликий 0034.png. А типичный пример грязного приема — создать сотню мусорных страниц со ссылками на раскручиваемый сайт или, хуже того, при помощи специальной программы или нанятых за минимальную плату школьников разместить множество ссылок на различных форумах и в гостевых книгах. Одна из задач, которую можно решить созданием моделей веб-графа, — различение массового упоминания бло-госферой действительно важного события от попытки безвестного предпринимателя повысить в рейтинге свой сайт.