13759
Президент РФ Владимир Путин подписал закон, дающий авиакомпаниям право продавать билеты на самолет по невозвратным тарифам, что должно способствовать снижению стоимости авиаперелета, сообщает агентство Прайм со ссылкой на пресс-службу Кремля
14540
Президент РФ Владимир Путин подписал закон об упрощенной выдаче российского гражданства соотечественникам, которые свободно владеют русским языком и живут либо проживали на территории СССР или Российской империи в границах современной РФ, сообщает РИА Новости
8250
Комиссия Госдумы по этике по поручению спикера Сергея Нарышкина, предположительно, на следующей неделе рассмотрит инцидент с участием лидера ЛДПР Владимира Жириновского, который оскорбил журналистку МИА «Россия Сегодня», сообщает РИА Новости.
2645
Парламент Крыма утвердил назначение экс-главы самообороны вице-премьером республики
5114
Роспотребнадзор не ожидает проблем с прохождением летнего оздоровительного сезона в Крыму, сообщает РИА Новости со ссылкой на главу ведомства Анну Попову
4413
Крымские отряды самообороны уберут все заборы, незаконно преграждающие проход к пляжам, сообщило правительство региона в своем микроблоге в Twitter.
2878
Высшая школа экономики продолжает цикл лекций в музеях Москвы. 24 апреля в Центре современной культуры «Гараж» состоится лекция «Истинная роль брендов в обществе постмодерна».
2133
Министр природных ресурсов: Природные пожары в этом году застали Россию врасплох
7707
Сотрудники столичной Госавтоинспекции ограничат движение в центре Москвы в понедельник из-за репетиции военного парада, который пройдет на Красной площади 9 мая, сообщает РИА Новости
6436
Власти Москвы могут отказаться от строительства одной станции на «зеленой» ветке метро
4915
Военную технику для участия в Параде Победы этой ночью перебросят на Ходынское поле
5442
Федеральное агентство по туризму (Ростуризм) выражает озабоченность вмешательством политики в туристическую отрасль на примере отказа чешского отеля принять российских туристов в знак протеста против присоединения Крыма к РФ, сообщила РИА Новости руководитель пресс-службы ведомства Ирина Щеголькова.
3675
МВД Украины утверждает, что телевышки в Донецке никто не захватывал, и каналы транслируются в обычном режиме, сообщает РИА Новости со ссылкой на сайт ведомства.
2848
В украинском Славянске неизвестные обесточили телецентр, транслирующий российские каналы
2357
Компромисс по ситуации на Украине должен быть найден внутри нее, а не между третьими игроками, например между РФ и США, заявил президент РФ Владимир Путин во время прямой линии с россиянами
2278
ЦБ РФ с 17 апреля отозвал лицензию у дагестанского банка «Каспий»
2708
Торговый дом «Шатер» рассматривает возможность строительства сафари-парка в Подмосковье
2077
Лоукост-авиакомпания «Добролет», созданная «Аэрофлотом», будет базироваться в Шереметьево
2102
«Ростелеком» построил линию связи с Крымом по дну Керченского пролива
3287
Павел Дуров: Мы не будем удалять ни антикоррупционное сообщество Навального, ни сотни других сообществ
2877
Google не раскрывает данные о первом дне продаж «умных» очков в США
2220
Чиновники бронируют адреса в новых доменах .москва и .moscow
1934
Компания Google отделила Крым от Украины на своих картах
3110
Суд отклонил иск мордовской колонии к Толоконниковой из-за ее письма об условиях труда
3050
Мировой суд в Москве рассмотрит дело Алексея Навального о клевете
2094
Глава Мосгорсуда Ольга Егорова подала документы в квалификационную коллегию на повторное занятие этой должности; таким образом, Егорова не претендует на занятие вакантного места председателя объединенного Верховного суда РФ
2128
Прокуроры заинтересовались художником, приковавшим гениталии к Красной площади
2396
Здания в центре Москвы украсят репродукциями знаменитых картин
2257
Фильм о русской Жанне Д'Арк покажут на открытии киномарафона в Крыму
2121
Харуки Мураками впервые за девять лет выпустил сборник новелл
2266
В Мексике скончался писатель Габриэль Гарсиа Маркес, его тело будет кремировано
3976
Менеджер Шумахера сообщила, что его состояние немного улучшилось
2908
Олимпийские кольца из Сочи подарят Греции
2671
Новый логотип чемпионата России по футболу будут выбирать болельщики
2276
Официальную песню чемпионата мира-2014 по футболу представили на YouTube
00:05 14/02/2012 Алексей Тимошенко 0 46

От «Яндекса» до белков

Лауреат президентской премии обещает сократить количество спама

Владимир Родионов

Лауреат премии президента России для молодых ученых Андрей Райгородский возглавляет кафедру дискретной математики амбициозного факультета инноваций и высоких технологий Московского физико-технического института. Он также является профессором МГУ и главой исследовательского центра компании «Яндекс». «Только, пожалуйста, не пишите, что это Райгородский придумал поиск «Яндекса»! — просит он. — Мы немного улучшили поиск, а не создали его с нуля». В интервью «МН» лауреат рассказал о том, как фундаментальные математические проблемы помогают улучшать работу поисковика «Яндекс», какие задачи ученые решают почти сто лет, и о том, что общего между живой клеткой и московскими пробками на дорогах.

— Ваша работа, понятно, не сводится к оптимизации поиска в интернете?

— Даже в «Яндексе» мы ведем как прикладные, так и теоретические исследования. В частности, мы создаем модели веба, так называемые веб-графы. А вообще я занимаюсь теорией графов и дискретной математикой, в частности комбинаторикой.

Райгородский берет мел и рисует на доске несколько точек.

— Это сайты. Вот, к примеру, сайт номер один — пусть будет «Яндекс». Вот сайт номер два — МФТИ. Номер три — мой собственный; я ссылаюсь на первый и второй, — здесь ученый проводит две стрелки, соединяя точки друг с другом, — а МФТИ и «Яндекс» ссылаются друг на друга. Вся эта система из точек и стрелочек и есть граф, от греческого «рисунок», как «графика»; объект очень простой с виду и в то же время фундаментальный. Наша задача — создать такой веб-граф, который будет максимально соответствовать реальности.

— Рано или поздно проблема спама будет решена? То есть поисковые системы смогут искать действительно человеческие сайты, а не многократно скопированные тексты?

— Конечно, это еще и вечное противостояние брони и снаряда. Мы пытаемся делать более адекватный поиск, спамеры пытаются наши алгоритмы обмануть; об окончательном решении тут говорить не приходится. Но мы придумываем новые способы борьбы с черным SEO.

— Например?

— Подробно рассказать про новые методы не могу, это же секрет «Яндекса». Но вот один из простых методов: можно анализировать число определенных букв или слогов на странице, это очень простой показатель, который часть спама отсекает.

— И это, как я понимаю, уже не совсем графы, то есть вам важны не только ссылки со страницы и на нее?

— У нас занимаются и машинной обработкой текста, и много чем еще — правда, это уже без моего участия.

— А есть ли среди них такие, которые были бы понятны и не математикам? Или пусть уже решенные, но объясняющие, почему такой вроде бы простой объект, как граф, так долго изучается?

— Пожалуйста: задача о четырех красках. Есть карта мира, нам ее надо раскрасить в разные цвета четырьмя красками, и очевидным образом соседние страны надо красить в разные цвета. Вопрос: для любой ли карты задача решаема? То есть может ли быть такая конфигурация стран, при которой две соседние неизбежно будут одного цвета? Эту задачу решали почти сто лет, а ее решение в итоге заняло десятки страниц, сложнейшая теорема, между прочим.

— И каков ответ?

— Можно раскрасить.

— В чем, кроме чистой математики, состоит ваша работа? То есть чем еще приходится заниматься, кроме доказательства теорем?

— Мы ставим эксперименты.

— Какие могут быть опыты в математике?

— Мы меняем модель веба и смотрим, будет ли она соответствовать реальности. Или меняем настройки поисковой машины и проверяем, как это повлияло на качество поиска.

— То есть это снова моделирование, и для занятия этим, получается, кроме специальных знаний требуется только компьютер?

— Нет. Лишь некоторые простые вещи можно смоделировать с использованием простого ноутбука. Если мы говорим об изменении механики поиска или больших расчетах, то приходится переходить к расчетам на кластерах, то есть практически суперкомпьютерах. В «Яндексе» все это есть, но со стороны выглядит все точно так же — сидят люди за компьютерами, что-то делают.

— Насколько радикально при этом меняется поиск? То есть вам приходится переделывать все заново или это скорее тонкая настройка?

— Изменить все радикально, переписать с нуля — это фактически уже невозможно. Вероятно, сейчас алгоритмы далеко не идеальны, но мы не можем взять и создать все сначала, слишком уж сложная задача. А вот немного улучшать вполне реально.

— Какие еще у фундаментальных математических результатов могут быть практические приложения?

— Это лучшее моделирование белок-белковых взаимодействий, например. Или городское планирование. Мы этим не занимаемся просто в силу того, что нельзя делать все сразу, хотя это все очень интересно. И главным нашим достижением я считаю создание школы.

— Школа анализа данных, проект «Яндекса»?

— Нет, я не про школу анализа данных, хотя я там действительно преподаю. Речь идет о научной школе, самовоспроизводящейся группе людей, которая занимается современной и интересной математикой, которая в свою очередь помогает решать и вполне конкретные задачи. Это и в Физтехе, и в «Яндексе». И премия, я думаю, конечно, должна рассматриваться как премия нашей группе в целом.

 

Поиск жизни в интернете

Search Engine Optimisation (SEO) — оптимизация страниц под поисковые машины, совокупность приемов, позволяющих сделать сайт более заметным для «Яндекса» или Google. Честные методы включают в себя, например, задание подробных описаний для иллюстраций: картинку с видимой поисковику аннотацией «тройной стеклопакет в разрезе» по запросу «окна» найти проще, чем безликий 0034.png. А типичный пример грязного приема — создать сотню мусорных страниц со ссылками на раскручиваемый сайт или, хуже того, при помощи специальной программы или нанятых за минимальную плату школьников разместить множество ссылок на различных форумах и в гостевых книгах. Одна из задач, которую можно решить созданием моделей веб-графа, — различение массового упоминания бло-госферой действительно важного события от попытки безвестного предпринимателя повысить в рейтинге свой сайт.