20402
Президент РФ Владимир Путин подписал закон, дающий авиакомпаниям право продавать билеты на самолет по невозвратным тарифам, что должно способствовать снижению стоимости авиаперелета, сообщает агентство Прайм со ссылкой на пресс-службу Кремля
22736
Президент РФ Владимир Путин подписал закон об упрощенной выдаче российского гражданства соотечественникам, которые свободно владеют русским языком и живут либо проживали на территории СССР или Российской империи в границах современной РФ, сообщает РИА Новости
12052
Комиссия Госдумы по этике по поручению спикера Сергея Нарышкина, предположительно, на следующей неделе рассмотрит инцидент с участием лидера ЛДПР Владимира Жириновского, который оскорбил журналистку МИА «Россия Сегодня», сообщает РИА Новости.
3803
Парламент Крыма утвердил назначение экс-главы самообороны вице-премьером республики
8082
Роспотребнадзор не ожидает проблем с прохождением летнего оздоровительного сезона в Крыму, сообщает РИА Новости со ссылкой на главу ведомства Анну Попову
6698
Крымские отряды самообороны уберут все заборы, незаконно преграждающие проход к пляжам, сообщило правительство региона в своем микроблоге в Twitter.
4033
Высшая школа экономики продолжает цикл лекций в музеях Москвы. 24 апреля в Центре современной культуры «Гараж» состоится лекция «Истинная роль брендов в обществе постмодерна».
2971
Министр природных ресурсов: Природные пожары в этом году застали Россию врасплох
12028
Сотрудники столичной Госавтоинспекции ограничат движение в центре Москвы в понедельник из-за репетиции военного парада, который пройдет на Красной площади 9 мая, сообщает РИА Новости
9493
Власти Москвы могут отказаться от строительства одной станции на «зеленой» ветке метро
7474
Военную технику для участия в Параде Победы этой ночью перебросят на Ходынское поле
7910
Федеральное агентство по туризму (Ростуризм) выражает озабоченность вмешательством политики в туристическую отрасль на примере отказа чешского отеля принять российских туристов в знак протеста против присоединения Крыма к РФ, сообщила РИА Новости руководитель пресс-службы ведомства Ирина Щеголькова.
5286
МВД Украины утверждает, что телевышки в Донецке никто не захватывал, и каналы транслируются в обычном режиме, сообщает РИА Новости со ссылкой на сайт ведомства.
4045
В украинском Славянске неизвестные обесточили телецентр, транслирующий российские каналы
3141
Компромисс по ситуации на Украине должен быть найден внутри нее, а не между третьими игроками, например между РФ и США, заявил президент РФ Владимир Путин во время прямой линии с россиянами
3067
ЦБ РФ с 17 апреля отозвал лицензию у дагестанского банка «Каспий»
4013
Торговый дом «Шатер» рассматривает возможность строительства сафари-парка в Подмосковье
2859
Лоукост-авиакомпания «Добролет», созданная «Аэрофлотом», будет базироваться в Шереметьево
2876
«Ростелеком» построил линию связи с Крымом по дну Керченского пролива
4379
Павел Дуров: Мы не будем удалять ни антикоррупционное сообщество Навального, ни сотни других сообществ
3814
Google не раскрывает данные о первом дне продаж «умных» очков в США
2683
Чиновники бронируют адреса в новых доменах .москва и .moscow
2306
Компания Google отделила Крым от Украины на своих картах
4352
Суд отклонил иск мордовской колонии к Толоконниковой из-за ее письма об условиях труда
4335
Мировой суд в Москве рассмотрит дело Алексея Навального о клевете
2856
Глава Мосгорсуда Ольга Егорова подала документы в квалификационную коллегию на повторное занятие этой должности; таким образом, Егорова не претендует на занятие вакантного места председателя объединенного Верховного суда РФ
2919
Прокуроры заинтересовались художником, приковавшим гениталии к Красной площади
3346
Здания в центре Москвы украсят репродукциями знаменитых картин
3121
Фильм о русской Жанне Д'Арк покажут на открытии киномарафона в Крыму
2967
Харуки Мураками впервые за девять лет выпустил сборник новелл
3168
В Мексике скончался писатель Габриэль Гарсиа Маркес, его тело будет кремировано
5568
Менеджер Шумахера сообщила, что его состояние немного улучшилось
4060
Олимпийские кольца из Сочи подарят Греции
3700
Новый логотип чемпионата России по футболу будут выбирать болельщики
3125
Официальную песню чемпионата мира-2014 по футболу представили на YouTube

10 лучших проектов хакатона. Спецпроект «МН»

Соревнование по журналистике данных: от влияния нефти на зарплату до эмоционального фона твиттера

Команда: «Большой город»

«Пульс» («Большой город»)

«Где в России жить хорошо» («Аргументы и факты»)

«Эмоциональный фон твиттера» («Меркатор»)

«Из Москвы. Россия большая, куда вам переехать?» («Московские новости»)

«Закредитованность населения в России» (агентство экономической информации «Прайм»)

«2013–2030: как нефть повлияет на зарплату» (РБК)

«Биографии России» («Российская газета»)

«Молоко за вредность» («РИА Рейтинг»)

«Порядочное государство. Детские сады» («Татар-информ»)

Changing Russia («Эсквайр»)


Что такое журналистика данных и зачем она нужна людям

1. «Пульс» («Большой город»)

Суть проекта

Команда представила интерактивную карту Москвы, которая позволяет изучить, где проводят свое свободное время жители. Проект отслеживает точки активности москвичей на основе «чекинов» пользователей социальной сети «вконтакте». На карте, разбитой на административные районы города, представлены так называемые места силы. Это наибольшая концентрация заведений на определенной площади, где «зачекинились» пользователи. Команда наложила эти данные на такие показатели, как пол, возраст, наличие высшего образования, семейный статус и др. В результате, переключая фильтры, можно выяснить, какие «места силы» существуют для разных групп горожан — мужчин, женщин, людей после 40, школьников и так далее. Например, из этой карты можно узнать, что одинокие мужчины и одинокие женщины выбирают разные заведения в центре города. С помощью такой карты можно узнать, ходят ли люди в новые модные заведения на окраинах или по-прежнему предпочитают ехать в центр города, чтобы провести свое свободное время.

Какие данные использовали

126 тыс. «чекинов» в 72 тыс. заведений 62 тыс. профайлов «вконтакте».

Как это поможет людям

С помощью этого проекта можно проверить различные гипотезы о жизни людей в городе.

Данияр Шекебаев, онлайн-продюсер проекта «Большой город»

— Когда мы выпускали районные блоги, мы сталкивались с одной проблемой: было непонятно, с чем ассоциируют себя горожане на микроуровне. Понятно, что они все считают себя москвичами, но москвичами какого района? Что горожане считают своей идентификацией? Они москвичи хамовнические, краснооктябрьские или по имени своего любимого кафе? Поэтому мы решили взять эту проблему. Изначально мы хотели наложить муниципальные границы Москвы на социальные. Но математически это было трудно осуществить в рамках хакатона за два дня, поэтому мы решили ухватиться за более простые вещи. И в итоге нас это спасло.

наверх

Что такое хакатон

Хакатон (слияние английских слов hack — взламывать и marathon — марафон) — соревнование, в котором команды из программистов, дизайнеров и менеджеров создают совместные продукты в рамках заданной концепции. Термин появился в 1999 году в среде программистов, и изначально на хакатонах соревновались именно команды разработчиков ПО. Сейчас такие состязания проводятся по всему миру, и каждое имеет свою специализацию: определенный язык программирования, приложение, операционная система, программный интерфейс.

Хакатон, прошедший в ноябре в пресс-центре РИА Новости, — этап мирового соревнования Editors Lab, посвященного использованию открытых данных (big data) в СМИ. Участие принимали команды из дизайнеров, программистов и редакторов.

2. «Где в России жить хорошо» («Аргументы и факты»)

Суть проекта

Пользователю предлагается ответить на ряд вопросов и задать критерии для оптимального места жизни. После этого ему предлагается пять вариантов возможного переезда: на карте от его города расходятся стрелки к возможным городам для миграции. Толщина линии показывает, насколько вариант соответствует критериям пользователя. Можно посмотреть общий рейтинг городов в зависимости от выбранных критериев. Задавая критерии (допустимое расстояние до нового места, численность населения, цены на жилье, уровень зарплаты, безработицы, преступности, обеспеченность детскими садами, больницами, культурный уровень, пробки на дорогах и так далее), можно сравнивать данные своего города и города, в который планируешь переехать.

Какие данные использовали

Рейтинг российских регионов института территориального планирования «Урбаника» в Санкт-Петербурге (средний уровень зарплаты, экологическая обстановка и проч.), данные Росстата.

Как это поможет людям

Если человек хочет переехать в другой город, тест даст ему приблизительное представление о том, насколько лучше или хуже он будет жить в предполагаемом месте переезда.

 

Сергей Кондратьев, руководитель группы дизайна, инфографики и иллюстрирования департамента по развитию цифрового направления новых медиа «Аргументы и факты»

— Наша особенность в том, что мы работаем с регионами, у нас более 35 региональных сайтов. И нашему читателю интересно, хуже или лучше жизнь в соседнем регионе. До этого мы подобными проектами не занимались, но мы понимаем, что это перспективная область и это дает новые возможности рассказывать читателю истории, которые скрыты за огромными массивами данных.

наверх

3. «Эмоциональный фон твиттера» («Меркатор»)

Суть проекта

По нескольким десяткам профилей в русскоязычном твиттере вычислили разницу между количеством позитивных и негативных слов в постах, составили графики по дням. Получилась кардиограмма эмоционального фона русскоязычного твиттера.

Какие данные использовали

Архивы проекта «Хаб открытых данных», данные твиттера, библиотеки слов позитива и негатива, составленные студентами филфака.

Как это поможет людям

Интернет-пользователи могут следить, как меняется настроение главных твиттер-персонажей.

Андрей Скворцов, директор и совладелец группы «Меркатор»

— Мы уже около года занимаемся визуализациями анализа речи, это очень интересная задача. Можно мерить «позитив» и «негатив», «уверенность» и «неуверенность», политические предпочтения, фокус на себе или на группе, общую тематику. Дальше мы планируем подключать все больше словарей, вычислять «грубость» и «интеллигентность», «факты» и «общие слова» и прочее. Твиттер взят еще и потому, что это большие данные прямой речи. Можно анализировать не только отдельных людей, но и целые категории: политиков, госорганы, звезд эстрады, ученых.

Мы не знали, что получится на выходе. Долго подбирали единицы измерения (то ли считать среднее, то ли разницу позитив-негатив, то ли и то и то). Потом думали над «очисткой» данных. В итоге потратили так много времени на анализ и исследования, что доделать собственно визуализационный блок не успели, а это было одним из важных условий хакатона. Но в итоге у нас осталась работающая технология сбора и анализа данных, а визуализатор мы не спеша доделаем. Я уверен, что это будет как минимум интересный инструмент, эмоциональный барометр твиттера.

Визуализируй это. Лучшие проекты дата-журналистики

наверх

4. «Из Москвы. Россия большая, куда вам переехать?» («Московские новости»)

Суть проекта

Проект поможет москвичу или любому другому жителю страны найти населенный пункт, который подходит ему больше, чем тот, где он сейчас проживает. Сперва, исходя из приоритетов пользователя, проект определяет, куда ему лучше всего переехать — в индустриальный город, провинциальный городок или деревню. Например, если вас больше интересуют деньги, а не экология, то программа предложит мегаполис и индустриальный город. На втором этапе программа попросит уточнить параметры идеального места для жизни (транспортная доступность, зарплатные ожидания, подключение к интернету и сотовой связи, жаркий или умеренный климат, можете ли вы работать удаленно, как часто вы собираетесь ездить за границу и так далее) и выдаст подборку подходящих городов или деревень. При выборе того или иного населенного пункта проект расскажет, почему именно он подходит пользователю и чем он примечателен. Команда анализировала показатели 14 мегаполисов, 13 индустриальных городов, 16 провинциальных городов, 14 деревень и семи мест для отшельнической жизни.

Какие данные использовали

По каждому населенному пункту анализировались различные показатели и данные из открытых источников — плотность населения, безработица, средняя температура, средняя зарплата. Индустриальные города отбирались по рейтингам института «Урбаника», а деревни — по рейтингу самых удивительных деревень Forbes.

Как это поможет людям

Тем, кто о переезде пока не думает, проект поможет задуматься о том, какой разной может быть Россия, и узнать много нового о других городах.

Филипп Кац, редактор студии инфографики РИА Новости

— По данным, которые мы собрали, было понятно, что все миграционные пути внутри страны идут от меньшего населенного пункта к большему. Уже на третьем переезде семья или человек наверняка попадут в Москву. По данным за 2011 год, больше половины всех переездов в России — это переезды в Москву. И такой миграционный путь не позволяет людям сравнивать похожие по статусу населенные пункты. Нам было интересно посмотреть, а вдруг с каких-то точек зрения провинциальный городок или даже деревня будут гораздо лучше, чем Москва. Самая большая проблема, с которой мы столкнулись, — это методологическая, как сохранить объективный и при этом осмысленный проект. Даже по каким-то общим параметрам мы понимали, что не можем сравнивать деревню и город, деревню и маленький городок, маленький городок и мегаполис, потому что от того, куда мы переезжаем, зависят методы оценки. Понятно, что, переезжая в большой населенный пункт, мы не должны задумываться о сотовой связи, но как только мы говорим про деревню, то для нас важным фактором становится наличие сотовой сети и интернета.

наверх

5. «Закредитованность населения в России» (агентство экономической информации «Прайм»)

Суть проекта

Команда представила интерактивную карту России, которая помогает проанализировать ситуацию с закредитованностью жителей страны. За основу были взяты данные о кредитах физических лиц по четырем группам — потребительские, ипотечные, автокредиты и операции по кредитным картам за три последних года. Данные были разделены на число экономически активного населения. На результат команда наложила такие показатели, как средняя зарплата в регионе, валовой региональный продукт, преступность и так далее. В результате с помощью карты можно узнать, например, сколько еще должны выплатить банкам жители каждого региона, где плата по кредитам просрочена, в каких регионах ситуация наиболее острая и т.д. Команда хотела показать, насколько тяжело кредитное ярмо для среднего жителя того или иного региона. На карте также есть таймлайн, поэтому все данные можно посмотреть в динамике с 2010 года.

Какие данные использовали

Национального бюро кредитных историй и Росстата.

Как это поможет людям

Проект помогает человеку задуматься о том, стоит ли ему брать кредиты, какое экономическое поведение предпочтительно, а какое опасно.

Алексей Тиматков, редактор дизайн-центра РИА Новости

— Мы встревожены обилием публикаций в СМИ, посвященных проблемам россиян, связанным с кредитами, с экономической безграмотностью, которая загоняет их в ловушку. И мы хотели изучить эту тему. Главная сложность заключалась в том, что у нас было всего два дня для полноценного исследования вопроса. Основой послужили данные по кредитам, на которые мы наслоили ряд данных с Росстата. Но получить данные по преследованию заемщиков было сложно. Мы их парсили с сайта РосПравосудие. Нашей главной проблемой было то, что мы набрали слишком много данных и не успели их упорядочить, отведенного времени было мало.

наверх

6. «2013–2030: как нефть повлияет на зарплату» (РБК)

 

Суть проекта

График зависимости зарплат россиян от цен на нефть. Зарплаты разных профессий с 2008 по 2013 год сравниваются с ценами на нефть марки Urals за тот же период. Получался график зависимости для каждой профессии. Можно проследить, насколько твоя зарплата будет зависеть от колебаний цен на российскую нефть, можно посмотреть отдельно собранные данные для самых зависимых и самых независимых от нефти профессий.

Какие данные использовали

Данные об оплате труда с 2008 по 2013 год, биржевые сводки о ценах на нефть марки Urals.

Как это поможет людям

Можно рассчитать, какой будет зарплата к 2030 году, если цена на нефть будет меняться согласно плану Минэкономразвития. С помощью рубрикатора можно выбрать интересующие профессии, сравнить зависимости и средние заработки, смотреть на прогноз. Журналист может сделать несколько интересных подборок, например показать, какие профессии пострадают от инфляции меньше всего, а кому стоит срочно перепрофилироваться.

 

Эдик Цветцих, руководитель департамента дизайна и юзабилити РБК

— Тема была выбрана за несколько дней до хакатона. Минэкономразвития опубликовало прогноз развития экономики России до 2030 года, и мы решили изучить, как будут чувствовать себя люди к 2030 году. Поскольку ВВП нашей страны на 92% определяется ценой на нефть и, судя по прогнозу, эта цифра не изменится (мы на это рассчитывали), решено было взять именно этот показатель.

То, чего мы не предвидели: для хакатона и журналист, и дизайнер должны уметь программировать на каком-то уровне, чтобы работа шла быстрее. Одного разработчика оказалось мало, много времени ушло на первоначальную обработку данных.

наверх

7. «Биографии России» («Российская газета»)

Суть проекта

Попытка с помощью интернета актуализировать открытые данные — сверить статистику с живыми людьми. В специальной программе пользователь указывает свой пол, возраст и регион и проходит небольшие визуальные тесты по категориям «семья», «доход», «образование», «работа», «привычки», «отношения с законом». Каждый раз программа показывает пользователю, сколько в его регионе проживает людей с такими же показателями. Например, указав свой доход, программа сообщит вам, сколько ваших сверстников зарабатывают больше. Когда все тесты будут заполнены, программа сообщит, насколько пользователь живет лучше или хуже по сравнению со своими сверстниками в том или ином регионе. Программа также выдаст небольшое предсказание, основанное на статистических данных. Например, покажет, какова вероятность, что пользователь увеличит свой доход в два раза за следующие три года, какова вероятность, что он доживет до 68 лет или станет родителем троих детей.

Какие данные использовали

Сведения Росстата, всероссийской переписи 2002 и 2010 годов, открытые данные МВД, Минздрава, ВОЗ и многие другие.

Как это поможет людям

Для пользователя этот проект может стать, с одной стороны, развлекательным, а с другой — пользователь сможет получать релевантный контент, который ему интересен. «Основная беда всех контент-проектов в том, что они не знают, кто их аудитория. А мы создали панель, которая даст четкое понимание, где живет пользователь, сколько денег он зарабатывает, есть ли у него дети, какое у него образование. Она поможет быстро составить портрет аудитории. В результате пользователя перестанут доставать ненужным ему контентом, а к изданию в очередь выстроятся рекламодатели», — объясняет глава команды «Российской газеты», аналитик сайта rg.ru Евгений Волков.

Евгений Волков, аналитик сайта rg.ru

— Когда мы получили задание, мы стали изучать всевозможные открытые данные. Оказалось, что не все они полные, их качество не позволяло создать достоверную картину по населению России. Родилась идея попробовать все эти данные дополнить. Если в силу государственной специфики статистика всегда запаздывает, тогда почему бы не создать нечто среднее между ней и быстрым пользовательским вводом.

Василий Гатов о том, как большие данные превращаются в большие деньги и большую слежку

наверх

8. «Молоко за вредность» («РИА Рейтинг»)

Суть проекта

Анализ экологической ситуации в регионах России в сравнении с экономическими параметрами. Проект помогает понять, получают ли люди, живущие в регионе с плохой экологией, какую-либо компенсацию. Индекс компенсации (индекс молока) состоял из расходов местных властей на окружающую среду, количества врачей на душу населения и средней зарплаты в регионе. А в качестве фактора, разрушающего экологию, разработчики рассматривали только вредные выбросы в атмосферу — транспорт и производство. При этом анализировались данные не регионального уровня, а муниципального, в результате чего команда получила детальную интерактивную карту.

Какие данные использовали

Все показатели команда брала из данных Росстата.

Как это поможет людям

Глядя на карту, пользователи могут понять, что экология в их районе не такая благополучная, как им казалось. Поняв источник проблемы, жители могут поднять этот вопрос перед региональными или федеральными властями.

Андрей Манько, начальник управления анализа финансовых институтов РИА Новости

— Нам хотелось разработать более детальную карту. Региональные карты существуют, но нам было интересно спуститься на более низкий уровень — муниципальных образований и городских округов. Такого анализа еще не было, и в этом заключается новаторство проекта. Сложностей было несколько. Во-первых, нам пришлось обработать очень большой объем данных — более миллиона ячеек информации. Во-вторых, это проблема качества данных, которая до конца не решена. По шести регионам нет данных совсем, например, по Чечне и Ингушетии. Статистика по этим республикам стала появляться только недавно, работа статистических органов на местах еще не отлажена. А в тех регионах, где данные есть, могут быть пропуски по отдельным районам.

наверх

9. «Порядочное государство. Детские сады» («Татар-информ»)

Суть проекта

Интерактивная тепловая карта обеспеченности детскими садами в Татарстане. На карте можно выбрать конкретный район и посмотреть, насколько хорошо власть решает проблемы, связанные с детскими садами: сколько было жалоб, сколько решили, сколько в работе, а сколько осталось нерешенными. Можно посмотреть количество жалоб и по отдельным садикам. Можно сравнить районы по количеству детских садов.

Какие данные использовали

Данные о жалобах на детские сады в рамках государственного проекта «Народный контроль», список детских садов на сайте казначейства РФ.

Как это поможет людям

Можно сравнить свой район и тот, в который они хотят переехать, по количеству и качеству работы детских садов.

Максим Толчинский, исполнительный директор агентства «Татар-информ»

— У нас в республике поменялась система финансирования детских садов, и плата за них увеличилась. Государство покрывает только ее часть, а родители хотят, чтобы плата была ниже. И по этому поводу в Татарстане идет легкая буза, люди протестуют, ходят с плакатиками. Мы захотели наглядно показать, как в реальности обстоят дела, на основе данных самого государства, чтобы никто на эту тему не спекулировал. Кроме того, люди не имеют адекватного источника данных о количестве детских садов в разных районах республики, а это один из ключевых параметров при переезде. В дальнейшем мы будем развивать проект и охватим все остальные социальные проблемы в регионе: и ЖКХ, и благоустройство, и мобильная связь.

наверх

10. Changing Russia («Эсквайр»)

Суть проекта

Восприятие России в мире на основе статей англоязычной википедии. На карту России нанесены в виде точек упоминания конкретных населенных пунктов, людей и объектов, которые с ними связаны. К карте прилагается рейтинг статей с наибольшим количеством изменений в течение последних недель, месяцев и лет. Правки, которые вносятся в статьи, отображаются на карте в режиме реального времени в виде флажков с названием населенного пункта на карте. В перспективе можно будет фильтровать данные на карте по языку статьи, по типу (о человеке, об объекте и т.п.). Можно выбрать регион и посмотреть, на какие темы пишут статьи о нем.

Какие данные использовали

Англоязычные статьи википедии, данные правки, а также сайт dbpedia.org, который позволяет работать с архивами википедии на разных языках.

Как это поможет людям

Можно увидеть, какая информация о России интересует людей больше всего в самой стране и за ее пределами.

Дмитрий Голубовский, главный редактор журнала «Эсквайр»

— Мы сделали вполне себе рабочий прототип сервиса, который скоро появится у нас на сайте. Мы давно интересуемся википедией как медийным феноменом, феноменом того, как организуются человеческие знания. С одной стороны, она стремится к академизму, с другой — быстро меняется. И это едва ли не самое массовое медиа, по крайней мере судя по количеству людей, которые принимают участие в составлении статей. Количество правок показывает, насколько тема острая, насколько она вызывает споры. Интересно, что в рейтинге статей с наибольшим количеством правок довольно высокое место занял Распутин. На первом месте вполне закономерно оказался Путин, а вот дальше всплывают разные странные персонажи, например в недельном рейтинге на высокой позиции оказался Рокоссовский.

наверх