Соцсеть «ВКонтакте» включила фильтр «враждебных комментариев»

Администраторам групп социальной сети «ВКонтакте» стал доступен фильтр враждебных высказываний. Нейросеть блокирует комментарии, в которых содержатся угрозы, пожелания смерти и обещания причинить вред здоровью.

По умолчанию фильтр выключен в настройках сообщества. Однако администратор может включить его в любой момент. Также можно увидеть отсеянные комментарии, восстановить их при необходимости или отправить автора в черный список.
Фильтр высказываний в сообществах впервые протестировали 4 ноября 2020-го — в День народного единства. Функция стала доступна администраторам сообществ на сутки.
В ближайших планах разработчиков «ВКонтакте» — улучшение работы нейросети, в частности распознавание травли по принципу национальной или религиозной принадлежности.

Как еще «ВКонтакте» борется с хейтерами

С августа 2020 года соцсеть блокирует пользователей и сообщества, систематически публикующих оскорбительный контент или призывы к насилию. За первую неделю действия нового правила «ВКонтакте» забанила 142 сообщества, в основном среди них — паблики с оскорблениями уроженцев стран Средней Азии.

Контент проверяется в так называемом гибридном режиме.

Модераторы вручную обрабатывают жалобы пользователей или запросы правоохранительных органов и при необходимости блокируют профили пользователей, сообщества и посты с недопустимой информацией.
Также соцсеть использует механизмы автоматического поиска и удаления противоправного контента. Для оперативного обнаружения такой информации применяются так называемые цифровые отпечатки — языковые настройки, шрифты, установленные в системе, часовой пояс, плагины браузера, разрешение экрана, информация о которых остается при публикации контента на сайте.
«ВКонтакте» не проверяет личную переписку на предмет травли, однако пользователи могут пожаловаться модераторам на сообщение, содержащее угрозу.

Аналогичные функции в других социальных сетях

Facebook использует ручную модерацию. У администраторов соцсети есть десятки методических пособий и сборников правил, в которых разъясняется работа с различным противоправным контентом: от разжигания ненависти и вражды до терроризма и каннибализма. При этом в Facebook считают, что не каждое проявление грубости это угроза. Например, фраза «сдохни уже наконец» — это использование грубой лексики для выражения несогласия, а высказывание «Пристрелите уже Трампа кто-нибудь» — угроза политическому деятелю. Допустимым выражением считается «Давайте избивать толстых детей».

В феврале 2021 года Instagram объявил о том, что будет блокировать аккаунты пользователей за оскорбления в личных переписках. Раньше за это общаться в директе запрещали лишь на время. Также соцсеть начнет навсегда удалять страницы, которые были созданы для обхода ограничений на отправку сообщений или для рассылки оскорблений.

Помимо этого, в Instagram есть функция борьбы с буллингом. Нейросеть анализирует комментарии и, если в них есть оскорбительные выражения, спрашивает у пользователя: «Вы уверены, что хотите это опубликовать?».