КиберпанкДеталиИнтернет

«Википедия» обзаведется искусственным интеллектом: сайт будет бороться с ошибками с помощью алгоритма компании Цукерберга. Что не так со статьями онлайн-энциклопедии

ИИ будет проверять ссылки в материалах и заменять их на более подходящие при необходимости.

«Википедию» часто обвиняют в неточности информации, на сайте появлялись даже полностью фейковые статьи.

Что произошло

Wikimedia договорилась с компанией Meta об использовании ИИ для контроля за качеством статей на «Википедии».

История вопроса

«Википедия» была запущена в 2001 году, сейчас статьи для энциклопедии пишут более 300 тыс. добровольцев по всему миру.

Почему это важно

Из-за человеческого фактора в энциклопедии появляется немало ошибок и даже фейковых статей.

Контекст

Meta анонсировала сразу несколько проектов в области ИИ, в том числе универсальный переводчик устной речи для метавселенной.

Что произошло

Wikimedia договорилась с компанией Meta о разработке искусственного интеллекта для проверки статей на сайте «Википедии».

  • Разрабатываемый Meta ИИ использует модель преобразования Natural Language Understanding (NLU), которая пытается понять взаимосвязи между словами и фразами в предложении. Он опирается на базу данных Sphere, которая содержит более 134 млн веб-страниц. Модель разработана таким образом, чтобы найти источник для проверки каждого утверждения.
  • В рамках тестирования ИИ проверил статью «Знаменитые черноногие». В статье упоминался Джо Хип — первый коренной американец, который боролся за титул чемпиона мира по версии WBA в супертяжелом весе. Однако на сайте, указанном автором, Хип не был упомянут. ИИ провел поиск в базе данных Sphere и нашел более подходящую цитату в материале 2015 года в Great Falls Tribune.

История вопроса 

  • История «Википедии» начинается с появления в марте 2000 года другого сайта — «Нупедии», где статьи писались экспертами. Заметки проходили через семиэтапный процесс рецензирования и проверку редакторами-экспертами. Все это замедляло процесс наполнения сайта — к ноябрю 2000 года на «Нупедии» опубликовали всего две полноценные статьи. Тогда создателям и пришла в голову идея свободной энциклопедии. После этого сайт начал работать в нынешнем виде.
  • Русскоязычная версия «Википедии» появилась 11 мая 2001 года. По словам исполнительного директора «Викимедиа РУ» Станислава Козловского, в 2018 году сайт ежемесячно посещали около 100 млн человек. При этом авторами были всего 10–12 тыс., причем большинство из них лишь вносили незначительные правки.
  • Сейчас по всему миру «Википедию» редактируют около 300 тыс. добровольцев.
  • Вся информация в энциклопедии должна подкрепляться ссылками на достоверные источники. Чтобы повысить точность материалов, «Википедия» ограничивает использование материалов некоторых СМИ. Например, в 2017 году авторам запретили ссылаться на британское издание Daily Mail.

За сайтом стоит НКО из Сан-Франциско Wikimedia Foundation, которая занимается серверами, сбором средств и юридическими проблемами.

Почему это важно

Возможность свободного редактирования материалов онлайн-энциклопедии приводит к ряду проблем.

  • На 2021 год только 40 тыс. статей из 6 млн на «Википедии» считались «хорошими». Кроме того, в энциклопедии существует гендерный дисбаланс: в англоязычной «Википедии» более 80% редакторов — мужчины, и только 18% биографий посвящено женщинам.
  • Статьи в «Википедии» часто бывают слишком субъективными. В исследовании 2018 года сравнили 4 тыс. статей из онлайн-энциклопедии от Wikimedia с такими же в «Британнике». Оказалось, что в «Википедии» 73% статей политически предвзяты, в то время как в «Британнике» таких материалов лишь 34%.
  • В «Википедии» встречаются как банальные ошибки, так и статьи-мистификации. Например, сотрудник колл-центра из Глазго Алан Макилрайт создал биографическую страницу в «Википедии», где объявил себя героическим офицером Британской армии.
  • В 2009 году в английской версии статьи о французском оскароносном композиторе Морисе Жарре сделал правку студент-ирландец, сообщив о смерти творца. Новость подхватили многие СМИ, включая популярное издание The Guardian. Когда обман раскрылся, им пришлось опровергать свои сообщения.
  • Домохозяйка из Китая Джемао, представлявшаяся историком и дочерью российского дипломата, 10 лет сочиняла материалы для «Википедии» о средневековой Руси. Обман вскрылся случайно благодаря писателю-фантасту по имени Ифань, который читал тексты в энциклопедии в поисках вдохновения и наткнулся в одной из статей Джемао на интересную историю о серебряном руднике Кашин в Тверском княжестве, где трудились десятки тысяч рабов. Не найдя подтверждения ни в одном источнике, он заподозрил неладное и написал о своих догадках на китайском сайте вопросов-ответов Zhihu. История получила резонанс, «Википедия» начала расследование. Выяснилось, что Джемао успела сочинить более 200 статей, все они были удалены.
  • В некоторых странах, в том числе в Китае, «Википедия» подвергалась блокировкам.

Контекст

Алгоритм, которым решила воспользоваться «Википедия», не единственная подобная программа компании Марка Цукерберга. Meta активно занимается разработками в области искусственного интеллекта.

  • В январе 2022 года компания анонсировала создание нового суперкомпьютера AI Research SuperCluster (RSC). Он сможет обучать модели искусственного интеллекта (AI) с более чем триллионом параметров, а также будет использоваться в разработке AI для распознавания речи, голосового перевода в реальном времени и выявления вредоносного контента. Разработчики уверяют, что к концу 2022 года он станет самым мощным компьютером в мире.
  • В феврале глава компании Марк Цукерберг представил систему искусственного интеллекта Builder Bot, обученную создавать трехмерные объекты в виртуальном мире по их словесному описанию.
  • Meta намерена также создать универсальный ИИ-переводчик устной речи для всех языков мира. Продукт должен стать частью метавселенной и помочь людям снять языковые барьеры. Сроки реализации проекта не объявлялись.