Новости    Библиотека    Байки    Ссылки    О сайте


15.11.2014

Мы наш, мы новый… Почему русская «Википедия» уступает английской?

Вот уже пару лет меня занимает загадка, не слишком приятная для меня как носителя русского языка. Это сравнительная неполноценность русскоязычного раздела крупнейшей энциклопедии, Wikipedia, на фоне раздела англоязычного. Не поймите неверно, я не хочу лить масло в огонь полыхающего сейчас политического пожара Запад-Восток. Речь только про «Вику», без политики, и описать и измерить здесь практически всё можно килобайтами. И вот в чём дело: вместо ожидаемого равновесия получается перевес не в нашу пользу — и совершенно непонятно почему!

Как сравнить разделы «Википедии» на разных языках? Проще всего сопоставить общее количество написанных статей. Статистика на этот счёт доступна свежайшая: по состоянию на август английский язык использован для написания 4,5 млн статей, тогда как русский — для 1,2 млн (и я округлил в нашу пользу). Соотношение получается кошмарное, но на ум сразу же приходит несколько вероятных объяснений.

Распределение статей Wikipedia по языкам. Большой серый сегмент в правой части — английский (14% всех материалов), крохотный синий в левом верхнем квадранте — русский (3.5%). Да, обратите внимание ещё на светло-зелёный кусочек чуть пониже нашего. Это доля статей на вьетнамском языке (3.4%), но об этом позже
Распределение статей Wikipedia по языкам. Большой серый сегмент в правой части — английский (14% всех материалов), крохотный синий в левом верхнем квадранте — русский (3.5%). Да, обратите внимание ещё на светло-зелёный кусочек чуть пониже нашего. Это доля статей на вьетнамском языке (3.4%), но об этом позже

Прежде всего, людей, для которых английский родной, в мире минимум полмиллиарда, тогда как русский является основным только лишь для 150 млн человек. Предположив, что суммарная активность в Вики-разделе прямо пропорциональна численности носителей языка, получим сносное объяснение наблюдаемой диспропорции — те же самые три или четыре к одному.

Но кроме того англоязычный раздел «Википедии» востребован непропорционально больше (каждый второй человек, приходящий на wikipedia.org, приходит в английскую секцию; в русскую идёт только каждый пятнадцатый). А ещё у англоязычной «Вики» была фора по времени: в 2000-м году с неё стартовал весь проект, тогда как русский раздел фактически заработал лишь четырьмя годами позже.

Что ещё важнее, у такого сравнения есть очевидный недостаток: суммарное количество статей ничего не говорит об информативности каждой статьи в отдельности. Что если в силу особенностей языка, культуры, ещё каких-нибудь трудноформулируемых национальных нюансов, наш раздел должен содержать меньшее количество материалов? Поэтому стоит ввести ещё одну «номинацию»: сравнивать информативность статей на одну тему на обеих языках. Темы правильней выбрать случайные, для чего воспользоваться любым веб-генератором случайных слов.

Веб-генератор случайных слов
Веб-генератор случайных слов

Опыт получается простой, хоть и не без подводных камней: вы, например, быстро обнаружите, что смысло-культурная разница действительно существует (многие термины, подробно расписанные в русской части, отсутствуют в английской — и наоборот). Сохраняйте странички на диск, а потом сравните количество символов в них, либо прямо их размеры в байтах (в последнем случае не забудьте только, что русский алфавит кодируется юникодом, так что каждая буква занимает два байта, вместо одного для английского алфавита). Здесь диспропорция получается уже не такой сильной, но она по-прежнему имеется: в подавляющем большинстве случаев русскоязычные статьи Wikipedia оказываются короче своих англоязычных аналогов.

Безусловно, и такое сопоставление нельзя назвать строго научным. Правильней было бы вычленять семантику и сравнивать, например, количество фактов в той и другой статьях. Если у кого-нибудь из читателей достанет на это знаний и терпения — буду признателен за дополнение в комментариях. Однако лично мне получившийся результат кажется соответствующим положению дел. По роду деятельности я пользуюсь «Википедией» чуть не с самого её рождения (как инструмент для кругового обзора любой темы она непревзойдённа), и особенно в последние годы примитивность русскоязычных Вики-статей режет ухо: в значительной степени они — калька с английского, причём калька грубая, без осмысления, без стыковки текстовых фрагментов, без попыток развить тему. Английские статьи смотрятся намного более оригинальными, проработанными, литературно мягкими. Думается, те, кто читает и русскую и английскую секции, со мной согласятся.

И отсюда вопрос: почему? Не столько обидно за державу, сколько просто интересно. Вероятная нехватка сил здесь уже упоминалась: когда носителей языка втрое меньше, соответственно меньше и пассионариев, готовых тратить время на неоплачиваемый труд. Однако такое объяснение — больше попытка оправдаться, нежели действительный аргумент. Не верите — посмотрите на вьетнамскую «Вику», статей в которой практически столько же, сколько у нас, хоть носителей языка вдвое меньше!

Подборка цитат из замечательного проекта «Короче, Википедия!». К «Википедии», увы, прямого отношения не имеющего
Подборка цитат из замечательного проекта «Короче, Википедия!». К «Википедии», увы, прямого отношения не имеющего

Подборка цитат из замечательного проекта «Короче, Википедия!». К «Википедии», увы, прямого отношения не имеющего
Подборка цитат из замечательного проекта «Короче, Википедия!». К «Википедии», увы, прямого отношения не имеющего

Подборка цитат из замечательного проекта «Короче, Википедия!». К «Википедии», увы, прямого отношения не имеющего
Подборка цитат из замечательного проекта «Короче, Википедия!». К «Википедии», увы, прямого отношения не имеющего

Другое объяснение, к которому склоняются и многие активные пользователи «Википедии», состоит в ужесточившихся в последние годы требованиях к новым материалам и правкам, что отпугнуло новичков. Считается, что в погоне за «энциклопедичностью» администраторы русскоязычной части перегнули палку, докатившись до самодурства (даже английскую секцию редактировать сейчас проще). Впрочем, и это вряд ли объясняет всей наблюдаемой диспропорции.

Но что же остаётся? Лень как доминирующая черта характера русского человека? Или может быть разница в масштабах национальных идей: грубо говоря, пока Америка строит ракеты, мы пытаемся набить брюхо? Обидно? Обидно. А только других ответов не видать.

Почему это вообще важно? Дело в том, что отношение общества к «Википедии» изменилось. Её более не воспринимают как бесплатный подарок, от которого неразумно и невозможно что-либо требовать. За каждый казус, каждую нестыковку, над которыми раньше посмеивались, теперь прилюдно «распинают» — всех, кто к её созданию причастен. А это в свою очередь вызвано тем, что широкая публика теперь доверяет «Вике» больше, чем классическим средствам массовой информации: британцы, например, ставят её даже выше BBC. Вовсе не из-за (воображаемой) точности, а из-за свободной природы. Так что рано или поздно мы окажемся в такой же ситуации, но на что нам будет равняться, если наша «Википедия» так слаба?

P.S. В статье использованы иллюстрации Mikeedesign, Mypouss, проекта «Короче, Википедия!».

Евгений Золотов


Источники:

  1. computerra.ru






В Китае робот сдал тест для поступления в университет

Россия будет защищена от внешнего отключения Рунета к 2021 году

О конференции Strata AI: будущее искусственного интеллекта

Китайский самообучающийся процессор сможет имитировать работу нервных клеток человека

Илон Маск работает над интерфейсом для подключения мозга к компьютеру

Загадка QWERTY: почему буквы на клавиатуре расположены не в алфавитном порядке

Нейронную сеть научили практически идеально копировать человеческий голос





© Злыгостев Алексей Сергеевич, подборка материалов, оцифровка, статьи, оформление, разработка ПО 2001-2017
При копировании материалов проекта обязательно ставить активную ссылку на страницу источник:
http://informaticslib.ru/ "InformaticsLib.ru: Информатика"