Новости    Библиотека    Байки    Ссылки    О сайте


10.03.2013

Лингвистический анализ приспособили для деанонимизации

Группа аспирантов из американского Университета Дрекселя на конференции 29C3 в Берлине представила способ установить автора анонимной публикации путем лингвистического анализа материалов, опубликованных в Сети, сообщает SC Magazine Australia.

Лингвистический анализ приспособили для деанонимизации
Лингвистический анализ приспособили для деанонимизации

Исследователи предлагают исследовать материалы - это могут быть "твиты", электронные письма, сообщения из мессенджеров или посты из форумов - с точки зрения статистической стилистики, выявляя в них закономерности и общие черты.

Одним из главных ориентиров, позволяющих вычислить человека, являются служебные слова, которые он использует в переписке, утверждает Садиа Афроз (Sadia Afroz), одна из разработчиков метода. Служебные слова используются не для обозначения предметов, а для выражения отношений между другими членами предложения.

Затруднить поиск может использование автором "альтернативного алфавита" или языка, отличного от английского (создатели метода, напомним, являются американцами), однако текст, переведенный автоматическим переводчиком, также может успешно выступать материалом для анализа.

Инструмент для установления авторства текста, созданный исследователями, получил название JStylo. Программа существует в виде альфа-версии; ее разработка еще не завершена.

JStylo способна успешно выявить автора текста лишь при соблюдении ряда условий, уточняет The New York Times. Во-первых, круг "подозреваемых" должен быть ограничен пятьюдесятью людьми или менее. Во-вторых, на каждого "подозреваемого" должен быть собран языковой материал - тексты совокупной длиной не менее 6500 слов. В-третьих, длина текста, авторство которого нужно установить, должна превышать 500 слов.

Когда разработка JStylo будет завершена, инструмент сможет использоваться для выявления личностей злоумышленников: хакеров, взломщиков программ, создателей вирусов, операторов ботнетов. Материалом для анализа станут сообщения, оставленные ими на тематических форумах.

Одновременно с JStylo исследователи разрабатывают инструмент Anonymouth, задача которого состоит в обратном - помочь авторам "зашифровать" свои сообщения, оформив их в нехарактерном стиле: например, введя дополнительные предложения, изменив слова или переставив знаки препинания.


Источники:

  1. Lenta.Ru






Ричард Столлман опубликовал рекомендации по ведению дискуссий в сообществе GNU

Калифорнийский законопроект делает скрытое использование ботов нелегальным

Как подготовиться к собеседованию в Google и не пройти его. Дважды

Рейтинг языков программирования 2018 года от издания IEEE Spectrum

Как анализ больших данных применяется в России

Нейросеть поставила диагноз быстрее 15 лучших китайских врачей

Американские ученые создали самый мощный суперкомпьютер в мире

Выпущен открытый сервер навыков 0Mind для упрощения разработки ИИ

Создатель Всемирной паутины выступил против Facebook и Google

В Китае построят суперкомпьютер, способный выполнять квинтиллион вычислений в секунду

Использование нейронной сети для восстановления повреждённых изображений

В Китае робот сдал тест для поступления в университет

Россия будет защищена от внешнего отключения Рунета к 2021 году

О конференции Strata AI: будущее искусственного интеллекта

Китайский самообучающийся процессор сможет имитировать работу нервных клеток человека

Илон Маск работает над интерфейсом для подключения мозга к компьютеру

Загадка QWERTY: почему буквы на клавиатуре расположены не в алфавитном порядке

Нейронную сеть научили практически идеально копировать человеческий голос





© Злыгостев Алексей Сергеевич, подборка материалов, оцифровка, статьи, оформление, разработка ПО 2001-2018
При копировании материалов проекта обязательно ставить активную ссылку на страницу источник:
http://informaticslib.ru/ "InformaticsLib.ru: Информатика"