Страницы

понедельник, 28 ноября 2011 г.

Технические и юридические методы борьбы с плагиатом - окончание

В предыдущих (часть1 и часть2) сообщениях было представлено начало работы моих студенток группы 5-41-20з А.П. Трефиловой и А.А. Вахрушевой: Технические и юридические методы борьбы с плагиатом. В данном сообщении представлено продолжение этой работы.

2. Double Content Finder 1.2
Разработчик: TextBroker
Размер дистрибутива: 400 кб
Распространение: бесплатно

Утилита Double Content Finder работает очень просто – вы вводите текст, ссылку на интернет-публикацию или выбираете текстовый файл на жестком диске, после чего нажимаете кнопку "Далее". Программа начинает поиск в интернете и, в случае обнаружения идентичных материалов, показывает ссылки на источники плагиата. Максимальное количество предоставляемых ссылок на источники – 50.

Приложение работает полностью автономно - нет никаких настроек, отсутствуют какие-либо параметры уточнения запроса. Утилита бесплатная и воспринимает русский текст.

К сожалению, движок Double Content Finder несовершенен. Программа ориентирована главным образом на поиск идентичных текстов. Малейший рерайтинг, и утилита уже воспринимает текст как уникальный, хотя он таковым может и не являться. В связи с низкой эффективностью определения плагиата, эту утилиту мы бы рекомендовали использовать для поиска ресурсов, которые занимаются копированием уникального авторского контента без получения разрешения от правообладателя.

3. Praide Unique Content Analyser 2
Разработчик: com-seo.ru
Размер дистрибутива: 3,9 Мб
Распространение: бесплатно

Praide Unique Content Analyser 2 предоставляет гораздо более гибкий инструмент для поиска плагиата, чем описанный выше Double Content Finder. Программа работает с одним из трех вариантов ввода данных – со ссылкой на web-страницу с проверяемым текстом, с файлом в формате TXT или HTML, а также с текстом, введенным вручную или вставленным из буфера обмена. Если для проверки текста выбрана ссылка на страницу, программа покажет весь обнаруженный на странице текст и даст пользователю возможность убрать ненужные слова.

Анализ текста происходит очень медленно, дольше всех сервисов и приложений, рассмотренных в этой статье. В какой-то степени это объясняется большим количеством запросов, отсылаемых программой. Утилита Praide Unique Content Analyser использует для проверки аутентичности текста сразу несколько проверенных поисковых систем: Yahoo, «Яндекс», Mail.Ru, Google, причем в настройках можно указывать, к каким именно поисковикам следует прибегать в процессе исследования контента. Для продвинутых пользователей в программе предусмотрена отдельная возможность добавления новой поисковой системы.

Чтобы проверка текста приложением не мешала основной работе пользователя, можно использовать фоновый режим. Эта опция весьма кстати, ведь общее время проверки может занимать более часа.

В настройках программы можно использовать защиту IP-адреса, чтобы ее не блокировали поисковые системы, принимая за робота. Кроме этого, Praide Unique Content Analyser поддерживает соединение через прокси-сервер, позволяя работать со списками таких серверов.

Онлайн-сервисы для оценки уникальности текста и определения плагиата

1. Copyscape

Проект Copyscape - это разработка компании Indigo Stream Technologies Ltd. Он является одним из самых лучших web-инструментов, с помощью которого можно вывести на чистую воду недобросовестного автора.

Бесплатный сервис Copyscape работает по принципу поисковой системы, проверка плагиата сводится к поиску аналогичного содержания в интернете. В поле поиска вводится адрес страницы, на которой опубликован текст, после чего движок обрабатывает запрос и выдает несколько адресов страниц, которые содержат текст, наиболее похожий на тот, что присутствует на проверяемом ресурсе. Если перейти по одной из предложенных ссылок, можно посмотреть, какая именно часть текста совпадает - на новой странице одинаковые фразы и слова будут выделены цветом.

Сами разработчики подчеркивают, что сервис является лишь инструментом для поиска одинаковых текстов, а делать вывод о наличии плагиата может лишь сам пользователь, ведь не исключены ошибочные совпадения.

Помимо бесплатного поиска плагиата в сети, сервис Copyscape предлагает ряд платных услуг, в числе которых - ежедневный или еженедельный мониторинг интернет-страниц на предмет появления плагиата, возможность пакетного выполнения проверок (до 10 000 страниц одновременно), анализ офлайнового контента. Коммерческая версия проекта также дает возможность установить список ресурсов, которые движок Copyscape не будет использовать для проверки плагиата.

Проект Copyscape не только предоставляет онлайновый сервис для определения фактов кражи чужого текста, но также содержит немало полезной информации. Так, в частности, тут можно найти рекомендации относительно того, каким образом можно отстаивать свои авторские права, а также как следует поступить автору, если он стал свидетелем плагиата. Кроме этого, на форуме Copyscape образовалось целое сообщество, которое совместными усилиями борется с этим явлением и делится опытом.

2. «Антиплагиат»

Система «Антиплагиат» ориентирована, главным образом, на поиск плагиата в студенческих работах. Базовая версия сервиса бесплатна, но есть и коммерческий вариант – система «Антиплагиат.ВУЗ», разработанная специально для высших учебных заведений.

Онлайновый сервис предоставляет два варианта проверки на наличие плагиата: быстрый и подробный.

Сервис быстрой проверки дает возможность проанализировать набранный текст, однако при этом имеет некоторое ограничение - введенный в специальное поле текст не может содержать более пяти тысяч знаков.

Если же требуется проверить статью или другое произведение большего объема, следует использовать второй вариант проверки. Для этого нужно использовать возможности специальной админ-панели, в которую можно попасть после регистрации на сайте. После активирования учетной записи на сайт можно будет загрузить текстовые документы (предварительно обязательно заархивировав их в формат RAR или ZIP). Размер загружаемых файлов не должен превышать 20 мегабайт. Сервис распознает текст в документах RTF, PDF, TXT, HTML, DOC (MS Word).

Файл отчета, подготовленного сервисом, может быть сохранен на жестком диске для просмотра в режиме офлайн. Правда, для этого необходимо установить специальное средство для просмотра отчетов системы антиплагиата Antiplagiat ReportViewer.

К сожалению, эффективность работы данного сервиса ниже средней. Время, которое тратится на анализ схожей информации, очень велико - небольшой файл, загруженный нами в базу данных сервиса, обрабатывался минут десять, причем результат оказался неудовлетворительным, поскольку очевидный плагиат не был распознан.

Создатели этой системы утверждают, что их метод обнаружения совпадений имеет множество степеней защиты от рерайтинга - поиск синонимов, анализ измененных знаков препинания и т.д. Тем не менее, на практике оказывается, что все эти хитрости бессильны перед обычным "копи-пастом". Судя по всему, база данных движка, по которой определяются схожие фрагменты произведения, недостаточна для того, чтобы с высокой долей достоверности находить заимствование.

3. Miratools

Miratools – один из наиболее удачных отечественных сервисов для определения ворованного контента. Сервис существует в двух версиях - промо (бесплатной) и коммерческой. Первый вариант, разумеется, содержит ограниченные возможности.

Во-первых, на промо-версии Miratools количество проверок не может быть более десяти в сутки. Во-вторых, количество знаков в "пробном фрагменте" не может превышать 3000. Достоверность определения плагиата сервисом Miratools хорошая, однако скорость обработки текста довольно низкая, от сервера долгое время может не быть ответа, и может показаться, что сервис "забыл" про то, что пользователем был сделан запрос.

Заключение сервиса Miratools о достоверности текста содержит процент уникальности текста - чем выше этот показатель, тем меньше найдено плагиата. В проверенном фрагменте выделены те участки, которые совпали с аналогичным текстом на одном или нескольких интернет-ресурсах. Если поднести курсор к выделенному тексту, появится всплывающее окно, в котором будет отображена фраза и группа ссылок, где встречается это словосочетание или предложение. Таким образом, можно увидеть не просто список сайтов, откуда украден текст, но и проследить, какая его часть откуда была заимствована.

В платной версии Miratools есть много дополнительных полезных опций - возможность проверки группы текстов, планировщик заданий с возможностью регулярной онлайновой проверки, ручная настройка параметров Шингл (число слов, по которым будет сделана выборка) и ГАП (участок текста, пропускаемый после обнаружения выборки с плагиатом).

4. FIndCopy

Российский сервис FindCopy позволяет проверить статью, размещенную по указанной ссылке, или сам текст. Результат проверки - адреса источников, где движок обнаружил искомый текст. Также напротив каждого результата есть ссылка "сравнить текст", которая позволит открыть страницу, где помимо оригинального текста (если был введен URL интернет-страницы, то сервис покажет только текст на ней) будет в отдельном фрейме показана копия сайта, где предположительно расположен заимствованный текст. В подозреваемой копии с помощью подсветки выделяются одинаковые фразы.

При использовании бесплатной проверки текста придется терпеть следующие ограничения: список результатов сервиса будет состоять только из пяти пунктов, а проверку можно будет делать не чаще, чем один раз в две минуты. Также будет ограничено время хранения результатов быстрой проверки - не более семи дней. Все эти ограничения снимаются в платной версии.

На сервисе FindCopy присутствует еще одна несложная, но полезная функция, с помощью которой также можно искать ворованный текст - сравнительный анализ двух текстовых фрагментов. Процент определения плагиата на этом сервисе высокий, это видно даже при столь небольшом списке выдаваемых результатов.

5. Istio.com

Российский сервис Istio.com использует для проверки текста две крупные поисковые системы – «Яндекс» (для текстов на русском языке) и Yahoo! (для англоязычных текстов). Введя текст в специальную форму, можно быстро узнать, является ли он уникальным. Если текст не уникальный, сервис сразу же сообщит об этом и предоставит ссылки на сайты, на которых он был обнаружен.

После обработки введенной ссылки сервис подсчитывает объем текста и выдает статистику, в том числе количество символов с учетом пробелов и без них, TOP-10 наиболее часто встречаемых слов, количество слов. Сервис также пытается определить приблизительную тематику текста.

Сервис также может выполнять проверку орфографии и разбирать содержимое на слова. Так, можно просмотреть все слова, которые использовались автором в тексте, исключая так называемые стоп-слова (это, как правило, предлоги и другие часто используемые слова, которые сами по себе не несут никакой смысловой нагрузки). Еще одна интересная функция этого сервиса – составление карты текста. Карта текста чем-то напоминает облако тегов, которое можно часто встретить на страницах современных сайтов. Составляющие этого облака – слова, которые часто встречаются в тексте. Чем чаще упоминается слово, тем больше его размер на карте. Благодаря этому, можно с первого взгляда определить, какие слова встречаются в тексте чаще всего.

6. Поисковик - самый простой способ выявления плагиата

Как мы убедились, существует достаточно много сервисов и программ для поиска плагиата. Однако существует еще один, самый простой и быстрый способ определения уникальности текста – скопировать из нее фразу, заключить в кавычки и выполнить поиск в Google, в «Яндексе» или в другом поисковике. Можно также использовать поисковую машину Nigma.ru, которая выполняет поиск сразу в нескольких системах: «Яндекс», Google, «Рамблер», Bing, Yahoo, Altavista, Aport и в собственной базе Nigma. Возможно, таким способом не всегда удастся обнаружить плагиат (особенно если статья или реферат были скопированы не полностью), однако явное нарушение авторских прав поисковые машины сразу же покажут.

5. Ответственность за нарушение авторских прав

За совершенное правонарушение, в том числе в авторско-правовой среде, в отношении нарушителя может наступать юридическая ответственность трех видов: гражданско-правовая, административная и уголовная.

Вид ответственности, к которой привлекают нарушителя, зависит от его действий.

1. Гражданско-правовая ответственность
Может наступить в случае предъявления требований от обладателей исключительных авторских прав.

Требования могут быть:
  • о признании права (если лицо отрицает или не признает право)
  • о пресечении действий, нарушающих право (например, убрать вашу статью с чужого сайта, где не указано авторство, или указать авторство)
  • о возмещении убытков (если лицо неправомерно использовало чужое произведение и нанесло таким образом ущерб)
  • об изъятии материального носителя (предъявляется к продавцу, распространителю, недобросовестному приобретателю)
  • о публикации решения суда о допущенном нарушении с указанием действительного правообладателя – к нарушителю исключительного права.
Правообладатель по своему выбору вправе требовать от нарушителя вместо возмещения убытков выплаты компенсации:
  • В размере от 10 000 р. до 5 млн. рублей (определяется судом)
  • В двукратном размере стоимости экземпляров произведения или в двукратном размере стоимости права использования произведения.
При этом следует обратить внимание, что компенсация (от 10 тыс. руб. до 5 млн. р) выплачивается на каждый случай нарушения). Требование о выплате компенсации – наиболее распространенное требование.

Также следует помнить, что удаление информации об авторском праве (копирайтов, указания авторства и т.п.) влечет отдельную ответственность в виде возмещения убытков или компенсации в указанном размере.

При этом отсутствие вины нарушителя не освобождает его от обязанности прекратить нарушение авторских прав. Например, если вы не знали, что это произведение принадлежит человеку, указавшему вам на нарушение его авторских прав.

2. Административная ответственность
Предусмотрена Кодексом об административных правонарушениях. Нарушение авторских прав в целях извлечения дохода влечет наложение административного штрафа в размере от 1500 руб. до 2000 руб. – с граждан, от 30 000 до 40 000 тыс. руб. – с юридических лиц.

3. Уголовная ответственность
Предусмотрена Уголовным кодексом. Присвоение авторства (плагиат), если это причинило крупный ущерб автору или правообладателю, наказываются штрафом в размере от 200 000 р. или в размере з/п или иного дохода за период до 18 месяцев, либо обязательными работами на срок от 180 до 240 часов, либо арестом на срок от трех до шести месяцев. Крупный размер – если стоимость экземпляров или прав больше 50 000 р.

Незаконное использование объектов авторского права или смежных прав, а также приобретение, хранение, перевозка контрафактных экземпляров произведений фонограмм в целях сбыта, совершенные в крупном размере наказываются штрафом в размере от 200 000 р. или в размере з/п или иного дохода за период до 18 месяцев, либо обязательными работами на срок от 180 до 240 часов, либо лишением свободы на срок до 2 лет.

Эти же деяния, совершенные группой лиц, в особо крупном размере или с использованием служебного положения, наказывается лишением свободы на срок до 6 лет со штрафом в размере 500 000 рублей или в размере заработной платы или иного дохода осужденного за период до 3 лет либо без него.

Особо крупный размер – 250 000 рублей.

Заключение

Проблема поиска плагиата - головная боль не только для пострадавшего автора, у которого украли текст. Помимо авторов, которые несут прямые убытки, связанные с этим правонарушением, серьезно страдают крупные издательства, случайно опубликовавшие недобросовестный текст. К таким издательствам вполне могут быть предъявлены иски потерпевшей стороны. Вдобавок, плагиат подрывает имидж и доверие, поэтому для организаций, которые сотрудничают с авторами, инструменты для проверки подлинности текста просто необходимы.

Список литературы

1. Конституция Российской Федерации. Принята всенародным голосованием 12.12. 1993 г.//СЗ РФ №30 (с поправками от 30 декабря 2008 г.).
2. Кодекс Российской Федерации об административных правонарушениях (по состоянию на 20 февраля 2008 года)
3. Гражданский кодекс Российской Федерации (части первая, вторая , третья и четвертая ) : По состоянию на 12 ноября 2011 г.
4. Ананьева, Е.В. Защита личных неимущественных прав автора / Е.В. Ананьева // Современное право. – 2009. - № 4. – С. 22-27.
5. Борисов, А.Н. Административные правонарушения / А.Н. Борисов. – М.: «Дашков и К», 2010. – 309 с.
6. Велитминский, И. Интеллект под защитой / И. Велитминский // Российская газета. – 2008. – 10 марта. – С. 2.
7. Дворянкин, О.А. Защита авторских и смежных прав. Ответственность за их нарушение: научно – практическое пособие / О.А. Дворянкин. – М.: «Весь мир», 2009. – 464 с.
8. Защита авторских и смежных прав по законодательству России / Под ред. И.В. Савельевой. – М.: «Экзамен», 2008. – 288 с.
9. Казаков, Ю,В. Защита интеллектуальной собственности / Ю.В. Казаков – М.: «Мастерство», 2008. – 225 с.
10. Макагонова, Н.В. Авторское право / Н.В. Макагонова. – М.: «Юридическая литература», 2009. – 240 с.
11. Садовский, П. Можно ли защитить права авторов / П. Садовский // эж – ЮРИСТ. – 2009. – март (№ 9). – С. 5-6.

Комментариев нет:

Отправить комментарий