23:10
Антиплагиат.ру теперь намного лучше ищет заимствования

Робот Робот извещает Вас о том, что у этой страницы на сайте нашлись похожие материалы. Посмотреть
Я заподозрил это ещё в апреле, воспользовавшись данным сервисом после более чем годичного перерыва. А заподозрив, постепенно тестировал Антиплагиат.ру, сравнивая полученные результаты с результатами проверки программами Advego Plagiatus и Etxt Антиплагиат. Оказалось, что теперь в большинстве случаев результаты сопоставимы. И, насколько я могу судить, улучшение поиска заимствований произошло благодаря долгожданному расширению поисковой базы.

Дело в том, что в начале 2012 года я практически отказался от сервиса Антиплагиат.ру именно из-за ограниченности базы ресурсов, используемой в поиске заимствований, вследствие чего он постоянно завышал процент уникальности и нередко определял полностью скачанные из Интернета тексты как стопроцентно уникальные.

Собственно, очевидных изменений на сайте Антиплагиат.ру целых два.

Во-первых, в лучшую сторону изменилась «вывеска» (логотип).

Было…
Антиплагиат.ру старый логотип 





Стало…

Антиплагиат.ру новый логотип

Во-вторых, (и это главное) Антиплагиат.ру теперь намного лучше ищет заимствования из интернет-источников. Хотя его база поиска по-прежнему ограничена, она всё же заметно расширилась. И тут есть две стороны.

С одной стороны, очень хорошо, что Антиплагиат.ру существенно расширил свою базу поиска, включив в неё различные сайты публикаций.

АнтиплагиатС другой – качество таких сайтов порой очень сомнительно, поскольку в базе Антиплагиата.ру есть do.gendocs.ru и подобные ему ресурсы, которые пополняются за счёт «генерации документов». Проще говоря, они в автоматическом или полуавтоматическом режиме ищут в Интернете новые тексты в форматах txt, doc, pdf и др., скачивают их и заново публикуют те же тексты, но уже в формате своих веб-страниц, не слишком заботясь о корректной ссылке на первоисточник. О таких ресурсах я уже упоминал в посте, посвящённом публикациям в файлах.

Принимая во внимание, что эти сайты нередко воспроизводят чужие тексты без указания настоящего авторства, они, по сути, сами являются закоренелыми плагиаторами, поставившими литературное воровство на поток.

Сама идея проверки текстов на плагиат по пиратско-плагиаторским ресурсам мне кажется странной. Ведь в этом случае вполне может получиться следующее.
1. Автор пишет уникальную статью и публикует её в печатном издании (например, в журнале или в сборнике статей).
2. Электронный вариант этого текста попадает в Интернет и повторно публикуется вышеупомянутым методом «генерации текстов». При этом автор вполне может быть не указан.
3. Проверяя авторский текст, Антиплагиат.ру определяет его как заимствованный.
4. Настоящий автор вынужден доказывать своё авторство (т.е. что не он украл, а у него украли). И ведь ещё не факт, что его об этом вообще спросят.

На самом деле я и многие мои коллеги-авторы уже знакомы с такой схемой на личном опыте - как минимум, до 3-го пункта. В одном из следующих постов я планирую привести конкретные примеры с результатами проверки моих работ.

Итак, Антиплагиат.ру стал намного лучше обнаруживать заимствования в тексте. Однако он по-прежнему является лишь инструментом проверки на заимствования, и в руках неумелого или предвзятого человека вполне может использоваться для несправедливого обвинения автора в литературном воровстве.

      07.06.2013
Робот списокРобот обнаружил, что со статьёй "Антиплагиат.ру теперь намного лучше ищет заимствования" тематически связаны:
Для ссылки:
Антиплагиат.ру теперь намного лучше ищет заимствования [Электронный ресурс] // Сидоров С.В. Сайт педагога-исследователя – URL: http://si-sv.com/blog/2013-06-07-42 (дата обращения: 19.03.2024).
Просмотров: 6591 | Автор: : Сергей Сидоров | Рейтинг: 3.7/3
Всего комментариев: 8
avatar
7 Eni • 13:10, 28.12.2013
Неоднократно  используя  Антиплагиат. ру, я для себя отметила, что безусловно, большим плюсом является то, что теперь это средство проверки уникальности текстов расширило свою базу. Тем самым осложнив жизнь плагиаторам. Помимо этого я нашла еще один минус: все используемые термины, установленные исторические факты, даже средства выразительности русской речи  отмечаются программой как плагиат. Допустим, студент пишет статью по Великой Отечественной войне, как обойтись без упоминания дат, названий столь важных событий? Ведь все это программа может найти в любом интернет источнике. Что же делать авторам что бы доказать свою уникальность программе?
avatar
8 ssw01 • 00:45, 29.12.2013
Eni, заимствования определяются не по словам (тогда бы вообще не было уникальных текстов), а по шинглам - кусочкам из нескольких слов. Подробней об этом: http://si-sv.com/blog/2012-02-14-5
avatar
5 Иван • 01:28, 31.07.2013
Получил Ваш ответ. Спасибо за информацию. Понимаю причину, по которой не хотите публиковать сведения о той конференции. Но мое мнение - все же было бы неплохо создать некую базу "плохих" конференций, организаторы которых наплевательски относятся к авторам.
avatar
6 ssw01 • 01:42, 31.07.2013
Честно говоря, было желание начать составлять "чёрный список" конференций, организаторы которых плохо выполняют свои обязательства перед авторами. Но потом призадумался. Я сам бываю в составе оргкомитетов могу себе представить случаи, когда члены оргкомитета не в силах ускорить процесс издания (подвела типография, не выделили обещанные деньги, попал в больницу человек, отвечающий за макетирование... да и мало ли что ещё могло быть).
avatar
3 Иван • 21:39, 30.07.2013
Да, неприятная история этот ваш 2-й пример. Интересно было бы знать, что за конференция, кто ее проводил. Чтобы мне тоже так не попасть.
avatar
4 ssw01 • 21:48, 30.07.2013
Могу сообщить, но не на странице сайта, а только Вам лично. Вы не оставили e-mail, напишите со страницы обратной связи, отвечу.
avatar
1 Екатерина • 12:05, 24.07.2013
У меня было, что моя статья оказалась в интернете вскоре после того как вышла в сборнике. Я её не выкладывала и в общем ни с какими проблемами не столкнулась. Даже порадовалась, что кто-то выложил мою работу в сети, так больше людей ее прочитает. Теоретически могу представить ситуацию, что статья будет без указания автора, но в моем случае все сведение об авторе были сохранены.
avatar
2 ssw01 • 12:41, 24.07.2013
Екатерина, Ваш случай вполне типичный и относительно безобидный. Но бывает и по-другому. Приведу два примера из своего опыта.

1-й пример. Сразу признаюсь, что тут есть и моя вина (ошибка, наивность,
легкомысленность - как угодно). На своём сайте sv-sidorov.ucoz.com я
выложил авторские материалы для студентов в формате doc - в каждом файле
раскрывался один вопрос, приводились примеры, давались ссылки на
источники. В общем, это были материалы, которые я собирался впоследствии
включить в учебное пособие. Я не догадался указать в каждом файле
сведения об авторе. Подумал: раз на моём сайте, то и так ясно, кто
автор. Результат: теперь эти тексты "гуляют" по рунету, студенты (в том
числе мои) их активно используют, ссылаясь на совершенно другие сайты.

2-й пример ещё неприятней, поскольку я как автор в утечке не был виноват. Я
отправил статью для участия в научной конференции. Сборника материалов
не было очень долго, а оргкомитет никак не реагировал на мои запросы. И
вот, прождав больше полугода, я решил, что оргкомитет так и не доведёт
до конца начатое дело, никакого сборника не будет. А раз так, то статью
можно отправить в другое издание. На всякий случай проверил её ещё раз
на заимствования и обнаружил, что статья давно в интернете, и весь
сборник (причём незавершённый электронный вариант без указания выходных
данных) - тоже! Ситуация получилась следующая: материалы участников
конференции опубликованы, а на них даже нельзя сослаться, свою статью
невозможно включить в список публикаций, поскольку печатного сборника
нет, его выходные данные неизвестны, а размещение материала на каком
попало непрофильном сайте не считается за научную публикацию. В итоге я
всё же получил сборник со своей статьёй - ровно через год. Но случай
запомнился очень хорошо.
ComForm">
avatar