kouprianov (kouprianov) wrote,
kouprianov
kouprianov

Category:

Корчеватель-2: Вестник Томского государственного университета и "Дарвинизм"

Еще один журнал из «списка ВАК» опубликовал сгенерированную компьютером статью

История с «Корчевателем» не пошла впрок. «Вестник Томского государственного университета (Философия, социология, политология)» опубликовал статью «Дарвинизм», сгенерированную компьютером. Однако, в отличие от случая с «Журналом научных публикаций аспирантов и докторантов», исключенным из списка ВАК, это не имело для журнала никаких административных последствий.

...

«Полит.ру» также публикует комментарий члена рабочей группы по проверке качества журналов. Беседовал Кирилл Бочаров.

Интервью с членом рабочей группы по проверке качества журналов, разработчиком программы РОДОС, к.т.н. Михаилом Ковалевым.

– Вы удовлетворены результатами эксперимента?

– И да, и нет. Как российский ученый, я рад, что уровень первых проверенными нами 50 научных журналов оказался не таким ужасным, как все думали после истории с «Корчевателем». А как автор программы я, конечно, хотел бы, чтобы порождаемые ею тексты были более похожи на настоящие. Должен сказать, что по результатам работы в следующую версию программы будут внесены некоторые изменения.

– Зачем? Кто-то планирует продолжать испытывать журналы на прочность?– Да, насколько мне известно, эта работа продолжается. Есть еще и чисто научный интерес – тест Тьюринга никто не отменял. И потом, на свете есть не только журналы – есть стостраничные отчеты, которые вынуждены во множестве писать научные институты, есть патенты, тезисы конференций, в конце концов, есть студенческие рефераты и большие монографии...

...

– В чем отличие Вашей программы от той, которая написала «Корчевателя»?

– Программа SCIgen использует контекстно-свободную грамматику. Это хорошо известная алгоритмическая техника. В принципе, поскольку исходный код доступен, можно было бы переобучить программу на новом материале. Но это потребовало бы слишком больших усилий. Поэтому мы пошли другим путем. Мы использовали два известных алгоритма, которые были разработаны для других целей, но, как оказалось, подходят и в нашем случае, и, главное, не нуждаются в переобучении под каждую новую область.

Один алгоритм используется в известной библиографической биомедицинской базе данных PubMed, в которой есть понятие «близких по содержанию статей» (related articles). Алгоритм анализирует резюме статей и группирует их по сходству содержания. В нашей программе этот алгоритм составляет основу для статьи – последовательность фрагментов, в которых говорится про одно и то же.

Второй алгоритм называется «Марковский морфологический анализатор». Это лингвистическая техника, которая в нашем случае осуществляет редактирование последовательных фрагментов так, чтобы не было противоречий в грамматике – предложения должны согласовываться по времени, числу и т.п. Попросту говоря, текст должен быть «гладким».

– Вам удалось этого добиться?

– Мне кажется, да. Посмотрите сами – текст статьи доступен в Интернете.

– Какие тексты Вы брали в качестве исходных?

– В основном использовались различные псевдонаучные Интернет-сайты и форумы. Кроме того, «для оживления слога» были добавлены «Письмо к ученому соседу» А. П. Чехова и некоторые рассказы М. М. Зощенко.

http://www.polit.ru/science/2009/04/01/erunda.html

Топ-топ... поднимаем в топ...

Tags: корчеватель, наука в России
Subscribe
  • Post a new comment

    Error

    default userpic

    Your reply will be screened

    Your IP address will be recorded 

    When you submit the form an invisible reCAPTCHA check will be performed.
    You must follow the Privacy Policy and Google Terms of use.
  • 151 comments
Previous
← Ctrl ← Alt
Next
Ctrl → Alt →
Previous
← Ctrl ← Alt
Next
Ctrl → Alt →