Генеративный искусственный интеллект (ИИ) не является магией, но он способен значительно улучшить оригинальное творческое письмо, используя доступные данные. Рассмотрим, как это происходит и какие возможности открываются для авторов и образовательных учреждений.
Преобразование идей в творчество
Творчество человека, который хочет передать свои идеи, является основой взаимодействия с генеративным ИИ. Пользователь формулирует запрос, и ИИ создает текст, изображения или звуки на основании заданных идей. В 1948 году основатель теории информации Клод Шеннон предложил моделировать язык с точки зрения вероятности следующего слова в предложении, основываясь на предыдущих словах. Эти вероятностные языковые модели долгое время подвергались критике, в частности, лингвистом Ноамом Хомским. Он утверждал, что концепция “вероятности предложения” совершенно бесполезна для генеративного ИИ.
С появлением ChatGPT в 2022 году, спустя 74 года после предложений Шеннона, внимание общественности к языковым моделям возросло, и некоторые даже начали говорить о них как о пути к сверхчеловеческому интеллекту. Путь от теории Шеннона до ChatGPT занял так много времени, потому что объем данных и вычислительных ресурсов, необходимых для этого, был трудно вообразим всего несколько лет назад. ChatGPT представляет собой большую языковую модель (LLM), обученную на огромном корпусе текстов из Интернета. Она предсказывает вероятность следующего слова, учитывая контекст — запрос и ранее сгенерированные слова.
Творчество и ИИ
Существуют споры о том, как эти инструменты могут помочь или помешать обучению и практике творческого письма. Как профессор компьютерных наук я считаю, что понимание моделей, таких как генеративный ИИ, может помочь писателям и педагогам осознать их ограничения и потенциальные возможности в сфере “творческого” письма.
Важно провести различие между “творчеством” LLM и творчеством человека. Для тех, кто имел низкие ожидания от того, что может создать компьютер, было легко приписать творческие способности машине. Однако другие, такие как когнитивный ученый Дуглас Хофстадтер, были более скептичны, замечая “умопомрачительную пустоту, скрывающуюся под яркой поверхностью”.
Языковые модели и отражение человеческого творчества
Лингвист Эмили Бендер и ее коллеги описали языковые модели как стохастических попугаев, что означает, что они повторяют то, что содержится в данных, на которых они были обучены, с элементом случайности. Это можно проиллюстрировать на примере выбора слова: слово генерируется, потому что оно имеет относительно высокую вероятность, и эта вероятность высока, потому что в большом количестве текстов в обучающем корпусе это слово использовалось в похожих контекстах. Генерация текста с помощью LLM может рассматриваться как плагиат, по одному слову за раз.
Когда человек использует генеративный ИИ, он вставляет свои идеи в запрос и получает текст. Если кому-то не важно, что будет сгенерировано, не имеет значения, какой запрос он использует. Но если автор заботится о результате, LLM старается сгенерировать то, что мог бы написать случайный человек, написавший предыдущий текст. Большинство творческих писателей не хотят, чтобы их текст напоминал то, что мог бы написать кто-то другой. Они хотят использовать свое творчество и могут нуждаться в инструменте, который создаст то, что они написали бы, если бы у них было время.
Позитивные аспекты LLM можно провести параллель с разработкой программного обеспечения: имея представление о том, что требуется, разработчики создают код (текст на языке программирования) аналогично тому, как писатели создают текст на естественном языке. Генеративный ИИ рассматривает написание кода и написание текстов на естественном языке одинаково; корпус, на котором обучена каждая LLM, содержит как естественный язык, так и код. Результат зависит от контекста.
Опыт разработчиков программного обеспечения
Авторы могут учиться на опыте разработчиков программного обеспечения. LLM хорошо подходят для небольших проектов, которые были выполнены многими другими людьми, таких как запросы к базам данных или написание стандартных писем. Они также полезны для частей более крупных проектов, например, для всплывающих окон в графическом интерфейсе. Если программисты хотят использовать их для более крупных проектов, им нужно быть готовыми генерировать несколько вариантов и редактировать.
Проблема в разработке программного обеспечения всегда заключалась в точной формулировке того, что требуется; кодирование — это простая часть. Генерация хороших запросов — это искусство, которое называют “инженерией запросов”. Приверженцы генеративного ИИ предлагают несколько техник, которые улучшают результат текущих LLM, такие как просьба о структуре, а затем запрос текста на основе оригинального запроса, дополненного этой структурой.
Раскрытие шагов мышления LLM для более точных ответов
Также можно попросить LLM показать шаги своего мышления, как в так называемом “цепочке размышлений”. LLM выводит не только ответ на вопрос, но и объясняет шаги, которые можно предпринять для его получения. Эти шаги используются как часть запроса для получения окончательного ответа. Однако такой совет может оказаться мимолетным. Если какая-то техника инженерии запросов сработает, она будет интегрирована в будущие версии LLM, и эффект будет достигнут без необходимости явного использования этой техники.
В эпоху дезинформации важно, чтобы каждый имел возможность оценить часто самообслуживающийся хайп. Генеративный ИИ не является магией, но из него можно извлечь много данных для предсказания того, что кто-то мог бы написать. Я надеюсь, что творчество — это не просто регургитация того, что написали другие.
Источник: BizzBuzz