Внеклассное мероприятие ко Дню российской науки и техники
«Волшебство Нейросетей»
Вступительное слово. (Слайд 1)
Здравствуйте дорогие студенты и гости нашего мероприятия! Cегодня мы погрузимся с вами в волшебный мир нейросетей.
Действия нейросети для обычного обывателя могут казаться волшебством, потому что они выполняют сложные задачи, которые раньше были доступны только людям с высоким уровнем навыков и знаний. Например, нейросети могут распознавать лица на фотографиях, переводить тексты с одного языка на другой, генерировать изображения и даже писать тексты, которые выглядят как написанные человеком.
Нейронные сети — это разновидность машинного обучения, при котором компьютерная программа работает по принципу человеческого мозга, используя различные нейронные связи. Если очень сильно упрощать, это человеческий мозг в миниатюре, только нейроны в нем искусственные и представляют собой вычислительные элементы, созданные по образу и подобию биологических нейронов.
А как же устроены нейроны головного мозга? Давайте обратимся к эксперту в этой области. Слово предоставляется преподавателю Биологии, Филатовой Елене Александровне. (Слайд 2)
(Нейронные связи головного мозга.) (Слайд 3) (Слайд 4)
Что такое нейронные сети и как они работают. (Слайд 5)
Представьте, что вам нужно написать программу, которая распознаёт котов по фото. Можно написать длинный список правил и алгоритмов по типу «если есть усы и шерсть, то это кот». Но всех условий учесть нельзя — скажем, если хозяйка одела кота в костюм динозавра или супермена, алгоритм будет бессилен. В этом случае нам поможет нейронная сеть.
Нейросеть — это программа, которая умеет обучаться на основе данных и примеров. То есть она не работает по готовым правилам и алгоритмам, а пишет их сама во время обучения. Если показать ей миллион фотографий котов, она научится узнавать их в любых условиях, позах и костюмах.
Хитрость нейросети в том, что алгоритмы в ней устроены как нейроны в человеческом мозге — то есть они связаны между собой синапсами и могут передавать друг другу сигналы. Именно от силы этих сигналов и зависит обучение — например, в случае с котами нейросеть сформирует сильные связи между нейронами, распознающими морду и усы.
А чтобы нейросеть ещё быстрее решала задачи, разработчики придумали располагать нейроны на разных слоях.
(Видео)
Вот, например, как будут работать слои нейросети, если загрузить в неё картинку с котом из Шрека: (Слайд 6)
Входной слой — получает данные. Картинка раскладывается на пиксели, каждый из которых поступает на отдельный нейрон.
Скрытые слои — творят магию. Именно в них происходит обработка данных. Нейросеть узнаёт кота, шляпу, траву и другие детали. Условно можно сказать, что чем больше слоёв в нейросети, тем она умнее.
Выходной слой — выдаёт результат. Нейросеть собирает пазл воедино и отвечает: «Это же тот мем, где Кот в сапогах трогательно смотрит в камеру».
Как видите, никакого мышления и сознания в нейросети нет — только алгоритмы и формулы. Единственное, что отличает её от других программ, — это способность обучаться и адаптироваться к новым задачам.
Итак, по какому принципу работают нейросети?
В нейросеть загружается некоторое количество конкретных, необходимых для эксперимента или исследования, данных.
Информация передается с помощью искусственных синапсов от искусственного нейрона к нейрону, от слоя к слою, каждый нейрон может иметь несколько входящих синапсов с данными.
Данные, полученные каждым нейроном, представляют собой сумму всех данных, умноженных на коэффициент веса каждого искусственного синапса.
Полученные значения формируют выходные сигналы, которые передаются до тех пор, пока информация не достигнет конечного выхода.
Все равно звучит сложно?
Тогда попробуем упростить еще больше. В нейросеть, то есть в заранее созданную сложную математическую модель, как в пустую емкость, загружается массив данных. Это могут быть научные работы, литературные произведения, коллекции изображений и так далее.
Если загрузить в нейросеть собрания сочинений мировых литературных классиков, то на выходе она сможет написать собственный текст в стиле Шекспира — если максимально упрощать и утрировать. Аналогичным образом происходит генерация изображений: вы загружаете в нейросеть базу картинок в различных художественных стилях самых разных художников, а на выходе получаете совершенно новое изображение, созданное по мотивам загруженных данных.
Точно так же нейросети позволяют находить различные закономерности и совпадения при анализе огромных баз данных, например находить преступников или делать прогнозы на несколько лет вперед, основываясь на ранее полученных исследованиях.
Как работает нейросеть (на примере Midjourney) (Слайд 7)
Попробуем объяснить работу нейросети более подробно на примере генератора картинок по текстовому описанию. Для примера попросим её нарисовать енота, который летает на скейтборде в стиле фильма «Назад в будущее».
Шаг 1. Нейросеть получает запрос и разбивает его на ключевые слова: «енот», «летает», «скейтборд», «стилистика фильма „Назад в будущее“».
Шаг 2. Затем она превращает слова в наборы цифр, которые называют векторами — так нейросеть сможет определить их смысл.
Шаг 3. Слова в виде векторов передаются на следующий слой нейросети, которая создаёт на их основе набросок будущей картинки. Например, для набора чисел «енот» нейросеть создаст пиксельный овал с чёрными полосами.
Шаг 4. Набросок картинки поступает в следующий слой, который добавляет объектам более сложные детали — цвета, текстуру и освещение. Скажем, для фразы «стилистика фильма „Назад в будущее“» она может добавить доске неоновую подсветку в стиле ретрофутуризма.
Шаг 5. Выходной слой улучшает качество изображения и выдаёт готовую картинку.
Возникает вопрос: а откуда вообще нейросеть знает, что такое енот, скейтборд, а тем более фильм «Назад в будущее»? Ответ прост: её этому обучили на большом массиве данных, который называется датасетом. Принцип тот же, что и с детьми в яслях: «Смотри, Ванюша, это яблоко. А это морковь. А это, Ванюша, летающий скейтборд в стиле ретрофутуризма» :)
Как обучаются нейросети
В обычном программировании всё стабильно: мы пишем программе инструкции, а она по ним выдаёт какой-то результат. Например, можно прописать, как считать время поездки в метро, и она будет делать это всегда одинаково — по заранее заданному алгоритму.
Нейросеть работает по-другому: она не программируется в классическом смысле, а обучается. Выглядит это так: мы даём ей задачу на входе, а на выходе — готовое решение. А алгоритмы и инструкции она учится писать сама, постоянно сверяясь с ответом. Идея в том, чтобы дать нейросети достаточное количество попыток, и рано или поздно она выдаст нужный результат.
Например. (Слайд 8)
Мы хотим научить нейронную сеть отличать картинку с шаурмой от картинки с котиком. В этом случае выходной слой будет выдавать нам пару чисел (x;y) 0xy
от нуля до 1 каждая. первое число это у нас на сколько нейронная сеть уверена что на картинке шаурма, а второе на сколько это кошка. В этом случае пара чисел 1: 0 значит что нейросеть думает что на картинке 100% шаурма, а 0:1 значит, на картинке 100% котик . Мы даем нашей нейронной сети изображение шаурмы, она разбирает его на пиксели, прогоняет через свои нейроныи синапсы со случайными весами и выдает нам результат (0,5:0,5) что означает нейронная сеть думает что на картинке может быть шаурма, может быть котик с равной долей вероятности, но мы то знаем, что это точно не котик поэтому насильно вводим результат (1:0) и говорим а ну-ка пересчитай все весы своих связей и сделай так чтобы в конце был такой результат и она покорно все пересчитывает и запоминает эти конкретные весы а потом мы повторяем тоже самое с огромным количеством фотографий шаурмы и котиков. В конце концов наша нейронная сеть подберет такие веса для своих связей что в конце концов может без проблем отличить (Слайд 9) вот это от этого. Чем больше нейронов в нашей сети тем точнее она будет выдавать ответ, вместе с этим возрастает время и сложность ее обучения. Такой метод обучения называется метод обратного распространения ошибки и применяется он только тогда, когда мы точно знаем что хотим получить от нейронной сети. Это простейший вид нейронной сети, который называется перцептрон. Есть и другие виды (многослойные, сверточные, реккурентные)
Какие бывают нейросети и что они умеют
Универсального ИИ, который умеет абсолютно всё, пока не изобрели. Зато уже сейчас есть целая россыпь онлайн-сервисов, которым можно поручить любую задачу, связанную с текстом, картинками, видео, кодом, дизайном и даже игровой разработкой.
Нейросети для генерации текста
ChatGPT (Слайд 10)
Знаменитый чат-бот от OpenAI с искусственным интеллектом на борту, который может поддерживать диалог, в том числе на русском языке, писать статьи, сочинять стихи, отвечать на вопросы, давать советы и даже спорить. Его ответы можно корректировать с помощью наводящих вопросов.
Ещё нейросеть умеет:
Писать код, анализировать его, переводить с одного языка программирования на другой.
Генерировать сценарии, например создавать новые эпизоды для сериалов или игры по мотивам фильмов.
Давать медицинские советы. Как правило, она предупреждает, что нужно обратиться к врачу.
Переводить текст с одного языка на другой.
Стоимость: бесплатно.
Доступна в россии: нет. Кроме того, недоступна и авторизация по российской сим-карте.
Язык интерфейса: английский.
YandexGPT
Наш ответ ChatGPT. Нейросеть от «Яндекса», которая работает прямо на главной странице поисковика. Может генерировать тексты на заданные темы на разных языках, создавать описания продуктов и услуг, общаться с пользователями, искать информацию в интернете, переводить тексты и многое другое.
Чтобы запустить YandexGPT, нужно зайти на ya.ru, нажать на иконку Алисы в правом нижнем углу страницы и выбрать режим «Давай придумаем». Затем нужно сформулировать запрос для нейросети. Алиса выдаст текст, сгенерированный искусственным интеллектом.
Стоимость: бесплатно.
Доступна в россии: да.
Язык интерфейса: русский.
Нейросети для генерации изображений
Midjourney (Слайд 11)
Самая популярная нейросеть для генерации картинок. Умеет рисовать не только по тексту, но и на основе пользовательских картинок. Можно указать и стиль иллюстрации — например, аниме, киберпанк или реализм. Встроенный ИИ генерирует четыре изображения, из которых пользователь может выбрать самое лучшее и получить его в высоком разрешении.
Доступна в россии: да.
Язык интерфейса: английский.
Стоимость: от 10 долларов в месяц.
Kandinsky 2.2
Нейросеть от «Сбера» для генерации изображений по тексту. Умеет создавать изображения в 21 разных стилях, в том числе фотореалистичные в высоком разрешении.
Нейросеть также может изменять или дорисовывать объекты изображений или их элементы, генерировать картинки на основе двух фото, создавать варианты загруженных изображений, изменять стиль одной картинки на основе другой.
Стоимость: бесплатно.
Язык интерфейса: русский.
Доступна в россии: да.
Looka
Генератор логотипов на базе искусственного интеллекта. Онлайн-сервис предназначен для предпринимателей, владельцев малого бизнеса и небольших компаний, которые хотят сэкономить на услугах дизайнеров. В качестве референса можно выбрать готовые образцы логотипов.
Стоимость: от 20 долларов за базовую версию. Если нужно лого в высоком разрешении и с возможностью редактирования, потребуется премиум-тариф, который стоит от 65 долларов.
Пробный период: да, в течение 7 дней.
Доступна в россии: да.
Язык интерфейса: английский.
Нейросети для работы с аудио (Слайд 12)
MacWhisper
Мощная программа для преобразования аудио в текст на устройствах с macOS. Работает на базе продвинутой нейросети Whisper от компании OpenAI, разработчика ChatGPT. Поможет расшифровать многочасовые записи лекций, интервью или конференций — и всё это за несколько секунд и без доступа к интернету. Поддерживает более 100 языков, в том числе и русский.
SteosVoice
Нейросеть для преобразования текста в аудио. Подходит для голосового воспроизведения текста статей на сайте, озвучивания видеороликов, героев игр и другого видеоконтента. SteosVoice имеет более 50 голосов озвучки. Онлайн-сервис поддерживает русский и английский язык.
Стоимость: от 5,65 долларов.
Доступна в россии: нет.
Язык интерфейса: английский.
Нейросети для создания видео (Слайд 13)
Visper
Нейросеть, разработанная Sber AI, которая создаёт презентационные ролики с виртуальными персонажами. В качестве исходных данных для ролика можно использовать текст, презентацию в PDF-формате или аудио.
Можно выбрать внешний вид диктора из готовых вариантов или использовать собственный аватар. Есть опция настройки голоса и стиля речи, положения диктора на слайде, цвета фона, фоновой музыки и других параметров.
Стоимость: поминутный тариф — от 90 рублей за минуту, помесячный — 1490 рублей в месяц.
Пробная версия: бесплатно можно создавать до 50 роликов в месяц общим хронометражом до 2 минут.
Доступна в россии: да.
Язык интерфейса: русский.
Designs.ai (Слайд 14)
Нейросеть для создания маркетингового контента. Включает четыре основных компонента:
Videomaker — для создания видео.
Logomaker — для создания логотипов.
Designmaker — для разработки дизайна.
AI Writer — для написания рекламных текстов.
Стоимость: от 25 долларов за базовую версию.
Пробная версия: в течение 30 дней.
Доступна в россии: да.
Язык интерфейса: английский.
Также существуют нейросети для создания документов и презентаций, для генерации игровых миров и персонажей, для написания кода, Нейросети для жизни (составляет рецепты блюд, создаёт дизайн интерьеров, позволяет примерять разную одежду по фотографии. (Первый в мире клип, полностью сделанный с помощью нейросетей)
Где используются нейросети (Слайд 15)
Сейчас уже проще перечислить, где их нет. Но вот несколько жизненных примеров:
Голосовые помощники «Сбера» и «Тинькофф» анализируют речь клиентов, чтобы общаться с ними и решать сложные вопросы. Это позволяет компаниям нанимать меньше сотрудников в техподдержку.
Алгоритмы «ВКонтакте» анализируют вашу активность в соцсетях, чтобы подбирать нужные мемы с котами, новости и рекламу.
Селфи-камеры в смартфоне применяют фильтры для фотографий, чтобы люди получались хорошенькими.
Face ID в айфоне строит цифровые модели лица пользователя, чтобы узнавать его в любых условиях: в темноте, на улице, в очках, с бородой, с новой причёской и так далее.
Роботы-доставщики «Яндекс Еды» прокладывают путь от склада до клиента в обход препятствий и c соблюдением ПДД, чтобы доставлять посылки в целости.
В Москве нейросети помогают медицинским центрам анализировать ЭКГ, УЗИ и рентгеновские снимки для диагностики заболеваний.
(видеоролик «Эвакуационный бот») Преимущества и недостатки нейросетей
Очевидно, что само изобретение нейросетей было направлено на то, чтобы приносить как можно больше пользы человечеству. Их основное преимущество перед другими сложными математическими моделями заключается в распознавании более сложных и глубоких закономерностей, позволяющих решать любые поставленные перед ними задачи.
При грамотной настройке нейросети способны выдавать пугающе точные результаты, но нейросети бывают и неточными, а их результаты — слишком приблизительными или только отдаленно напоминающими что-то, что вы хотели бы увидеть. (Слайд 16-17)
Соответственно, нельзя полностью полагаться на результаты работы нейросети, но их можно использовать в качестве дополнительного инструмента решения конкретных задач.
Работа с нейросетями
Заключение (Слайд 18)
Хоть нейросети и можно назвать своего рода искусственным интеллектом, до полноценного ИИ им еще очень далеко. Это связано с тем, что вычислительные возможности человеческого мозга пока что просто невозможно повторить, так как в теле человека содержится 86 млрд биологических нейронов, а в самых современных нейросетях — не более 10 млрд. Какими бы сложными математическими моделями ни были нейросети в своей основе, до человеческого мозга они пока что недотягивают.
Уже сейчас понятно, что нейросети будут брать на себя всё больше задач, раньше считавшихся человеческими. Вопрос только в том, разовьются ли они настолько, чтобы полностью заменить собой часть профессий или останутся на уровне помощников — этаких творческих калькуляторов.