javascript

Обучаем нейросеть онлайн

  • суббота, 7 марта 2026 г. в 00:00:07
https://habr.com/ru/articles/1007114/

Небольшая статья о том как я под впечатлением статьи с Хабра "Возможно, самый гениальный код на python на сегодня: разбираем 200-строчный microgpt от Андрея Карпаты" решил проверить все это на практике, и перенес код при помощи нейросети в онлайн формат.

Пример генерации названий городов
Пример генерации названий городов

Эта минималистичная нейросеть, на самом деле является нейросетью поскольку обучается на тех данных, которые вы ей предоставите. В оригинале автор скормил нейросети список из 32000 имен написанных на латинице и она генерировала похожие имена (в той статье есть пример). Но мне было интересно сгенерировать что-то другое, поэтому я скормил нейросети другой список имен, на русском языке (мужские), и она стала генерировать совсем другие имена, похожие на те что в списке. Потом я проверил это на кличках животных и городах России - все это в итоге было похоже на то, что изначально ей давали, то есть это реально нейросеть, которая обучается на любых текстовых данных. Вот ссылка на эту станицу, чтобы проверить как это работает: https://boolkin.github.io/html/Vibe/microgpt/

На этой странице можно проверить, как на основании разных данных для обучения нейросеть по-разному генерирует имена (изначально имена, и по сути только на это и способна). Но перед тем как начать генерировать нужно провести обучение и для удобства в настройках можно выбрать датасеты для обучения: есть 4 готовых представленных в примере, либо можно загрузить текстовый файл со своим списком:

Пример как проходит обучение. Выбран датасет Города России.
Пример как проходит обучение. Выбран датасет Города России.

После окончания обучения выводится график обучения, который показывает что к концу значение loss уменьшается (то есть нейросеть обучается и допускает меньше ошибок), а так же генерируются имена, например города России как на первой картинке.

График loss
График loss

На самом деле это конечно же баловство, но было довольно интересно. Хотя есть и полезное применение для такого: можно генерировать клички для домашних животных, если не страшно довериться нейросети, ну или узнать как называют другие. Для этого я создал (с помощью нейронки тоже) генератор имен.

Все это я больше делал для себя, чтобы понять как происходит обучение нейросетей, но решил поделиться с сообществом, чтобы другие люди, которым как и мне интересно, могли бы в онлайне немного поиграться. Ну и к тому же может быть кто-то поделится еще какими-нибудь простейшими датасетами (например женскими именами), чтобы можно было добавить и их тоже и проверить результат на чем-то еще.