Обучаем нейросеть онлайн
- суббота, 7 марта 2026 г. в 00:00:07
Небольшая статья о том как я под впечатлением статьи с Хабра "Возможно, самый гениальный код на python на сегодня: разбираем 200-строчный microgpt от Андрея Карпаты" решил проверить все это на практике, и перенес код при помощи нейросети в онлайн формат.
Эта минималистичная нейросеть, на самом деле является нейросетью поскольку обучается на тех данных, которые вы ей предоставите. В оригинале автор скормил нейросети список из 32000 имен написанных на латинице и она генерировала похожие имена (в той статье есть пример). Но мне было интересно сгенерировать что-то другое, поэтому я скормил нейросети другой список имен, на русском языке (мужские), и она стала генерировать совсем другие имена, похожие на те что в списке. Потом я проверил это на кличках животных и городах России - все это в итоге было похоже на то, что изначально ей давали, то есть это реально нейросеть, которая обучается на любых текстовых данных. Вот ссылка на эту станицу, чтобы проверить как это работает: https://boolkin.github.io/html/Vibe/microgpt/
На этой странице можно проверить, как на основании разных данных для обучения нейросеть по-разному генерирует имена (изначально имена, и по сути только на это и способна). Но перед тем как начать генерировать нужно провести обучение и для удобства в настройках можно выбрать датасеты для обучения: есть 4 готовых представленных в примере, либо можно загрузить текстовый файл со своим списком:
После окончания обучения выводится график обучения, который показывает что к концу значение loss уменьшается (то есть нейросеть обучается и допускает меньше ошибок), а так же генерируются имена, например города России как на первой картинке.
На самом деле это конечно же баловство, но было довольно интересно. Хотя есть и полезное применение для такого: можно генерировать клички для домашних животных, если не страшно довериться нейросети, ну или узнать как называют другие. Для этого я создал (с помощью нейронки тоже) генератор имен.
Все это я больше делал для себя, чтобы понять как происходит обучение нейросетей, но решил поделиться с сообществом, чтобы другие люди, которым как и мне интересно, могли бы в онлайне немного поиграться. Ну и к тому же может быть кто-то поделится еще какими-нибудь простейшими датасетами (например женскими именами), чтобы можно было добавить и их тоже и проверить результат на чем-то еще.