Category : habrahabr

habrahabr
Как мы готовим RL для Alignment в больших языковых моделях: опыт команды YandexGPT

Сегодня через API стала доступна новая модель YandexGPT 3 Lite. Одним из ключевых этапов её обучения, как и в случае с другими недавними моделями, стал этап Alignment (выравнивания), включающий в том числе стадию обучения с подкреплением — RL. Пожалуй, без этого этапа мы бы не смогли добиться такого роста в качестве, который был необходим для запуска новых возможностей и сервисов (например, Нейро). Поэтому эту статью мы полностью посвятим особенностям выравнивания моделей. На тему Alignment и R…

  • понедельник, 3 июня 2024 г. в 00:00:14
habrahabr
Сложно ли генерировать 1024-битные простые числа?

Простые числа удивительны!С одной стороны, их легко объяснить: это просто числа, которые делятся только на единицу и на себя; с другой стороны, они содержат в себе бесконечную сложность. Они встречаются во множестве разных сфер, от математических концепций и гипотез до любопытных визуализаций и криптографии, лежат в основе многих Интернет-стандартов и протоколов безопасности, которые мы используем ежедневно.Несмотря на моё восхищение простыми числами, я никогда не исследовал их подробно, поэтом…

  • понедельник, 3 июня 2024 г. в 00:00:13
habrahabr
Как сервер с моим проектом был удалён вместе с бэкапами

Не так давно на Хабре была небольшая волна постов и комментариев о том, как можно быстро и эффективно потерять данные своего проекта — неработающие или отсутствующие бэкапы, ошибки «железа» и прочие радости инженеров DevOps. Тогда я это всё прочитал с интересом — всегда же любопытно почитать про чужие факапы (про свои неинтересно). Через несколько дней я вдруг оказался среди таких же несчастных "уже делающих бэкапы".Немного контекста - у меня есть свой домашний проект, которым я занимаю…

  • понедельник, 3 июня 2024 г. в 00:00:12
habrahabr
Простая, недорогая, точная мини-электропечь (для фьюзинга) своими руками

Существует целый ряд интересных технических и декоративно-прикладных забав с применением печного электрического нагрева. Печь, однако, прибор дорогостоящий и громоздкий, по средствам не всякому любителю. Тем не менее, ограничив себя в размерах обрабатываемых деталей, нетрудно собрать чрезвычайно простую мини-печь из самых простецких деталей и материалов, обычным ручным инструментом и используя только невеликие навыки слесарного дела, электромонтажа да капельку терпения и аккуратности. Здесь, …

  • воскресенье, 2 июня 2024 г. в 00:00:17
habrahabr
Блокировка Docker Hub для России. Без паники разбираемся как работать дальше

Главной новостью этой недели стала блокировка пользователей из России ресурсом Docker Hub. Она осуществляется по Geo IP.Ирония в том, что у самого докера есть инструменты, чтобы обойти эту блокировку. Используем докер, чтобы обойти блокировку докера и дальше использовать докер.В статье три проверенных мною способа, как получить доступ к ресурсу.Знакомо?~> docker pull alpine:3.17 Error response from daemon: pull access denied for alpine, repository does not exist or may require 'docker lo…

  • воскресенье, 2 июня 2024 г. в 00:00:16
habrahabr
Как мы нашли новый подход к передаче сервисов в промышленную эксплуатацию

Привет, Хабр! Меня зовут Анна, я начальник управления поддержки проектов и клиентских сервисов в X5 Tech. Последние 16 лет я работаю в области сопровождения, и для меня одним из самых загадочных этапов в поддержке всегда был процесс приёма нового функционала. Ты как будто берёшь кота в мешке: вы ещё с ним не знакомы, он не приучен к лотку, ты не знаешь его возраст, цвет и как сильно он кусается. У нас получилось кардинально изменить один из подходов в разработке, а именно – процесс передачи реш…

  • суббота, 1 июня 2024 г. в 00:00:15
habrahabr
Quansheng UV-K5/K6, трансивер, из которого можно сделать что угодно: аппаратные доработки

Привет, Хабр! В прошлый раз мы рассказывали о трансивере Quansheng UV-K5/K6 и его возможностях. Сегодняшняя статья посвящена аппаратным доработкам этого дешёвого и доступного китайского девайса. С их помощью можно расширить принимаемый диапазон, обзавестись большим количеством памяти для контактов, реализовать своеобразный TeamViewer для удалённого управления трансивером и обеспечить работу в сети APRS. Приятного чтения!Получаем полный КВ-диапазонВ предыдущей статье мы рассказывали, что путём п…

  • суббота, 1 июня 2024 г. в 00:00:14
habrahabr
Сложная красота в простой формуле

В детстве мне крупно повезло. Когда я учился в восьмом классе, в нашем доме появился всамделишный компьютер ZX Spectrum 128, который подключался к нашему домашнему телевизору и позволял почувствовать себя программистом. После школы, кое-как разобравшись с уроками, я крепко залипал перед экраном и старался успеть до прихода родителей с работы (телевизор-то на всех один), сотворить что-нибудь сногсшибательное. Творил я тогда на неотъемлемом от компьютера, и даже от его клавиатуры, языке BASIC, а …

  • суббота, 1 июня 2024 г. в 00:00:13
habrahabr
Объявляю ошибку вида if (x = 42) вымирающей и заношу её в Красную книгу C и C++ багов

Если спросить программиста, какие баги чаще всего можно встретить в C и C++ коде, он назовёт разыменование нулевого указателя, неопределённое поведение, выход за границу массива и другие, на его взгляд, типовые паттерны ошибок. Скорее всего, он назовёт и случайное присваивание в условии. Но действительно ли эта ошибка распространена в наше время? Так уж сложилось, что в языке C и C++ для оператора присваивания используется символ =, а для сравнения ==. Как следствие, возможны опечатки, когда в…

  • суббота, 1 июня 2024 г. в 00:00:11