habrahabr

Конфиденциальность мертва: Яндекс и ВК обучают ИИ на ваших личных данных?

  • воскресенье, 13 апреля 2025 г. в 00:00:07
https://habr.com/ru/articles/900132/
Счёт производства индусов идёт на секунды по мнению Алисы ПРО
Счёт производства индусов идёт на секунды по мнению Алисы ПРО

Недавно Яндекс «подарил» мне месячную подпиську на АлисаПро — доступ к последней модели YandexGPT в ра мках использования голосового ассистента в колонке Алиса.

Конечно же, как и любой человек наслаждающийся манией величия, я поинтересовался у Алисы — что она знает обо мне.
И... выпал в осадок.

Вот видеопример снятый чуть позже, что бы не обвиняли в скриншотах состряпанных в MSPaint Ж)

В подборке обычного бреда который выдают все ИИ, творчески привирая и приукрашивая данные на основании ключевых слов связанных с персоной, я увидел перечень мест моей работы и мой номер телефона.

Врёт! С 2005 (первая публикация) я любитель, профессией стало только в 2010, когда начали платить :)
Врёт! С 2005 (первая публикация) я любитель, профессией стало только в 2010, когда начали платить :)

Перепроверил. Почистил чат и начал диалог заново. Да, Яндекс GPT знает мой номер телефона и выдаёт его по запросу сторонним пользователям, то есть хранит персональные данные в своей модели, без моего на то разрешения (он же это на территории РФ хранит, да? На сертефицированных ФСБ серверах, как положено?).

По совокупности признаков — это данные из социальной сети ВКонтакте. Например список мест работы совпадает с опубликованным мною ранее в этой соц.сети.

Но... есть нюанс — телефон там с момента публикации был в формате «Только друзьям». То есть его видеть могли мои друзья, а кого попало я в друзья не добавляю, и сотрудники ВКонтакте имеющие соответствующий доступ.

Я, конечно же проверил с помощью archive.org доступность моего личного профиля для поисковых роботов, внимательно рассмотрел все снапшоты за достаточно большой период времени — ни списка мест работы, ни телефонного номера ВКонтакте «наружу» не публиковал.

"Это был пранк, а вы не поняли! Хнык!"
"Это был пранк, а вы не поняли! Хнык!"

Как мне посоветовали боты поддержки Яндекса в соц.сети платформы  Meta Platforms Inc.* (* -Признана экстремистской организацией и запрещена на территории РФ) я спросил у Алисы об источнике информации, на что получил ответ, что это был «вымышленный сценарий». Ну‑ну, она бы ещё указала, что все совпадения с живущими людьми случайны. К сожаленнию ссылки на источник информации добиться не удалось.

Простите, тут будет несколько картинок подряд. Иначе мне никто не поверит, что ИИ умеет нагло и беспринципно врать.

Алиса признаётся, что брешет...
Алиса признаётся, что брешет...
...и Алиса уходит в несознанку
...и Алиса уходит в несознанку

Что это может быть?

Искуственный Интеллект Яндекса проник через задний проход ВКонтакт в поисках Джона Коннора и, на всякий случай, взял и мой номерок? Кто‑то при смене места работы прихватил с собой немного BigData и обучил нейронку на «обезличенном наборе данных» который нейронка вполне себе соотнесла с реальным человеком и совпадение 100%? Просто моя паранойя и моё везение традиционно встретились с кейсом вероятностью 0.00 000 000 000 000 000 002% который если и мог случиться, то только со мной?
(кстати принимаю предложения работы в сфере тестирования неудачником)

Окау, предположим, что кто‑то из моих фанатов занимался сталкингом и выложил где‑то мою биографию, делаем ещё один тест — новая персона непубличная, страница доступна только авторизованным пользователям, поисковики (в частности Wayback Machine) её не видят вообще.

Запрашиваем у Алисы о персоне и способах связи с нею. Получаем следующую информацию (см. скриншот). Видим список внуков, видим место учёбы. По словам «источники вдохновения» понимаем, что данные точно взяты с личной страницы В Контакте.

При этом профиль у пользователя — закрытый. Основную информацию страницы согласно настроек видят — только друзья. И среди этих друзей нету Yandex GPT и вообще сотрудников Яндекса или ботов.

По именам внуков можно понять, что актуальность информации достаточно свежая, доступ к базе ИИ получил последний (крайний?) раз после 20 года, это не какой-то старый "слив" или архивы поисковика Яndex времён начала века, когда программисты VK ещё не знали о существовании robots.txt.

То есть Яндекс обучал свой искуственный интеллект на свежих, реальных данных, уже после того как был принят федеральный закон о персональных данных. Я даже не стал затруднять себя уточнением у Алисы по поводу источника перечня имён несовершеннолетних которые она предоставила, потому что назвать ребёнка Радуга в «гипотетической генерации для демонстрации» ИИ просто неспособ ен, (если конечно речь не про искуственный интеллект племени Навахо или Чероки), но будет мне об этом упорно врать, якобы это вымышленные дети. Пользуясь случаем передаю привет отцу X Æ A-12.

За время написания статьи счётчик просмотров ЗАКРЫТОЙ записи   -  подрос на три визита.
За время написания статьи счётчик просмотров ЗАКРЫТОЙ записи - подрос на три визита.

И да, у меня конечно же есть лакмусовые бумажки для того, что бы видеть с какой частотой к моей «закрытой» информации обращаются разные любопытные носы, будь то товарищ майор или дорвавшийся до базы ИИ.

Покажу одну для примера — в 22 году опубликовал пост ВКонтакте с галочкой видимости «только Близкие Друзья» — а их у меня 0 человек. Закрепил ег о на страничке (я тогда писал видео-анонс к своему каналу мне надо было иметь текст под рукой повторяя дубли в разных локациях) и забыл о нём. Потом гляжу, просмотры есть. И растут!

Как?! Он же закрытый от ВООБЩЕ ВСЕХ! За два с половиной года ~ 380 обращений к записи. Если бы учитывались мои заходы — счётчик был бы посолиднее, если исключительно с новых устройств, локаций, IP — цифры были бы меньше. За последнюю неделю пока я пишу этот материал — три захода‑просмотра. Кто‑то просматривает закрытую запись? Кто?!

Что мы имеем в итоге? *

 — В анекдоте после 10.000.000.000 попыток сервер соглашается, что пароль «Мао Дзе Дун», а Алиса в реальной жизни с полпинка разглашает персональные данные людей называя это «демонстрацией возможностей» и «несуществующей информацией». И где‑то хранит их без нашего ведома и разрешения.

— ВКонтакте не так уж и хорошо хранят персональные данные пользователей и все настройки «только для друзей» и прочие закрытия страницы не работают, либо работают не так, как пользователь ожидает. И кто‑то за нами наблюдает.

— Уже не надо копаться по мусорным бакам в поисках бумажек с паролями и прочих чувствительных сведений, достаточно взять российский искуственный интеллект не ограниченный рамками закона и этики, и он сам всё расскажет. К слову другие ИИ отказывались даже пытаться искать и выдавать контакты персон, аппелируя к заложенным в них ограничениям.

* Голосом Леонида Каневского: Конечно же не мы, а нас.

Конфиденциальность в интернете — мертва, ибо что знают двое — знает и свинья.

PS & NB: Все опубликованные в статье персональные данные используются в данном материале исключительно в иллюстративных целях для освещения проблемы имеющей общественную значимость. При репостах публикации просьба согласовывать использование иллюстраций с автором. Или своих наделайте, это просто.
Спасибо.