javascript

Расширяем кругозор: Garbage Collector в V8

  • пятница, 16 августа 2024 г. в 00:00:07
https://habr.com/ru/articles/836290/

Всем привет, Хабрчане! Во время подготовки к очередному тех-собесу, я задался вопросом: а как в V8 работает Garbage Collector, что такое Heap и Stack, про которые я неоднократно слышал? После прочтения нескольких англоязычных и русскоязычных ресурсов понял, что одни копают очень глубоко, а другие дают лишь минимальную базу. Я решил сделать что-то среднее и с агрегировать все эти знания в одну статью, плавно погружая читателя в тему.

Кстати, я начинающий Node.js разработчик и это моя первая статья, прошу не судить строго :)

Погружаемся!

Начнем с базы

Принцип сборки мусора довольно прост: если на сегмент в памяти никто не ссылается, например на объект, можно считать, что он (объект) не используется, и очистить его. Такой принцип ещё называют "принципом достижимости".

Основной алгоритм сборки мусора называется mark-and-sweep. Этот алгоритм может быть объединен также и с алгоритмом mark-compact. Вместе они работают следующим образом:

  1. Сборщик мусора отмечает все корневые объекты.

  2. Далее помечаются все объекты, на которые ссылаются эти корни.

  3. Процесс повторяется для всех достижимых объектов.

  4. После этого непомеченные объекты считаются недостижимыми и удаляются.

  5. Происходит перемещение (дефрагментация) оставшихся объектов. Это уменьшит фрагментацию и повысит производительность выделения памяти для новых объектов.

mark-and-sweep + mark-compact
mark-and-sweep + mark-compact

Существует ещё несколько алгоритмов сборки мусора. Некоторые из наиболее распространенных алгоритмов включают:

  1. Serial Garbage Collector

  2. Parallel Garbage Collector

  3. Concurrent Mark and Sweep (CMS)

  4. Garbage First (G1)

Копаем глубже

Как в памяти V8 распределяются переменные, функции и объекты? V8 использует схему, основанную на концепции Java Virtual Machine (JVM) и делит память на сегменты:

V8 memory schema

  • Code Segment: выполняемый на данный момент код.

  • Stack (статическое выделение памяти): содержит все примитивные типы данных (вроде int, bool, string) с указателями на функции, объекты, а также информация о вызовах методов.

  • Heap (динамическое выделение памяти): сегмент памяти, предназначенный для хранения ссылочных типов данных, вроде объектов, массивов и функций. Это самый большой блок области памяти и именно здесь происходит сборка мусора.

Подробнее про каждый сегмент

Stack:

Это область памяти, выделенная для каждого процесса в V8. Здесь, как говорилось ранее, хранятся статические данные, включая фреймы методов/функций, примитивные значения и указатели на объекты. Стек работает по принципу LIFO (Last In, First Out), то есть последний добавленный элемент будет первым извлеченным.

Heap – самый большой блок области памяти, под капотом он делиться на:

Heap schema

  • Young generation - место, где "живут" новые объекты, и большинство из них недолговечны. Это пространство небольшое и состоит из двух полу-пространств (from-space, to-space).

  • Old generation - место, куда перемещаются объекты, которые пережили два цикла сборки мусора в Young generation блоке. Это пространство управляется основным алгоритмом сборки мусора mark-and-sweepOld generation можно поделить ещё на два подпространства:

    • Old pointer space - cодержит объекты, которые пережили два цикла сборки мусора, и имеют указатели на другие объекты.

    • Old data space – содержит исключительно объекты, которые имеют данные (без ссылок) и строки, числа, массивы.

  • Large object space – тут хранятся объекты, размер которых превышает размер других пространств. Большие объекты никогда не удаляются сборщиком мусора.

  • Code-space - Здесь Just In Time (JIT) компилятор сохраняет скомпилированные блоки кода. Это единственное пространство с исполняемой памятью.

  • Cell space, property cell space, and map space – тут хранятся сервисные объекты, которые упрощают сборку мусора.

Заключение

Я надеюсь, что эта статья была полезной и интересной. Буду рад любым замечаниям и вопросам. Спасибо за внимание!

Вдохновлялся:

  1. A tour of V8: Garbage Collection

  2. Visualizing memory management in V8 Engine (JavaScript, NodeJS, Deno, WebAssembly)

  3. Устройство и работа JVM (Java Virtual Machine)

  4. Эффективная работа с памятью в Node.js

Мой репозиторий "Расширяем кругозор: Node.js и JavaScript", где я записываю интересные ответы на вопросы и познаю дзен V8.