Проблема с расширением mmap и хеш-таблицы в glibc

В подходе к обнаружению повреждения кучи я пытаюсь реализовать хеш-таблицу, чтобы хранить некоторую информацию о поврежденной памяти. Это делается внутри самой glibc. Когда мы malloc (), мы помещаем такую информацию, как адрес и размер, в хеш-таблицу, а когда мы free (), мы освобождаем соответствующую запись в хеш-таблице, опять же в самой glibc's free ().

Чтобы выделить память для хэш-таблицы, я использовал mmap'd некоторую память (воздержался от использования для этого malloc, поскольку вероятность повреждения кучи, вызванного процессом, также может повредить мою хеш-таблицу). Проблема в том, что нет ограничений на количество mallocs, которые может запросить процесс, это требует, чтобы моя хеш-таблица была расширяемой. Поскольку моя хеш-таблица работает с индексами массива, память, используемая для хеш-таблицы, должна быть непрерывной, чтобы с помощью индекса мы могли легко добраться до корзины или записи. Теперь, когда хеш-таблица использует всю память, мне нужно снова выполнить «mmap» таким образом, чтобы эта память начиналась там, где закончилась предыдущая. На странице руководства mmap говорится, что мы можем предоставить адрес для mmap, который будет действовать как подсказка ядру для отображения виртуальной памяти по этому адресу. Для хеш-таблицы это будет выглядеть как непрерывный кусок памяти. Я хотел бы спросить вас, насколько надежен этот подход и каковы возможные подводные камни при его использовании.

Kapil 24.10.2011 источник

Ответы (2)

arrow_upward
3
arrow_downward

Если это Linux, вы можете использовать _1 _ .

Если вы пишете свою хеш-таблицу на основе смещений, а не абсолютных указателей, вы можете передать флаг MREMAP_MAYMOVE и никогда не беспокоиться о сбоях выделения. (Ну, по крайней мере, пока вы не исчерпаете свою виртуальную память.)

Nemo 31.10.2011

comment

Большое спасибо "Занятому русскому" и "Немо" за ответы. Я изучу mremap (). Похоже, если mmap - это malloc (), то mremap - это realloc (), в чем я отчаянно нуждался. - Kapil; 01.11.2011

arrow_upward
1
arrow_downward

насколько надежен этот подход

MAP_FIXED очень надежен: ЕСЛИ запрашиваемая память доступна, ядро предоставит ее вам.

каковы потенциальные ловушки

Очевидный: что-то еще могло mmap попасть в область, в которую вы хотите расширить, и вы проиграете.

Если вы делаете это для 64-битного процесса, вы можете mmap например 1 ТБ памяти в качестве начального выделения хеш-таблицы. Пока вы фактически не обращаетесь к нему, это mmap фактически бесплатно (по стоимости), если вы выполняете MA_ANON отображение.

Кстати, я надеюсь, вы понимаете, что здесь вы заново изобретаете велосипед, поскольку многие существующие решения (такие как tcmalloc и jemalloc) уже предоставляют средства отладки, которые, вероятно, будут лучше, чем все, что вы придумываете сами.

Employed Russian 31.10.2011

Проблема с расширением mmap и хеш-таблицы в glibc

Ответы (2)

Вопросы по теме