Ни один разговор об искусственном интеллекте в медицинской сфере не обходится без изучения медицинских изображений. Однако медицинские изображения часто проблематичны из-за множества существующих форматов. В этом посте мы расскажем вам все, что вам нужно знать обо всех существующих форматах медицинских изображений.

Если вы уже работаете с форматами медицинских изображений и хотите пометить их для обучения своей модели машинного обучения, ознакомьтесь с нашим постом о маркировке медицинских данных или нашим Введением в аннотацию медицинских изображений. Если вы готовы маркировать свои данные, ознакомьтесь с нашей платформой маркировки данных Ango Hub: она бесплатна и поддерживает все основные форматы медицинских файлов. И если вы хотите передать свою медицинскую маркировку на аутсорсинг, с Ango Service это легко сделать.

Свойства медицинских изображений

Чтобы понять различные форматы медицинских изображений, важно сначала понять свойства медицинских изображений. Многие из нас знакомы с нормальными/плоскими изображениями. Следующее обсуждение возьмет элементы из нашего понимания традиционных изображений для понимания медицинских изображений.

Размерность

В то время как плоские (обычные jpg, png и т. д.) изображения имеют 2 измерения (3, если считать цветовые каналы), медицинские изображения часто могут иметь дополнительные измерения для получения дополнительной информации. Мы называем изображения с добавленными размерами объемами.

Таким образом, у нас есть следующие подразделения:

  • Двухмерное изображение: проекция анатомического объема на плоскость изображения, например рентгеновского снимка.
  • Трехмерный объем: серия изображений, представляющих тонкие срезы объема. Например, одно КТ. Третье измерение — пространственное, представляющее различные местоположения сканов.
  • 4-мерный объем: набор 3D-объемов или несколько снимков одного и того же 3D-объема с течением времени для создания динамической серии снимков, например исследования, содержащего несколько МРТ-сканирований. Четвертое измерение часто является временным, представляя сканирование в разное время.

Глубина пикселя

Пиксельная глубина представляет биты, необходимые для кодирования каждого пикселя. Например, для изображений RGB для каждого цветового канала требуется 1 байт, а поскольку цветовых каналов 3, глубина пикселя составляет 3 байта. 1 байт представляет диапазон значений для каждого цвета от 0 до 255. Чем больше число значений на пиксель, тем больше деталей мы можем зафиксировать.

Однако для медицинских изображений эта глубина пикселей варьируется. Как правило, поскольку необходимо представить больше деталей, в зависимости от типа исследования и используемого формата, глубина пикселей выше, чем у обычных изображений RGB. Многие медицинские изображения могут хранить до 2 байтов на пиксель (глубина пикселя 2 байта), что соответствует диапазону значений от 0 до 65535.

Фотометрическая интерпретация

Фотометрическая интерпретация определяет, как должен отображаться пиксель: монохромным или цветным. Например, дисплеи в оттенках серого будут интерпретировать пиксели иначе, чем дисплеи RGB. В качестве конкретных примеров, рентгеновские снимки и компьютерная томография имеют оттенки серого, тогда как ПЭТ, УЗИ (некоторые) и ОФЭКТ имеют RGB.

Медицинские изображения могут содержать информацию о том, как было создано изображение. Например, магнитно-резонансное изображение будет иметь параметры, связанные с используемой последовательностью импульсов, например, информация о времени, угол переворота, количество снимков и т. д.

Изображение ядерной медицины, такое как изображение ПЭТ, будет содержать информацию о введенном радиофармпрепарате и весе пациента.

Метаданные — это мощный инструмент для аннотирования и использования информации, связанной с изображениями, в клинических и исследовательских целях, а также для организации и извлечения изображений с определенными характеристиками.

Здесь хранятся фактические данные, представляющие пиксели изображения, обычно в виде массива значений. Комбинируя свойства в разделе «Метаданные», можно визуализировать пиксельные данные.

Как правило, для приложений компьютерного зрения это часть, которая имеет большее значение и часто используется для архитектуры глубокого обучения.

Форматы медицинских изображений

Формат файла DICOM

DICOM, пожалуй, самый популярный формат для хранения медицинских изображений. Он определяет стандарт обработки, хранения, печати и передачи информации в медицинских изображениях. Это формат файлов, который вы можете ожидать сразу после сканирования или больничной PACS.

Файл DICOM состоит из заголовка и данных изображения в одном файле (*.dcm). Заголовок содержит такую ​​информацию, как идентификатор пациента, имя пациента, модальность и другую информацию. Он также определяет, сколько кадров содержится и в каких разрешениях. Любая аннотация, сделанная на томе или изображении DICOM, также может быть сохранена в заголовке.

Помимо рентгеновских снимков, одно сканирование (сканирование) создает несколько файлов DICOM. В идеале каждый из этих файлов должен иметь пространственное и временное расположение, поэтому мы можем упорядочить их.

Формат файла NIFTI

NIFTI также является популярным форматом для хранения медицинских данных. Формат файла NIFTI (.nii) содержит два определения аффинных координат, которые связывают каждый индекс вокселя (i,j,k) с пространственным положением (x,y,z).

Основное различие между DICOM и Nifti заключается в том, как Nifti хранит 3D-данные. В DICOM в одном объеме хранится несколько срезов без встроенной поддержки трехмерных координат. Файлы NIFTI, с другой стороны, изначально хранят объемы 3D-изображений (такие как компьютерная томография и магнитно-резонансная томография).

Недавно была создана обновленная версия стандарта NIFTI-2 для управления большими наборами данных. В этой новой версии каждое измерение матрицы изображения кодируется 64-битным целым числом вместо 16-битного, как в Nifti-1, что обеспечивает более широкий диапазон деталей.

Формат файла NRRD

Гибкий формат NRRD (.nrrd) включает один файл заголовка и файл(ы) изображения, которые можно разделить или объединить. Заголовок NRRD точно представляет N-мерную растровую информацию для научной визуализации и обработки медицинских изображений.

В отличие от DICOM основное внимание уделяется не хранению медицинских данных, а скорее визуальному представлению N-мерных данных (обычно N равно 2, 3 или 4).

Анализ формата медицинского файла

Analyze был одним из первых формальных форматов хранения медицинских изображений, разработанных еще в 1980-х годах. Формат Analyze был разработан для многомерных данных (объемы 3D, 4D). Таким образом, это был большой шаг вперед для хранения медицинских изображений, которые раньше обычно поддерживали только формат 2D.

Том Analyze 7.5 состоит из двух двоичных файлов: файла изображения с расширением «.img», который содержит необработанные данные вокселей, и файла заголовка с расширением «.hdr», который содержит метаданные, такие как количество пикселей в x, направления y и z, размер вокселя и тип данных.

Формат файла MINC

Формат MINC (.mnc) для данных нейроинформатики был разработан и реализован в начале 1992 года. Целью проекта была разработка формата данных и инструментов программирования для нейровизуализации.

Файлы MINC обычно используются для представления любых данных 2D или 3D изображений, таких как МРТ, ПЭТ, КТ или гистология. Одним из преимуществ данных ПЭТ является способность MINC представлять временную ось с неравномерным интервалом. MINC также можно использовать для представления производных данных, таких как тензоры диффузии и поля деформации.

В своем нынешнем состоянии (MINC 2.0) он следует иерархическому формату хранения данных и является гибким и расширяемым форматом.

Коротко о форматах медицинских изображений

Хотя каждый формат файла имеет свое собственное применение для разных случаев использования, DICOM на сегодняшний день является наиболее часто используемым форматом медицинских изображений, а другие форматы часто преобразуются в DICOM для дальнейшей обработки. Однако для исходной 3D-системы часто предпочтительны NRRD и NIFTI, поскольку они могут изначально хранить многомерные данные.

Используя наше обсуждение форматов медицинских изображений и методов их внутреннего хранения, мы можем адекватно использовать их метаданные и пиксельные данные для приложений машинного обучения и глубокого обучения. В сообществе открытого исходного кода существует множество фреймворков, которые поглощают эти файлы вместе с качественными аннотациями, чтобы делать замечательные выводы о медицинских данных.

Однако трудно найти качественные аннотации к медицинским данным. Аннотирование этих сложных форматов является еще более обременительной задачей, чем их расшифровка и интерпретация. Вот где мы входим в Анго А.И.. С нашей командой медицинских экспертов и платформой, предназначенной для решения сложных задач чтения и аннотирования медицинских данных, мы гарантируем, что наши клиенты получат наборы медицинских данных высочайшего качества, чтобы раздвинуть границы ИИ в медицинской сфере.

Не стесняйтесь заказать демонстрацию у нас, чтобы обсудить решение ваших потребностей в маркировке данных, или попробовать Ango Hub сегодня бесплатно.

Автор: Баладж Салим
Технический корректор: Онур Айдын
Редактор: Лоренцо Гравина

Первоначально опубликовано на https://ango.ai 22 июля 2022 г.