Если вы ищете отель для следующего отпуска, поиск в Google, вероятно, будет вашим первым шагом. В таком городе, как Сан-Франциско и его окрестностях, есть сотни отелей, но, выполнив поиск по прямым ссылкам и сайтам с рейтингами в результатах, вы можете найти то, что ищете. Вы упустите некоторые варианты, но вы все равно найдете достаточно вариантов, чтобы быть удовлетворенными.

Этот поиск полностью отличается от поиска неструктурированных медицинских данных, таких как заметки о состоянии пациента, изображения или отчеты о патологии. Даже небольшой набор данных — это сотни тысяч записей, а скорее десятки миллионов. Помимо размера, есть много других отличий. Во-первых, если вы ищете заболевание, в отличие от отелей, вы получите результаты как присутствия, так и отсутствия. Если вы ищете место обнаружения заболевания, простое упоминание участка тела в записи не означает, что оно связано с заболеванием, которое вы искали. То же самое верно для значения измерения, такого как размер опухоли. Измерение в записи может относиться к размеру органа, а не обязательно к размеру опухоли. Таким образом, поиск по ключевому слову болезни, места обнаружения болезни и размера опухоли даст во много-много раз больше результатов, чем на самом деле ищет ищущий. На самом деле в нашем бизнесе обычно ищут менее 0,25% (четверть процента) записей.

Что это значит?

Возвращаясь к примеру с отелем, если бы в Сан-Франциско были сотни тысяч отелей, чтобы найти то, что вы ищете, вам нужно было бы запросить точные параметры… что-то вроде двух кроватей размера «queen-size», бежевого ковра в клетку. , рядом БАРТ, и светодиодные лампочки во всех светильниках. Вы пробовали это в последнее время в Google?

Если вы не используете технологию, которая может запрашивать связанные понятия в ваших медицинских данных, вам либо придется нанять персонал для ручной обработки результатов поиска, либо вы пропустите пациентов, которых ищете. Первый вариант излишне увеличит расходы на вашу аналитическую команду, а второй снизит уровень обслуживания пациентов, который мог бы быть обеспечен.

В моей следующей статье я углублюсь в примеры того, что означает поиск связанных понятий в здравоохранении. Я также отмечу, насколько беспорядочны неструктурированные данные EMR.