Поскольку данные продолжают влиять на принятие решений в различных секторах, эффективные инструменты визуализации данных становятся все более ценными. В области фармакологии эти инструменты особенно полезны для понимания сложных наборов данных и извлечения ценных идей. Одним из таких инструментов является пакет Tidy Life Formats (TLF), комплексная библиотека, разработанная Open-Systems-Pharmacology для создания стандартных и пользовательских графиков.
Краткий обзор TLF
TLF — это надежный инструмент, использующий язык программирования R, популярный среди статистиков и специалистов по данным. TLF выделяется своей гибкостью и простотой использования, что делает его предпочтительным выбором для визуализации данных в фармакологии и других научных дисциплинах.
Монтаж
Установка TLF — это простой процесс, а разрабатываемая версия TLF легко доступна на GitHub. Для установки используйте следующую команду:
# install.packages("remotes") remotes::install_github("Open-Systems-Pharmacology/TLF-Library")
Кроме того, TLF требует установки определенных пакетов. Некоторые из них можно установить из CRAN, включая ggplot2
, jsonlite
, patchwork
и R6
. Другие, такие как ospsuite.utils
, необходимо загружать вручную.
Типичный рабочий процесс в TLF
Процесс создания графиков с помощью библиотеки TLF представляет собой стандартный рабочий процесс, состоящий из нескольких шагов:
- Сбор данных: соберите данные и упорядочите их в аккуратном формате
data.frame
. - Предварительная обработка данных: используйте класс
AggregationSummary
для предварительной обработки данных. - Группировка данных: примените класс
GroupMapping
, чтобы указать группы данных, которые будут отображаться в виде заголовков в подписях к рисункам. - Отображение данных: используйте класс
DataMapping
для выбора независимых и зависимых переменных обрабатываемых данных и выбора внешнего вида, который будет различать указанные группы данных. - Конфигурация графика: задайте объект
PlotConfiguration
, который описывает настройки графика, такие как маркировка осей, размеры шрифта и водяные знаки. - Генерация графика: создайте объект
ggplot
, используя специальную функцию построения графика из классов выше.
Соглашения об именах
TLF использует специальные соглашения об именах для функций и классов, относящихся к отдельным графикам. Соглашение для классов следует формату <Plot Name><Class>
, а функции используют формат <function><Plot Name>
. Примеры включают:
PKRatio
: PKRatioDataMapping, PKRatioPlotConfiguration, plotPKRatioDDIRatio
: DDIRatioDataMapping, DDIRatioPlotConfiguration, plotDDIRatioIndividualIdProfile
: Индивидуалидпрофиледатамаппинг, Индивидуалидпрофилеплотконфигуратион, сюжетиндивидуалидпрофилеObsVsPred
: ObsVsPredDataMapping, ObsVsPredPlotConfiguration, plotObsVsPredHistogram
: HistogramDataMapping, HistogramPlotConfiguration, plotHistogramBoxWhisker
: BoxWhiskerDataMapping, BoxWhiskerPlotConfiguration, plotBoxWhisker
Предварительная обработка данных
Класс AggregationSummary
упрощает вычисление сводной статистики из необработанных данных. Например, он может вычислить минимальное и среднее значение для каждого человека в заданном столбце набора данных. Он работает в три этапа:
- Выбирает три набора столбцов из входного фрейма данных
data
: набор независимых переменных (xColumnNames
), набор группирующих переменных (groupingColumnNames
) и набор зависимых переменных (yColumnNames
). - Для каждого значения независимой переменной
xColumnNames
строки кадра данных объединяются в группы, определяемые уникальными комбинациями элементов в столбцах группирующих переменныхgroupingColumnNames
. - Оценивает сводную статистику для
yColumnNames
переменных в каждой группе. Функции для вычисления сводной статистики задаются при инициализацииAggregationSummary
черезaggregationFunctionsVector
.
Заключение
Хотя в этом руководстве представлен обзор пакета TLF и его возможностей, всегда лучше обращаться к официальной документации для получения самой актуальной и полной информации. Являетесь ли вы опытным специалистом по данным или начинающим исследователем, пакет TLF — это мощный инструмент для визуализации данных, который может стать активом в вашем наборе инструментов для анализа данных.