Вот минимальный, полный и проверяемый набор данных игрушек для моей проблемы:
genes = pd.Series(["Gene1"] * 16 + ["Gene2"] * 16)
conditions = pd.Series(np.tile(np.array(["Condition1"] * 8 + ["Condition2"] * 8), 2))
wellID = pd.Series(np.array(["W1"] * 4 + ["W2"] * 4 + ["W3"] * 4 + ["W4"] * 4 + ["W5"] * 4 + ["W6"] * 4 + ["W7"] * 4 + ["W8"] * 4))
fluo = pd.Series(np.array([np.sort(np.random.logistic(size=4)) for _ in range(8)]).flatten())
cycles = pd.Series(np.tile(np.array([0, 1, 2, 3]), 8))
df = pd.concat([genes, conditions, wellID, cycles, fluo], axis=1)
df.columns = ["Gene", "Condition", "WellID", "Cycle", "Fluo"]
Он состоит из 2 генов для 2 условий, каждый из которых имеет 2 повтора (1 реплика имеет 1 уникальный WellID, для которого имеется 4 цикла, 1 измеренная точка флуоресценции на цикл).
Я могу создать линейный график, который я хочу изолировать один ген с помощью этой команды:
sns.lineplot(x="Cycle", y="Fluo", hue="Condition", units="WellID", estimator=None, data=df.loc[df.Gene == "Gene1"])
Мне пришлось использовать и единицы измерения, и оценщик, чтобы я мог видеть 2 повтора (а не агрегированную кривую для каждого гена / состояния.
Наконец, я хотел использовать FacetGrid, чтобы увидеть этот график для двух генов, поэтому я сделал:
g = sns.FacetGrid(df, col="Gene", hue="Condition", col_wrap=5)
g.map(sns.lineplot, "Cycle", "Fluo");
Но тогда, если бы у меня были ключевые слова «единицы» и «оценщик», у меня была бы ошибка «ValueError: не удалось интерпретировать ввод 'WellID'».
Я мог отображать только графики с двумя агрегированными репликами.