LaTeX для специалистов по данным, менее чем за 6 минут

Незаменимый навык для любого резюме в области науки о данных

Как специалист по данным, вы работаете с данными. Данные по своей сути математичны, и вам необходимо четко изложить эти идеи. Даже если вы не разрабатываете алгоритмы, умение выражать общие методы науки о данных - возможно, результат полиномиальной регрессии или выполнения преобразования Бокс-Кокса - является обязательным.

При этом LaTeX, самый популярный язык математического набора, имеет множество и много-много изысков. В этом руководстве будут показаны только самые важные части LaTeX, относящиеся к науке о данных, и к концу вы будете знать о LaTeX достаточно, чтобы использовать его в своих проектах.

Вот LaTeX, через 6 минут или меньше. В конце 5 практических задач LaTeX.

Отображение математики

Чтобы математические выражения отображались в тексте, выражение должно быть между знаками доллара.

In physics, the mass-energy equivalence is stated  by the equation $E=mc^2$, discovered in 1905 by Albert Einstein.

В качестве альтернативы можно использовать открывание и закрывание \[ и \].

The mass-energy equivalence is described by the famous equation
\[E=mc²\]

Это автоматически центрирует математику и отображает ее на новой строке.

Подстрочные и надстрочные индексы

Нижний индекс обозначается символом _, а верхний индекс - символом ^. $a^2$ выведет . Верхние индексы, а также объединяться с нижними индексами, вызывая их последовательно:

\[ a_1^2 + a_2^2 = a_3^2 \]

Для более длинных надстрочных и подстрочных индексов размещение надстрочного и подстрочного индекса в скобках может очистить код:

\[ x^{2 \alpha} - 1 = y_{ij} + y_{ij}  \]

Примечание. В LaTeX есть много символов, которые можно вызывать с помощью \name. В приведенном выше примере использовалось \alpha. Другие включают \infty, что означает символ бесконечности.

Верхние и нижние индексы также могут быть вложены и объединены разными способами, если область действия четко указана в круглых скобках:

\[ (a^n)^{r+s} = a^{nr+ns}  \]

Многие математические операторы требуют индексов и / или надстрочных индексов. В этих случаях оператор рассматривается как объект с обычными надстрочными и подстрочными свойствами. Возьмем, например, оператор сигмы / суммирования, который вызывается \sum.

\[ \sum_{i=1}^{\infty} \frac{1}{n^s}  
= \prod_p \frac{1}{1 - p^{-s}} \]

Несмотря на то, что надстрочные и подстрочные индексы вызываются для обычного объекта с помощью оператора сигма, он автоматически выравнивается.

Еще кое-что следует отметить - при использовании индикаторов открытия и закрытия \ [и \] все будет помещено в одну строку, поэтому код, размещенный в нескольких строках, не повлияет на конечный результат.

Другие операторы, которые работают с надстрочным и подстрочным индексом, включают:

  • \int для интегралов
  • \cup для соединения (направленный вверх u)
  • \cap для перекрестка (вниз на u)
  • \oint для интеграла кривой
  • \coprod для сопутствующего продукта

Операторы

Тригонометрические функции, логарифмы и другие математические функции можно выделить без курсива и отформатировать, поставив перед ними символ \.

\[ 
\sin(a + b ) = \sin(a)\cos(b) + \cos(a)\sin(b) 
\]

Некоторые операторы могут принимать параметры через нижний индекс, например, оператор ограничения.

\[ 
\lim_{h \rightarrow 0 } \frac{f(x+h)-f(x)}{h} 
\]

Обратите внимание, как объявление лимита включает в себя нижний индекс и вызов символа \rightarrow. \frac{a}{b} - это метод создания дроби a/b.

Дроби и биномы

Чтобы некоторые команды в этом разделе работали, вы должны сначала включить пакет amsmath в начало файла.

\usepackage{amsmath}

Дроби и биномиальные коэффициенты очень просты. Они называются с \name{parameter1}{parameter2}.

\[     
\binom{n}{k} = \frac{n!}{k!(n-k)!} 
\]

Отображение дробей различается, когда они используются в строке.

Fractions can be used alongside the text, for  example $frac{1}{2}$, and in a mathematical  display style like the one below:
\[\frac{1}{2}\]

Дроби можно легко вкладывать, используя дробь в качестве параметра.

\[   
a_0+\cfrac{1}{a_1+\cfrac{1}{a_2+\cfrac{1}{a_3+\cdots}}} 
\]

В приведенной выше команде используется \cfrac{}{} из пакета amsmath, который сохраняет размер дробей одинаковым, даже если они вложены. Его можно заменить на \frac{}{}, что уменьшит вложенные дроби.

Скобки и круглые скобки

LaTeX поддерживает множество типов скобок:

  • (x+y) визуализирует (x + y)
  • [x+y] отображает [x + y]
  • \{ x+y \} отображает {x + y}
  • \langle x+y \rangle отображает ⟨x + y
  • |x+y| визуализирует | x + y |
  • \| x+y \| отображает ∥ x + y

Иногда скобки и круглые скобки будут слишком маленькими для выражения, например, если в нем есть дроби.

Динамические скобки и скобки используются командами \left[object] и \right[object] для обозначения начала и конца.

\[  
F = G \left( \frac{m_1 m_2}{r^2} \right) 
\]

В этом случае [object] был круглой скобкой, поэтому выражение было заключено в \left( и \right). [object] также можно заменить скобками (\left[ и \right]).

Матрицы

Пакет amsmath включает множество команд для набора матриц.

Матрица определяется несколькими значениями, разделенными в каждой строке знаком &, а каждая строка - знаком \\. Он заключен в стандартные \begin{object} и \end{object}.

Для простой матрицы без боковых скобок:

\begin{matrix}
1 & 2 & 3\\
a & b & c
\end{matrix}

Если подставить {matrix} в \begin{matrix} и \end{matrix} на {pmatrix}, матрица будет заключена в скобки:

{bmatrix} заключил его в скобки:

… И {Bmatrix} заключает его в фигурные скобки.

Упражняться

Теперь у вас есть базовые навыки работы с LaTeX. Найдите код, который создаст данный вывод.

Решения

# 1 (проигрыш):

\[
Loss = Bias^2 + Variance^2 + Noise
\]

# 2 (Хи-квадрат):

\[
Chi 
= \frac{(\hat(y)-y)^2}{\sqrt{y}}
= \frac{\delta^2}{\sqrt{y}}
\]

# 3 (KNN):

\[
\hat(f)(x)
\leftarrow \frac{\sum f(x)}{k}
\]
\[
DE(x_i,x_j) = \sqrt{(x_i-x_j)^2 + (y_{xi}-y_{xj})^2}
\]

# 4 (сигмовидная):

\[
\frac{1}{1+e^{-(wx+b)}}
\]

#5 (R²):

\[
R^2 = \frac{n \sum xy - \sum x. \sum y}{\sqrt{(n \sum x^2 - (\sum x)^2). (n \sum y^2 - (\sum y)^2)}}
\]

Заключение

В этом уроке вы узнали…

  • Как отформатировать математику в строке и отдельно
  • Как использовать надстрочные и подстрочные индексы, а также с операторами
  • Как звонить определенным операторам
  • Как использовать круглые и квадратные скобки, в том числе динамические
  • Как создавать матрицы с различными стилями боковых скобок

Теперь вы можете красиво отформатировать математику! Сейчас большая часть изучения LaTeX - это запоминание кода определенных объектов (\object), поскольку теперь вы знаете основную структуру LaTeX.

Если вам понравилась эта статья, возможно, вас заинтересуют и другие статьи из этой серии: