«Выбранный нами объектив меняет то, как мы смотрим на вещи» - Девитт Джонс.

Примечание от редакторов Data Science. Хотя мы разрешаем независимым авторам публиковать статьи в соответствии с нашими правилами и рекомендациями, мы не поддерживаем вклад каждого автора. Не стоит полагаться на работы автора без консультации с профессионалами. См. Подробности в наших Условиях для читателей.

Повышенная доступность данных, более высокая вычислительная мощность и доступность легко реализуемых фреймворков ИИ открыли эру возрождения ИИ между Великой рецессией и сейчас. Это дает нам возможность анализировать кризис после COVID-19 так, как мы не могли в 2008 году.

В этой статье изучается влияние COVID-19 путем изучения того, как изменились доходы компании после COVID-19. В частности, в ней используется машинное обучение для прогнозирования ключевых факторов, лежащих в основе снижения доходов компании, зарегистрированной на NASDAQ, более чем на 10% г / г во втором квартале 2020 года.

В этой статье используются концепции анализа финансовой отчетности и машинного обучения для получения важных сведений. Сначала я представляю свою методологию и результаты, а затем глубоко погружаюсь в моделирование. Это предназначено скорее для использования в качестве основы для анализа, чем для исследования, направленного на получение конкретных выводов. Возьмите кофе, расслабьтесь и наслаждайтесь!

Содержание

  1. Резюме
  2. Ключевые драйверы + выбор глубоких погружений
  3. Пример моделирования компании: Salesforce
  4. Моделирование глубокого погружения
  5. Дополнительная справочная информация
  6. Заключительные мысли

1. Резюме

Я сравнил данные финансовой отчетности компании за 2 квартал 2020 г. и 2 квартал 2019 г., чтобы понять, произошло ли падение чистой прибыли более чем на 10% за период со 2-го кв. Я разработал модель машинного обучения на основе lightgbm для прогнозирования результатов (›снижение чистой прибыли на 10%) с несколькими исходными данными, включая финансовые показатели за 19 финансовый год.

Модель машинного обучения дает возможность моделировать макро- и микротенденции - это мощный инструмент для определения основных параметров воздействия. Его также можно использовать для анализа, какие факторы оказали максимальное влияние на падение прибыли компании.

Модель использует данные из Yahoo Finance с помощью yahooquery и использует SHAP для анализа ML-модели. Помимо предоставления результатов анализа ML + SHAP, я также попытался предоставить интуитивное объяснение результатов везде, где это возможно.

2. Ключевые драйверы + выбор глубоких погружений

Ключевые факторы: сектор - самый надежный фактор, предсказывающий ›снижение чистой прибыли на 10%, за которым следует отношение капитальных затрат к выручке.

Глубокий анализ сектора. Секторы сильно влияют на падение доходов. На приведенном ниже графике (ось Y показывает влияние COVID-19, а ось X - секторы), где анализируемые компании представляют собой отдельные точки данных, убедительно демонстрирует, что Энергетика и Цикличность потребителей являются наиболее затронутыми секторами, тогда как Защита потребителей, Технологии и коммунальные предприятия пострадают меньше всего.

Интуиция: COVID-19 привел к шоку со стороны спроса для энергетических компаний (проще говоря, меньше людей заправляет топливо), что привело к снижению доходов и, следовательно, убыткам нефтяных компаний. Среди потребительских компаний Consumer Defensive (те, которые продают основные продукты и привычные товары) осталась на месте, поскольку спрос на их продукты относительно неэластичен, в то время как Consumer Cyclicals (те, которые продают товары повседневного спроса) значительно упали. Неэластичность спроса также объясняет слабое влияние на коммунальные предприятия. Технологии также остались относительно невредимыми благодаря увеличению WFH, ускоренному продвижению к оцифровке и т. Д.

Дополнительное наблюдение: обратите внимание на набор красных точек наверху башни Сектора 3 (Защита потребителей) - это, скорее всего, эффект от таких компаний, как Coca Cola, Pepsi и т. д. с большим количеством занятых полный рабочий день. сотрудников, сообщивших Снижение кв / кв во 2 кв.

Углубленный анализ капвложений: компании с высоким соотношением капвложений к выручке сильно пострадали - обратите внимание на тенденцию в виде точек на графике ниже (Примечание: ось Y = сила / влияние на модель. Цвет точка = степень влияния ключевого вторичного фактора, т. е. общего дохода).

Интуиция: COVID-19 снизил доходы. Компании потенциально могли бы действовать быстро, чтобы в некоторой степени сдерживать операционные затраты, однако более высокие капитальные затраты (затраты, понесенные для создания потенциальной выручки в последующие годы) в прошлые годы означали бы более высокую амортизацию по прибылям и убыткам и, следовательно, более низкую чистую прибыль. Кроме того, глядя на красные точки вверху, можно сделать вывод, что больше всего пострадают компании с более высокими абсолютными капитальными затратами (а не только отношением капитальных затрат к выручке).

Глубокий анализ коэффициента P / E: компании с более высокой вероятностью публикации ›10% -ного падения прибыли имели более низкий коэффициент P / E (цена / прибыль, который также совпадает с отношением рыночной капитализации к чистой прибыли. ) чем другие.

Интуиция: г-н. Рынок всегда прав. Устойчивость акции оценивается в ее ценовой надбавке, то есть компания с более высоким качеством прибыли (включая потенциал удержаться перед лицом неблагоприятных рыночных условий) будет иметь более высокую цену, чем компания с более низким качеством. Акции, которые, по мнению участников рынка, в среднем лучше, пережили бурю COVID-19 лучше с точки зрения прибыли.

3. Пример моделирования компании: Salesforce

У Salesforce был замечательный Q2FY20. Чистая прибыль увеличилась с 91 млн долларов до 2,6 млрд долларов США по сравнению с предыдущим кварталом. Модель правильно предсказывает, что это акция с очень меньшей вероятностью ›10% -ного падения прибыли. Кроме того, он дает ключевые положительные факторы, способствующие наряду с их величиной воздействия - тот факт, что акции технологического сектора с высоким коэффициентом P / E вносят значительный положительный вклад (синий цвет), намного превосходящий отрицательный вклад (красный цвет) таких показателей, как общий доход. диапазон.

4. Моделирование глубокого погружения.

(Пропустите этот раздел, если не слишком разбираетесь в мелочах)

  • Я выбрал функции / входные данные, учитывая два ключевых принципа: (1) Включать поля с высоким уровнем доступности данных (меньше NaN и т. Д.) И
    (2) Избегать множественной коллинеарности: например, Валовая прибыль = Выручка - COGS, поэтому не могу выбрать все три, просто выберите максимум два и т. Д.
  • Модель имеет AUC (показатель качества модели) ›0,65.
  • Моя работа размещена на Kaggle here на случай, если вы захотите посмотреть. Любые отзывы приветствуются. Моя записная книжка Kaggle также содержит еще несколько потенциально значимых снимков, которые можно использовать для получения дополнительных сведений.

5. Дополнительная справочная информация

Об анализе финансовой отчетности…

Эта ссылка Investopedia является хорошей отправной точкой для анализа финансовой отчетности 101. Если вам нужен глоссарийный взгляд на ключевые термины в финансовой отчетности с хорошими пояснениями, то этот ресурс от Mercer Capital - хороший.

О машинном обучении…

С точки зрения бизнеса, эта страница McKinsey - один из лучших ресурсов, которые я когда-либо видел. Если вы хотите уточнить детали, Замечательные слайды Джейсона Мейеса идеально подходят для вас.

6. Заключительные мысли

Мы изучили схему анализа влияния COVID-19 на прибыль компании. Мы подробно рассмотрели, как сектор, капитальные затраты и коэффициент P / E повлияли на снижение прибыли. Приведенная ниже визуализация с использованием SHAP прекрасно резюмирует наш анализ.

Фреймворк можно использовать для анализа тенденций макроэкономической прибыли, как описано выше, или для выполнения микроанализа, как в примере с Salesforce выше. Такой анализ дает более глубокое представление о том, как кризис COVID-19 повлиял на экономику.

PostScript:

  1. Что касается финансов, я сделал снимок данных из Yahoo Finance примерно в середине сентября. Результаты могут немного отличаться в зависимости от того, когда у вас есть снимки данных.
  2. Это не является инвестиционной гипотезой и не должно рассматриваться как инвестиционный совет.
  3. Взгляды, выраженные в этой статье, являются моими личными взглядами. Ваши отзывы всегда приветствуются.

Кредиты:

Скотт Лундберг за замечательный фреймворк SHAP https://shap.readthedocs.io/en/latest/
Дуг Гатри за yahooquery, который я использовал для сборки данных https://pypi.org/project/yahooquery/