Задача NTCIR-14 FinNum

На прошлой неделе наша команда специалистов по обработке и анализу данных успешно выиграла конкурс «Мелкое числовое понимание финансовых твитов». Мы так гордимся ими!

Введение

Чтобы понять детали финансового документа, инвесторам необходимо проанализировать не только текст, но и фундаментальную и техническую числовую информацию. Числовые данные играют решающую роль в финансовой сфере, например, при оценке стоимости ценных бумаг или прогнозировании фондового рынка. Таким образом, идентификация, понимание и анализ этих финансовых данных составляют основу отрасли, а данные являются наиболее важным ресурсом для инвесторов.

Сегодня социальные сети становятся важным центром для инвесторов, поскольку они содержат большой объем финансовых данных, влияющих на то, как формируется их мнение. Twitter — одна из таких платформ, собирающих массивы числовых твитов, что создает новые проблемы для ручной обработки данных.

Национальный тайваньский университет организовал FinNum задание для детального понимания числовых данных в финансовых данных социальных сетей, чтобы определить категорию числительного.

Подробнее о предоставленных данных и задачах

Команде Fortia data science приходилось работать в основном с неструктурированными данными. Была представлена ​​таксономия числительных. Он был разделен на 7 категорий и несколько подкатегорий. Общая задача FinNum состояла в том, чтобы классифицировать эти числительные по предопределенным категориям и подкатегориям.

Подзадача 1. Классифицируйте числительное по 7 категориям, т. е. денежным, процентным, опционным, индикаторным, временным, количественным и номером продукта/версии.

Подзадача 2. Расширьте задачу классификации до уровня подкатегории и классифицируйте числа по 17 классам, включая индикатор, количество, номер продукта/версии и все подкатегории, показанные в таблице 1.

Используя предоставленный набор данных, специалисты по обработке и анализу данных Fortia создали новую архитектуру глубокого обучения для решения этой задачи многоклассовой классификации. Быть в курсе! Наша команда представит свою модель на 14-й конференции NTCIR в Японии в июне следующего года!

Ссылка на результат участников FinNum