Задача NTCIR-14 FinNum
На прошлой неделе наша команда специалистов по обработке и анализу данных успешно выиграла конкурс «Мелкое числовое понимание финансовых твитов». Мы так гордимся ими!
Введение
Чтобы понять детали финансового документа, инвесторам необходимо проанализировать не только текст, но и фундаментальную и техническую числовую информацию. Числовые данные играют решающую роль в финансовой сфере, например, при оценке стоимости ценных бумаг или прогнозировании фондового рынка. Таким образом, идентификация, понимание и анализ этих финансовых данных составляют основу отрасли, а данные являются наиболее важным ресурсом для инвесторов.
Сегодня социальные сети становятся важным центром для инвесторов, поскольку они содержат большой объем финансовых данных, влияющих на то, как формируется их мнение. Twitter — одна из таких платформ, собирающих массивы числовых твитов, что создает новые проблемы для ручной обработки данных.
Национальный тайваньский университет организовал FinNum задание для детального понимания числовых данных в финансовых данных социальных сетей, чтобы определить категорию числительного.
Подробнее о предоставленных данных и задачах
Команде Fortia data science приходилось работать в основном с неструктурированными данными. Была представлена таксономия числительных. Он был разделен на 7 категорий и несколько подкатегорий. Общая задача FinNum состояла в том, чтобы классифицировать эти числительные по предопределенным категориям и подкатегориям.
Подзадача 1. Классифицируйте числительное по 7 категориям, т. е. денежным, процентным, опционным, индикаторным, временным, количественным и номером продукта/версии.
Подзадача 2. Расширьте задачу классификации до уровня подкатегории и классифицируйте числа по 17 классам, включая индикатор, количество, номер продукта/версии и все подкатегории, показанные в таблице 1.
Используя предоставленный набор данных, специалисты по обработке и анализу данных Fortia создали новую архитектуру глубокого обучения для решения этой задачи многоклассовой классификации. Быть в курсе! Наша команда представит свою модель на 14-й конференции NTCIR в Японии в июне следующего года!
Ссылка на результат участников FinNum