Познакомьтесь с командой Thread Genius на Sotheby’s

Наука о данных, машинное обучение и искусственный интеллект - это области компьютерных наук, которые уже проникли во многие отрасли и компании по всему миру. Их внедрение почти наверняка коррелирует с ростом« больших данных » за последнее десятилетие.

Усовершенствованная аналитика данных может изменить то, как компании понимают идеи, организуют деятельность и создают ценность. Прогресс в области языков программирования, библиотек с открытым исходным кодом и облачных вычислений также упростил эффективное применение этих методов к данным.

Рынок искусства остается сектором, в котором революция в аналитике данных еще не началась должным образом.

В этом сообщении блога будет рассказано, как современные методы обработки и обработки данных, машинного обучения (ML) и искусственного интеллекта (AI) используются на рынке искусства Thread Genius, фирмой, приобретенной Сотбис, старейший международный аукционный дом в мире (оценка 1744 г.). Я расскажу вам о динамике нашей команды, о проблемах, которые мы решаем, и о том, как мы это делаем.

Что такое машинное обучение и искусственный интеллект?

Это хороший вопрос. Во-первых, наука о данных - это дисциплина, в которой данные используются и анализируются для проверки гипотез, ответов на вопросы и понимания идей.

Машинное обучение - это когда вычислительные инструменты и статистические методы используются, чтобы дать компьютерам возможность учиться на данных и на их основе. Юфэн Джи из Google Cloud использует в своей статье более точное определение: использование данных для ответа на вопросы.

Искусственный интеллект - это когда вычислительные инструменты начинают обладать когнитивными способностями - для целей этого поста ИИ будет относиться к методам« глубокого обучения », использующим искусственные нейронные сети.

Кто такие Thread Genius?

Thread Genius - это стартап в области искусственного интеллекта, основанный Ахмадом Камаром и Эндрю Шумом в 2015 году и приобретенный Sotheby's в январе 2018 года. Оба основателя использовали работать в Spotify до запуска Thread Genius . Основным применением этой технологии была система визуального поиска, которая применяла методы глубокого обучения с использованием искусственных нейронных сетей для индустрии моды.

Обучая искусственные нейронные сети, Thread Genius смог распознавать одежду по изображениям, чтобы находить визуально похожие. Прочтите их статью на Medium Робо Билл Каннингем: Shazam для моды с глубокими нейронными сетями, чтобы узнать больше.

Интересно, что Thread Genius также применил эту технологию к искусству: прочтите Art Genius: открытие произведений искусства с помощью визуального поиска », чтобы узнать больше.

Как наша команда разбита?

Сейчас Thread Genius - это растущая команда инженеров машинного обучения, инженеров по программному обеспечению и данных, специалистов по обработке данных и дизайнеров, базирующаяся в штаб-квартире Sotheby’s в Нью-Йорке.

Наши первоначальные усилия включают разработку программного обеспечения для крупномасштабных конвейеров данных для очистки и стандартизации множества исторических данных Sotheby’s, чтобы мы могли проводить анализ данных и применять машинное обучение и искусственный интеллект в больших масштабах.

Прочтите эту статью в Fast Company о нас для получения более подробной информации.

Что мы пытаемся решить?

Итак, какие гипотезы мы пытаемся проверить, и на какие вопросы мы пытаемся ответить, используя и анализируя данные?

На Sotheby’s собраны одни из лучших данных на рынке искусства, связанные с историческими сделками, индивидуальными предпочтениями в отношении искусства в любой ценовой категории, изображениями, объектами и произведениями искусства и многим другим. Эффективно используя эти данные, мы надеемся выполнить следующие задачи:

Использование базы данных Sotheby’s Mei Moses. Это воплощает наши усилия по анализу искусства как актива. Набор данных Sotheby’s Mei Moses - это уникальная база данных о более чем 50 000 повторных аукционных продаж в восьми категориях коллекционирования - самые ранние зарегистрированные аукционные продажи были в начале 17 века! Впервые он был разработан в 2002 году профессорами Школы бизнеса Стерна Нью-Йоркского университета Джианпин Мэй, доктором философии, и Майклом Мозесом, доктором философии - прочтите научную статью здесь.

Набор данных использует закупочные цены одной и той же картины в два разных момента времени (то есть повторные продажи), чтобы измерить изменение стоимости уникальных произведений искусства. Мы планируем использовать эту информацию для анализа того, как стоимость уникальных объектов менялась во времени, и для сравнения инвестиционной эффективности искусства как актива с показателями других классов активов.

Разблокирование поставок. Мы хотим, чтобы нашим клиентам было проще продавать свои произведения искусства, если они захотят это сделать. Наша цель - использовать данные для создания более низкого барьера, помогающего людям продавать свое искусство. В настоящее время мы разрабатываем продукты, обеспечивающие прозрачность цен с помощью различных методов машинного обучения.

Система рекомендаций. До приобретения Thread Genius специализировалась на технологиях распознавания образов и рекомендаций на основе вкусов с использованием сверточных нейронных сетей. Используя данные Sotheby’s, мы будем рекомендовать нашим клиентам произведения искусства или предметы, поступающие на продажу, с использованием глубокого обучения.

Создание лучших продуктов для обработки данных. Объединив все три задачи, наша цель - повысить операционную эффективность и создать лучшие продукты для обработки данных на рынке искусства, чтобы наши клиенты могли получить лучший опыт и прозрачность. информация при работе с искусством на Sotheby's.

Как мы собираемся это сделать?

В основном мы используем платформу Google Cloud для всей нашей работы - от очистки данных в Dataprep, от обработки и стандартизации данных в Dataflow до хранения данных в Big Query, анализа данных в Datalab и, наконец, ML и AI с использованием всего набора возможностей машинного обучения GCP.

В основном мы кодируем на Python, но наши разработчики программного обеспечения используют Node и Ruby для внутренней разработки. Мы будем создавать индивидуальные приложения для некоторых миссий, описанных выше.

Почему эта проблема сложна

Хотя мы используем расширенную аналитику данных, чтобы понять суть изображений и данных, искусство в корне субъективно - как по ценности, так и по вкусу.

Всякий раз, когда мы обнаруживаем выводы из нашего анализа, очень важно проверять их на предмет знаний в предметной области, которыми обладают наши специалисты. Невозможно переоценить, насколько важно участие человека в этом процессе. Нам повезло, что на Sotheby’s работают лучшие в мире специалисты по искусству, которые могут нам помочь.

Более того, это будет первый раз, когда кто-то сделает что-то подобное на арт-рынке - мы, по сути, работаем на чистом холсте. Подобная задача очень увлекательна, и мы рады прокладывать путь к ее будущим разработкам.

Хотите нам помочь?

Целью Sotheby's всегда было быть лидером в области инноваций и технологий на рынке искусства и поддерживать будущее искусства и технологий.

Мы рады применять передовое машинное обучение и искусственный интеллект на рынке искусства и работать напрямую с нашими специалистами на Sotheby’s, чтобы мы могли создавать лучшие информационные продукты в отрасли.

Если у вас есть опыт работы в области науки о данных, машинного обучения, НЛП и / или искусственного интеллекта и вы заинтересованы в изменении мира, не стесняйтесь обращаться к нам за чатом, мы всегда заинтересованы в разговоре с вами, нашей аудиторией.

Продолжая свой путь к науке о данных, мы продолжим писать о наших проектах в этой публикации и более подробно, так что следите за обновлениями!

Спасибо за чтение,

Vishal

Прежде чем ты уйдешь…

Если вы нашли эту статью полезной, нажмите и удерживайте кнопку ниже и поделитесь статьей в Facebook, Twitter или LinkedIn, чтобы все тоже могли извлечь из нее пользу.

Вишал - специалист по анализу данных в компании Thread Genius на Sotheby’s. Вы можете связаться с ним в LinkedIn или по электронной почте.