Во вторник мы объявили о нашем партнерстве с eToro, крупнейшей в мире социальной торговой платформой, для разработки и коммерциализации торговых стратегий, основанных на настроениях, для их двенадцати миллионов клиентов по всему миру. Эта статья служит дополнением к этому объявлению, чтобы глубже вникнуть в то, что такое настроения и наш запатентованный процесс оценки настроений, а также ответить на соответствующие вопросы и опасения, поднятые членами криптовалютного сообщества по поводу наших новых предложений.

Структура этой статьи – вопрос-ответ. Мы будем активно обновлять его по мере поступления более актуальных вопросов от сообщества.

Крипто-Твиттер и настроения на рынке

Мошенничают ли разговоры о криптовалюте в Твиттере?

Да, разговоры о криптовалютах чрезвычайно манипулируются. В ходе нашего исследования мы обнаружили, что более 90% разговоров о цифровых активах в Твиттере исходят от недобросовестных, манипулирующих или мошеннических пользователей.

Проблема в том, как отделить сигнал от шума и разработать технологию для обнаружения и устранения этой нечестной деятельности? Войдите в Social Market Analytics (SMA), инвестора-основателя TIE и ведущего поставщика количественных данных о настроениях в отношении акций, фьючерсов, форекс и ETF для ведущих мировых финансовых компаний. За последние восемь лет SMA разработала и запатентовала технологию фильтрации счетов, обнаружения манипуляций и точности счета, чтобы устранить шум и предоставить четкие и действенные потоки данных о настроениях для институциональных инвесторов. TIE сотрудничает с SMA, чтобы объединить опыт и отношения TIE в предметной области с запатентованной SMA технологией машинного обучения и обработки естественного языка для разработки решений для настроений для рынка цифровых активов.

Механизм SMA способен определять точность сообщений отдельных пользователей о конкретных активах в Twitter. Когда Джон Доу делает положительные посты о Microsoft или Ethereum, SMA может определить, в каком проценте случаев эти активы растут в течение дня, недели или месяца. Оценка точности счета позволяет удалить счета, которые исторически плохо предсказывали движение активов, и может помочь выявить и сегментировать профессиональных инвесторов.

Еще один интересный способ оценки манипуляций — рассмотреть дисперсию или процент твитов, исходящих от уникальных учетных записей Twitter. Когда дисперсия чрезвычайно низка или, другими словами, очень небольшой процент твитов исходит от уникальных пользователей, это обычно является признаком коллективной группы учетных записей, которые часто публикуют сообщения об отдельном активе и часто пытаются манипулировать разговорами, чтобы повлиять на движение цены. .

Оценка возраста учетной записи, соотношения ее подписчиков и подписчиков и ее истории публикаций также помогает в устранении нечестной активности. Если один и тот же пользователь публикует сообщения исключительно об одном и том же объекте и массово делится одинаковыми положительными или отрицательными сообщениями, маловероятно, что их сообщения окажут какое-либо влияние на движение объекта.

Когда фильтрация учетных записей завершена, более 90% твитов и учетных записей цифровых активов помечаются и удаляются до оценки настроений рынка.

Что такое настроение и как The TIE превращает миллионы твитов в полезную информацию?

Настроение — это количественное представление будущих намерений инвесторов. Неважно, что Джон Доу доволен тем, что Биткойн вырос в этом месяце, важно то, что он настроен оптимистично в отношении будущего актива, и что коллективные настроения (или чувства) инвесторов по отношению к отдельному активу в течение заданного периода времени позитивнее, чем в предыдущий период.

Настроение оценивается в четыре шага. SMA получает полный поток Twitter Firehose — поток из более чем восьмисот пятидесяти миллионов твитов в день, доступный исключительно для партнеров Twitter. После загрузки пожарного шланга первым шагом является оценка релевантности твита отдельному объекту, а также извлечение и группировка всех твитов, связанных с одной и той же темой. На первый взгляд это может показаться чрезвычайно интуитивным — твит, в котором упоминается ETH, должен иметь отношение к Ethereum. Проблема? Между акциями и криптовалютами существует более 80 перекрывающихся тикеров. Хотя ETH является тикером Ethereum, он также является тикером Ethan Allen, публичной американской компании по производству мебели для дома. NEM — это тикер криптовалюты NEM, а также символ Newmont Goldcorp. Однако проблема не ограничивается только символами тикера. Кто-то, кто пишет в Твиттере о XRP, может называть монету Ripple, но Ripple — это общий термин. Другой пользователь может написать в Твиттере о том, что снижение доходов Apple оказывает волновой эффект на NASDAQ в более широком смысле.

В результате были разработаны пользовательские тематические модели для решения этих проблем по классам активов. Хотя большая часть этого процесса автоматизирована, необходим ежедневный контроль со стороны человека, чтобы гарантировать, что нерелевантные твиты не будут обнаружены в тематической модели актива. При оценке релевантности необходимо учитывать контекст твита и исторические модели поведения отдельных пользователей. Этот запатентованный процесс помогает удалить более 99% ненужной активности.

Второй шаг — это вышеупомянутая фильтрация аккаунта. После того, как пожарный шланг будет проглочен и каждый твит, относящийся к активу, будет собран вместе, манипулятивные посты должны быть удалены. На этом этапе отфильтровывается более 90% твитов.

Третий шаг — расчет настроения инвестора по отдельному сообщению. Словарь из более чем 100 000 уникальных терминов был разработан, чтобы помочь с этой оценкой. Каждое слово в каждом твите оценивается индивидуально с использованием собственного процессора естественного языка SMA с использованием технологии машинного обучения. Оценки каждого слова суммируются, и каждому отдельному твиту присваивается оценка. Пример твита приведен ниже.

В приведенном выше примере всплеск слова и его покупка оцениваются положительно, и этому сообщению присваивается общая положительная оценка +,4.

Последний шаг – превратить эти оцененные отдельные твиты в количественную и полезную информацию для трейдеров и инвесторов. При количественной оценке настроений очень важно не сравнивать разговоры об отдельном активе с разговорами о другом активе. Причина, по которой это важно, заключается в том, что в среднем об одних криптовалютах может быть больше позитивных разговоров, чем о других. Например, у XRP есть большое сообщество, поддерживающее актив в Твиттере, и в среднем разговоры о нем гораздо более позитивны, чем о Биткойне.

При подсчете настроений мы вместо этого сравниваем разговоры о конкретном объекте за один период с разговорами об этом же объекте за другой период. Например, мы можем посмотреть, насколько позитивны разговоры о биткойнах сегодня по сравнению с последними семью днями. После нормализации данных мы можем обнаружить, что настроения Биткойна сегодня на два стандартных отклонения более позитивны, чем на прошлой неделе. Нормализуя данные и сравнивая настроения по периодам ретроспективного анализа, мы можем определить, когда разговоры об активе становятся все более позитивными или негативными. Наше исследование обнаружило веские доказательства того, что количественные данные о настроениях TIE и SMA обладают предсказательной силой в отношении движения цен цифровых активов.

С момента отправки твита через Twitter до момента, когда он извлекается, фильтруется, оценивается и становится доступным для институциональных клиентов через наш API, проходит 300 миллисекунд. Более 20 уникальных и действенных показателей настроений генерируются практически в режиме реального времени.

Где я могу прочитать о ваших исследованиях и просмотреть бэк-тесты ваших данных?

Вот небольшой образец некоторых из наших исследований и количественных моделей, которые мы построили:

Количественные стратегии

· Стратегия ежедневной торговли цифровыми активами

· Настроение криптовалюты, RSI и ценовой импульс

· Наклон индекса в зависимости от настроения

Отчеты об исследованиях

· География крипто-твиттера

· Биткойн-прогноз Delphi Digital Q2 2019

· Заработок на волатильности криптовалют

TheTIE-LongOnly CopyPortfolio на eToro

Как работает процесс распределения? Вы просто покупаете криптовалюту с самыми положительными отзывами в Твиттере?

The TIE-LongOnly CopyPortfolio использует чисто алгоритмический процесс распределения, при принятии решения о распределении по отдельным активам не требуется вмешательства человека. Есть четыре ключевых термина и два фактора, которые являются частью процесса распределения. Первый термин — Raw-Sentiment, который представляет собой сумму настроений каждого разговора в Твиттере о конкретной криптовалюте в отдельный день. Второй – Poster – это количество уникальных аккаунтов в Твиттере, размещающих сообщения об объекте в определенный день.

Для разработки CopyPortfolio мы нормализовали значения обеих этих точек данных, чтобы создать два фактора в нашей модели. Результатом является Необработанная оценка настроения, которая сравнивает необработанную оценку монеты за последний месяц с предыдущими шестью месяцами, а также Плакатная оценка, которая сравнивает количество пользователи твитят о криптовалюте за последний месяц по сравнению с предыдущими шестью.

Чтобы уменьшить нагрузку спредов на пользователей, мы решили перебалансировать CopyPortfolio один раз в месяц и, таким образом, разработали вышеупомянутые факторы в качестве ежемесячных индикаторов.

В результате серьезного тестирования мы определили оптимальный четырехэтапный процесс для определения составляющих и распределения. Первый шаг — определить, превышает ли Poster-Score отдельной криптовалюты одно стандартное отклонение от среднего значения. Делая это, мы хотим увидеть, было ли значительно больше пользователей Twitter, обсуждающих актив за последний месяц, чем за предыдущие шесть.

Второй шаг заключается в том, чтобы определить, где значение Poster-Score больше 1. Если Poster-Score>1, значение исходного Sentiment Score инвертируется. Причина, по которой он перевернут, заключается в том, что мы обнаружили, что когда количество пользователей, обсуждающих актив, и настроения увеличиваются, значение сигнала покупки больше не действует. С другой стороны, мы обнаружили, что восходящее движение цены имеет тенденцию следовать, когда значительно больше пользователей Twitter обсуждают криптовалюту, и этот разговор негативен.

В-третьих, мы смотрим, есть ли три или более криптовалют с необработанными оценками настроений больше 0. Если это так, мы взвешиваем их распределения на основе абсолютных значений их необработанных оценок настроений.

В-четвертых (необязательно), если имеется менее трех криптовалют с необработанной оценкой тональности больше 0, мы выбираем три самые высокие криптовалюты по исходной оценке тональности и взвешиваем самые высокие 3/6, вторые по величине 2/6 и самые низкие 1/6. . Причина, по которой мы поддерживаем как минимум три позиции, заключается в том, чтобы снизить риск, связанный с владением отдельным активом.

На какие монеты вы планируете выделить?

Каждый месяц мы оцениваем корзину из тринадцати криптовалют для включения. Эти активы были выбраны, потому что они были цифровыми активами, доступными по всему миру на eToro, когда первоначально формулировались стратегии. Возможно, каждый месяц в CopyPortfolio включается от трех до всех тринадцати. Полный список доступен ниже:

Какова историческая эффективность стратегии только для длинных позиций?

В сочетании ретроспективных тестов и реальной торговли CopyPortfolio вернул 213,7% после комиссий с октября 2017 года (по расчетам eToro) по сравнению с доходностью 41,1% для биткойнов и доходностью 29,7% для ежемесячно ребалансируемой корзины с одинаковым весом. активы после комиссий. Вы можете увидеть ежемесячную разбивку распределения и производительности на eToro. CopyPortfolio также достиг значительно лучшего соотношения (мера риска и вознаграждения) по сравнению с биткойнами и корзиной с одинаковым весом из тех же активов.

Какие риски связаны с копированием TheTIE-LongOnly CopyPortfolio?

Всякий раз, принимая инвестиционное решение, очень важно провести собственное исследование и понять связанные с этим риски. Криптовалюта — это класс активов с высокой волатильностью, и внутридневные колебания актива до 10% остаются обычным явлением. В то время как стратегия только для длинных позиций при тестировании на исторических данных исторически превосходила контрольный показатель для одних и тех же базовых активов с одинаковым весом, прошлые результаты не являются гарантией будущих доходов. Поскольку эта стратегия распределяет исключительно длинные позиции на рынке криптовалют, она подвержена риску снижения, если рынок в целом не работает.

Меня интересует TheTIE-LongOnly CopyPortfolio, где я могу узнать больше?

Нажмите здесь, чтобы узнать больше и начать копирование TheTIE-LongOnly CopyPortfolio на eToro. Если у вас есть какие-либо вопросы, вы можете связаться с нами в Telegram или отправить электронное письмо по адресу [email protected].

The TIE – ведущий поставщик альтернативных решений для работы с данными для институциональных инвесторов в цифровые активы. Благодаря внутренней разработке, эксклюзивным партнерским отношениям и стратегическим приобретениям мы создали набор из девяти собственных наборов данных для следующего поколения инвестирования в цифровые активы. Наш набор каналов данных, от корпоративных действий/значительных событий до настроений и данных о занятости, был разработан для обслуживания ряда институциональных вариантов использования, включая количественную торговлю, соблюдение нормативных требований, исследования продавцов и дискреционные инвестиции, ориентированные на события.

Наша приверженность этичному ведению бизнеса

С момента создания The TIE придерживается строгой этической политики, обеспечивающей нашу независимость и целостность наших данных и предложений. Каждый сотрудник и крупный акционер обязаны соблюдать строгий набор принципов и правил профессионального поведения, превышающих отраслевые стандарты.

В отрасли, где широко распространены дезинформация, мошенничество и нечестное поведение, очень важно действовать прозрачно, соблюдая четкие этические принципы. Завоевание и поддержание доверия наших пользователей и клиентов всегда будет лежать в основе миссии TIE.

Чтобы узнать больше о наших строгих этических стандартах, нажмите здесь.

Запросы на решения для институциональных данных

Если вы хотите узнать больше о наших предложениях по институциональным данным, вы можете посетить эту страницу. Чтобы запросить демонстрацию любого из наших предложений по работе с данными или поговорить с нами о наших решениях, отправьте электронное письмо по адресу [email protected], и наша команда будет более чем рада помочь вам.