Сегодня мы рады объявить о раунде финансирования Descartes Labs серии B в размере 30 миллионов долларов, возглавляемом March Capital, венчурным фондом из Лос-Анджелеса. Наш посевной раунд возглавлял Crosslink Capital, а нашу серию A - Cultivian Sandbox. И Crosslink, и Cultivian участвовали в серии B вместе с несколькими другими инвесторами, включая одного из наших клиентов, Cargill.

Менее трех лет назад компания Descartes Labs была создана в качестве ответвления Лос-Аламосской национальной лаборатории с целью использования спутниковых изображений для моделирования сложных глобальных систем. В ходе достижения этой смелой цели мы создали то, что, по нашему мнению, является критически важным и отсутствующим компонентом, раскрывающим ценность спутниковых снимков: завод по переработке данных.

Позвольте мне объяснить, как мы дошли до этого момента, что такое обработка данных и почему это особенно важно для спутниковой индустрии.

Суперкомпьютеры и спутники: больше не только для правительства

В течение многих лет только правительства имели возможность производить вычисления в масштабе петабайтов, делая спутники и суперкомпьютеры исключительно своей сферой. Это быстро меняется.

За последние 10 лет такие компании, как Google и Amazon, построили свою инфраструктуру на стандартном стандартном оборудовании, вместо того, чтобы покупать специализированные суперкомпьютеры для обработки данных. Эти компании открыли свою инфраструктуру в облаке, обеспечивая доступ к практически неограниченным вычислительным ресурсам и хранилищам без каких-либо предварительных затрат.

Конечно, для решения огромных научных проблем требуются специальные навыки. Наша команда ученых-основателей прибыла из Национальной лаборатории Лос-Аламоса с уникальным опытом программирования самых мощных суперкомпьютеров на планете. Одним из первых вещей, которые мы сделали в Descartes Labs, было доказательство того, что мы можем создать суперкомпьютер в облаке. Мы использовали 30 000 ядер, чтобы обработать полный петабайт спутниковых снимков всего за 16 часов. С тех пор мы вложили огромные средства в инфраструктуру для размещения данных и выполнения вычислений в огромных масштабах.

Что касается спутников, аналогичные тенденции влияют на рынок. На протяжении десятилетий спутники были предметом шпионов, тщательно скрываемыми секретами крупнейших и наиболее технически продвинутых правительств мира. В 90-х годах правительство США разрешило частному сектору создавать и запускать спутники для использования в частном секторе. Это породило такие компании, как DigitalGlobe. Хотя к этим наборам данных был проявлен некоторый коммерческий интерес, крупнейшим заказчиком по-прежнему было государство.

Только за последнее десятилетие произошла настоящая буря науки, техники, инноваций и инвестиций, которая вызвала возрождение наблюдения Земли. Снижены затраты на запуск. Спутники стали меньше, от размера автобуса VW до размера буханки хлеба. Свыше миллиарда долларов инвестируется в спутниковые компании следующего поколения, чтобы улучшить технологию, сделать наблюдение Земли менее дорогостоящим и сделать выгоды доступными для гораздо более широкой группы интересов. Для контекста, за последние 10 лет было запущено 1500 спутников, в следующие десять лет будет запущено в шесть раз больше (9000).

Эти спутники будут производить огромные объемы данных. Группе NASA Landsat потребовалось четыре десятилетия и семь спутников стоимостью в миллиарды долларов, чтобы накопить петабайт данных. Для сравнения, в архиве DigitalGlobe более 100 ПБ. Современное созвездие с более чем 100 кубесатами будет генерировать петабайты данных каждый год. Кроме того, в онлайн-режиме будет поступать много новых типов данных, от радара до видео высокой четкости. По мере увеличения объема данных цена на данные будет снижаться, что сделает их доступными для более широкого круга потребителей.

Этот взрыв данных стал контекстом и основополагающим тезисом для Descartes Labs.

Создание завода по переработке данных и почему это важно для спутниковой индустрии

Как и многие компании в нашей сфере, мы пошли по очевидному пути, пытаясь превратить спутниковые данные в полезную информацию. Нашим первым продуктом был прогноз производства кукурузы для всех Соединенных Штатов. Создавая эту модель, мы построили значительную инфраструктуру.

Было необходимо собрать и очистить данные от множества спутниковых группировок. MODIS от НАСА был великолепен тем, что его ежедневно пересматривали. Но датчики с более высоким разрешением, такие как Landsat-8, который собирает данные только каждые 16 дней, отлично подходят для лучшего понимания того, где находятся поля. И дело не только в спутниковых данных. Погода является важным компонентом здоровья сельскохозяйственных культур, поэтому мы также собрали множество погодных данных. Вдобавок к этому мы создали ряд инструментов, которые упростили для наших ученых тестирование и измерение точности моделей и выполнение больших вычислений. Например, при создании нашей модели 2016 года для каждой модели-кандидата требовалось 4 квадриллиона пикселей, и мы использовали более 1000 из них.

Хотя наш прогноз по кукурузе имел успех у покупателей, обычно это было только началом разговора. Кукуруза - известное количество в Соединенных Штатах, и клиенты хотели знать, можем ли мы использовать ту же систему, что и при построении нашей модели кукурузы, чтобы посмотреть на другие культуры и другие регионы. Кроме того, большинство этих клиентов хотели раскрыть всю мощь данных, которые они собирали годами, и просто собирали пыль где-то на сервере.

Это заставило нас понять, что особенной была не наша модель кукурузы, а наша инфраструктура. Подобно тому, как Google создала переработку данных для веб-данных, а GE создала очистку данных для промышленных данных с помощью Predix, Descartes Labs фокусируется на переработке данных о физическом мире, начиная со спутниковых снимков.

Обработка данных - это система, которая извлекает необработанные данные, очищает их, объединяет данные из разрозненных источников и добавляет поверх них инструменты для облегчения анализа.

Одним из отличительных признаков очистки данных является очистка данных. Команда Descartes Labs тратит слишком много времени на дистанционное зондирование, которое позволяет сложным моделям быть точными. Мы работали над совместной регистрацией пикселей (чтобы убедиться, что каждый пиксель находится в нужном месте), глобальной отражательной способностью поверхности (с поправкой на влияние атмосферы) и расширенным обнаружением облаков (убедитесь, что модели включают только лучшие пиксели).

Но даже более важным, чем очистка данных, является слияние данных. Каждый набор данных обладает уникальными качествами: более тонкое пространственное разрешение, изображения с большей частотой, просмотр сквозь облака и даже прослушивание радиочастотных сигналов или измерение тепла. Работая над проблемами клиентов, мы обнаружили, что проблему редко можно решить с помощью одного спутника или набора данных. Только превратив разные наборы данных в единый датчик, суперсенсор, мы сможем решить проблему.

Наконец, мы создаем серию инструментов для работы с данными, которые упростят специалистам по обработке данных доступ к огромному количеству пикселей и управление ими. Мы уже упростили поиск в нашем архиве и возвращение пикселей менее чем за 100 миллисекунд. Мы продолжим создавать программное обеспечение, которое сделает спутниковые данные доступными для всех специалистов по данным, а не только для тех, кто имеет докторскую степень в области дистанционного зондирования.

Создавая переработку данных, Descartes Labs отличается от чисто аналитической компании и от спутниковых провайдеров. Мы полагаем, что по-прежнему будут происходить огромные инвестиции в спутники и инновации в области оборудования - все это приведет к созданию большего количества наборов данных со скрытой информацией, которую необходимо обнаружить. Мы ожидаем появления множества аналитических компаний, использующих спутниковые данные уникальными способами для потребителей, корпораций и правительств. В будущем наш завод по переработке данных будет собирать все изображения, полученные со спутников, нормализовать их по всем различным датчикам и предоставлять готовые для науки данные, позволяя разработчикам сосредоточиться на развитии науки с использованием спутниковых изображений вместо того, чтобы тратить время на сбор и очистку. данные.

Но наше видение не заканчивается на создании центра обработки данных для спутниковых снимков. Есть и другие большие наборы данных, которые необходимы, если вы хотите построить сложные модели сельского хозяйства, судоходства и логистики, лесного хозяйства, энергетической инфраструктуры и человеческой деятельности. Погода, дроны, Интернет вещей и даже геолокационные социальные сети - все это полезные типы данных, которые можно использовать для создания точных моделей активности здесь, на планете Земля.

Первая версия этого механизма обработки данных, платформа Descartes Labs, доступна уже сейчас. Разработчики и исследователи из университетов изучают Землю в рамках бета-версии нашей платформы, и мы напрямую помогаем коммерческим клиентам лучше понять свой бизнес и цепочки поставок. Независимо от того, являетесь ли вы исследователем, заинтересованным в использовании спутниковых данных для развития своей науки, или компанией, заинтересованной в получении лучшего понимания вашей цепочки поставок с помощью спутниковых данных, поговорите с нами - мы ищем интересные проблемы, которые нужно решить.

На самом деле важно не праздновать повышение венчурного капитала, а то, что вы делаете с деньгами. Мы будем держать вас в курсе, пока мы совершенствуем нашу систему обработки данных, решаем более сложные научные задачи и раскрываем ценность спутниковых данных, чтобы лучше понять эту прекрасную планету, на которой мы живем.