Это перепечатка (более или менее) Ежедневного информационного бюллетеня ARCHITECHT за четверг. Зарегистрируйтесь здесь, чтобы получать его в свой почтовый ящик каждое утро.

Segment.io объявила об инвестиционном раунде серии C на сумму 64 миллиона долларов в четверг и на данный момент привлекла почти 110 миллионов долларов с момента своего основания в 2012 году. Если вы не слышали о Segment, это платформа для сбора цифровых данных о клиентах из таких источников, как веб-сайты, чаты, электронная почта, услуги SaaS и т. д., а также включение их в любое количество инструментов маркетинговой аналитики или продуктов хранилища данных. Вы можете получить больше информации в сообщении в блоге, указанном выше, или послушать соучредителя Segment и технического директора Кэлвина Френч-Оуэна в подкасте ARCHITECHT Show в апреле.

Скажу честно: маркетинговая аналитика клиентов — это не та область, о которой я слишком сильно беспокоюсь, но это область, которая стала чрезвычайно важной за последние несколько лет. Это можно объяснить многими вещами, но я думаю, что это сводится к тому факту, что сообщения о больших данных и SaaS дошли до нас. Так возникли тысячи компаний и сервисов, собирающих все, что можно, о клиентах, и тысячи компаний, желающих платить за них.

Ранее на этой неделе я разговаривал с соучредителем и генеральным директором Segment Питером Рейнхардтом, и он отметил, что в настоящее время в Индексе промышленности MarTech зарегистрировано более 5000 компаний. Клиенты зрелого сегмента могут подключать свои данные к десяткам различных мест назначения (сервисы или базы данных), а сам сегмент подключается к 20 или 30.

В результате, объяснил Рейнхардт, объем данных, обрабатываемых сегментом для клиентов, удваивается каждые шесть месяцев, и в настоящее время компания обрабатывает 50 000 точек данных в секунду. Каждая из этих точек данных привязана к тому, кто щелкает, печатает или иным образом взаимодействует с источником данных клиента.

На самом деле, одной из основных причин, по которой Френч-Оуэн был в подкасте в апреле, было обсуждение блога Segment, подробно описывающего, как он сократил свой счет Amazon Web Services более чем на 1 миллион долларов в год. Это действительно хороший пример того, как быстро может расти компания, ее клиентская база и ее счета за AWS — последний из которых может быть полон возможностей для оптимизации, которые требуют сосредоточенных усилий на наблюдении за ним, устранении неполадок и умении о том, как вы управлять ресурсами.

Сегмент также является предзнаменованием того, что вот-вот ударит (или уже ударит) по компаниям, пытающимся предложить какую-либо значимую аналитику данных, полученных от датчиков или других взаимодействий, ранее не поддающихся оцифровке. Я бы также поместил в это ведро различные приложения с искусственным интеллектом — цифровые помощники, приложения для распознавания лиц, чат-боты и т. д. Чтобы помочь клиентам воспользоваться преимуществами этих новых типов взаимодействия и интегрировать их с существующими данными, потребуются еще большие инвестиции в архитектуру, хранение и обработку данных.

Чтобы узнать больше об этой общей теме, я бы посоветовал прослушать несколько эпизодов шоу АРХИТЕКТ, выпущенных ранее в этом году. Помимо Френча-Оуэна, мне сразу же приходят на ум интервью с Адамом Коколоски из IBM, Майком Олсоном из Cloudera, Джеем Крепсом из Confluent и Honeycomb’s Charity Majors.

Другие новости: Google и Alibaba так много делают в области прикладного искусственного интеллекта…

Вот ссылки на некоторые хорошие сообщения в блогах и новостные статьи за эту неделю о том, что они создают и как они применяют ИИ действительно интересными способами:

P.S. Информационный бюллетень ARCHITECHT Daily, выставка ARCHITECHT Show и выставка AI и роботов ARCHITECHT быстро растут! Если вы заинтересованы в привлечении самой умной аудитории в области ИТ в качестве спонсора, свяжитесь со мной по адресу [email protected].

Узнайте, что нового на выставке ARCHITECT Show

Эп. 28: Жизнерадостный генеральный директор о создании лучших приложений и победе над китами-неудачниками с помощью микросервисов

architechtshow.com

В этом выпуске ARCHITECT Show соучредитель и генеральный директор Buoyant Уильям Морган рассказывает о причинах создания облачных приложений и о том, как за последние несколько лет исчезли барьеры на пути внедрения этих технологий. Он также обсуждает Linkerd, флагманскую технологию Buoyant; недавний раунд финансирования компании на сумму 10,5 млн долларов; его время помогало масштабировать Twitter, чтобы преодолеть проблемы с инфраструктурой; и как Buoyant планирует монетизировать свой фонд с открытым исходным кодом.

Технический директор IBM Watson Data о том, как развиваются архитектуры данных и наука о данных в эпоху облачных технологий и искусственного интеллекта

architecht.io

Основные моменты из подкаста ARCHITECHT Show прошлой недели, в котором научный сотрудник IBM и технический директор Watson Data Platform Адам Коколоски, который также является соучредителем Cloudant, рассказывает о бизнесе облачных баз данных, науке о данных и искусственном интеллекте.

Искусственный интеллект

Назревает мини-спор о предоставлении расшифровок Alexa разработчикам

состояние.com

Я понимаю проблемы с конфиденциальностью, но если это будет проблемой с продуктами Echo, теоретически это должно быть проблемой для каждого продукта, который мы используем, особенно для тех, которые используют голосовые сервисы. Именно так модели и продукты улучшаются.

The Economist оценивает противостояние ИИ между США и Китаем

www.economist.com

Опять же, это не игра с нулевой суммой, в которой Китай «выигрывает», потому что его люди и компании принимают определенные аспекты ИИ раньше, чем люди и компании США. Вот мой предыдущий взгляд на эту тему.

Делают ли данные и ИИ Google, Facebook и Amazon невосприимчивыми к конкуренции?

www.wired.com

На самом деле речь идет о статье «Необоснованная эффективность данных, издание для глубокого обучения», опубликованной в понедельник, которая настолько узка по своему охвату, что не может ответить на этот вопрос. При этом ответ ДА ​​по многим другим причинам.

Clarifai выпустила мобильный SDK для обучения компьютерному зрению — интернет не требуется

blog.clarifai.com

Я имею в виду, что вы не тренируетесь с библиотекой ImageNet на своем телефоне, но это может быть очень полезно для целевых приложений в областях, где нет подключения к Интернету.

А победителями конкурса стартапов Google по машинному обучению стали…

techcrunch.com

Трое победителей изучают заболевания головного мозга, помогают компаниям улучшать функции персонализации и анализируют медицинские записи. Первые два получают инвестиции в размере 500 000 долларов, а последний получает 1 миллион долларов в виде кредитов Google Cloud.

Подробнее от Instacart об использовании ИИ для улучшения покупок в продуктовых магазинах

venturebeat.com

У компании есть несколько крутых приложений для глубокого обучения, чтобы оптимизировать то, как покупатели совершают покупки, а водители доставляют товары. Однако теперь ему придется иметь дело с Amazon, у которого будет намного больше данных обо всем, что происходит в Whole Foods, и который уже освоил доставку.

Учебник по эволюционным алгоритмам для глубокого обучения

www.oreilly.com

Если вы не следили, это особенно захватывающая область исследований ИИ, и этот пост — хорошее введение. Общая идея заключается в том, что, хотя глубокое обучение помогло сократить разработку функций и т. д., эволюционные алгоритмы могут помочь автоматизировать остальную часть процесса настройки модели.

Облако и инфраструктура

У Google Cloud теперь есть офис в Лондоне

cloudplatform.googleblog.com

Это место № 2 из 5, запланированных в настоящее время для Европы, а Бельгия принимает другой живой регион. В какой момент облачным провайдерам потребуются центры обработки данных в каждой стране?

Басё явно задыхается, если даже так

www.theregister.co.uk

Согласно этому отчету, компания, которая коммерциализировала хранилище данных Riak, почти мертва, и в ней осталось очень мало сотрудников. Это печально, но Riak — уважаемая технология с открытым исходным кодом, и похоже, что сообщество будет поддерживать ее существование и процветание.

Spotinst привлекает 15 миллионов долларов для оптимизации расходов на AWS

techcrunch.com

Компании такого типа существуют уже некоторое время, но у Spotinst есть несколько крутых технологий, помогающих клиентам максимизировать спотовые инстансы (и эквивалент Azure) и стороннюю «бессерверную» платформу.

OwnBackup привлекает 7,5 млн долларов для резервного копирования данных SaaS

techcrunch.com

Резервное копирование Salesforce, Slack и т. д. кажется достаточно логичным, но также кажется, что для этого уже должны быть какие-то надежные решения. Если я ошибаюсь, пожалуйста, дайте мне знать.

Red Hat добавляет мультиарендность в OpenShift

thenewstack.io

Я действительно не уверен, предлагают ли другие дистрибутивы Kubernetes в настоящее время то, что вы бы назвали мультитенантностью «корпоративного уровня» (я вполне уверен, что DC/OS делает это), но это более или менее обязательное условие для контейнеров-как- a-service и настоящий пул ресурсов.

Облачная безопасность по-прежнему является проблемой для государственных органов, но они работают над этим

gcn.com

В Government Computing News есть пара заслуживающих внимания статей о том, как федеральное правительство думает об облачных вычислениях. Заголовок ссылается на историю о том, как IARPA ищет способ хранения секретных данных в общедоступных облаках. Эта статья — скорее краткое изложение цитат (но хороших) из недавнего правительственного мероприятия по кибербезопасности.

Все данные

Teradata приобретает стартап по предоставлению ресурсов StackIQ

www.teradata.com

Эта технология будет встроена в новые платформы Teradata, чтобы помочь клиентам развертывать Teradata в инфраструктуре, отличной от этих огромных ящиков, но неясно, будет ли еще существовать StackIQ. Я не уверен, что это спасение для Teradata, но сдерживание конкуренции между облаком и товаром является критически важной стратегией.

Element Data привлекает 3,5 миллиона долларов, чтобы упростить процесс принятия решений

www.geekwire.com

Его продукт более или менее похож на рекомендательный движок, но, как мы видели в последнее время снова и снова, это все еще нерешенная проблема. По крайней мере, сделать это правильно все еще сложно.

Компании, работающие в Европе, должны подумать о том, что новые правила будут означать для науки о данных

vision.cloudera.com

Это довольно информативный пост в блоге от Cloudera об Общем регламенте ЕС по защите данных, который должен вступить в силу в 2018 году. Закон охватывает все: от того, когда вы можете анализировать данные, до того, как объяснять алгоритмические решения потребителям.

Более подробный взгляд на механизм потоковой обработки Bullet от Yahoo

www.zdnet.com

Я дал ссылку на сообщение в блоге Bullet, когда оно было открытым, но вот мнение аналитика Тони Бэра. Эта строчка в значительной степени предсказывает судьбу проекта (особенно с учетом того, кто его создал): «У него нет поддержки поставщиков, и он не является частью какого-либо инструмента, поэтому вы сами решаете, как управлять им и интегрировать его».

Iris — проект с открытым исходным кодом, предоставляющий диалоговый интерфейс для науки о данных

hackernoon.com

Это проект из Стэнфорда, но он предвещает то, что, как я думаю, будет иметь большое значение в будущем: ChatOps. Большой проблемой, конечно же, является обеспечение того, чтобы эти инструменты соответствовали существующим рабочим процессам и лексикону.

Апач Спарк 2.2. имеет улучшения потоковой передачи и R

www.infoworld.com

к вашему сведению