Центры обработки данных Microsoft: надежные, эффективные и работающие на большом количестве Linux

Это перепечатка (более или менее) ежедневного информационного бюллетеня ARCHITECHT за вторник. Зарегистрируйтесь здесь, чтобы получать его в свой почтовый ящик каждое утро.

Во вторник из Редмонда поступило несколько интересных материалов, в основном связанных с Microsoft Azure и центрами обработки данных, в которых она работает. Они здесь:

Microsoft заявляет, что 40% всех виртуальных машин в Azure сейчас работают под управлением Linux (ZDNet):это больше, чем год назад, когда компания утверждала, что почти треть всех виртуальных машин Azure работает под управлением Linux. Что-то мне подсказывает, что этот процент будет только расти, особенно по мере того, как Microsoft наращивает усилия Kubernetes, пытаясь привлечь больше разработчиков.

Microsoft жаждет топливных элементов (Bloomberg):Это попытка повысить энергоэффективность, возможно, даже удвоив ее. Проблема сейчас в том, что энергоэлементы дороги — Microsoft рассчитывает потратить около 45 миллионов долларов на разработку 10-мегаваттной системы, которую можно будет развернуть через несколько лет. История заканчивается отличной цитатой, которая, как я подозреваю, находит отклик у большинства интернет-компаний, создающих свои собственные продукты (включая Facebook, который, как мне кажется, сотрудничает с Intel в разработке чипов ИИ, поэтому ему не нужно создавать свои собственные):

«По сути, мы хотим как можно скорее отказаться от исследований и разработок и фактически использовать их для питания центра обработки данных, мы надеемся сделать это как можно скорее. К сожалению, у нас проблема с цепочкой поставок. Мне нужны сотни мегаватт этих вещей».

Microsoft Azure и Microsoft Research делают гигантский шаг к устранению простоев сети (Microsoft Research): Итак, Microsoft помогает минимизировать время простоя сети, создавая точную копию сетевой архитектуры Azure с помощью эмулятора под названием CrystalNet. Прежде чем изменения вводятся в действие, они тестируются в CrystalNet, чтобы убедиться в отсутствии скрытых ошибок или других проблем. Что еще круче, так это то, что сообщение в блоге предполагает, что Microsoft может коммерциализировать технологию, продавая ее напрямую клиентам или, возможно, предоставляя сетевым поставщикам возможность тестировать свои продукты.

— -

В других новостях, проверьте эти три пункта из мира науки о данных и искусственного интеллекта:

Состояние науки о данных и машинного обучения, 2017 г. (Kaggle).Это довольно содержательный (и интерактивный) опрос, проведенный Kaggle, в котором приняли участие более 16 000 участников сообщества. Пара важных результатов включает в себя популярность логистической регрессии и других традиционных методов по сравнению с нейронными сетями в рабочей среде, а также важность образования в области науки о данных. Из более чем 15 000 респондентов подавляющее большинство имеют как минимум степень бакалавра, а более 41 процента имеют степень магистра.

Ускорение аналитики в Uber с помощью нашего рабочего места для анализа данных (Uber Engineering): это кажется довольно прогрессивным подходом к переносу задач по анализу данных на единую платформу, а не распределению по набору различных инструментов. . В то время как стек данных Uber достаточно разнообразен и сложен, поэтому создание собственной платформы имеет смысл, я должен представить, что существуют готовые платформы для небольших компаний или компаний, которые не хотят вкладывать слишком много бюджета в разработку своей собственной платформы. собственные ИТ.

Закон об авторском праве усугубляет предвзятость искусственного интеллекта (Motherboard): это увлекательное обсуждение юридических вопросов, связанных с тем, какие наборы данных доступны для обучения моделей машинного обучения. Я не уверен, насколько это важно для конкретных случаев использования, таких как поиск или распознавание лиц, когда такие компании, как Google и Facebook, могут генерировать более чем достаточно своих собственных данных, но вы можете видеть, к чему может привести опора на открытые наборы данных. проблемы для небольших компаний или приложений, которые пытаются действовать за рамками своих обучающих данных.

Искусственный интеллект

Nvidia стремится обучать следующее поколение экспертов по искусственному интеллекту

www.technologyreview.com

Институт «Вектор удваивает команду преподавателей искусственного интеллекта мирового уровня»

s3.ca-central-1.amazonaws.com

Сокращение разрыва между моделированием и реальностью для глубокого роботизированного обучения

research.googleblog.com

Облако и инфраструктура

Google Cloud Dedicated Interconnect обеспечивает глобальную маршрутизацию, больше местоположений и общедоступный доступ

cloudplatform.googleblog.com

Облегчение использования Envoy в качестве балансировщика нагрузки Kubernetes

blog.heptio.com

Amazon CloudFront теперь имеет 100 точек присутствия с запуском своего пятого периферийного местоположения в Токио, Япония.

aws.amazon.com

В корпоративных облачных вычислениях это AWS против Microsoft Azure

www.infoworld.com

Как GlaxoSmithKline ускоряет развитие науки с помощью Docker Enterprise Edition

blog.docker.com

Центры обработки данных Microsoft: надежные, эффективные и работающие на большом количестве Linux

Искусственный интеллект

Nvidia стремится обучать следующее поколение экспертов по искусственному интеллекту

Институт «Вектор удваивает команду преподавателей искусственного интеллекта мирового уровня»

Сокращение разрыва между моделированием и реальностью для глубокого роботизированного обучения

Облако и инфраструктура

Google Cloud Dedicated Interconnect обеспечивает глобальную маршрутизацию, больше местоположений и общедоступный доступ

Облегчение использования Envoy в качестве балансировщика нагрузки Kubernetes

Amazon CloudFront теперь имеет 100 точек присутствия с запуском своего пятого периферийного местоположения в Токио, Япония.

В корпоративных облачных вычислениях это AWS против Microsoft Azure

Как GlaxoSmithKline ускоряет развитие науки с помощью Docker Enterprise Edition

Большие данные и наука о данных

Hortonworks запускает сервис резервного копирования в гибридном облаке под названием Data Lifecycle Manager

Амит Видж о базах данных аналитики с GPU-ускорением

Apache Arrow против Parquet и ORC: действительно ли нам нужен третий проект Apache для столбчатого представления данных?

Центры обработки данных Microsoft: надежные, эффективные и работающие на большом количестве Linux

Искусственный интеллект

Институт «Вектор удваивает команду преподавателей искусственного интеллекта мирового уровня»

Облако и инфраструктура

Amazon CloudFront теперь имеет 100 точек присутствия с запуском своего пятого периферийного местоположения в Токио, Япония.

Большие данные и наука о данных

Вопросы по теме