Это перепечатка (более или менее) ежедневного информационного бюллетеня ARCHITECHT за вторник. Зарегистрируйтесь здесь, чтобы получать его в свой почтовый ящик каждое утро.
Во вторник из Редмонда поступило несколько интересных материалов, в основном связанных с Microsoft Azure и центрами обработки данных, в которых она работает. Они здесь:
Microsoft заявляет, что 40% всех виртуальных машин в Azure сейчас работают под управлением Linux (ZDNet):это больше, чем год назад, когда компания утверждала, что почти треть всех виртуальных машин Azure работает под управлением Linux. Что-то мне подсказывает, что этот процент будет только расти, особенно по мере того, как Microsoft наращивает усилия Kubernetes, пытаясь привлечь больше разработчиков.
Microsoft жаждет топливных элементов (Bloomberg):Это попытка повысить энергоэффективность, возможно, даже удвоив ее. Проблема сейчас в том, что энергоэлементы дороги — Microsoft рассчитывает потратить около 45 миллионов долларов на разработку 10-мегаваттной системы, которую можно будет развернуть через несколько лет. История заканчивается отличной цитатой, которая, как я подозреваю, находит отклик у большинства интернет-компаний, создающих свои собственные продукты (включая Facebook, который, как мне кажется, сотрудничает с Intel в разработке чипов ИИ, поэтому ему не нужно создавать свои собственные):
«По сути, мы хотим как можно скорее отказаться от исследований и разработок и фактически использовать их для питания центра обработки данных, мы надеемся сделать это как можно скорее. К сожалению, у нас проблема с цепочкой поставок. Мне нужны сотни мегаватт этих вещей».
Microsoft Azure и Microsoft Research делают гигантский шаг к устранению простоев сети (Microsoft Research): Итак, Microsoft помогает минимизировать время простоя сети, создавая точную копию сетевой архитектуры Azure с помощью эмулятора под названием CrystalNet. Прежде чем изменения вводятся в действие, они тестируются в CrystalNet, чтобы убедиться в отсутствии скрытых ошибок или других проблем. Что еще круче, так это то, что сообщение в блоге предполагает, что Microsoft может коммерциализировать технологию, продавая ее напрямую клиентам или, возможно, предоставляя сетевым поставщикам возможность тестировать свои продукты.
— -
В других новостях, проверьте эти три пункта из мира науки о данных и искусственного интеллекта:
Состояние науки о данных и машинного обучения, 2017 г. (Kaggle).Это довольно содержательный (и интерактивный) опрос, проведенный Kaggle, в котором приняли участие более 16 000 участников сообщества. Пара важных результатов включает в себя популярность логистической регрессии и других традиционных методов по сравнению с нейронными сетями в рабочей среде, а также важность образования в области науки о данных. Из более чем 15 000 респондентов подавляющее большинство имеют как минимум степень бакалавра, а более 41 процента имеют степень магистра.
Ускорение аналитики в Uber с помощью нашего рабочего места для анализа данных (Uber Engineering): это кажется довольно прогрессивным подходом к переносу задач по анализу данных на единую платформу, а не распределению по набору различных инструментов. . В то время как стек данных Uber достаточно разнообразен и сложен, поэтому создание собственной платформы имеет смысл, я должен представить, что существуют готовые платформы для небольших компаний или компаний, которые не хотят вкладывать слишком много бюджета в разработку своей собственной платформы. собственные ИТ.
Закон об авторском праве усугубляет предвзятость искусственного интеллекта (Motherboard): это увлекательное обсуждение юридических вопросов, связанных с тем, какие наборы данных доступны для обучения моделей машинного обучения. Я не уверен, насколько это важно для конкретных случаев использования, таких как поиск или распознавание лиц, когда такие компании, как Google и Facebook, могут генерировать более чем достаточно своих собственных данных, но вы можете видеть, к чему может привести опора на открытые наборы данных. проблемы для небольших компаний или приложений, которые пытаются действовать за рамками своих обучающих данных.