Вспышка новостей науки о данных: 08–29

Последние статьи по науке о данных - алгоритмически отобранные, ранжированные и обобщенные специально для вас.

News Flash - это еженедельное издание, в котором публикуются основные новости по определенной теме. Истории алгоритмически подбираются, оцениваются по качеству и ранжируются, чтобы вы могли оставаться в курсе самых важных событий. Кроме того, наиболее важные предложения для каждой истории извлекаются и отображаются в виде основных моментов, чтобы вы могли понять, о чем каждая история. Если вам нужна дополнительная информация по конкретной истории, просто нажмите на нее, чтобы прочитать всю статью.

Вы можете увидеть другие темы, которые у нас есть, для новостей, доступные здесь, и подписаться на рассылку новостей, которые вас интересуют.

Все, что должен знать специалист по данным об управлении данными *

Особенности:

Google создал GFS, MapReduce и BigTable; Amazon создала DynamoDB; Yahoo создала Hadoop; Facebook создал Кассандру и Улей; LinkedIn создал Kafka.
Базы данных графов, такие как Neo4J и Amazon Neptune, представляют данные как сеть связанных узлов или объектов, чтобы облегчить визуализацию данных и аналитику графов.
Хранилище данных поддерживает поток данных из операционных систем в системы аналитики / принятия решений путем создания единого репозитория данных из различных источников (как внутренних, так и внешних).
Озера данных позволяют пользователям запускать аналитику без необходимости перемещать данные в отдельную аналитическую систему, позволяя предприятиям получать информацию из новых источников данных, которые ранее не были доступны для анализа, например, путем построения моделей машинного обучения с использованием данных из файлов журналов, потоки кликов, социальные сети и устройства Интернета вещей.
Hadoop обычно используется для создания сложных аналитических моделей или приложений для хранения больших объемов данных, таких как ретроспективная и прогнозная аналитика; машинное обучение и сопоставление с образцом; сегментация клиентов и анализ оттока клиентов; и активные архивы.

Как искусственный интеллект обучается с помощью алгоритмов машинного обучения

Особенности:

Хотя общий термин ИИ действительно включает алгоритмы машинного обучения, важно отметить, что не все ИИ демонстрируют машинное обучение.
Программы, которые созданы с возможностью улучшения и повторения путем приема данных, являются алгоритмами машинного обучения, тогда как программы, которые имитируют или имитируют определенные части человеческого интеллекта, подпадают под категорию ИИ.
Хотя объяснимый ИИ уже был проблемой с машинным обучением, объяснить действия алгоритмов глубокого обучения сегодня считается практически невозможным.
Алгоритмы глубокого обучения могут стать ключом к созданию более мощного ИИ, поскольку они могут выполнять более сложные задачи, чем алгоритмы машинного обучения.
Этот общий ИИ, несомненно, будет иметь алгоритмы машинного обучения или программы глубокого обучения как часть своей архитектуры, поскольку обучение является неотъемлемой частью жизни, подобной человеческой.

7 горячих вакансий в области искусственного интеллекта для расширения ваших знаний об искусственном интеллекте

Особенности:

Используя модели машинного обучения, специалист по данным помогает принимать своевременные бизнес-решения на основе крупномасштабного анализа данных.
Инженер машинного обучения (ML) - это инженер-программист, который специализируется на создании приложений машинного обучения, конвейеров данных и интеграции API.
Инженеры машинного обучения должны иметь опыт работы со статистическими моделями, знать, как работают алгоритмы, понимать, что такое глубокое обучение и его связь с машинным обучением, быть знакомыми с объектно-ориентированным программированием и знать, как разрабатывать программы и приложения.
Некоторые вакансии позволяют соискателям подавать заявки со степенью бакалавра и сертификатом в области машинного обучения и искусственного интеллекта, как программа, предлагаемая в Массачусетском технологическом институте.
По данным Glassdoor, средняя базовая зарплата инженера по машинному обучению в США составляет примерно 121 000 долларов.

Интервью с Абхишеком Кумаром, старшим менеджером Data Science в Publicis Sapient

Особенности:

Он работал над различными проектами машинного обучения и глубокого обучения, включая рекомендательные системы, распознавание изображений, прогнозирование, оптимизацию, обнаружение аномалий и обработку естественного языка.
В настоящее время он работает в Publicis Sapient в качестве старшего менеджера по анализу данных и специализируется на применении методов машинного обучения к возможностям в розничной торговле, электронной коммерции, автомобилестроении, маркетинге и оптимизации операций.
Я надеюсь, что это интервью послужит цели для улучшения сообществ специалистов по науке о данных и машинного обучения в целом.)
В настоящее время я возглавляю практику науки о данных в Publicis Sapient, Индия, где мы работаем над несколькими интересными и передовыми проектами, основанными на искусственном интеллекте и машинном обучении, в различных отраслях, таких как розничная торговля, финансовые услуги, энергетика и сырьевые товары, путешествия и гостиничный бизнес, а также автомобили. .
Мое путешествие в области науки о данных и машинного обучения началось не с формального университетского образования, а скорее с исследовательской.

В чем разница между аналитикой и статистикой?

Особенности:

Статистика и аналитика - это две отрасли науки о данных, которые объединяют многих из своих ранних героев, поэтому время от времени пиво все еще посвящается оживленным спорам о том, где провести границу между ними.
Фактически, от элитных специалистов по данным ожидается, что они будут полными экспертами в области аналитики и статистики (а также машинного обучения)… и каким-то чудом такие люди действительно существуют, хотя и редки.
В то время как программы обучения аналитике обычно вооружают своих студентов навыками работы с программным обеспечением для просмотра массивных наборов данных, программы обучения статистике с большей вероятностью сделают эти навыки необязательными.
Распространенная ошибка среди сомневающихся в данных - думать, что цель исследовательской аналитики - ответить на вопросы, хотя на самом деле она их поднимает.
Изучение данных аналитиками - это способ убедиться, что вы задаете более точные вопросы, но к обнаруженным ими закономерностям не следует относиться серьезно, пока они не будут статистически проверены на новых данных.

Как наука о данных способствует эффективному маркетингу и SEM

Особенности:

В течение последнего десятилетия жизнь современного маркетолога поисковых систем была сосредоточена вокруг данных и приложений искусственного интеллекта (ИИ).
Споры и диалоги о подмножествах ИИ, машинном обучении и науке о данных, а также о том, как именно они влияют на работу отрасли, продолжают множиться.
Междисциплинарная область науки о данных является главной среди них, позволяя маркетологам комбинировать различные наборы данных и расшифровывать переменные в своих кампаниях, которые оказывают наибольшее влияние на производительность.
Прогнозный анализ включает использование науки о данных и статистических алгоритмов для перевода этих данных и сегментации поведения клиентов.
Благодаря внедрению науки о данных в маркетинговые стеки по всему миру менеджеры SEM получили значительно больше знаний о работе и тонкостях своих кампаний.

Как оптимизировать хранилище для ИИ, машинного обучения и глубокого обучения

Особенности:

Возрождение ИИ благодаря машинному обучению и глубокому обучению вызвало бурный рост исследований и разработок продуктов, поскольку компании открывают творческие способы использования этих новых алгоритмов для автоматизации процессов и прогнозирования.
Природа моделей машинного обучения и глубокого обучения, последние из которых часто имитируют нейронную структуру и возможности взаимодействия мозга, требует сбора, подготовки, перемещения и обработки массивных наборов данных.
Краткий экскурс в природу программного обеспечения машинного обучения и глубокого обучения покажет, почему системы хранения так важны для этих алгоритмов, чтобы обеспечить своевременные и точные результаты.
Дизайн системы хранения с глубоким обучением должен обеспечивать сбалансированную производительность для различных типов данных и моделей глубокого обучения.
Разнообразие моделей глубокого обучения и источников данных, а также схемы распределенных вычислений, обычно используемые для серверов глубокого обучения, означают, что системы, предназначенные для обеспечения хранилища для ИИ, должны учитывать следующие факторы.

Почему мы находим радость и ценность в создании визуализаций данных

Особенности:

Это миф, что проектирование визуализаций нужно только в конце процесса анализа данных или когда вы готовы поделиться некоторыми идеями.
Как визуальная метафора для точек данных, визуализация данных может сделать идеи более легко усваиваемыми и одновременно увлекательными.
Маркетологи знают, что привлекательная визуализация данных в сочетании с мощным повествованием может быть очень убедительной и убедительной, как показано в статье «Визуализация данных + рассказывание историй - это золотой маркетинг», которая циркулирует в Интернете.
Для практикующей Венди Смолл, практикующей dataviz, использование более простых визуализаций данных, таких как линейные диаграммы, было здоровым и эффективным способом поощрения новых подходов к чтению данных в рамках инициативы по грамотности данных.

Инструменты AutoML становятся важными факторами в науке о данных

Особенности:

Дни созданных вручную алгоритмов еще не закончились, но трудно не заметить, как автоматизированное машинное обучение (AutoML) влияет на область науки о данных.
По мере того, как компании стремятся привнести интеллектуальные возможности в свои продукты и услуги, инструменты AutoML снизят барьер для входа в науку о данных и откроют двери для автоматизации на основе данных в огромных масштабах.
В последние несколько лет мы стали свидетелями всплеска интереса к инструментам AutoML, которые автоматизируют ряд задач в рабочем процессе обработки данных.
Фудзимаки говорит, что большинство клиентов dotData - это гражданские специалисты по данным, которые используют инструмент dotData с графическим интерфейсом, чтобы проводить их через процесс построения моделей машинного обучения.
Databricks надеется расширить возможности трех групп - специалистов по обработке данных, инженеров по обработке данных и гражданских специалистов по данным - для помощи в создании приложений для машинного обучения.

3 эффективных применения машинного обучения в маркетинге

Особенности:

Если маркетологи рассчитывают создать более значимые кампании с целевой аудиторией и повысить вовлеченность, интеграция машинного обучения может стать инструментом для выявления скрытых закономерностей и действенных тактик, спрятанных в огромных объемах больших данных.
Компания обнаружила, что искусственный интеллект и машинное обучение позволяют аналитическому отделу слышать, о чем говорят в публичной сфере.
Конечно, хотя приведенные выше примеры показывают, как машинное обучение более эффективно задействует клиентские базы брендов, важно не упускать из виду реальную рентабельность таких интеллектуальных маркетинговых кампаний.
Поскольку приток данных продолжает бесконтрольно расти, внедрение машинного обучения в маркетинговые кампании станет еще более актуальным, когда дело доходит до начала увлекательных разговоров с потребителями.
Такие компании, как Ben & Jerry’s, Mazda и Sephora, уже осознали положительное влияние машинного обучения на их бренды, в том числе более высокий уровень вовлеченности и повышение рентабельности инвестиций.

Подготовлено и спонсировано:

Инновационные решения в области науки о данных и расширенной аналитики

Вспышка новостей науки о данных: 08–29–2019

Последние статьи по науке о данных - алгоритмически отобранные, ранжированные и обобщенные специально для вас.

Особенности:

Особенности:

Особенности:

Особенности:

Особенности:

Особенности:

Особенности:

Особенности:

Особенности:

Особенности:

Подготовлено и спонсировано:

Вопросы по теме