Последние статьи по науке о данных - алгоритмически отобранные, ранжированные и обобщенные специально для вас.

News Flash - это еженедельное издание, в котором публикуются основные новости по определенной теме. Истории алгоритмически подбираются, оцениваются по качеству и ранжируются, чтобы вы могли оставаться в курсе самых важных событий. Кроме того, наиболее важные предложения для каждой истории извлекаются и отображаются в виде основных моментов, чтобы вы могли понять, о чем каждая история. Если вам нужна дополнительная информация по конкретной истории, просто нажмите на нее, чтобы прочитать всю статью.

Вы можете увидеть другие темы, которые у нас есть, для новостей, доступные здесь, и подписаться на рассылку новостей, которые вас интересуют.

Все, что должен знать специалист по данным об управлении данными *

Особенности:

  • Google создал GFS, MapReduce и BigTable; Amazon создала DynamoDB; Yahoo создала Hadoop; Facebook создал Кассандру и Улей; LinkedIn создал Kafka.
  • Базы данных графов, такие как Neo4J и Amazon Neptune, представляют данные как сеть связанных узлов или объектов, чтобы облегчить визуализацию данных и аналитику графов.
  • Хранилище данных поддерживает поток данных из операционных систем в системы аналитики / принятия решений путем создания единого репозитория данных из различных источников (как внутренних, так и внешних).
  • Озера данных позволяют пользователям запускать аналитику без необходимости перемещать данные в отдельную аналитическую систему, позволяя предприятиям получать информацию из новых источников данных, которые ранее не были доступны для анализа, например, путем построения моделей машинного обучения с использованием данных из файлов журналов, потоки кликов, социальные сети и устройства Интернета вещей.
  • Hadoop обычно используется для создания сложных аналитических моделей или приложений для хранения больших объемов данных, таких как ретроспективная и прогнозная аналитика; машинное обучение и сопоставление с образцом; сегментация клиентов и анализ оттока клиентов; и активные архивы.

Как искусственный интеллект обучается с помощью алгоритмов машинного обучения

Особенности:

  • Хотя общий термин ИИ действительно включает алгоритмы машинного обучения, важно отметить, что не все ИИ демонстрируют машинное обучение.
  • Программы, которые созданы с возможностью улучшения и повторения путем приема данных, являются алгоритмами машинного обучения, тогда как программы, которые имитируют или имитируют определенные части человеческого интеллекта, подпадают под категорию ИИ.
  • Хотя объяснимый ИИ уже был проблемой с машинным обучением, объяснить действия алгоритмов глубокого обучения сегодня считается практически невозможным.
  • Алгоритмы глубокого обучения могут стать ключом к созданию более мощного ИИ, поскольку они могут выполнять более сложные задачи, чем алгоритмы машинного обучения.
  • Этот общий ИИ, несомненно, будет иметь алгоритмы машинного обучения или программы глубокого обучения как часть своей архитектуры, поскольку обучение является неотъемлемой частью жизни, подобной человеческой.

7 горячих вакансий в области искусственного интеллекта для расширения ваших знаний об искусственном интеллекте

Особенности:

  • Используя модели машинного обучения, специалист по данным помогает принимать своевременные бизнес-решения на основе крупномасштабного анализа данных.
  • Инженер машинного обучения (ML) - это инженер-программист, который специализируется на создании приложений машинного обучения, конвейеров данных и интеграции API.
  • Инженеры машинного обучения должны иметь опыт работы со статистическими моделями, знать, как работают алгоритмы, понимать, что такое глубокое обучение и его связь с машинным обучением, быть знакомыми с объектно-ориентированным программированием и знать, как разрабатывать программы и приложения.
  • Некоторые вакансии позволяют соискателям подавать заявки со степенью бакалавра и сертификатом в области машинного обучения и искусственного интеллекта, как программа, предлагаемая в Массачусетском технологическом институте.
  • По данным Glassdoor, средняя базовая зарплата инженера по машинному обучению в США составляет примерно 121 000 долларов.

Интервью с Абхишеком Кумаром, старшим менеджером Data Science в Publicis Sapient

Особенности:

  • Он работал над различными проектами машинного обучения и глубокого обучения, включая рекомендательные системы, распознавание изображений, прогнозирование, оптимизацию, обнаружение аномалий и обработку естественного языка.
  • В настоящее время он работает в Publicis Sapient в качестве старшего менеджера по анализу данных и специализируется на применении методов машинного обучения к возможностям в розничной торговле, электронной коммерции, автомобилестроении, маркетинге и оптимизации операций.
  • Я надеюсь, что это интервью послужит цели для улучшения сообществ специалистов по науке о данных и машинного обучения в целом.)
  • В настоящее время я возглавляю практику науки о данных в Publicis Sapient, Индия, где мы работаем над несколькими интересными и передовыми проектами, основанными на искусственном интеллекте и машинном обучении, в различных отраслях, таких как розничная торговля, финансовые услуги, энергетика и сырьевые товары, путешествия и гостиничный бизнес, а также автомобили. .
  • Мое путешествие в области науки о данных и машинного обучения началось не с формального университетского образования, а скорее с исследовательской.

В чем разница между аналитикой и статистикой?

Особенности:

  • Статистика и аналитика - это две отрасли науки о данных, которые объединяют многих из своих ранних героев, поэтому время от времени пиво все еще посвящается оживленным спорам о том, где провести границу между ними.
  • Фактически, от элитных специалистов по данным ожидается, что они будут полными экспертами в области аналитики и статистики (а также машинного обучения)… и каким-то чудом такие люди действительно существуют, хотя и редки.
  • В то время как программы обучения аналитике обычно вооружают своих студентов навыками работы с программным обеспечением для просмотра массивных наборов данных, программы обучения статистике с большей вероятностью сделают эти навыки необязательными.
  • Распространенная ошибка среди сомневающихся в данных - думать, что цель исследовательской аналитики - ответить на вопросы, хотя на самом деле она их поднимает.
  • Изучение данных аналитиками - это способ убедиться, что вы задаете более точные вопросы, но к обнаруженным ими закономерностям не следует относиться серьезно, пока они не будут статистически проверены на новых данных.

Как наука о данных способствует эффективному маркетингу и SEM

Особенности:

  • В течение последнего десятилетия жизнь современного маркетолога поисковых систем была сосредоточена вокруг данных и приложений искусственного интеллекта (ИИ).
  • Споры и диалоги о подмножествах ИИ, машинном обучении и науке о данных, а также о том, как именно они влияют на работу отрасли, продолжают множиться.
  • Междисциплинарная область науки о данных является главной среди них, позволяя маркетологам комбинировать различные наборы данных и расшифровывать переменные в своих кампаниях, которые оказывают наибольшее влияние на производительность.
  • Прогнозный анализ включает использование науки о данных и статистических алгоритмов для перевода этих данных и сегментации поведения клиентов.
  • Благодаря внедрению науки о данных в маркетинговые стеки по всему миру менеджеры SEM получили значительно больше знаний о работе и тонкостях своих кампаний.

Как оптимизировать хранилище для ИИ, машинного обучения и глубокого обучения

Особенности:

  • Возрождение ИИ благодаря машинному обучению и глубокому обучению вызвало бурный рост исследований и разработок продуктов, поскольку компании открывают творческие способы использования этих новых алгоритмов для автоматизации процессов и прогнозирования.
  • Природа моделей машинного обучения и глубокого обучения, последние из которых часто имитируют нейронную структуру и возможности взаимодействия мозга, требует сбора, подготовки, перемещения и обработки массивных наборов данных.
  • Краткий экскурс в природу программного обеспечения машинного обучения и глубокого обучения покажет, почему системы хранения так важны для этих алгоритмов, чтобы обеспечить своевременные и точные результаты.
  • Дизайн системы хранения с глубоким обучением должен обеспечивать сбалансированную производительность для различных типов данных и моделей глубокого обучения.
  • Разнообразие моделей глубокого обучения и источников данных, а также схемы распределенных вычислений, обычно используемые для серверов глубокого обучения, означают, что системы, предназначенные для обеспечения хранилища для ИИ, должны учитывать следующие факторы.

Почему мы находим радость и ценность в создании визуализаций данных

Особенности:

  • Это миф, что проектирование визуализаций нужно только в конце процесса анализа данных или когда вы готовы поделиться некоторыми идеями.
  • Как визуальная метафора для точек данных, визуализация данных может сделать идеи более легко усваиваемыми и одновременно увлекательными.
  • Маркетологи знают, что привлекательная визуализация данных в сочетании с мощным повествованием может быть очень убедительной и убедительной, как показано в статье «Визуализация данных + рассказывание историй - это золотой маркетинг», которая циркулирует в Интернете.
  • Для практикующей Венди Смолл, практикующей dataviz, использование более простых визуализаций данных, таких как линейные диаграммы, было здоровым и эффективным способом поощрения новых подходов к чтению данных в рамках инициативы по грамотности данных.

Инструменты AutoML становятся важными факторами в науке о данных

Особенности:

  • Дни созданных вручную алгоритмов еще не закончились, но трудно не заметить, как автоматизированное машинное обучение (AutoML) влияет на область науки о данных.
  • По мере того, как компании стремятся привнести интеллектуальные возможности в свои продукты и услуги, инструменты AutoML снизят барьер для входа в науку о данных и откроют двери для автоматизации на основе данных в огромных масштабах.
  • В последние несколько лет мы стали свидетелями всплеска интереса к инструментам AutoML, которые автоматизируют ряд задач в рабочем процессе обработки данных.
  • Фудзимаки говорит, что большинство клиентов dotData - это гражданские специалисты по данным, которые используют инструмент dotData с графическим интерфейсом, чтобы проводить их через процесс построения моделей машинного обучения.
  • Databricks надеется расширить возможности трех групп - специалистов по обработке данных, инженеров по обработке данных и гражданских специалистов по данным - для помощи в создании приложений для машинного обучения.

3 эффективных применения машинного обучения в маркетинге

Особенности:

  • Если маркетологи рассчитывают создать более значимые кампании с целевой аудиторией и повысить вовлеченность, интеграция машинного обучения может стать инструментом для выявления скрытых закономерностей и действенных тактик, спрятанных в огромных объемах больших данных.
  • Компания обнаружила, что искусственный интеллект и машинное обучение позволяют аналитическому отделу слышать, о чем говорят в публичной сфере.
  • Конечно, хотя приведенные выше примеры показывают, как машинное обучение более эффективно задействует клиентские базы брендов, важно не упускать из виду реальную рентабельность таких интеллектуальных маркетинговых кампаний.
  • Поскольку приток данных продолжает бесконтрольно расти, внедрение машинного обучения в маркетинговые кампании станет еще более актуальным, когда дело доходит до начала увлекательных разговоров с потребителями.
  • Такие компании, как Ben & Jerry’s, Mazda и Sephora, уже осознали положительное влияние машинного обучения на их бренды, в том числе более высокий уровень вовлеченности и повышение рентабельности инвестиций.

Подготовлено и спонсировано:

Инновационные решения в области науки о данных и расширенной аналитики