Публикации по теме 'big-data'


Анализ настроений сегодняшних твитов о президенте Бухари, использующем Python Vader и Sentiwordnet
После долгих выходных, путешествующих по Лагосу, Кадуне и Абудже для проведения ежеквартального анализа бизнес-данных и углубленного обучения Excel в Абудже, я сегодня отдохнул и решил выполнить интересную задачу по анализу данных. Провести анализ настроений по сегодняшним твитам о президенте Бухари. Это было очень интересное задание. Познакомил меня с библиотекой Python Tweepy. Мне помог Марко Бонзанини. Вам следует ознакомиться с его книгой Освоение майнинга социальных сетей с..

СОВЕРШЕНСТВО, СТРАСТЬ, ЧЕСТНОСТЬ И СОТРУДНИЧЕСТВО: МОИ СЛОВА ANDELA BOOTCAMP
СОВЕРШЕНСТВО, СТРАСТЬ, ЧЕСТНОСТЬ И СОТРУДНИЧЕСТВО: МОИ СЛОВА ANDELA BOOTCAMP Бросать эти воображаемые разноцветные мячи сегодня было действительно здорово. Тренировка мягких навыков может быть такой интересной, хотя поначалу вы действительно ничего не понимаете, но смысл постепенно раскрывается по мере того, как веселье становится лучше, благодаря вам, «ТРЕНЕР», надеюсь, вы испытаете больше этого. Сегодня я на самом деле научился использовать Git и Github, и в настоящее время у меня там..

Краткое введение в PySpark
Краткое введение в PySpark Учебник по PySpark для науки о данных PySpark - отличный язык для выполнения масштабного исследовательского анализа данных, построения конвейеров машинного обучения и создания ETL для платформы данных. Если вы уже знакомы с Python и такими библиотеками, как Pandas, тогда PySpark - отличный язык для изучения, чтобы создавать более масштабируемые анализы и конвейеры. Цель этого поста - показать, как приступить к работе с PySpark и выполнять общие задачи...

Улучшение переменной расстояния временных рядов в больших данных
Мы сгенерируем синтетические данные трех случайных величин x1, x2 и x3 и оценим ответ y, добавив некоторый шум к линейной комбинации. Чтобы сформулировать проблему таким образом, чтобы мы могли предоставить нашим моделям больших данных как можно более полные данные, этот скрипт Python будет генерировать окна с учетом данных временного ряда. /сильный>» Во-первых, давайте посмотрим, какие данные у нас есть и какую терапию мы собираемся применять. N = 600, — Np.arange(0, N,..

Как молниеносно выполнять операции над массивом с помощью композиции функций и Transducer.JS!
Старая добрая доверенная структура данных, массив. Мы все знаем, что они из себя представляют, и, вероятно, используем их чаще, чем, я уверен, планировалось. Вы можете выполнять с ними множество операций и, что важно, можете объединять несколько методов (сопоставлять, фильтровать, уменьшать и т. д.), чтобы получить желаемый результат. Эта гибкость также может быть ахиллесовой пятой с точки зрения производительности… Как мы теперь используем массивы? Часто, когда мы обрабатываем..

Кто на самом деле будет контролировать ИИ?
Кто на самом деле будет контролировать ИИ? Вчера принесли новости об еще одной инициативе, поддержанной миллиардером — на этот раз во главе с Ридом Хоффманом и Пьером Омидьяром — направленной на обеспечение мирного сосуществования искусственного интеллекта и общественных интересов. Это благородное начинание, как и такие инициативы, как OpenAI и AI100 , но остается фундаментальный вопрос: кто на самом деле будет применять лучшие практики, рекомендованные этими инициативами, или..

Как найти отличные решения для машинного обучения
Вы думаете о том, чтобы попробовать решение для машинного обучения для своей компании, но не знаете, как отличить хорошее машинное обучение от плохого. В этот золотой век данных разумное использование данных стало для многих компаний разницей между успехом и неудачей. Машинное обучение — самый популярный подход к решению проблем в этом десятилетии. Многие компании ищут решения для машинного обучения, чтобы оставаться конкурентоспособными, но мало знают о том, что искать в потенциальных..