Публикации по теме 'big-data'


Databricks привлекает 140 миллионов долларов, а Microsoft представляет свои собственные чипы искусственного интеллекта
Это перепечатка (более или менее) ежедневного информационного бюллетеня ARCHITECHT за вторник. Зарегистрируйтесь здесь , чтобы получать его в свой почтовый ящик каждое утро. Это два довольно больших вопроса, и мне есть что сказать, поэтому позвольте мне просто углубиться в каждый из них как можно меньше. Тем не менее, я думаю, что они также более связаны, чем может показаться, и я объясню, почему в конце. Databricks привлекла 140 млн долларов США , а в настоящее время уже..

Практическое создание конвейера больших данных — часть 1
Эта статья будет долгой, но ее стоит прочитать. Я хотел бы сказать: “Any Machine Learning project is 80% data engineering and 20% Model Engineering”. Следовательно, если вы посмотрите мое портфолио статей, я много раз концентрировался на различных шаблонах конвейеров данных, которые будут способствовать инженерии данных, эта статья также попадает в эту категорию. Мы сосредоточимся на построении конвейера больших данных и увидим практическую реализацию этого E2E. Основные этапы..

Когда большие данные становятся локальными, небольшие данные становятся большими
В более ранней статье Важность местоположения в недвижимости, погоде и машинном обучении обсуждались различные значения и применения обнаружения на основе местоположения в науке о данных и машинном обучении. Один из описанных здесь алгоритмов - это мощный, но странно названный алгоритм машинного обучения: машина опорных векторов (SVM). В примечаниях ниже мы суммируем значение и полезность другого мощного, но странно названного алгоритма машинного обучения, который фокусируется на..

Заменит ли Джулия Python и R для науки о данных?
Знакомство с Юлией Для тех из вас, кто не знает, Julia — это многопарадигмальный ( полностью императивный, частично функциональный и частично объектно-ориентированный) язык программирования предназначен для научных и технических ( читай числовых ) вычислений. Он обеспечивает значительный прирост производительности по сравнению с Python ( при использовании без оптимизации и векторных вычислений с использованием Cython и NumPy ). Время разработки сокращается в среднем в 2 раза...

Данные и инструменты
Что такое бизнес-аналитика? Бизнес-аналитика – это управляемый технологиями процесс анализа данных и представления полезной информации, которая помогает руководителям и менеджерам принимать бизнес-решения. Проще говоря, анализ, отчетность, составление бюджета и представление ваших бизнес-данных. Цель использования бизнес-аналитики для вашего бизнеса — улучшить ваши организационные процессы и финансовое положение, чтобы лучше управлять своим бизнесом. Программное обеспечение для..

Лучше, чем SQL: полное руководство по Apache Hive для работы с большими данными
Для больших данных SQL не подходит. В этом блоге рассказывается о проекте, в рамках которого я создал образ Docker для Apache Hive. Наряду с созданием многоузловой среды этих контейнеров. Показаны все команды, необходимые любому наивному пользователю для понимания основ Apache HIVE. Этот проект следует за процессом инициализации запуска контейнеров HIVE для обработки большого набора данных (размером 7 ГБ), каждая команда была доставлена ​​с полным объяснением. Если вы не..

13 предстоящих сессий Strata, от которых я в восторге
Представлено — Мукунд Раджаманнар, Synerzip. Технари и бизнес-профессионалы, одержимые данными, должны посетить Strata. ИИ и машинное обучение совершили качественный скачок за последние несколько лет. Неудивительно, что в повестке дня этого года им уделено особое внимание. Сегодня больше организаций собирают данные обо всем, чем когда-либо до последнего десятилетия. Однако сбор данных и осмысление их для принятия бизнес-решений — это две совершенно разные задачи. Следовательно, в..