Публикации по теме 'big-data'


Понимание слов для понимания языка
В Recast.AI мы используем обработку естественного языка (NLP) как способ обогащения информации, поступающей от пользователей, и контекст является важной частью процесса. Обрабатывая запрос пользователя, мы решаем, соответствует ли он намерению , которое является общим значением предложения. Для этого нам нужно понимать, что говорит пользователь, анализируя контекст и значения каждого слова. Однажды я наткнулся на предложение, которое наша программа не могла правильно..

Мое самое большое технологическое разочарование 2016 года
Самым неожиданным событием начала 2016 года стал внезапный запуск Netflix на 130 новых рынках, в том числе и у меня в лесу. Этот факт сам по себе был большим событием, но технологический ракурс интересовал меня не меньше, чем развлекательный. Я не большой поклонник больших данных, искусственного интеллекта и машинного обучения, но я довольно заинтересован в этой области, хотя и на очень поверхностном уровне. Я помню, как читал, насколько умными были некоторые технологии Netflix еще во..

Основы передовых технологий.
В последние годы область технологий стремительно росла, и одним из самых захватывающих событий является появление искусственного интеллекта (ИИ) и его потомка, генеративного ИИ . Но что именно входит в эти передовые технологии, что делает их такими передовыми? Сегодня давайте подробнее рассмотрим некоторые основные технические основы, лежащие в основе этих инноваций. Во-первых, важно понимать, что как ИИ, так и Генеративный ИИ построены на основе Машинного обучения (МО),..

Hadoop Hive MySQL в Ubuntu 20.04
Общий шаг Установить файл окружения hive-env.sh Установить основной файл конфигурации hive-site.xml Настройка пользователя куста MySQL / пароль и грант Загрузите и установите коннектор MySQL JDBC Запуск schemaTool должен увидеть здесь таблицу Hive Создать расположение Hive по умолчанию Контрольная точка с командой hive Запустите хранилище метаданных службы и server2 Подключиться к инструменту базы данных Шаг 1: Установите файл hive-env.sh Скопируйте файл шаблона в..

Введение: Контроль версий для проектов Data Science с помощью DAGsHub
Такие платформы, как GitHub, были инструментами для управления версиями программных проектов. Однако проекты машинного обучения сталкиваются с новыми проблемами при работе с GitHub: « Контроль версий моделей и данных ». GitHub имеет строгое ограничение на размер файла - 100 МБ. Это означает, что специалистам по данным и инженерам машинного обучения придется импровизировать, чтобы работать с GitHub, поскольку это ограничение препятствует контролю версий для больших наборов данных и..

Как новые подходы могут помочь нам подготовиться к непредвиденным вирусным атакам
Полагаться на наши знания об известном недостаточно, когда речь идет об управлении рисками и поддержании здоровья и безопасности. От оспы до атипичной пневмонии и лихорадки Эбола мы, люди, веками боролись со вспышками вирусов. Даже когда мы восстанавливаемся после одной вспышки, мы начинаем смотреть вперед, чтобы попытаться понять, что может произойти дальше. Мы пытаемся извлечь уроки из прошлого, работая над созданием новых средств защиты, и делаем все возможное, чтобы остановить..

Сила предиктивной аналитики — Использование данных для продвижения учащихся к успеху
Прогнозное моделирование — это процесс использования статистических методов для извлечения закономерностей из исторических данных с целью прогнозирования будущих результатов. От финансов до здравоохранения и, в частности, высшего образования использование прогнозной аналитики набирает обороты. Внедрение прогностической аналитики не только поможет вам добиться лучших результатов и улучшить качество обслуживания клиентов, но и принесет значительные финансовые выгоды. Давайте узнаем, как…..