Публикации по теме 'big-data'


Почему наука о данных так увлекательна?
Любой, кто занимается наукой о данных, уже знает, что эта отрасль быстро превращается в одну из самых захватывающих профессий 21 века. Многие даже считают эту роль самой сексуальной ролью современности. Вы бы согласились? Вот несколько причин, по которым наука о данных так интересна. Быть специалистом по обработке данных - значит работать детективом, современным Шерлоком Холмсом. Индустрия отлично подходит для любознательных людей, которые любят решать повседневные головоломки...

Использование машинного обучения для сопоставления продуктов в Indix
Фундаментальная проблема сопоставления заключается в том, что не существует единого источника истины . Существуют миллиарды продуктов, и нет абсолютной структуры, определяющей, как продукты должны быть идентифицированы в разных магазинах. UPC (универсальный код продукта) полезен, но большинство сайтов электронной коммерции не отображают его на страницах отображения своих продуктов. Это подводит нас к следующей проблеме, которая заключается в глубине информации о товарах в разных..

Технический обзор параллельного программирования.
Технический обзор параллельного программирования. Балансировка нагрузки, или балансировка нагрузки, пытается распределить одну и ту же рабочую нагрузку на каждую задачу, чтобы избежать того, что есть задачи, которые требуют гораздо большей вычислительной работы, чем другие. Другими словами, балансировка нагрузки пытается минимизировать рабочий дисбаланс между различными задачами и, следовательно, гарантирует, что каждая задача направлена ​​на выполнение чего-либо, сводя к минимуму..

Мозговые волны 30 декабря 2017 г.
Сегодня на мозговых волнах: Процесс профессиональной (кибер) безопасности: F3EAD: найти, исправить, завершить, использовать, проанализировать и распространить https://www.digitalshadows.com/blog-and-research/f3ead-find -исправить-завершить-эксплуатировать-анализировать-и-распространить-альтернативный-разведывательный-цикл/ Заглянем в хрустальный шар Raspberry Pi: Raspberry Pi 3X, Raspberry Pi 0X, Raspberry Pi 4, Broadcom и Qualcomm https://libre.computer/2017/12/..

Контроль версий для моделей ML
С кодом, алгоритмами и обучающими наборами данных Что такое контроль версий? Системы контроля версий — это классификация инструментов программирования, которые помогают команде разработчиков управлять изменениями в исходном коде с течением времени. Системы контроля версий отслеживают каждое изменение кода в уникальной базе данных. Если произошла путаница, инженеры могут сравнить более ранние версии кода, чтобы исправить оплошность, при этом ограничив помехи для всех других коллег,..

Мой первый сквозной проект по анализу текста и аналитике — от парсинга до инсайтов
Мой первый проект сквозного анализа текста и аналитики — от парсинга до инсайтов Предисловие Изучая различные методы анализа текста для извлечения полезных идей и шаблонов для поддержки принятия решений в рамках моего годичного диплома специалиста Nanyang Poly по аналитике больших данных, я работал над проектом NLP, в котором изучались возможности чтения сюжета фильма. набор данных, чтобы предсказать, будет ли это кассовым хитом. Цели проекта Я и трое моих однокурсников (Алекс,..

Айдентика и аналитика
В течение многих лет рынок IAM был рынком реагирования и обнаружения. Когда мы смотрим в будущее, наше внимание должно быть обращено на мир аналитики и способность прогнозировать и реагировать на проблемы управления. Запросы доступа больше не должны быть порционными, а должны быть амазонскими в выборе. Шаблоны интеллектуального анализа данных должны выявлять пользователей с похожими атрибутами и доступом, что позволяет легко обнаруживать профили доступа и предлагать, если не..