Публикации по теме 'data-science'


Фокус пакета Python: Faker
Простой способ сгенерировать тестовые данные для любой ситуации. Существует так много пакетов Python, и для людей, изучающих язык, может быть сложно узнать, какие инструменты вам доступны. Я хочу раскрыть некоторые из менее известных, но функциональных и полезных пакетов, которые помогут вам в вашем путешествии по Python. Итак, что такое Faker? Согласно их документации , Faker - это пакет Python, который генерирует для вас поддельные данные. Если вам нужно выполнить начальную..

У Jupyter есть идеальный редактор кода
Все под рукой Ноутбуки всегда были инструментом для постепенного развития идей программного обеспечения. Специалисты по обработке данных используют Jupyter для ведения журнала своей работы, исследования и экспериментов с новыми алгоритмами, быстрого наброска новых подходов и немедленного наблюдения за результатами. Более того, JupyterLab стремится стать полноценной IDE; просто не та IDE, к которой вы привыкли. Благодаря своим замечательным расширениям и библиотекам, таким как..

Данные в DoorDash: прозрачные, универсальные и только начинающие
Данные в DoorDash: прозрачные, универсальные и только начинающие DoorDash отслеживает сотни переменных, чтобы еда была доставлена ​​клиенту вовремя и свежей, но влияние данных выходит далеко за рамки продукта. Команда поддержки использует его, чтобы более эффективно отвечать на вопросы; Рекрутинг использует это, чтобы улучшить опыт кандидата; Команда по работе с персоналом использует его для отслеживания удовлетворенности и вовлеченности сотрудников. Наборы данных доступны..

Остерегайтесь сдвигов данных
НАУКА ДАННЫХ Остерегайтесь сдвигов данных Различия между данными обучения и данными после внедрения могут привести к снижению производительности модели. Модели прогнозирования, построенные с помощью алгоритмов машинного обучения, часто не работают в реальном мире. Даже искусственный интеллект, созданный некоторыми ведущими мировыми экспертами, часто с трудом может воспроизвести многообещающие характеристики за пределами лаборатории . Ярким примером являются системы AI Health..

№8 — Непрерывный бенчмарк в проектах машинного обучения
# 8 — Непрерывный бенчмарк в проектах ML Важность предоставления конкурентам возможности улучшить себя и продукт. У проектов данных есть особенность, которая делает их очень мощными: решения об их развитии сильно основаны на метриках. Если наши ключевые показатели эффективности четко определены и мы не оставили A/B-тестирование в производстве столь сложным, чтобы стать частью нашего технического долга , теперь у нас есть четкий путь к сравнительному анализу и составлению..

Проблема с ИИ в доверии?
Проблема ИИ в доверии? Раскрываем глубокий и дешевый секрет нейронных сетей Возможно, самой важной новостью об искусственном интеллекте на прошлой неделе стала еще одна крупная победа для астрофизики и академической республики Кембридж, штат Массачусетс. Генри В. Лин и Макс Тегмарк объяснили, почему нейронные сети настолько эффективны при отмыкании почти всех замков, которые мы пытались открыть. Объяснитель Лина на Quora продолжает эту метафору волшебными ключами ...

Ян Тайхманн - dataIQ 100 - Интервью
Самые влиятельные люди в Data 2020 Для меня большая честь быть включенным в список 100 самых влиятельных практиков в области данных и аналитики DataIQ . Я искренне поражен интересом к моей работе, опыту и мнениям более широкого сообщества. Вот что я сказал в своем интервью (первоначально опубликованном на https://www.dataiq.co.uk/dataiq100/jan-teichmann-consultant-thetrainlinecom ): Путь к власти Как и многих начинающих специалистов по данным, меня двигало любопытство,..