Публикации по теме 'data-science'
Фокус пакета Python: Faker
Простой способ сгенерировать тестовые данные для любой ситуации.
Существует так много пакетов Python, и для людей, изучающих язык, может быть сложно узнать, какие инструменты вам доступны. Я хочу раскрыть некоторые из менее известных, но функциональных и полезных пакетов, которые помогут вам в вашем путешествии по Python.
Итак, что такое Faker?
Согласно их документации , Faker - это пакет Python, который генерирует для вас поддельные данные. Если вам нужно выполнить начальную..
У Jupyter есть идеальный редактор кода
Все под рукой
Ноутбуки всегда были инструментом для постепенного развития идей программного обеспечения. Специалисты по обработке данных используют Jupyter для ведения журнала своей работы, исследования и экспериментов с новыми алгоритмами, быстрого наброска новых подходов и немедленного наблюдения за результатами.
Более того, JupyterLab стремится стать полноценной IDE; просто не та IDE, к которой вы привыкли. Благодаря своим замечательным расширениям и библиотекам, таким как..
Данные в DoorDash: прозрачные, универсальные и только начинающие
Данные в DoorDash: прозрачные, универсальные и только начинающие
DoorDash отслеживает сотни переменных, чтобы еда была доставлена клиенту вовремя и свежей, но влияние данных выходит далеко за рамки продукта. Команда поддержки использует его, чтобы более эффективно отвечать на вопросы; Рекрутинг использует это, чтобы улучшить опыт кандидата; Команда по работе с персоналом использует его для отслеживания удовлетворенности и вовлеченности сотрудников. Наборы данных доступны..
Остерегайтесь сдвигов данных
НАУКА ДАННЫХ
Остерегайтесь сдвигов данных
Различия между данными обучения и данными после внедрения могут привести к снижению производительности модели.
Модели прогнозирования, построенные с помощью алгоритмов машинного обучения, часто не работают в реальном мире.
Даже искусственный интеллект, созданный некоторыми ведущими мировыми экспертами, часто с трудом может воспроизвести многообещающие характеристики за пределами лаборатории . Ярким примером являются системы AI Health..
№8 — Непрерывный бенчмарк в проектах машинного обучения
# 8 — Непрерывный бенчмарк в проектах ML
Важность предоставления конкурентам возможности улучшить себя и продукт.
У проектов данных есть особенность, которая делает их очень мощными: решения об их развитии сильно основаны на метриках. Если наши ключевые показатели эффективности четко определены и мы не оставили A/B-тестирование в производстве столь сложным, чтобы стать частью нашего технического долга , теперь у нас есть четкий путь к сравнительному анализу и составлению..
Проблема с ИИ в доверии?
Проблема ИИ в доверии?
Раскрываем глубокий и дешевый секрет нейронных сетей
Возможно, самой важной новостью об искусственном интеллекте на прошлой неделе стала еще одна крупная победа для астрофизики и академической республики Кембридж, штат Массачусетс. Генри В. Лин и Макс Тегмарк объяснили, почему нейронные сети настолько эффективны при отмыкании почти всех замков, которые мы пытались открыть. Объяснитель Лина на Quora продолжает эту метафору волшебными ключами ...
Ян Тайхманн - dataIQ 100 - Интервью
Самые влиятельные люди в Data 2020
Для меня большая честь быть включенным в список 100 самых влиятельных практиков в области данных и аналитики DataIQ . Я искренне поражен интересом к моей работе, опыту и мнениям более широкого сообщества. Вот что я сказал в своем интервью (первоначально опубликованном на https://www.dataiq.co.uk/dataiq100/jan-teichmann-consultant-thetrainlinecom ):
Путь к власти
Как и многих начинающих специалистов по данным, меня двигало любопытство,..