Публикации по теме data-science

Публикации по теме 'data-science'

Обзор науки о данных № 25: Когда наука о данных идет (очень) неправильно, борясь с бедностью с помощью данных, и ваши…

«Вы приложили много усилий, чтобы ответить на вопрос, который никогда не следовало задавать». - Неизвестный Наука о данных пошла (очень) неправильно Это одна из самых увлекательных статей, которые я читал за последнее время. В нем подробно описывается крупная ошибка в Herbalife, где основные бизнес-показатели систематически завышались в публичных финансовых отчетах. Руководство винит в ошибках «скрипты отчетности базы данных». Редко можно увидеть такой публичный провал науки о..

Машинное обучение, быстрое и медленное

Запоминание и обобщение моделей Допустим, у вас есть сайт с обзорами ресторанов под названием "Мишленовский человек". Вы собираете много отзывов от пользователей и хотите проанализировать, последовательны ли они . Пользователь только что ел в итальянском ресторане написал сообщение: Мне нравится повязка. Распространенный способ решить проблему - взглянуть на сообщение на уровне слов. ["i", "like", "the", "dressing", "."]..

Дополнение списков фреймами данных

Помимо коллекций и понятий Пару дней назад я написал пост, в котором резюмировал, сколько были использованы Коллекции и Понимание. Данные были предоставлены в виде lists , либо списков dictionaries , либо tuples . А чтобы ответить на вопросы о данных, автор часто использовал list comprehensions — перебор списков с помощью цикла for. Я начинаю видеть в этом очень ориентированный на Python способ решения проблем. Хотя не все данные являются табличными, многие из них..

Ядерная мышеловка

Искусственный интеллект - это сложно Ядерная мышеловка Попробуй небольшие простые решения, прежде чем браться за большие пушки Ученые сейчас строят модели с триллионами параметров. Гигантские системы вроде GPT-3 и даже более крупные модели вроде Wu Dao 2.0 сходят с конвейера. Эти поистине огромные модели, их меньшие братья на основе трансформаторов и даже старые добрые нейронные сети, созданные с нуля, очень популярны в средствах массовой информации и в практическом применении...

Создание конечной точки API погоды с помощью FastAPI и AWS Elastic Beanstalk

В рамках нашего проекта Lambda Labs я был частью команды, которой нужно было создать веб-приложение под названием CitySpire. Я был частью команды Data Science из 4 человек, которой было поручено построить модели прогнозирования (где это применимо) и конечные точки для наших источников данных. Мне было поручено построить модель прогнозирования погоды и развернуть ее. Что такое CitySpire? Приложение, которое анализирует данные из городов, такие как население, стоимость жизни, арендные..

«Человек, решивший рынок»: И решением было… HMM и регресс.

Я только что закончил читать фантастическую биографию Джима Саймонса Грегори Цукермана: Человек, который решил рынок . Он охватывает некоторых из многих уникальных персонажей RenTech до настоящего времени и больше всего говорит об их торговых стратегиях 1980–2000-х годов. Лучшие ответы, которые я смог получить из книги о том, каково было их решение для рынка: Цепи Маркова, модели HMM Линейные факторные модели, за которыми следуют методы ядерной регрессии большой размерности Большие..

Мое путешествие в машинное обучение: 4 класс

Всем привет! Спасибо, что отправились со мной в путешествие по машинному обучению! Это четвертый пост в серии; ознакомьтесь с первой , второй и третьей статьями, если вы еще этого не сделали. На прошлой неделе мы изучили основную концепцию линейной регрессии. Мы продолжали думать с байесовской точки зрения и изучали наивный байесовский алгоритм. Мы также вкратце рассмотрели, как оцениваются модели. На этой неделе мы: Обсудите необходимость набора для валидации Продолжить..