Публикации по теме data-sc

Публикации по теме 'data-sc'

Шесть подкастов по науке о данных, которые вам нужно послушать…

Шесть подкастов по науке о данных, которые вам нужно послушать… Нет времени взять книгу? Чтобы узнать больше о науке о данных, почему бы не послушать эти подкасты по науке о данных на ходу. От обсуждения серьезных проблем до более беззаботных, остроумных, открытых разговоров. Без дальнейших церемоний, давайте начнем. Супер наука о данных Веб-сайт: https://www.superdatascience.com/podcast/ Твиттер: @superdatasci Слушайте: RSS ⋅ iTunes ⋅ Podbean ⋅ Player FM С..

Как стать быстрее в программировании — Машинное обучение — Анализ данных

Темп — ключевой элемент повышения продуктивности Data Scientist. Почему вы должны стать быстрее в программировании как Data Scientist? Анализ данных технически является задачей поиска. Чем быстрее вы работаете, тем больше данных вы можете исследовать, поэтому шансы найти что-то ценное возрастают. Мы также можем сказать то же самое о разработке модели машинного обучения. Технически мы просматриваем почти бесконечное пространство модели, чтобы найти наилучшую комбинацию шагов..

Аспекты, тем лучше? Применение неконтролируемого извлечения аспектов в обзорах косметики Amazon.

Любой, кто хоть немного интересуется обработкой естественного языка (NLP), слышал о скрытом семантическом анализе (LSA) или его вероятностном родственнике скрытом распределении Дирихле (LDA). Оба метода направлены на извлечение тем из текстов. Любой, кто достаточно смел, чтобы попробовать один из этих методов, скорее всего, останется в еще большем замешательстве, чем раньше. Общие мысли после такого эксперимента, как правило, были бы такими: «Это и есть удивительная сила НЛП?» или «Так я..

Лучшие практики для программирования на R

Как человек, имеющий опыт работы в статистике, я признаю тот факт, что мне постоянно приходится улучшать свои компьютерные науки и инженерные навыки почти каждый день. Хотя для меня естественно думать о распределениях, статистике и других ключевых концепциях при анализе данных, написание эффективного и чистого кода - нет. К счастью, у меня была возможность поработать со множеством инженеров, которые научили меня и объяснили, почему код должен быть чистым и эффективным - если я могу..

Прикладные модели машинного обучения для улучшения оценки стартапов.

Определение стоимости стартапа на ранней стадии в большинстве случаев очень сложно из-за ограниченности исторических данных, незначительной или нулевой выручки, рыночной неопределенности и многого другого. Поэтому традиционные методы оценки, такие как дисконтированный денежный поток (DCF) или мультипликатор (CCA), часто приводят к ненадлежащим результатам. С другой стороны, альтернативные методы оценки остаются предметом субъективной оценки отдельных лиц и становятся черным ящиком для..

Методы выбора функций

Что такое выбор функции? Вы все видели наборы данных. Иногда они маленькие, но часто очень большие по размеру. Становится очень сложно обрабатывать очень большие наборы данных, по крайней мере, достаточно значительные, чтобы вызвать узкое место обработки. Время обучения и производительность алгоритма машинного обучения сильно зависят от функций в наборе данных. В идеале мы должны сохранять в наборе данных только те функции, которые действительно помогают нашей модели машинного..

Погрузитесь глубже в поиск похожих лиц с помощью Spotify’s Annoy, Tensorflow и Pytorch

В моем предыдущем посте я дразнил, что прыгнул в кроличью нору, чтобы попытаться улучшить свой конвейер сходства лиц Fate Grand Order, где я использовал детекторы объектов Tensorflow, экстракторы функций Pytorch и приблизительную библиотеку ближайших соседей Spotify ( досадно ). Общая идея, с которой я работал, заключалась в том, что я хотел закодировать информацию о чертах лица персонажей (чтобы найти похожие символы), а также фоновую информацию (чтобы возвращать изображения с похожими..