Публикации по теме 'data-science'


Как выбрать метод выбора
Аналитические данные, основанные на реальных наборах данных Автор: : Юваль Коэн , Ноа Коэн и Авиад Атлас . Введение Одна из тем, с которой сталкивается каждый специалист по обработке данных, младший или старший, в каждом проекте по науке о данных - это выбор функций. В этой статье, состоящей из двух частей, мы хотим поделиться своим опытом решения реальных проблем. В части 1 ниже мы представляем временной анализ различных методов выбора функций, которые мы использовали, и..

Классификация многоязычных документов
Классификация многоязычных документов Как создать приложение НЛП, не зависящее от языка. Использование неструктурированных данных становится обязательным условием для поддержки и развития бизнеса, основанного на данных. Разработка текстовых функций, которые могут улучшить производительность модели NLP , требует сочетания лингвистики, науки о данных и опыта в области бизнеса. Этого достаточно для стартапа, но как насчет того, чтобы ваш продукт стал вирусным и вы выйдете на мировой..

Как я улучшил свой результат в табличном соревновании Kaggle от 21 августа, используя CCA
В последних нескольких постах я вел хронику своих усилий по достижению хороших результатов на главном веб-сайте по науке о данных, Kaggle’s, табличном соревновании за август 2021 года. В самой последней публикации, которую я разместил, где я обсуждал GenericUnivariateSelect, селектор функций в sklearn, библиотеке машинного обучения Python, я также был застигнут врасплох, когда получил бронзовую медаль за эту работу. Ссылку на этот пост можно найти здесь:..

Основные функции spaCy: сравнение производительности для португальского, французского и английского языков
С июня 2020 г. я больше не буду использовать Medium для публикации новых историй. Пожалуйста, посетите мой личный блог, если вы хотите продолжить читать мои статьи: https://vallant.in . spaCy — отличный инструмент для НЛП. Библиотека с открытым исходным кодом бесплатна, быстра и проста в использовании. У spaCy также есть замечательные функции, такие как тот факт, что он использует неразрушающую токенизацию и поддерживает множество языков. Но мы знаем, как тяжело работать с..

Обучающие вложения предложений с помощью логического вывода
Подход к неконтролируемому обучению кажется нормальным способом построения вложений слов, предложений или документов, потому что он более обобщен, так что предварительно обученный результат встраивания может быть передан другим нисходящим задачам НЛП. Например, пропустить грамму при встраивании слов и пропустить при встраивании предложений и распределенный мешок слов при встраивании абзацев. Conneau et al. отметил, что контролируемое обучение в ImageNet (классификация изображений)..

Как я заработал 3333 доллара на моем первом онлайн-курсе по Data Science за 5 месяцев без маркетинга…
Советы по продвижению вашего курса искусственного интеллекта В этом году я запустил свой первый онлайн-курс на Udemy под названием Создание вопросов с использованием обработки естественного языка и заработал 3333 доллара за 5 месяцев без маркетинговых затрат и 100% оплачиваемых зачислений. Маркетинг курса искусственного интеллекта предполагает эффективное подключение к сообществу специалистов по науке о данных. Поэтому нам нужно применять маркетинговые стратегии, специфичные..

Районы Бангалора, в которых обязательно стоит остановиться
Введение: Бангалор (также называемый Бангалор) — столица южного индийского штата Карнатака. Центр индустрии высоких технологий Индии, город хорошо известен своими парками и ночными клубами. Таким образом, в результате этого возникает серьезная проблема с населением и дорожным движением, которая с каждым годом только увеличивается из-за того, что все больше людей хотят переехать в Бангалор. Поиск хорошего места для жизни в Бангалоре быстро становится очень утомительной задачей,..