Публикации по теме sklearn

Публикации по теме 'sklearn'

Глава 2: Комплексный проект машинного обучения

Обзор практического машинного обучения с помощью Scikit-Learn, Keras и Tensorflow Орельена Жерона Резюме В этой главе основное внимание уделяется работе над полным проектом машинного обучения. В частности, автор предлагает вымышленную ситуацию, в которой вы поручили проекту предсказать стоимость домов в Калифорнии, чтобы ваша компания могла улучшить свою текущую инвестиционную стратегию. Получение и оценка ваших данных Итак, для этого вы начинаете настраивать конвейер, чтобы вы..

Визуализация модели Sklearn, часть 1 : вес и предвзятость

Я обучил свою модель классификатора дерева решений с помощью набора данных Titanic. Я протестировал модель, все в порядке. Все прошло хорошо. Но затем я научился тому, что называется визуализацией обучения (кривая обучения и кривая проверки), которая будет полезна для анализа того, как моя модель обучается. Для модели TensorFlow или Keras существует отличный инструмент визуализации под названием tensorboard, но для модели sklearn нет возможности. Я искал в Интернете, но нашел что-то под..

Все о дереве решений

В этой статье мы поймем дерево решений, ответив на следующий вопрос: Что такое дерево решений? Какова основная концепция дерева решений? Какие термины используются в Дереве решений в случае классификации? Какие термины используются в дереве решений в случае регрессии? Каковы преимущества и недостатки дерева решений? Как реализовать дерево решений с помощью Scikit-learn? Что такое дерево решений? Дерево решений — один из самых мощных и важных алгоритмов, присутствующих в..

Что произошло, когда я сравнил конкурс Disaster Tweet со spacy и pytorch со sklearn…

В моем последнем посте я рассказал, как я использовал Pytorch, чтобы делать прогнозы на соревнованиях вентиляторов Kaggle. Это соревнование было задачей табличной регрессии, поэтому я хотел посмотреть, насколько хорошо я наберу баллы, если попробую Pytorch в задаче табличной классификации. Поэтому я выбрал соревнование Kaggle по выявлению бедствий, которое является проблемой классификации. Наборы данных для твитов о стихийных бедствиях можно найти здесь:..

Scikit-Learn: тонкие вопросы о реализации методов машинного обучения

Рассмотрим несколько, казалось бы, простых вопросов об алгоритмах машинного обучения и их реализации, на которые, однако, правильно ответить смогут лишь единицы (вы можете попробовать сами — не читая пояснений. Обратите внимание, что дополнительные вопросы в этом посте намеренно оставлены без ответа). Материал в этом посте для среднего уровня (тех, кто уже знаком с машинным обучением (ML) и библиотекой scikit-learn ) Первоначально опубликовано на dasha.ai/en-us/blog/scikit-learn..

Ускорение обучения модели sklearn

Sci-Kit Learn - это библиотека машинного обучения для Python. Эта библиотека содержит инструменты машинного обучения, необходимые для повседневного использования специалистами по данным. Одна вещь, которой этому модулю не хватает по сравнению с другими платформами глубокого обучения, такими как PyTorch и TensorFlow, - это невозможность обучать модели на графическом процессоре, что значительно увеличивает скорость обучения моделей. Но что, если я скажу вам, что есть инструмент, с помощью..

Как составить список самых распространенных слов из корпуса текста с помощью Scikit-Learn?

Часто мы хотим узнать, какие слова наиболее распространены в текстовом корпусе, потому что мы ищем какие-то закономерности. Объяснение vec = CountVectorizer (). fit (корпус) Здесь мы получаем модель Bag of Word, которая очистила текст, удалив нецифровые символы и стоп-слова . bag_of_words = vec.transform (корпус) bag_of_words матрица, где каждая строка представляет определенный текст в корпусе , а каждый столбец представляет слово в словаре, то есть все слова, найденные..