Публикации по теме 'sklearn'
Глава 2: Комплексный проект машинного обучения
Обзор практического машинного обучения с помощью Scikit-Learn, Keras и Tensorflow Орельена Жерона
Резюме
В этой главе основное внимание уделяется работе над полным проектом машинного обучения. В частности, автор предлагает вымышленную ситуацию, в которой вы поручили проекту предсказать стоимость домов в Калифорнии, чтобы ваша компания могла улучшить свою текущую инвестиционную стратегию.
Получение и оценка ваших данных
Итак, для этого вы начинаете настраивать конвейер, чтобы вы..
Визуализация модели Sklearn, часть 1 : вес и предвзятость
Я обучил свою модель классификатора дерева решений с помощью набора данных Titanic. Я протестировал модель, все в порядке. Все прошло хорошо. Но затем я научился тому, что называется визуализацией обучения (кривая обучения и кривая проверки), которая будет полезна для анализа того, как моя модель обучается. Для модели TensorFlow или Keras существует отличный инструмент визуализации под названием tensorboard, но для модели sklearn нет возможности. Я искал в Интернете, но нашел что-то под..
Все о дереве решений
В этой статье мы поймем дерево решений, ответив на следующий вопрос:
Что такое дерево решений? Какова основная концепция дерева решений? Какие термины используются в Дереве решений в случае классификации? Какие термины используются в дереве решений в случае регрессии? Каковы преимущества и недостатки дерева решений? Как реализовать дерево решений с помощью Scikit-learn?
Что такое дерево решений?
Дерево решений — один из самых мощных и важных алгоритмов, присутствующих в..
Что произошло, когда я сравнил конкурс Disaster Tweet со spacy и pytorch со sklearn…
В моем последнем посте я рассказал, как я использовал Pytorch, чтобы делать прогнозы на соревнованиях вентиляторов Kaggle. Это соревнование было задачей табличной регрессии, поэтому я хотел посмотреть, насколько хорошо я наберу баллы, если попробую Pytorch в задаче табличной классификации. Поэтому я выбрал соревнование Kaggle по выявлению бедствий, которое является проблемой классификации. Наборы данных для твитов о стихийных бедствиях можно найти здесь:..
Scikit-Learn: тонкие вопросы о реализации методов машинного обучения
Рассмотрим несколько, казалось бы, простых вопросов об алгоритмах машинного обучения и их реализации, на которые, однако, правильно ответить смогут лишь единицы (вы можете попробовать сами — не читая пояснений. Обратите внимание, что дополнительные вопросы в этом посте намеренно оставлены без ответа). Материал в этом посте для среднего уровня (тех, кто уже знаком с машинным обучением (ML) и библиотекой scikit-learn )
Первоначально опубликовано на dasha.ai/en-us/blog/scikit-learn..
Ускорение обучения модели sklearn
Sci-Kit Learn - это библиотека машинного обучения для Python. Эта библиотека содержит инструменты машинного обучения, необходимые для повседневного использования специалистами по данным. Одна вещь, которой этому модулю не хватает по сравнению с другими платформами глубокого обучения, такими как PyTorch и TensorFlow, - это невозможность обучать модели на графическом процессоре, что значительно увеличивает скорость обучения моделей. Но что, если я скажу вам, что есть инструмент, с помощью..
Как составить список самых распространенных слов из корпуса текста с помощью Scikit-Learn?
Часто мы хотим узнать, какие слова наиболее распространены в текстовом корпусе, потому что мы ищем какие-то закономерности.
Объяснение
vec = CountVectorizer (). fit (корпус)
Здесь мы получаем модель Bag of Word, которая очистила текст, удалив нецифровые символы и стоп-слова .
bag_of_words = vec.transform (корпус)
bag_of_words матрица, где каждая строка представляет определенный текст в корпусе , а каждый столбец представляет слово в словаре, то есть все слова, найденные..