Публикации по теме 'data-science'


Понимание градиентно-изолированного изучения представлений и интуиции для жадных…
С тех пор, как я начал заниматься наукой о данных и машинным обучением, меня всегда интересовало огромное количество данных, генерируемых людьми, и наша неспособность эффективно использовать их в сложных алгоритмах, доступных в нашем распоряжении. Единственный недостаток всех наших идей по применению глубокого обучения и спасению мира (для этого слишком поздно) - это усилия и время, затрачиваемые на предварительную обработку данных, а не сами данные, которых у нас в изобилии. Чтобы понять..

Автоматизация построения конвейера набора классификационных данных
Надоело тратить время на поиск и загрузку набора данных вручную? Хотите создать свой собственный набор данных изображений, но не можете этого сделать из-за ограниченного времени или по какой-либо другой причине? Сбор данных  — один из важных этапов анализа данных, машинного обучения и глубокого обучения. Это процесс сбора информации. нас интересуют изображения любого типа, которые мы хотим собрать. Без данных мы не можем смоделировать нашу проблему и провести ее анализ. Но у..

Автоматическая дифференциация TensorFlow (AutoDiff)
Keras API может легко выполнять обратное распространение с помощью встроенных оптимизаторов и функций потерь. Однако бывают случаи, когда мы хотим специально манипулировать или применять градиент. Например, чтобы избежать взрывного градиента, мы можем захотеть обрезать градиент. В общем, TensorFlow AutoDiff позволяет нам вычислять градиенты и управлять ими. В приведенном ниже примере мы вычисляем и строим производную сигмовидной функции. В глубоком обучении мы используем..

Понимание методов быстрого обучения LightGBM
Полное объяснение LightGBM - самой быстрой модели повышения градиента LightGBM - это модель дерева решений Gradient Boosting (GBDT), разработанная Microsoft в 2016 году. По сравнению с другими моделями GBDT, LightGBM отличается более быстрой эффективностью обучения и высокой точностью. Нет принципиальной разницы в структуре между LightGBM и общей моделью дерева решений Gradient Boosting Decision Tree, но с помощью следующих специальных методов LightGBM ускоряется в обучении...

Напишите лучший код Python с помощью этих 10 приемов
Развивайте свои навыки Python Напишите лучший код Python с помощью этих 10 приемов Узнайте, как кодировать питоническим способом Кодировать - это весело, а программировать на Python - еще веселее, потому что есть много разных способов реализовать одни и те же функции. Однако в большинстве случаев существуют предпочтительные реализации, которые некоторые люди называют Pythonic. Одной из общих черт этих реализаций Pythonic является аккуратность и лаконичность кода...

Объясните машинное обучение тому, кто создал «привет, мир» (часть 1)
Учебник по машинному обучению и турнир Numerai Что такое Numerai? Numerai - хедж-фонд, использующий модели машинного обучения из краудсорсинга. Numerai выпускает еженедельные наборы данных, относящиеся к финансовым данным, и пользователи используют эти данные для построения модели, которая генерирует прогнозы будущих движений на рынке. Эти прогнозы выполняются хедж-фондом Numerai, и участники получают вознаграждение (~ 20 000 долларов США) в зависимости от выполнения их прогнозов...

Оборудование для глубокого обучения: знайте свои варианты
Когда дело доходит до развертывания нейронной сети, существуют варианты помимо графических процессоров (графических процессоров), а именно FPGA (программируемая вентильная матрица). Прежде чем углубляться в FPGA и их реализацию, хорошо бы немного понять архитектуру графического процессора и почему графические процессоры являются основным продуктом для нейронных сетей. Популярные библиотеки, такие как Tensorflow, работают с использованием CUDA (Compute Unified Device Architecture) для..