Публикации по теме 'data'


Обратная матрица в искусственном интеллекте
Обратная матрица — одно из важных понятий в машинном обучении. ( источник: https://en.wikipedia.org/wiki/Invertible_matrix ) Матричная алгебра играет важную роль в современных технологиях искусственного интеллекта и машинного обучения. поскольку большинство языков программирования, используемых в искусственном интеллекте, работают с основными понятиями математики. Сегодня мы увидим, как MIMO и компьютерная графика связаны с одной из концепций матрицы, известной как матричная..

Понимание TagSpace - контролируемое изучение встраиваемых слов
Недавно я начал изучать машинное обучение для текста (до сих пор я работал с изображениями), и меня познакомили с StarSpace Facebook. Для тех, кто не знает о StarSpace, вот как это описывает Facebook Research. StarSpace - это нейронная модель общего назначения для эффективного обучения встраиванию сущностей для решения широкого круга задач. Одним из вариантов использования, упомянутых в репозитории, является TagSpace для генерации вложений слов / тегов, и именно об этом эта статья...

Зачем использовать машинное обучение вместо традиционной статистики?
Этот вопрос навис над мной, когда я готовился к собеседованию по телефону на должность аналитика в крупной фирме финансовых услуг. Мое любопытство переросло в тревогу, когда инженер, собеседовавший меня, спросил: «Почему вы решили использовать в своих проектах методы обучения, а не просто статистику с регрессиями и корреляциями?» Я сначала не понял вопроса. Мне казалось очевидным, что алгоритм, рекомендующий студенту будущий университет, не может работать без машинного обучения...

Большие данные наносят ответный удар: рост количества изображений, сенсоров и геномных данных, лежащих в основе глубоких вертикальных стартапов
Каждые два года мы создаем в десять раз больше данных, чем за всю предшествующую историю человечества - 90% мировых данных имеют возраст менее двух лет. Во всяком случае, этот темп будет увеличиваться. А уникальное сочетание инноваций в алгоритмах машинного обучения и недорогого сбора данных может обеспечить существенное преимущество как в вычислительной технике, так и в компаниях, которые от нее зависят. Как отмечают Алон Халеви, Питер Норвиг и Фернандо Перейра из Google в статье..

Деревья решений (часть 1)
Построение дерева решений и применение гипернастройки для повышения соответствия модели Деревья решений имитируют принятие решений человеком, точно так же, как человек, дерево решений периодически проверяет определенные параметры, пока мы не получим достаточное количество результатов (+ve или -ve), подтверждающих нас для принятия конкретных решений. Возьмем пример: создадим машину для принятия решений для оценки средней цены ноутбука для машинного обучения . набор данных (kaggle)..

Использование визуализаций для разоблачения черного ящика машинного обучения
Публикация в рамках курса визуализации информации NUS CS5346. Модели машинного обучения могут быть непрозрачными, иногда тревожными. Некоторые классы моделей, такие как случайные леса и глубокие нейронные сети, не дают четкого пути к пониманию того, как входные данные модели влияют на ее выходные данные. Эта непрозрачность имеет реальные последствия. В то время, когда модели машинного обучения принимают последовательные решения, например, одобрять жилищный кредит или нет, у граждан нет..

Установка Dataturks, платформы аннотирования данных машинного обучения в помещении
Я искал платформы аннотирования данных машинного обучения с открытым исходным кодом для аннотирования текста и изображений для наших бизнес-требований в моей компании. Я столкнулся с несколькими инструментами с открытым исходным кодом, такими как LabelImg, ImageTagger и Dataturks. Я глубоко погрузился в вышеупомянутые инструменты и понял, что инструмент Dataturks — лучший инструмент, который соответствует нашим потребностям. Dataturks можно использовать двумя способами. Облачная версия..