Публикации по теме 'ml-so-good'


Понимание глубокого обучения, кривых обучения для гипернастройки модели
Я знаю, как раздражает не понимать, что делать дальше после того, как вы подогнали модель к обучающему набору данных. Вы должны знать, как оценить точность вашей модели и кривые потерь. Эти кривые обучения помогут вам сделать следующий шаг. Ключевыми аспектами здесь являются проверка того, является ли модель недостаточной или чрезмерной, или какой-то странный призрак напал на вашу модель, и кривая стала чертовски зигзагообразной. Что это значит? Что, черт возьми, здесь происходит?..

Технология искусственного интеллекта: что это такое, а что нет, и как она может (потенциально) помочь нам решить проблему климата…
Подготовили: Том Хенгл (OpenGeoHub) , Давиде Консоли (OpenGeoHub) , Марина Багич (FER) , Лука Брокка (CNR) и Мартин Херольд (GFZ) Технология искусственного интеллекта (ИИ), с запуском ChatGPT (самого быстрорастущего приложения за всю историю) и подобных OpenAI, сейчас стала ажиотажем: новый технологический скачок человечества, но потенциально это ящик Пандоры для манипулирования информацией и ее неправильного использования. Вскоре ИИ может заменить тысячи рабочих мест и..

Резюме специализации Machine Learning Engineering for Production (MLOPs) Эндрю Нг, часть 2
Эта статья представляет собой краткое изложение курса Специализация инженера по машинному обучению для производства (MLOPs) . Этот курс посвящен развертыванию моделей машинного обучения. Этот курс можно записать на Coursera по этой ссылке (бесплатная пробная версия с полным доступом на 7 дней). Все видео первого курса этого курса вы можете посмотреть бесплатно по этой ссылке . Эта статья является частью 2, Вы можете прочитать часть 1 здесь Курс состоит из 3 тем (3 недели)..

Стратегии декодирования в языковом моделировании
Языковые модели могут рассчитать вероятность того, что любое заданное слово в их словаре будет стоять после входной последовательности. Но как они выбирают, какой из них на самом деле выводить? На высоком уровне современные языковые модели работают так: вы вводите последовательность слов, затем «сеть кодировщика» обрабатывает их одно за другим. Выход этой сети кодировщика затем передается в «сеть декодера», которая выводит последовательность слов. На каждом этапе сеть декодера может..

Количественная оценка влияния пропущенных значений на точность модели в контролируемых моделях машинного обучения
Описание проблемы Наблюдения с пропущенными значениями не могут использоваться многими методами контролируемого машинного обучения, такими как методы регрессии или методы нейронных сетей. Деревья решений могут обрабатывать отсутствующие значения во входных данных, поскольку они рассматривают их как отдельную категорию в данных и назначают их одной из ветвей. Перед аналитиком стоит задача решить, следует ли пропустить определенную запись для анализа или заменить отсутствующее значение..

Создание дорожной карты машинного обучения в 2023 году
Создание дорожной карты машинного обучения в 2023 году Машинное обучение (ML) — одна из самых интересных и быстро развивающихся областей современных технологий. С таким количеством новых разработок, происходящих постоянно, может быть ошеломляющим, пытаясь не отставать и придумывать, как продвигать свои собственные навыки машинного обучения и карьеру. В этом посте я изложу дорожную карту, которая поможет вам сориентироваться в ключевых областях для наращивания машинного обучения в 2023..

Функции активации: другие ReLU  — «Глубокое погружение»{Часть-1}
В нашей предыдущей статье, ' Функции активации: ReLU vs. Leaky ReLU ,' мы рассмотрели, что была функция активации, что такое ReLU и как два его основных варианта реализации должны были повлиять на работу нейронных сетей. Теперь давайте рассмотрим ДВА других типа ReLU — параметрический ReLU и экспоненциальную линейную единицу. Эти реализации ReLU в основном не обсуждаются и не преподаются в классах, поэтому я надеюсь, что эта статья будет информативной и проницательной. Давайте..