Публикации по теме 'data-science'
5 проектов Python для увеличения вашего портфолио в 2023 году
Python — популярный язык программирования, который широко используется в науке о данных, машинном обучении и веб-разработке. Если вы хотите улучшить свое портфолио и выделиться на рынке труда в 2023 году, добавление нескольких проектов Python в ваше резюме может стать отличным способом продемонстрировать свои навыки и опыт. В этом сообщении блога мы рассмотрим пять проектов Python, которые помогут вам расширить свое портфолио в следующем году.
Проект визуализации данных:..
Аналитика данных — «Куда она движется?
Понимание текущего состояния аналитики данных с точки зрения специалиста по данным
Много лет назад, когда отделилась область аналитики данных, в основном это был статистический анализ данных по небольшим наборам данных. Раньше мы говорили всего о нескольких тысячах точек данных в этих наборах данных. Сегодня наборы данных исчисляются терабайтами. Сегодня специалистам по данным приходится обрабатывать не только такие большие наборы данных, которые являются статическими, но и иметь..
Варианты использования иерархической сегментации часть 3 (алгоритмы)
MaskGroup: иерархическая группировка точек и маскирование для сегментации 3D-экземпляров (arXiv)
Автор: Минь Чжун , Синхао Чен , Сяокан Чен , Ган Цзэн , Юньхэ Ван .
Аннотация: В этой статье исследуется проблема сегментации 3D-экземпляров, которая имеет множество реальных приложений, таких как робототехника и дополненная реальность. Поскольку окружение 3D-объектов имеет высокую сложность, разделение разных объектов очень затруднено. Чтобы решить эту сложную проблему, мы предлагаем..
Очистка таблицы Википедии с помощью R
Введение в парсинг веб-страниц:
Мы знаем, что Интернет содержит всю информацию в виде веб-страниц, написанных в коде HTML . Таким образом, в Интернете содержится много данных, эти данные могут быть полезны для разных целей. Например, я хочу узнать подробности об iPhone 13 pro с разных уникальных веб-страниц, касающихся цены телефона, качества дисплея и общего обзора мобильного телефона. Я буду хранить эту собранную информацию в разных форматах файлов. Используя эти данные, я могу..
Работа с Softmax Loss, часть 3 (машинное обучение)
Атрибут Adaptive Margin Softmax Loss с использованием привилегированной информации (arXiv)
Автор: Сейед Мехди Иранманеш , Али Дабуэй , Насер М. Насрабади .
Аннотация: Мы представляем новую структуру для использования привилегированной информации для распознавания, которая предоставляется только на этапе обучения. Здесь мы сосредоточимся на задаче распознавания, где изображения предоставляются в качестве основного вида, а мягкие биометрические признаки (атрибуты) предоставляются в..
(1) Введение в ОПТИМИЗАЦИЯ
Понимание роли производных первого и второго порядка
Что такое оптимизация?
Оптимизация — это метод, используемый для улучшения системы (биологической, физической, инженерной) до ее оптимальной точки, что означает работу на уровне меньшего энергопотребления или меньшего количества ошибок, что оптимизирует набор показателей. Это…
Работа с синтетическими табличными данными, часть 2 (Data Centric AI)
ДАТГАН: Интеграция экспертных знаний в глубокое обучение синтетических табличных данных (arXiv)
Автор: Гаэль Ледеррей , Тим Хиллель , Мишель Бьерлер .
Аннотация: Синтетические данные могут использоваться в различных приложениях, таких как коррекция наборов данных смещения или замена дефицитных исходных данных в целях моделирования. Генеративно-состязательные сети (GAN) считаются современным средством разработки генеративных моделей. Однако эти модели глубокого обучения управляются..