Мое Портфолио
Мои статьи в Medium, связанные с наукой о данных - давайте вместе изучать идеи и делиться ими
Medium - хорошая платформа, на которой мы можем делиться своими идеями, опытом или мнениями.
Получайте ежемесячные статьи об аналитике данных для развития своей карьеры или проведения исследований!
Новые статьи 🆕
- Как найти файловую систему с помощью поиска в ширину и поиска в глубину (15 ноября 2021 г.)
- Как имитировать данные о ценах на акции и криптовалюту с помощью моделирования Монте-Карло (01 ноября 2021 г.)
- Почему центроиды начального кластера в k-средних влияют на сгенерированный окончательный кластер? (4 октября 2021 г.)
Скоро в продаже 🔜
- [Анализ изображений] Экстрактор фиксированных функций как метод обучения передачи для классификации изображений с помощью MobileNet
- [Теория графов] Как найти диаметр графа с помощью SNAP (Стэнфордский проект сетевого анализа)
Пояснительный анализ данных и визуализация данных
- Визуализация данных с помощью листовок с использованием R: Учебное пособие для новичков (26 сентября 2020 г.)
- Введение в визуализацию данных Twitter с использованием ggplot2 для начинающих (3 октября 2020 г.)
- Введение в Plotnine как альтернативу пакету визуализации данных на Python (22 ноября 2020 г.)
- Создание визуализации научных данных с нуля, используя Plotnine в Python (30 ноября 2020 г.)
Статистическая теория и моделирование
- Моделирование модели линейной регрессии с автокоррелированными ошибками (Des 19, 2020)
- Оптимальный порог несбалансированной классификации (02.01.2021) ⭐
- Каппа Коэна и каппа Флейса - как измерить согласие между оценщиками (10 июля 2021 г.)
- Как получилось, что двоичный поиск стал самым быстрым поисковым алгоритмом (3 августа 2021 г.)
- Статистическое моделирование центральной предельной теоремы и закона больших чисел (01 сентября 2021 г.)
Статистический анализ
- Введение в анализ соответствий с использованием реального набора данных R и Индонезии (30 сентября 2020 г.)
- Введение в двухкомпонентный анализ: анализ данных на основе данных о бедности в Индонезии (2 февраля 2021 г.)
- Факторный анализ для построения составного индекса (19 июня 2021 г.)
Обучение с учителем (классификация и регрессия)
- Прогрессивная оптимизация - метод перекрестной проверки для данных временных рядов (15 сентября 2021 г.)
Обучение без учителя (кластеризация)
- K-прототип как алгоритм кластеризации для смешанных типов данных (категориальных и числовых) (18 января 2021 г.) ⭐
- Начало работы с сегментацией клиентов с использованием модели RFM (13 мая 2021 г.)
- K-режимы как алгоритм кластеризации для категориальных типов данных (22 июня 2021 г.) ⭐
- Почему центроиды начального кластера в k-средних влияют на сгенерированный окончательный кластер? (4 октября 2021 г.)
Инженерия данных
- Введение в Apache Airflow как организацию работы: краткое руководство для начинающих (23 сентября 2020 г.)
- Подключиться к серверу базы данных PostgreSQL с помощью модуля Python psycopg2 (30 октября 2020 г.) ⭐
- Начало работы с Selenium WebDriver для парсинга веб-страниц с использованием Python (9 ноября 2020 г.)
- Начало работы с Cron Job на сервере Linux: полное руководство для начинающих (11 ноября 2020 г.) ⭐
- Профилирование среды выполнения Python с использованием SnakeViz - Как проверить выполнение кодов (3 июля 2021 г.)
- API для идентификации номера индонезийской идентификационной карты с помощью Flask (15 июля 2021 г.)
Обработка естественного языка
- Подробное руководство по сбору и предварительной обработке данных Twitter с использованием R (10 октября 2020 г.)
- Оптимизация сопоставления нечетких строк с использованием TF-IDF и KNN (14 февраля 2021 г.) ⭐
Финансовый анализ
- Реализация вогнутой функции для интерполяции данных о запасах с использованием Python (5 октября 2020 г.)
- Как смоделировать данные о ценах на акции и криптовалюту с помощью моделирования Монте-Карло (01 ноября 2021 г.) 🆕
Анализ изображений
- Как Instagram добавляет Центры коронавируса по контролю и профилактике заболеваний, ссылки на сообщения или истории, упоминающие вирус (22 июля 2021 г.)
- Экстрактор фиксированных функций как метод обучения передачи для классификации изображений с помощью MobileNet 🔜
Открытые источники
- Начало работы с Git и GitHub: полное руководство для начинающих (18 октября 2020 г.)
- Создайте впечатляющий профиль README на GitHub и добавьте в него свой RSS-канал с помощью GitHub Action (05 декабря 2020 г.)
Теория графов
- Как создать представление данных в социальных сетях для чатов WhatsApp (26 июня 2021 г.)
- Теория графов для опечаток в корректоре клавиатуры с использованием Python - как она улучшает алгоритм сопоставления строк (29 июля 2021 г.)
- Как эффективно найти файловую систему с помощью поиска в ширину и поиска в глубину (15 ноября 2021 г.) 🆕
- Как найти диаметр графа с помощью SNAP (Стэнфордский проект сетевого анализа) 🔜
Давай подключимся
В настоящее время я специалист по данным и автор контента в области науки о данных, технологий и аналитики, и мне нравится учиться и делиться новыми идеями, опытом и мнениями о данных, аналитике и технологиях. Следуйте за мной в социальных сетях для получения дополнительной информации.