Публикации по теме 'data'


5 полезных советов и приемов, которые вы захотите знать при использовании Python
Классные приемы, которые стоит знать при программировании на Python. В этом коротком сообщении в блоге я поделюсь пятью крутыми приемами, которые я считаю полезными или о которых стоит знать при программировании с использованием Python. Приступая к работе, мы рассмотрим несколько простых преобразований ASCII. Давайте приступим к этим трюкам. ASCII преобразования Output: A s c i i Слияние словарей Output: {'A': 1, 'B': 2, 'C': 3, 'X': 10, 'Y': 20, 'Z': 30} Удаление..

Очистка текста никогда не была такой простой: просто используйте одну строку кода Python!
Узнайте, как очистить любой текст с помощью всего одной строки кода Python. В этом уроке мы узнаем, как очистить любой текст с помощью python одной строки кода. Мы также увидим, как использовать чистый текст для удаления знаков препинания, специальных символов и лишних пробелов из текста.

Пасти стадо с MotherDuck: ваше следующее хранилище данных? — Сэм Дебрюйн
DuckDB чем-то напоминает распространенный подход к озеру, который вы видите повсюду, и может служить вычислительным механизмом на ваших платформах данных, где облачное хранилище используется для хранения, как обычно. Он может взаимодействовать с популярными инструментами, такими как dbt и Pandas. Вы можете обернуть выполнение своих преобразований DuckDB с помощью инструментов оркестровки, таких как Airflow, Prefect или Dagster, или вы можете просто запустить несколько AWS Lambdas / Azure..

Можете ли вы применить машинное обучение для очистки данных?
Машинное обучение  – это одно из самых популярных словечек или, если хотите, фраз, которые в настоящее время циркулируют. Короче говоря, это разновидность ИИ. Здесь необходимо сделать важное различие. Общепризнано, что у Искусственного интеллекта есть две стороны — Обобщенный ИИ и Прикладной ИИ . Обобщенный ИИ и прикладной ИИ В то время как прикладной ИИ включает в себя технологии, лежащие в основе беспилотных автомобилей и торговых программ, машинное обучение относится..

Глубокое погружение в Trie: маэстро поиска слов
В огромной вселенной структур данных некоторые из них ярко сияют благодаря своей уникальности, эффективности и применимости. Одним из таких выдающихся объектов является структура данных Trie — дерево, которое специализируется на хранении и поиске строк. Его великолепие заключается в том, как он обрабатывает строки с общими префиксами, обеспечивая эффективный поиск. Представьте себе, что вы можете найти каждое слово английского языка, начинающееся с «анти», за миллисекунды. Это магия..

Четыре эпохи аналитики и науки о данных
Профессор Томас Дэвенпорт из Колледжа Бэбсона, Гарвардской школы бизнеса и Школы менеджмента Слоуна Массачусетского технологического института выступил с основным докладом об истории анализа данных на Open Data Science Conference East 2017 в Бостоне под названием Четыре эры аналитики и науки о данных . Выступление профессора Давенпорта охватило весь диапазон аналитики данных с точки зрения бизнеса, начиная с 1970-х годов и до наших дней, разбив эту практику на четыре основные..

Данные OSEMN
В сообщении 2010 года под названием «Таксономия науки о данных » в блоге dataists Хилари Мейсон и Крис Виггинс представили структуру OSEMN. В основном это включало категоризацию общего рабочего процесса, который обычно выполняют специалисты по данным. Это список задач, над которыми ученый данных должен быть знаком и чувствовать себя комфортно. В этом посте я расскажу о структуре науки о данных, проведя вас через каждый этап жизненного цикла проекта, а также обсудив ключевые навыки..