Публикации по теме 'data'
Написание программного обеспечения для интеграции данных с помощью Conduit REST API
Сегодня у разработчиков программного обеспечения есть множество инструментов для перемещения данных из одного места в другое. Conduit , наш инструмент интеграции данных OSS, написанный на Go, включает в себя API, который разработчики могут использовать для программного построения конвейеров. Поскольку Conduit поставляется в виде крошечного двоичного файла, он функционирует как мощный инструмент, позволяющий эффективно перемещать данные из одного места в другое.
Сегодня Conduit..
Диагностика упрямой посредственности западных бульдогов
Использование данных, чтобы понять, почему поддерживаемая мной команда Австралийской футбольной лиги постоянно слабеет, и извлечь соответствующие уроки
Примечание. Эта статья отражает мою собственную работу и подход/убеждения/мысли, а не те, что были у нынешних или предыдущих работодателей.
Я использую общедоступные наборы данных, чтобы постоянно оттачивать свои навыки анализа данных и обобщения полученных результатов в краткие и эффективные сообщения. В поисках новой темы мне..
Понимание кластеризации графов
Что такое кластеризация графов?
Процесс кластеризации графов включает в себя организацию данных в виде графиков. Кластеризация графов включает два разных метода. Первый метод, называемый кластеризацией вершин , включает кластеризацию узлов графа в группы плотно связанных областей на основе весов ребер или расстояний между ними. Во втором методе кластеризации графов графы рассматриваются как объекты, подлежащие кластеризации, и группируются эти объекты на основе сходства...
Чтение об искусственном интеллекте: № 7
200 языков в рамках одной модели ИИ: прорыв в области высококачественного машинного перевода
NO language Left Behind (NLLB) — это первый в своем роде прорывной проект искусственного интеллекта, который представляет собой модели с открытым исходным кодом, способные обеспечить высококачественный перевод напрямую между любой парой из 200+ языков — включая малоресурсные языки, такие как астурийский, луганда, урду и другие. Он призван помочь людям общаться с кем угодно и где угодно,..
Топ-5 модных словечек о данных, которые чаще всего используются не по назначению
«Я буду честен. Когда несколько лет назад пришел мой технический директор и начал говорить об «озере данных», я подумал, что он шутит». Это Джефф, руководитель высшего звена, который недавно связался с нами, чтобы поговорить о некоторых проблемах, связанных с тем, чтобы оставаться в курсе последних технологических разработок для бизнеса. «Я имею в виду, что сначала мы сохраняем все в облаке , а теперь у нас есть озера данных ? Что дальше — поля файла ? Ураганы данных ?»..
Эволюционная инфраструктура данных
От монолита к платформе самообслуживания
Все системы начинаются как небольшой монолит. В начале, когда ресурсов и рабочей силы недостаточно, монолит — это выбор, который мы должны сделать, даже инфраструктура данных не является исключением.
Но по мере роста требований появляется все больше и больше сценариев, которые невозможно реализовать с помощью текущей архитектуры, и поэтому система должна развиваться. Каждый раз, когда система развивается, она решает возникающие проблемы,..
Исследовательские работы для чтения на Doc2vec (обработка естественного языка)
Прогнозирование ошибок с использованием встраивания исходного кода на основе Doc2Vec( arXiv )
Автор: Тамаш Аладич , Юдит Яс , Рудольф Ференц
Аннотация . Прогнозирование ошибок — это ресурсоемкая задача, которую трудно автоматизировать с помощью статического анализа исходного кода. Во многих областях информатики машинное обучение оказалось чрезвычайно полезным в таких задачах, однако, чтобы оно работало, нам нужен способ использовать исходный код в качестве входных..