Публикации по теме 'data'


Написание программного обеспечения для интеграции данных с помощью Conduit REST API
Сегодня у разработчиков программного обеспечения есть множество инструментов для перемещения данных из одного места в другое. Conduit , наш инструмент интеграции данных OSS, написанный на Go, включает в себя API, который разработчики могут использовать для программного построения конвейеров. Поскольку Conduit поставляется в виде крошечного двоичного файла, он функционирует как мощный инструмент, позволяющий эффективно перемещать данные из одного места в другое. Сегодня Conduit..

Диагностика упрямой посредственности западных бульдогов
Использование данных, чтобы понять, почему поддерживаемая мной команда Австралийской футбольной лиги постоянно слабеет, и извлечь соответствующие уроки Примечание. Эта статья отражает мою собственную работу и подход/убеждения/мысли, а не те, что были у нынешних или предыдущих работодателей. Я использую общедоступные наборы данных, чтобы постоянно оттачивать свои навыки анализа данных и обобщения полученных результатов в краткие и эффективные сообщения. В поисках новой темы мне..

Понимание кластеризации графов
Что такое кластеризация графов? Процесс кластеризации графов включает в себя организацию данных в виде графиков. Кластеризация графов включает два разных метода. Первый метод, называемый кластеризацией вершин , включает кластеризацию узлов графа в группы плотно связанных областей на основе весов ребер или расстояний между ними. Во втором методе кластеризации графов графы рассматриваются как объекты, подлежащие кластеризации, и группируются эти объекты на основе сходства...

Чтение об искусственном интеллекте: № 7
200 языков в рамках одной модели ИИ: прорыв в области высококачественного машинного перевода NO language Left Behind (NLLB) — это первый в своем роде прорывной проект искусственного интеллекта, который представляет собой модели с открытым исходным кодом, способные обеспечить высококачественный перевод напрямую между любой парой из 200+ языков — включая малоресурсные языки, такие как астурийский, луганда, урду и другие. Он призван помочь людям общаться с кем угодно и где угодно,..

Топ-5 модных словечек о данных, которые чаще всего используются не по назначению
«Я буду честен. Когда несколько лет назад пришел мой технический директор и начал говорить об «озере данных», я подумал, что он шутит». Это Джефф, руководитель высшего звена, который недавно связался с нами, чтобы поговорить о некоторых проблемах, связанных с тем, чтобы оставаться в курсе последних технологических разработок для бизнеса. «Я имею в виду, что сначала мы сохраняем все в облаке , а теперь у нас есть озера данных ? Что дальше — поля файла ? Ураганы данных ?»..

Эволюционная инфраструктура данных
От монолита к платформе самообслуживания Все системы начинаются как небольшой монолит. В начале, когда ресурсов и рабочей силы недостаточно, монолит — это выбор, который мы должны сделать, даже инфраструктура данных не является исключением. Но по мере роста требований появляется все больше и больше сценариев, которые невозможно реализовать с помощью текущей архитектуры, и поэтому система должна развиваться. Каждый раз, когда система развивается, она решает возникающие проблемы,..

Исследовательские работы для чтения на Doc2vec (обработка естественного языка)
Прогнозирование ошибок с использованием встраивания исходного кода на основе Doc2Vec( arXiv ) Автор: Тамаш Аладич , Юдит Яс , Рудольф Ференц Аннотация . Прогнозирование ошибок — это ресурсоемкая задача, которую трудно автоматизировать с помощью статического анализа исходного кода. Во многих областях информатики машинное обучение оказалось чрезвычайно полезным в таких задачах, однако, чтобы оно работало, нам нужен способ использовать исходный код в качестве входных..