В последнее время я просматривал рынок баз данных и просто наткнулся на тот факт, что я, по-видимому, немного ошибался в отношении termusDB и был прав в отношении важности открытого исходного кода.

Давайте посмотрим на всю историю…

Я Свен, я собираю Точки данных, чтобы помочь понять и сформировать будущее, основанное на данных, а не на электричестве.

Мысли Свенса

Если у вас есть всего 30 секунд свободного времени, вот что я считаю полезной информацией для инвесторов, руководителей данных и основателей компаний, занимающихся данными.

- Пять из шести новичков в пространстве graphDB делают ставку на открытый исходный код.

- Проблема «снежинки данных» — хороший повод серьезно заняться открытым исходным кодом в качестве варианта по умолчанию, если вы начинаете компанию по обработке данных.

- Инженеры машинного обучения становятся чем-то особенным, серьезно подумайте как о способах их поддержки, так и о способах их интеграции в вашу компанию.

– Если вы управляете продуктом в пространстве данных, внутреннем или внешнем, ознакомьтесь с каталогом вопросов WSFJ, чтобы точно настроить свои оценки ценности.

Новички в области баз данных графов

🔥Что: С конца 2018 года шесть новых компаний вошли в пространство графовой базы данных. Все они набрали обороты и выходят на рынок, на котором некоторое время доминировал Neo4j, а с 2017 года, вероятно, он поделен между Neo4j и Microsoft Cosmos DB.

🐰Моя точка зрения: ⅚ новичков работают с открытым исходным кодом, что меня удивляет. Я действительно считаю, что в данных открытый исходный код должен быть вашим режимом работы по умолчанию, но видеть это довольно удивительно.

Что также интересно, так это то, что база данных termusDB находится прямо там, хотя я осудил их (очевидно, неправильно) как мертвый проект с открытым исходным кодом в начале этого года.

Ресурсы:Рейтинг СУБД графовых баз данных.

Восхождение инженера машинного обучения

🎁 Что:Компания Arize.ai обсуждает рост роли инженера по машинному обучению. Интересно прочитать о ролях, которые все еще находятся в стадии формирования в пространстве машинного обучения/науки о данных.

🐰Моя точка зрения. Мне нравится, как в этой статье обсуждается роль разных людей в среде машинного обучения и, в частности, инженера машинного обучения, который занимается переходом от «Блокнот для анализа данных» в «действующую производственную систему» ​​как можно более плавно.

Но я не уверен, что рекомендация, которой они следуют, использовать три конкретных инструмента для разработки машинного обучения, правильна. Они рекомендуют хранилище функций, хранилище моделей и хранилище оценки.

Я бы предпочел, чтобы люди воспользовались преимуществами, которые уже принесла нам разработка программного обеспечения, и рассматривали данные как код, модели как код и просто повторно использовали инструменты, которые у нас уже есть. С этой точки зрения единственные инструменты, которые вам нужны, — это какое-то решение для управления версиями данных, все хорошие вещи, которые у вас уже есть, и немного воображения, чтобы, наконец, начать использовать то, что вы уже делаете в области машинного обучения.

Кстати. Я думаю, что эти продукты могли бы иметь место, я просто думаю, что они должны быть поверх обычного рабочего процесса, а не пытаться его заменить/разнообразить.

Ресурсы:Arize AI о подъеме инженера машинного обучения.

WSJF в Data PM

🔮Что. Метод «сначала самая короткая работа взвешивается» – не самый простой способ расставить приоритеты для гибких рабочих пакетов. Идея состоит в том, чтобы в первую очередь делать то, что приносит наибольшую ценность в единицу времени. Если что-то ценное и занимает неделю, что-то еще ценное и занимает две, вы сначала делаете первое. Это так просто.

Но это оставляет вопрос оценки стоимости. В методе WSJF есть список вопросов, которые мне очень нравятся, чтобы определить это значение.

🐰Моя точка зрения. Управление продуктом в пространстве данных, на мой взгляд, довольно сложно. Продукты сложны, конечными пользователями часто являются предприятия, так что уже много сложностей для начала. Вот почему мне нравится каталог вопросов, он делает оценку ценности как минимум систематической.

Первый вопрос: «Какова ценность этой вещи для пользователя?» где я обычно добавляю «поверх уже работающего варианта?». Поэтому, когда блоки данных купили и интегрировали Redash в платформу блоков данных, пользовательская ценность заключалась не в том, что «пользователи теперь могут анализировать и создавать информационные панели здесь…». Дело в том, что им не нужно было обращаться к своему внешнему инструменту и подключать его к блокам данных. Что, конечно же, сразу показывает, что ценность на самом деле намного меньше, потому что многие компании просто наслаждаются своим инструментом BI.

Второй вопрос: «Это срочно?», который я считаю особенно важным в сфере отчетности и анализа. Некоторым лицам, принимающим решения, необходимо принять решение сейчас из-за некоего крайнего срока, что просто делает задачу действительно важной. Но даже если это действительно важно, каждый принимающий решение может принять свое решение и без анализа. Итак, опять же, критичность по времени относительна.

Наконец, мы просим снизить риски и предоставить возможности; Например, добавление возможности размещения данных внутри ЕС снижает риск судебного преследования европейских компаний за нарушение GDPR.

Я думаю, что управление продуктами данных по-прежнему нуждается в большей строгости, и я думаю, что это хороший шаг в этом направлении.

Ресурсы: — Каталог WSFJ SAFE.

🎄 Спасибо!

Спасибо, что дочитали до этого места! Я также был бы рад, если бы вы поделились этим информационным бюллетенем с людьми, которым, по вашему мнению, он может быть интересен.

Данные будут питать каждую часть нашего существования в ближайшем будущем. Я собираю Точки данных, чтобы помочь понять и сформировать это будущее.

Если вы хотите поддержать это, поделитесь им в Twitter, LinkedIn или Facebook.

И, конечно же, оставляйте отзывы, если у вас есть твердое мнение о новостной рассылке! Так?

Это ужасно | Это довольно плохо | средний бюллетень… | хороший контент… | Обожаю, буду ждать!!!

P.S. Я делюсь важными, а не самыми последними новостями. Я делюсь книгами, исследовательскими работами и инструментами. Я пытаюсь дать простой способ понять все эти вещи. Я склонен быть самоуверенным. Вы всегда можете нажать кнопку отказа от подписки!