Большие данные и искусственный интеллект настолько актуальны, что будет полезно начать с краткого обзора того, как начинается этот путь и как он развивается вместе. Большие данные можно объяснить с помощью 3V, а именно скорости, объема и разнообразия. Сегодня появилось много различных решений связанных проблем, таких как необходимость обработки больших и разнообразных данных в режиме реального времени. Когда программное обеспечение чат-ботов объединится с роботизированными приложениями, мы приблизимся к миру мечты футуристов.

Искусственный интеллект имеет множество различных областей реализации. Некоторые из них - это аналитические решения, промышленные решения, транспорт, авиация и космические исследования, финансы, здравоохранение, сфера услуг и сельское хозяйство.

Мы начинаем путь к искусственному интеллекту, а также к большим данным и кибербезопасности.

Я планирую совершить наш путь из 10 основных названий.

  1. Основы

Мы займемся такими вопросами, как матрица, линейная алгебра, теория CAP, сегментирование, NoSQL.

2. Статистика

Под этим заголовком будут изучаться теория вероятностей, функции плотности вероятностей, теорема Байеса, случайные величины.

3. Программирование

С R, Python, Scala, Java; матричные операции, оперативное чтение данных и выполнение манипуляций с данными будут нашими некоторыми темами.

4. Машинное обучение

Искусственные нейронные сети, деревья решений, анализ настроений, машины опорных векторов будут нашими некоторыми темами.

5. Естественный язык, интеллектуальный анализ текста

Под этим заголовком будут представлены такие темы, как частота слов, рыночный анализ, извлечение признаков.

6.Визуализация

Когда мы достигли уровня, на котором мы можем выполнять операции с данными, нам понадобятся инструменты визуализации, чтобы увидеть результаты. Полезно рассмотреть эту тему под отдельным заголовком. D3.js, Исследование данных в R некоторые из них.

7. Большие данные

Под этим заголовком будет рассмотрено экосистема Hadoop (HDFS, MapReduce, Sqoop, Flume, Hive, Pig, Manhout). HortonWorks и Cloudera также попадут под эту рубрику.

8. Получение и изменение данных

Также мы сосредоточимся на вопросах интеграции данных в систему. Архитектурный дизайн будет выполнен путем сравнения пакетной обработки или потоковой обработки.

9.Кибербезопасность

После создания отказоустойчивой системы с искусственным интеллектом она будет соответствовать системам безопасности, которые могут выполнять обнаружение аномалий. Apache Mentor и Apache Spot - первые проекты, которые приходят на ум…

10.Toolbox

Иногда мы просто расширяем границы программного обеспечения, которое будет использоваться в проектах, и пытаемся увидеть, что мы можем сделать. Иногда у нас будут наши комментарии и примеры о книге (инструменты искусственного интеллекта, такие как H2O, Mahout, MLib, TensorFlow, SAMOA) или инструменты для работы с общими данными, такие как Nutch, NLTK, Rattle ... например, эти книги



http://www.dataonfocus.com/21-free-data-mining-books





10 различных основных заголовков следует рассматривать отдельно друг от друга. Мы можем открывать сотни субтитров под каждым основным заголовком, с преобладанием общей картины. Тема мероприятия иногда включает несколько названий вместе. Начнем наше счастливое путешествие…