Как наука о данных может помочь вам решить, какой фильм о ведьмах посмотреть сегодня вечером?

Введение

Мне за сорок, и для моего возраста вы можете вспомнить видеокассеты и те знаменитые пункты проката в конце 80-х.

Это было приятное место, и вы могли найти поддержку от мягкого человека, чтобы выбрать фильм для просмотра в зависимости от вашего настроения.

В настоящее время, когда вы одни дома и хотите посмотреть один из популярных фильмов последних лет, что вы можете сделать?

У вас есть несколько возможностей, но давайте рассмотрим некоторые из них.

Сначала попробуй, позвони другу, правда приятно с кем-то поговорить, нет? Но, к сожалению, ваши друзья недоступны.

Тогда наверняка все, что мы ищем, находится на …. интернет, Google, ImDb… почему бы не поискать на IMDb и не попробовать выбрать правильный.

Эта база данных настолько огромна, что все выглядит великолепно, а затем очень сложно выбрать правильный.

Тогда я мечтаю о другом решении. Почему бы не иметь дома веб-инструмент, объединяющий набор данных IMDb, науку о данных, интеллектуальный анализ данных для изучения и анализа всех этих данных?

Мы могли бы ввести наши собственные предпочтения, и инструмент мог бы изучить сделанный нами выбор, чтобы предложить что-то и уведомить вас в другой день.

В базе данных фильмов в Интернете хранится 5000 фильмов со многими функциями, связанными с каждым фильмом, например:

«имя директора,

информация о социальных данных, например, количество отметок "Нравится" в Facebook или направление отметок "Нравится" в Facebook, актеры, отметившие "Нравится" в Facebook

длительность, пол

имя главного и второстепенного актеров

оценка imdb,

бюджет, брутто”

Попробуем помечтать.

Как соотносятся лайки в Facebook и популярность фильмов?

После изучения данных и очистки базы данных 4658 фильмов остаются доступными со всеми функциями, которые вы только могли себе представить, а некоторые описаны здесь ранее.

Наш инструмент может глубже изучить данные, проанализировать их, а затем показать вам такой график. Но, честно говоря, это не могло помочь. Пусть наука о данных сделает его работу.

Благодаря методу Пирсона инструмент может легко сопоставить функцию и выделить положительную корреляцию между лайками актеров на Facebook и популярностью фильма.

Инструмент может группировать фильмы на основе атрибутов, которые показывают социальное влияние, таких как количество отметок «Нравится» на Facebook, количество пользователей, получивших отзывы, количество критиков за отзывы и количество проголосовавших пользователей.

Кластер фильмов с наибольшим количеством лайков в Facebook также имеет высокий средний показатель лайков актеров в Facebook. Можно предположить, что в высокой степени, чтобы фильм понравился зрителям, сначала должны понравиться актеры, а затем режиссер.

Все эти графики здесь, чтобы подчеркнуть этот пост, тем не менее, то, что люди хотят, и то, что вы хотите, — это предложение фильма. Итак, давайте отсортируем фильмы по количеству лайков в Facebook и попадем в топ-10.

Итак, мы здесь. Кажется, «Начало» — это то, что стоит посмотреть сегодня вечером. И если вам нравятся такие жанры, как боевик, приключение, научная фантастика или триллер, вы более чем счастливы.

А как насчет рейтинга контента и жанров 200 лучших фильмов, получивших наибольшее количество лайков в Facebook?

Мы можем изучить IMDb и признать тот факт, что наиболее ценимым жанром являются приключения и драма среди 200 фильмов с наибольшим количеством лайков в Facebook, и 49% этих фильмов имеют пометку pg-13 (Родительский контроль — некоторые материалы могут быть неподходящими для детей младше 13).

У них есть такие ключевые слова, как будущее/отношения/битва/женщина/наркотики/война и т. д.

Wordcloud с названием самых популярных фильмов

Метод машинного обучения для проверки важности функции, связанной с оценкой imdb

Используя метод машинного обучения, такой как регрессия с повышением градиента, мы можем наблюдать, что лайки фильма на Facebook — это атрибут, который имеет наибольшее значение при определении оценки imdb. Удивительно, но название года, то есть год выхода фильма, также является важным фактором.

Вывод

В этой статье мы обсудили веб-инструмент, который вы можете использовать дома, чтобы определить, какой фильм смотреть, на основе базы данных фильмов в Интернете. Изучив эту базу данных с 5000 фильмов, мы продемонстрировали, что некоторые методы машинного обучения могут быть действительно полезными, чтобы дать некоторое представление.

Мы могли бы разработать этот инструмент? ВЫ заинтересованы? Дай мне знать !