Введение
Мне за сорок, и для моего возраста вы можете вспомнить видеокассеты и те знаменитые пункты проката в конце 80-х.
Это было приятное место, и вы могли найти поддержку от мягкого человека, чтобы выбрать фильм для просмотра в зависимости от вашего настроения.
В настоящее время, когда вы одни дома и хотите посмотреть один из популярных фильмов последних лет, что вы можете сделать?
У вас есть несколько возможностей, но давайте рассмотрим некоторые из них.
Сначала попробуй, позвони другу, правда приятно с кем-то поговорить, нет? Но, к сожалению, ваши друзья недоступны.
Тогда наверняка все, что мы ищем, находится на …. интернет, Google, ImDb… почему бы не поискать на IMDb и не попробовать выбрать правильный.
Эта база данных настолько огромна, что все выглядит великолепно, а затем очень сложно выбрать правильный.
Тогда я мечтаю о другом решении. Почему бы не иметь дома веб-инструмент, объединяющий набор данных IMDb, науку о данных, интеллектуальный анализ данных для изучения и анализа всех этих данных?
Мы могли бы ввести наши собственные предпочтения, и инструмент мог бы изучить сделанный нами выбор, чтобы предложить что-то и уведомить вас в другой день.
В базе данных фильмов в Интернете хранится 5000 фильмов со многими функциями, связанными с каждым фильмом, например:
«имя директора,
информация о социальных данных, например, количество отметок "Нравится" в Facebook или направление отметок "Нравится" в Facebook, актеры, отметившие "Нравится" в Facebook
длительность, пол
имя главного и второстепенного актеров
оценка imdb,
бюджет, брутто”
Попробуем помечтать.
Как соотносятся лайки в Facebook и популярность фильмов?
После изучения данных и очистки базы данных 4658 фильмов остаются доступными со всеми функциями, которые вы только могли себе представить, а некоторые описаны здесь ранее.
Наш инструмент может глубже изучить данные, проанализировать их, а затем показать вам такой график. Но, честно говоря, это не могло помочь. Пусть наука о данных сделает его работу.
Благодаря методу Пирсона инструмент может легко сопоставить функцию и выделить положительную корреляцию между лайками актеров на Facebook и популярностью фильма.
Инструмент может группировать фильмы на основе атрибутов, которые показывают социальное влияние, таких как количество отметок «Нравится» на Facebook, количество пользователей, получивших отзывы, количество критиков за отзывы и количество проголосовавших пользователей.
Кластер фильмов с наибольшим количеством лайков в Facebook также имеет высокий средний показатель лайков актеров в Facebook. Можно предположить, что в высокой степени, чтобы фильм понравился зрителям, сначала должны понравиться актеры, а затем режиссер.
Все эти графики здесь, чтобы подчеркнуть этот пост, тем не менее, то, что люди хотят, и то, что вы хотите, — это предложение фильма. Итак, давайте отсортируем фильмы по количеству лайков в Facebook и попадем в топ-10.
Итак, мы здесь. Кажется, «Начало» — это то, что стоит посмотреть сегодня вечером. И если вам нравятся такие жанры, как боевик, приключение, научная фантастика или триллер, вы более чем счастливы.
А как насчет рейтинга контента и жанров 200 лучших фильмов, получивших наибольшее количество лайков в Facebook?
Мы можем изучить IMDb и признать тот факт, что наиболее ценимым жанром являются приключения и драма среди 200 фильмов с наибольшим количеством лайков в Facebook, и 49% этих фильмов имеют пометку pg-13 (Родительский контроль — некоторые материалы могут быть неподходящими для детей младше 13).
У них есть такие ключевые слова, как будущее/отношения/битва/женщина/наркотики/война и т. д.
Wordcloud с названием самых популярных фильмов
Метод машинного обучения для проверки важности функции, связанной с оценкой imdb
Используя метод машинного обучения, такой как регрессия с повышением градиента, мы можем наблюдать, что лайки фильма на Facebook — это атрибут, который имеет наибольшее значение при определении оценки imdb. Удивительно, но название года, то есть год выхода фильма, также является важным фактором.
Вывод
В этой статье мы обсудили веб-инструмент, который вы можете использовать дома, чтобы определить, какой фильм смотреть, на основе базы данных фильмов в Интернете. Изучив эту базу данных с 5000 фильмов, мы продемонстрировали, что некоторые методы машинного обучения могут быть действительно полезными, чтобы дать некоторое представление.
Мы могли бы разработать этот инструмент? ВЫ заинтересованы? Дай мне знать !