Webscrape Google Movies с Goutte/Guzzle: проблема с регионом

Я создал простой веб-скрейпер с Goutte, чтобы получить время показа фильмов для какого-то приложения. Я использую этот король URL-адресов, например: http://www.google.fr/movies?view=list&date=3&tid=4f451a87a71bfa51.

Код не работает на моем производственном сервере, и я, наконец, заметил, что Google Movies не будет отображать результаты в зависимости от местоположения запрашивающего. Театр находится во Франции, и он, очевидно, работает из этой страны и из Германии, насколько я могу судить, но не из Нидерландов, где находится мой производственный сервер.

Кто-нибудь сталкивался с такой проблемой? Я думаю, что мог бы решить эту проблему с помощью прокси, но это кажется немного сложным (я должен настроить новый сервер во Франции только для этой цели?); может быть, есть способ настроить HTTP-запрос к Google Movies?

Заранее спасибо.


person Philippe    schedule 20.08.2015    source источник


Ответы (1)


Окей, я нашел. Хитрость заключается в том, чтобы добавить параметр «near» в строку запроса с названием страны или региона. Кажется, что "tid" недостаточно, чтобы идентифицировать театр.

Надеюсь, это поможет кому-то.

person Philippe    schedule 26.08.2015
comment
Я тоже застрял в похожей ситуации. Не могли бы вы объяснить свой метод в деталях? - person hassanrazadev; 12.11.2019
comment
Ммм, это старый, и с тех пор, как Google Movies исчез, но я думаю, что хитрость заключалась в том, чтобы просто добавить ?near=france (в моем случае) в строку запроса, чтобы дать подсказку о местоположении — поскольку служба обычно использует браузер / IP-адрес для этого. - person Philippe; 15.11.2019
comment
На самом деле я создаю сайт сравнения цен, который собирает данные с разных сайтов и отображает их на одной странице. Единственная проблема, с которой я столкнулся, это разница в цене доставки, потому что сервер находится в Болгарии, а результаты соответствуют Болгарии. - person hassanrazadev; 15.11.2019
comment
Но я хочу показать цену доставки в зависимости от местоположения пользователя. Вот сайт, над которым я работаю: hardwareguru.net - person hassanrazadev; 15.11.2019