Очистите веб-сайт (веб-сайт javascript) с помощью php

Я пытаюсь очистить веб-сайт (думаю, это на JavaScript), используя простой PHP-скрипт. Я новичок, поэтому любая помощь будет принята с благодарностью. URL-адрес веб-страницы:

http://www.indiainfoline.com/Markets/Company/Fundamentals/Balance-Sheet/Yes-Bank-Ltd/532648

Так вот, например, я хотел бы передать название компании (Yes-Bank-Ltd) и код (532648) в get_file_contents. Не уверен, как это сделать, может кто-нибудь, пожалуйста, помогите.

Спасибо, Нидхи.


person user839403    schedule 11.07.2011    source источник
comment
Лом, как в переработке? Полагаю, вы можете попробовать unlink.   -  person Kerrek SB    schedule 11.07.2011
comment
что вы имеете в виду под "пройти", как я вижу, они уже в URL-адресе   -  person Senad Meškin    schedule 11.07.2011
comment
@Kerrek SB, он имел в виду «царапать».   -  person Nightfirecat    schedule 11.07.2011
comment
@Nightfirecat: Ааа, это имеет гораздо больше смысла! Хотя мне бы понравилась идея свалки веб-сайтов с кучей старых запросов и умирающими анимированными GIF-файлами...   -  person Kerrek SB    schedule 11.07.2011


Ответы (3)


Почему бы вам просто не добавить строку компании и код в URL-адрес. Вот идея, что вы заполняете массив компании и кода (должны быть одного размера), а затем зацикливаете их, чтобы очистить данные, которые вы хотите.

for($i=0;$i<count($listOfCie);$i++)
{
    $cie = $listOfCie[$i];
    $code = $listOfCode[$i];
    $urlToScrape = "http://www.indiainfoline.com/Markets/Company/Fundamentals/Balance-Sheet/" . $cie . "/" . $code
    //... = get_file_contents($urlToScrape....
 }
person Patrick Desjardins    schedule 11.07.2011
comment
Хорошо, кажется, это хорошая идея. Однако, когда я пытаюсь использовать синтаксис hte, который вы привели здесь, возникает проблема. Не могли бы вы проверить, нужны ли вам две кавычки в первой переменной и никаких кавычек после второй. - person user839403; 11.07.2011
comment
Вы разработчик? Проверка котировок должна быть вашей работой. Это просто псевдокод, чтобы показать вам, как решить вашу проблему. - person Patrick Desjardins; 11.07.2011
comment
нет, я не разработчик, отсюда и проблема... извините за беспокойство - person user839403; 11.07.2011
comment
Stackoverflow — это не место, где можно получить код, созданный для вашего проекта, а место, где можно задать вопрос. Извините, я не могу дать вам больше, я оцениваю свой ответ как хорошее начало. Вы должны получить учебник по PHP и вернуться сюда, потому что конкатенация строк является базовой вещью. - person Patrick Desjardins; 11.07.2011
comment
Хорошо, я понял это. Я использовал команду внутри одинарной кавычки, а не двойной кавычки. Теперь это работает. Кстати, вы знаете, как я могу запустить javascript на странице, которую я удаляю. В этом случае мне нужны консолидированные результаты и, следовательно, javasript:_doPostBack() - person user839403; 12.07.2011

Используйте таблицу data.html в YQL! http://developer.yahoo.com/yql/console

person Tilo Mitra    schedule 11.07.2011
comment
извините, я не нахожу Yahoo! сайт, полезный для индийских компаний - person user839403; 11.07.2011

Самый простой способ очистить сайт на PHP — использовать curl (http://php.net/manual/en/book.curl.php)

Некоторые примеры см. на http://php.net/manual/en/curl.examples-basic.php или Google :)

Если веб-сайт использует javascript, получить нужные данные будет сложно. Вы можете посмотреть на «безголовый браузер», например http://phantomjs.org/.

person TimoSolo    schedule 17.01.2018