Каков наилучший способ синтаксического анализа RSS / Atom-каналов с помощью Rails

Я разрабатываю приложение для чтения каналов в Rails. И я новичок в кормлении. У меня есть вопросы.

  1. Как лучше всего анализировать тысячи каналов RSS / Atom с помощью Rails или JavaScript / jQuery /?
  2. Есть ли способ получить только заголовок канала / не загружать весь канал /?
  3. Есть ли способ получить корм с лимитом?

Заранее спасибо!


person Zeck    schedule 08.09.2009    source источник


Ответы (3)


Я очень рекомендую feedzirra (правда, это настоящая жемчужина). В настоящее время я использую FeedZirra в производственной системе, которая постоянно импортирует тысячи каналов RSS и Atom. К тому же им очень легко пользоваться.

К другим вашим пунктам: нет и нет. Канал - это файл в Интернете, который необходимо полностью загрузить. Однако вы можете ограничить количество статей, которые вы читаете или импортируете в свою базу данных, в собственном коде.

Вам нужно проанализировать весь файл, но можно извлечь только заголовки из каждой статьи.

Опять же, feedzirra упрощает вам задачу.

http://github.com/pauldix/feedzirra/tree/master

person Ariejan    schedule 08.09.2009

Может быть, это вам поможет:

http://railscasts.com/episodes/168-feed-parsing

person BvuRVKyUVlViVIc7    schedule 08.09.2009
comment
Отливка рельсов очень проста. См. Мой комментарий к FeedZirra. Это быстро и работает очень хорошо. - person Ariejan; 08.09.2009

Лучший способ выполнить обработку фида - не делать этого и полагаться на сторонний API фида. Если вы хотите сделать это самостоятельно, вам придется обрабатывать и поддерживать автономный процесс и / или систему очередей для асинхронного извлечения и синтаксического анализа фида. Обычно это большой объем работы и небольшая ценность для вашего проекта. Для этого вам следует использовать API, например Google API или API фидов Superfeedr.

Мы создали Rails Engine для использования RSS через Superfeedr. Он позволяет вам подписываться, отказываться от подписки, извлекать прошлый контент из каналов и обрабатывать уведомления о новом контенте от вашего имени.

person Julien Genestoux    schedule 21.04.2015