Аутентификация MediaWiki в Python с помощью файлов cookie

Каким будет самый простой способ использовать файлы cookie MediaWiki в некоторых скриптах Python CGI (в том же домене, вне офиса) для аутентификации (включая, в частности, OpenID MW)?

Также возможен доступ из Python к базе данных MediaWiki.


person HoverHell    schedule 04.09.2010    source источник
comment
Проверьте это: stackoverflow.com/questions/2170990/   -  person Dale Reidy    schedule 14.01.2011
comment
Спасибо, это весьма актуально.   -  person HoverHell    schedule 17.01.2011
comment
Какую проблему вы хотите решить с помощью вашего скрипта?   -  person phobie    schedule 26.09.2012


Ответы (2)


Очень простой способ использования файлов cookie с медиавики заключается в следующем:

from cookielib import CookieJar
import urllib2
import urllib
import json

cj = CookieJar()
opener = urllib2.build_opener(urllib2.HTTPCookieProcessor(cj))

Теперь запросы можно делать с помощью opener. Например:

login_data = {
'action': 'login',
'lgname': 'Example',
'lgpassword': 'Foobar',
'format': 'json'
}
data = urllib.urlencode(login_data)
request = opener.open('http://en.wikipedia.org/w/api.php',data)
content = json.load(request)
login_data['token'] = content['login']['token']
data_2 = urllib.urlencode(login_data)
request_2 = opener.open('http://en.wikipedia.org/w/api.php',data_2)
content_2 = json.load(request_2)
print content_2['login']['result']

В приведенном выше примере, если Cookiejar не был создан, вход в систему не работал бы полностью, запрашивая другой токен. Однако рекомендуется использовать уже созданную оболочку медиавики, такую ​​как pywikipedia, mwhair, pytybot, simplemediawiki или wikitools, а также сотни других оболочек медиавики на Python.

person Hairr    schedule 31.12.2012

Вы можете подключиться и изменить базу данных SQL без HTTP и файлов cookie, используя модуль MySQLdb, но часто это неправильное решение для обслуживания MediaWiki. Хотя доступ только для чтения не должен быть проблемой.

Лучший способ получить доступ к MediaWiki с помощью сценария — использовать api.php.

Наиболее известным ботом MediaWiki-API на основе Python является Pywikibot (бывший Pywikipediabot).

Самый простой способ сохранить файлы cookie в Python — использовать http.cookiejar модуль. Его документация содержит несколько простых примеров.

Я извлек код функционального примера из моего собственного MediaWiki-бота:

#!/usr/bin/python3

import http.cookiejar
import urllib.request
import urllib.parse
import json

s_login_name = 'example'
s_login_password = 'secret'

s_api_url = 'http://en.wikipedia.org/w/api.php'
s_user_agent = 'StackOverflowExample/0.0.1.2012.09.26.1'

def api_request(d_post_params):
    d_post_params['format'] = 'json'
    r_post_params = urllib.parse.urlencode(d_post_params).encode('utf-8')
    o_url_request = urllib.request.Request(s_api_url, r_post_params)
    o_url_request.add_header('User-Agent', s_user_agent)
    o_http_response = o_url_opener.open(o_url_request)
    s_reply = o_http_response.read().decode('utf-8')
    d_reply = json.loads(s_reply)
    return (o_http_response.code, d_reply)

o_cookie_jar = http.cookiejar.CookieJar()
o_http_cookie_processor = urllib.request.HTTPCookieProcessor(o_cookie_jar)
o_url_opener = urllib.request.build_opener(o_http_cookie_processor)

d_post_params = {'action': 'login', 'lgname': s_login_name}
i_code, d_reply = api_request(d_post_params)
print('http code: %d' % (i_code))
print('api reply: %s' % (d_reply))

s_login_token = d_reply['login']['token']

d_post_params = {
    'action': 'login',
    'lgname': s_login_name,
    'lgpassword': s_login_password,
    'lgtoken':s_login_token
}
i_code, d_reply = api_request(d_post_params)
print('http code: %d' % (i_code))
print('api reply: %s' % (d_reply))

Классы, обработка ошибок и подфункции были удалены для повышения удобочитаемости.

Файлы cookie, сохраненные в o_url_opener, также можно использовать для запросов к index.php.

Вы также можете войти через index.php (поддельный запрос браузера), но это будет включать синтаксический анализ вывода HTML.


Легенда имени переменной:

# Unicode string
s_* = 'a'
# Bytes (raw string)
r_* = b'a'
# Dictionary
d_* = {'a':1}
# Integer number
i_* = 4711
# Other objects
o_* = SomeClass()
person phobie    schedule 26.09.2012