Я пытаюсь проанализировать файл HTML для строк в этом формате:
<a href="/userinfo/userinfo.aspx?ID=305157" target="main">MyUsername</a> O22</td>
Я хочу получить информацию, где «305157», «MyUsername» и первая буква в «O22» (которая может быть T, K или O).
Я использую это регулярное выражение; <a href="/userinfo/userinfo\.aspx\?ID=\d*" target="helgonmain">\w*</a> \w\d\d
и это работает нормально, пока нет никаких åäöÅÄÖ вместо "\w".
Что я должен делать?