Типы представления строки пользовательского форматирования Python/Cython

Я знаю, что можно расширить Formatter для предоставления дополнительных типов представления, как описано в PEP3101, но это слишком медленно для моих нужд. Мне любопытно, какие другие варианты могут быть для внедрения пользовательских типов представления для строк.

В настоящее время единственный другой вариант, который приходит на ум, - это проверить {vars} строки, отметить тип представления и индекс, удалить пользовательский тип представления, формат, а затем опубликовать формат результата для моих нужд.

Есть ли какие-либо другие варианты, чтобы избежать постобработки, используя скорость форматирования?


person dskinner    schedule 21.12.2011    source источник


Ответы (1)


Я разработал решение, которое, по-видимому, имеет значительно меньшие накладные расходы в cython, хотя то же самое можно сделать и в python, и здесь я приведу пример (не уверен в накладных расходах).

Согласно документам Python, объект может реализовать метод __ format__ и получить спецификацию формата. В cython я реализую свой собственный тип uobj, который действует как универсальный для args и kwargs, переданных в str.format. То же самое в python (в качестве общего примера экранирования ‹ и > ) выглядит так.

class uobj:
    def __init__(self, obj):
        self.obj = obj
    def __format__(self, format_spec):
        if format_spec == 's':
            return str(self.obj)
        else:
            # edit, shoehorning this in for completeness
            # to call an original format spec as should probably
            # happen after you do your own processing, use __format__
            if isinstance(self.obj, (int, float)):
                return self.obj.__format__(format_spec)
                # so then a :.2f spec on uobj(123.456) would work as expected
            return str(self.obj).replace('<', '&lt;').replace('>', '&gt;')
    def __getitem__(self, key):
        return uobj(self.obj[key])

Итак, теперь uobj может хранить пользовательский объект (str или dict в следующем примере), а затем к нему можно получить доступ, как

d = uobj({'a': '<b>asdf'})
s = uobj('<span>qwer</span>')
'{0:s} {d[a]}'.format(s, d=d)

# ouputs: '<span>qwer</span>&lt;asdf'

И где приведение к uobj будет происходить внутри функции fmt для *args и **kwargs. Здесь есть еще некоторые детали, которые нужно решить, например, я заметил, что ints не удалось проанализировать в моих модульных тестах, и uobj нужно будет распаковать с помощью * uobj и ** uobj для преобразования объектов по требованию, хотя мне может потребоваться разбить это на соответствующие клоны списка и dict. Тем не менее, это, кажется, лучший путь для меня.

изменить

кажется, плохо читать об эмуляции типов контейнеров здесь http://docs.python.org/reference/datamodel.html#emulating-container-types

person dskinner    schedule 22.12.2011