Диапазон, основанный на циклах для строк с нулевым завершением

Я как бы предполагал, что диапазон, основанный на циклах for, будет поддерживать строки в стиле C.

void print_C_str(const char* str)
{
    for(char c : str)
    {
        cout << c;
    }
}

Однако это не так, стандарт [stmt.ranged] (6.5.4) говорит, что range-based-for работает в одном из трех вариантов:

  1. Диапазон представляет собой массив
  2. Диапазон представляет собой класс с вызываемыми методами begin и end.
  3. Доступен ADL в связанном пространстве имен (плюс пространство имен std)

Когда я добавляю функции begin и end для const char* в глобальное пространство имен, я все равно получаю ошибки (как из VS12, так и из GCC 4.7).

Есть ли способ заставить циклы for на основе диапазона работать со строками в стиле C?

Я попытался добавить перегрузку к namespace std, и это сработало, но, насколько я понимаю, добавление перегрузок к namespace std незаконно (это правильно?)


person Motti    schedule 23.01.2013    source источник
comment
Вы можете легально специализировать шаблоны в пространстве имен std.   -  person Stephan Dollberg    schedule 23.01.2013
comment
@bamboon true, но IIRC только для пользовательских типов, и это перегрузка, а не специализация и для встроенного типа, а не UDT.   -  person Motti    schedule 23.01.2013
comment
Почему вы передаете строки C?   -  person Alex Chamberlain    schedule 23.01.2013
comment
Решение состоит в том, чтобы не использовать строки C в качестве строк. std::string достаточно плох из-за отсутствия понятия кодирования.   -  person Cubic    schedule 23.01.2013
comment
@AlexChamberlain Я играю с необработанными UDL, где строки C входят в стандарт   -  person Motti    schedule 23.01.2013


Ответы (3)


Если вы пишете тривиальный итератор для строк с завершающим нулем, вы можете сделать это, вызвав функцию для указателя, которая возвращает специальный диапазон, вместо того, чтобы рассматривать сам указатель как диапазон.

template <typename Char>
struct null_terminated_range_iterator {
public:
    // make an end iterator
    null_terminated_range_iterator() : ptr(nullptr) {}
    // make a non-end iterator (well, unless you pass nullptr ;)
    null_terminated_range_iterator(Char* ptr) : ptr(ptr) {}

    // blah blah trivial iterator stuff that delegates to the ptr

    bool operator==(null_terminated_range_iterator const& that) const {
        // iterators are equal if they point to the same location
        return ptr == that.ptr
            // or if they are both end iterators
            || is_end() && that.is_end();
    }

private:
    bool is_end() {
        // end iterators can be created by the default ctor
        return !ptr
            // or by advancing until a null character
            || !*ptr;
    }

    Char* ptr;
}

template <typename Char>
using null_terminated_range = boost::iterator_range<null_terminated_range_iterator<Char>>;
// ... or any other class that aggregates two iterators
// to provide them as begin() and end()

// turn a pointer into a null-terminated range
template <typename Char>
null_terminated_range<Char> null_terminated_string(Char* str) {
    return null_terminated_range<Char>(str, {});
}

И использование выглядит так:

for(char c : null_terminated_string(str))
{
    cout << c;
}

Я не думаю, что это теряет какую-либо выразительность. На самом деле, я думаю, что это более ясно.

person R. Martinho Fernandes    schedule 23.01.2013
comment
+1, он чище, потому что корректно работает как с char*, так и с char[]. Проблема с char[] заключается в том, что он изначально работает, но делает не то (он обрабатывается как любой C-массив, а не как строка с нулевым символом в конце, и, следовательно, имеет на один элемент больше длины. - person Konrad Rudolph; 23.01.2013
comment
+1 Из любопытства, есть ли причина, по которой это решение предпочтительнее for (char c: std::string(str))? Мне это кажется очевидным решением. Поскольку никто не опубликовал его в качестве ответа, я могу только догадываться, что мне чего-то не хватает. Либо в этом решении, которое вы опубликовали, либо в использовании std::string необходимо создать что-то дополнительное для выполнения итерации. - person hmjd; 23.01.2013
comment
@hmjd Да, for (char c: std::string(str)) - это альтернатива. Преимущество этого подхода по сравнению с std::string заключается в том, что эта абстракция имеет очень низкую стоимость времени выполнения: дополнительные объекты, которые создаются, чрезвычайно дешевы, в отличие от std::string, который может включать динамическое выделение и копировать всю строку в свою собственную. буфер. По сути, хотя я бы не смеялся, увидев, что для этого используется std::string (если только профилирование не доказало, что это проблема производительности), это обеспечивает именно желаемую функциональность, итерацию, в то время как std::string предоставляет ненужную функциональность, и это то, что расходы. - person R. Martinho Fernandes; 23.01.2013
comment
@R.MartinhoFernandes, аспект производительности был единственной возможной причиной, о которой я мог думать. Ваше здоровье. - person hmjd; 23.01.2013
comment
@R.MartinhoFernandes: это очень красиво, но держу пари, что менее умное решение с использованием прокси-класса для определения begin() и end(), где begin(s) просто s, а end(s) равно s+strlen(s), окажется таким же быстро, если не быстрее. Моя теория основана на моем подозрении, что strlen() сильно оптимизирован, чтобы не требовать сравнения байтов в каждом байте, поэтому накладные расходы на его выполнение должны быть примерно равны накладным расходам на выполнение двух тестов (или, может быть, трех) вместо одного. на каждой итерации цикла. В любом случае, это, безусловно, меньше работы, поскольку вообще не требует пользовательского итератора. - person rici; 24.01.2013

Возможный обходной путь — обернуть строку с завершающим нулем в другой тип. Простейшая реализация выглядит следующим образом (она менее производительна, чем предложение R. Martinho Fernandes, поскольку вызывает strlen, но также значительно меньше кода).

class null_terminated_range {
    const char* p:
public:
    null_terminated_range(const char* p) : p(p) {}
    const char * begin() const { return p; }
    const char * end() const { return p + strlen(p); }
};

Использование:

for(char c : null_terminated_range(str) ) 
person Motti    schedule 23.01.2013

C-строка — это не массив, это не класс с begin/end членами, и вы ничего не найдете с помощью ADL, потому что аргумент является примитивным. Возможно, это должен быть простой неквалифицированный поиск с ADL, который найдет функцию в глобальном пространстве имен. Но, учитывая формулировку, я думаю, что это невозможно.

person Puppy    schedule 23.01.2013