Проверяйте слова, если они состоят из последовательных букв алфавита.

Я беру в качестве входных данных такое предложение:

abcd 01234 87 01235

Затем я должен проверить каждое слово, чтобы увидеть, являются ли его символы последовательными в алфавите. Вывод выглядит следующим образом:

abcd 01234

Ну, 01235 содержит последовательные символы, но все слово ТАКЖЕ содержит непоследовательные символы (35), поэтому оно не печатается на экране.

Пока я написал это:

function string_to_ascii($string)
{
    $ascii = NULL;

    for ($i = 0; $i < strlen($string); $i++)
    {
        $ascii[] =  ord($string[$i]);
    }

    return($ascii);
}


$input = "abcd 01234 87 01235";
//first, we split the sentence into separate words
$input = explode(" ",$input);
foreach($input as $original_word)
{
    //we need it clear
    unset($current_word);

    //convert current word into array of ascii chars
    $ascii_array = string_to_ascii($original_word);

    //needed for counting how many chars are already processed
    $i = 0;

    //we also need to count the total number chars in array
    $ascii_count = count($ascii_array);

     //here we go, checking each character from array
     foreach ($ascii_array as $char)
     {
        //if IT'S THE LAST WORD'S CHAR
        if($i+1 == $ascii_count)
        {
            //IF THE WORD HAS JUST 1 char, output it
            if($ascii_count == 1)
            {
                $current_word  .= chr($char);
            }
            //IF THE WORDS HAS MORE THAN 1 CHAR
            else
            {
                //IF PREVIOUS CHAR CODE IS (CURRENT_CHAR-1)  (CONSECUTIVE, OUTPUT IT)
                if(($char - 1) == $ascii_array[($i-1)])
                {
                    $current_word .=chr($char);
                }

            }
        }
        //IF WE AREN'T YET AT THE ENDING
        else
        {
            //IF NEXT CHAR CODE IS (CURRENT_CHAR+1) (CONSECUTIVE, OUTPUT IT)
            if(($char + 1) == ($ascii_array[($i+1)]))
            {
                $current_word .=chr($char);
            }

        }

        $i++;
     }

    //FINALLY, WE CHECK IF THE TOTAL NUMBER OF CONSECUTIVE CHARS is the same as THE NUMBER OF CHARS
    if(strlen($current_word) == strlen($original_word))
    {
        $output[] = $current_word;
    }

}
//FORMAT IT BACK AS SENTENCE
print(implode(' ',$output));

Но, может быть, есть другой способ сделать это, более простой?

извините за неправильное написание


person technology    schedule 22.06.2011    source источник


Ответы (1)


Это работает...

$str = 'abcd 01234 87 01235';

$words = explode(' ', $str);

foreach($words as $key => $word) {
    if ($word != implode(range($word[0], chr(ord($word[0]) + strlen($word) - 1)))) {
       unset($words[$key]);
    }
}

echo implode(' ', $words);

CodePad.

По сути, он захватывает первый символ каждого слова и создает диапазон символов, который был бы значением, если бы слово состояло из последовательных символов.

Затем он выполняет простое сравнение строк.

Для более производительной версии...

$str = 'abcd 01234 87 01235';

$words = explode(' ', $str);

foreach($words as $key => $word) {

    foreach(str_split($word) as $index => $char) {
      $thisOrd = ord($char); 
      if ($index > 0 AND $thisOrd !== $lastOrd + 1) {
         unset($words[$key]);
         break;
      }
      $lastOrd = $thisOrd;
    }

}

echo implode(' ', $words);

CodePad.

Оба этих примера основаны на том, что порядковые номера символов являются последовательными для последовательных символов. Это относится к ASCII, но я не уверен в других символах.

person alex    schedule 22.06.2011
comment
@alex: Есть ли способ заставить это работать для символов в кодировке UTF-8? Русские алфавиты, если быть точным. - person gentrobot; 08.11.2012
comment
@gentrobot Последовательны ли их кодовые точки? Если нет, вы можете создать массив кодовых точек, которые вы считаете последовательными, и сравнить их. - person alex; 08.11.2012
comment
@alex Спасибо за предложение. Я постараюсь, и если где-то застряну, вернусь к SO :) - person gentrobot; 08.11.2012