подсчитывать слова из файла doc и docx

Я хочу подсчитать количество слов из файлов .doc и .docx.

Я пробовал ниже код: -

$file_upload = 'test.docx';
$zip = new ZipArchive;
$file_content = " ";
if ($zip -> open($file_upload) === true)
{
   if ( ($index = $zip -> locateName("word/document.xml")) !== false ) 
   {
                $data = $zip -> getFromIndex($index);
                $xml->formatOutput = true;
                $xml = DOMDocument::loadXML($data, LIBXML_NOENT | LIBXML_XINCLUDE | LIBXML_NOERROR | LIBXML_NOWARNING);

                $file_content = strip_tags($xml -> saveXML());
    }


   echo str_word_count($file_content);
}

Но приведенный выше код не дает ожидаемого результата.

Я также искал Google, а также раздел поиска stackoverflow. Но я не нашел желаемого ответа.

ПРИМЕЧАНИЕ. Код не будет зависеть от операционной системы или сервера.


person Ripa Saha    schedule 19.06.2013    source источник
comment
Проверьте stackoverflow.com/questions/7330660/   -  person Shreyos Adikari    schedule 19.06.2013
comment
@ShreyosAdikari Я уже пробовал это. Но не получить желаемый результат.   -  person Ripa Saha    schedule 19.06.2013


Ответы (1)


В настоящее время Microsoft не рекомендует и не поддерживает автоматизацию приложений Microsoft Office из любого автоматического неинтерактивного клиентского приложения или компонента (включая ASP, ASP.NET, DCOM и службы NT), поскольку Office может демонстрировать нестабильное поведение и/или или взаимоблокировка при запуске Office в этой среде.

Взгляните на PHPDocX.

(источник здесь)

person Filippo Lauria    schedule 19.06.2013