Я читал HTML-файлы в Matlab с помощью readfile
с интересом использовать regexp
для извлечения из него данных. Функция возвращает данные файла в виде строки, которая сохраняет «структуру» файла HTML, например новые строки. Например, если вы попытаетесь прочитать файл с указанным ниже содержимым, он вернет строку с той же структурой.
<!DOCTYPE html PUBLIC "-//IETF//DTD HTML 2.0//EN">
<HTML>
<HEAD>
<TITLE>
A Small Hello
</TITLE>
</HEAD>
</HTML>
Я ищу функцию, которая будет возвращать непрерывную строку, например...
<!DOCTYPE html PUBLIC "-//IETF//DTD HTML 2.0//EN">
<HTML>
<HEAD>
<TITLE>
A Small Hello
</TITLE>
</HEAD>
<BODY>
<H1>Hi</H1>
<P>This is very minimal "hello world" HTML document.</P>
</BODY>
</HTML>
Этот формат поможет мне в моих regexp
начинаниях.
Большое спасибо, Боб М.