Я пытаюсь проанализировать документ, который выглядит примерно так:
<PRESOL>
<DATE>1112
<YEAR>12
<AGENCY>Defense Logistics Agency
<OFFICE>DLA Acquisition Locations
<LOCATION>DLA Land and Maritime
<ZIP>43218-3990
<CLASSCOD>59
<DESC>Proposed procurement for NSN 5365013055528 SPACER,PLATE:
Line 0001 Qty 70.00 UI EA Deliver To: ARIZONA INDUSTRIES FOR THE BLIND By: 0180 DAYS ADOThe solicitation is an RFQ and will be available at the link provided in this notice. Hard copies of this solicitation are not available. Digitized drawings and Military Specifications and Standards may be retrieved, or ordered, electronically.
All responsible sources may submit a quote which, if timely received, shall be considered.
Quotes must be submitted electronically.
<SETASIDE>HUBZone
.......
</PRESOL>
Как видите, это странно, но, возможно, раньше это было каким-то стандартом. Кажется, что весь документ использует ограниченный набор пробельных символов, например, я не вижу [табуляции], однако я вижу разрывы строк в некоторых больших блоках данных.
Кому-нибудь это кажется знакомым?
Я ищу драгоценный камень рельсов, который мог бы проанализировать это.