что это за язык разметки? окончания строк вместо закрывающих тегов

Я пытаюсь проанализировать документ, который выглядит примерно так:

<PRESOL>
<DATE>1112
<YEAR>12
<AGENCY>Defense Logistics Agency
<OFFICE>DLA Acquisition Locations
<LOCATION>DLA Land and Maritime
<ZIP>43218-3990
<CLASSCOD>59
<DESC>Proposed procurement for NSN 5365013055528 SPACER,PLATE:
Line 0001 Qty 70.00  UI EA  Deliver To: ARIZONA INDUSTRIES FOR THE BLIND By: 0180 DAYS ADOThe solicitation is an RFQ and will be available at the link provided in this notice.  Hard copies of this solicitation are not available.  Digitized drawings and Military Specifications   and Standards may be retrieved, or ordered, electronically.
All responsible sources may submit a quote which, if timely received, shall be considered.
Quotes must be submitted electronically.

<SETASIDE>HUBZone
.......
</PRESOL>

Как видите, это странно, но, возможно, раньше это было каким-то стандартом. Кажется, что весь документ использует ограниченный набор пробельных символов, например, я не вижу [табуляции], однако я вижу разрывы строк в некоторых больших блоках данных.

Кому-нибудь это кажется знакомым?

Я ищу драгоценный камень рельсов, который мог бы проанализировать это.


person LessQuesar    schedule 14.11.2012    source источник
comment
Я не могу точно сказать, что это за язык разметки, но я уверен, что он соответствует спецификациям SGML (где элементы простых типов не должны содержать закрывающие теги) и, следовательно, может быть прочитан чем-то, что может читать SGML (пример приведен в этой статье). К сожалению, я не знаю никаких драгоценных камней для этой конкретной задачи.   -  person raina77ow    schedule 14.11.2012
comment
Немного похоже на язык на основе SGML. HTML — это приложение SGML, а XML — его продолжение. Я не вижу вашей странности, хотя это может быть потому, что я некоторое время работал с SGML.   -  person Michael Petrotta    schedule 14.11.2012
comment
Я вижу, что это для правительства, так что, возможно, это какой-то архаичный язык 1950-х годов.   -  person Steve Wellens    schedule 14.11.2012
comment
Вы все правы. По-видимому, конечные теги полностью отсутствуют в SGML. Я предполагаю, что изначально из соображений размера. В настоящее время преимущество его размера не перевешивает сложность анализа.   -  person LessQuesar    schedule 14.11.2012


Ответы (2)


(Поймите, я такого раньше не видел - это все результат некоторого копания)

Это формат для уведомления о предварительном запросе, как опубликовано Федеральным агентством по бизнесу США... что-то. Это один из пятнадцати форматов обмена данными, определенных этой организацией.

Я не смог найти описание базового формата для этого шаблона. Что прискорбно, потому что в SGML есть куча подводных камней (как я упоминал в комментариях, это очень похоже на SGML), которые вас укусят, если вы к ним не готовы. Вот интересный пример из Википедии: <QUOTE></QUOTE> также можно записать как: <QUOTE// или <QUOTE>.

шаблонная документация ограничена форматом данные, ожидаемые в каждом поле. Например:

<CLASSCOD>

Либо один буквенный код, либо двузначный код услуги или поставки, под которыми должен быть указан краткий обзор. Действительный классификационный код (FAR, раздел 5.207(g))

person Michael Petrotta    schedule 14.11.2012

Это уведомление о предварительном запросе от FederalBizOpps.gov.

Шаблон уведомления о предварительном запросе

Шаблон предварительного запроса используется для публикации уведомлений о предлагаемых приобретениях. Раздел 5.2 FAR требует предоставления этого документа до публикации любых дальнейших действий. ПФ отклонит любые другие документы, относящиеся к конкретному запросу, без предварительной публикации Уведомления о предварительном запросе для этого запроса.

 Tag           Description [Format]
 <PRESOL>                                                              
 <DATE>        Month and day synopsis is submitted [MMDD]
 <YEAR>        Year synopsis is submitted [YY]
 <CBAC>*       User ID for the Office Location. Assigned/managed by your location Administrator.    [string]
 <PASSWORD>*   Password. Assigned/managed by your location Administrator. [string]
 <ZIP>         The Contracting Office's ZIP code [5 Digits]
 <CLASSCOD>*   Either one alphabetic code or a two-digit code for service or supply that the synopsis should be listed under. [Valid classification code (FAR, Section 5.207(g))]
 <NAICS>*      Six-digit code for service or supply that the synopsis would be listed under [Valid NAICS Code]
 <OFFADD>      The complete address of the contracting office [Up to 65535 characters]
 <SUBJECT>     The classification code, two hyphens, and a brief title description of the synopsis. [Up to 255 characters]
 <SOLNBR>*     Unique reference number for the solicitation [Up to 128 characters from the set: a-z A-Z 0-9 - _ ( ) { }]
 <RESPDATE>    Response deadline date [MMDDYY]
 <ARCHDATE>    The date when this notice will be archived. [MMDDYYYY]
 <CONTACT>     The names and phone numbers of officials to contact in regard to this synopsis. If there are two points of contact, their information shall be separated by semicolon [Up to 65535 characters]
 <DESC>        A narrative description of the procurement action. [Up to 65535 characters]
 <LINK>        A structural tag [No data required or accepted]
 <URL>         The Government Agency's URL that will be listed with this award. [Up to 255 characters, consist of a restricted set of characters (see URL specification - RFC 2396)]
 <DESC>        Visible hypertext description provided to the user for linking to the related site [Up to 255 characters]
 <EMAIL>       A structural tag [No data required or accepted]
 <ADDRESS>     The Government Agency contact's email address [Up to 128 characters]
 <DESC>        Visible hypertext description provided for linking to the Government Agency contact's email [Up to 255 characters]
 <SETASIDE>    Identify set-aside acquisitions. [Valid values: 'Competitive 8(a)', 'Emerging Small Business', 'Woman Owned Small Business', 'Economically Disadvantaged Woman Owned Small Business', 'HUBZone', 'Partial HBCU / MI', 'Partial Small Business', 'Service-Disabled Veteran-Owned Small Business', 'Total HBCU / MI', 'Total Small Business', 'Veteran-Owned Small Business']
 <POPADDRESS>  Place of performance address [Up to 65535 characters]
 <POPZIP>      Place of performance ZIP code [Up to 5 digits]
 <POPCOUNTRY>  Place of performance country [Up to 32 characters]
 </PRESOL>     

Заметки

  1. Все красные метки представляют необходимые данные.
    • denotes validated data.
  2. <LINK>, <URL> и <DESC> являются групповыми данными и должны быть предоставлены или опущены вместе.
  3. <EMAIL>, <ADDRESS> и <DESC> являются групповыми данными и должны быть предоставлены или опущены вместе.

Пример

<PRESOL> 
<DATE> 0521 
<YEAR> 99 
<CBAC> demo 
<PASSWORD> DEMO 
<ZIP> 22030 
<CLASSCOD> B 
<NAICS>123456 
<OFFADD> Office of Environmental Studies; 1323 Y Street, Washington, DC 22030 
<SUBJECT> B--ENERGY AND ENVIRONMENTAL SERVICES KNOWLEDGE DEVELOPMENT AND DISSEMINATION ACTIVITIES REGARDING THE HOMELESS MENTALLY ILL POPULATION 
<SOLNBR> 208-94-0008 
<RESPDATE> 061399 
<ARCHDATE> 07131999 
<CONTACT> Mary Ann Deal, Contract Specialist, 301-443-5329; Contracting Officer, Beatrice L. Woods, 301-443-0043 
<DESC> The Center for Mental Health Services is soliciting proposals on a full and open competitive basis from qualified organizations to award a 3-year contract to develop and disseminate new knowledge about effective approaches to providing comprehensive community-based services to persons with serious mental illnesses who are homeless. 
<LINK> 
<URL> http://www.abc.gov 
<DESC> Center for Mental Health <EMAIL> <ADDRESS> [email protected] 
<DESC> Center for Mental Health <SETASIDE> Total Small Disadvantage Business 
<POPADDRESS> Office of Environmental Studies; 1323 Y Street; Washington, DC 22030 
<POPZIP> 22030 
<POPCOUNTRY> US 
</PRESOL>
person Mads Hansen    schedule 14.11.2012
comment
Это точный источник. Я не нашел описание этого документа. Надеюсь, я смогу найти способ легко его разобрать. - person LessQuesar; 14.11.2012