Я пытаюсь упростить понимание имен конфигураций для моей модели глубокого обучения. Первое, что я должен сделать, это разбить имена конфигураций на токены.
Ввод выглядит так:
allow-nonxdr-writes
io.native.lib.available
ha.zookeeper.parent-znode
min_file_size
ProxyStatus
ProxyFCGIBackendType
SessionDBDCookieRemove
DBDriver
SSLOCSPDefaultResponder
Соответствующий вывод должен быть:
allow nonxdr writes
io native lib available
ha zookeeper parent znode
min file size
Proxy Status
Proxy FCGI Backend Type
Session DBD Cookie Remove
DB Driver
SSL OCSP Default Responder
Как показано выше, формат имен конфигураций различается (поскольку они исходят от разного программного обеспечения разных организаций). Для первых 4 имен можно разделить их разделителем, например .
, -
или _
. С последними пятью мне тяжело справиться. Если я разделю эти имена только по принципу Camel-Case со словами, начинающимися с заглавной буквы, слова со специальными значениями, такими как FCGI
, DBD
, DB
, могут быть разделены неправильно.
Есть ли хорошая практика, подходящая для решения этой проблемы? Является ли создание словаря вручную единственным способом решения этой проблемы?
КСТАТИ. Эта ситуация возникает только при работе с именами конфигураций в Apache Httpd.
SSLOCSPDefaultResponder
мы не можем знать, как разделить первую часть наSSL
иOCSP
. Вы должны предоставить правила для этого. - person Tim Biegeleisen   schedule 31.08.2020