Вы помните дни, когда НЛП, известное как нейролингвистическое программирование, было в моде в книгах по самопомощи и мотивационных разговорах? Вы помните гуру самопомощи, проповедовавших использование нейролингвистического программирования как метода, который поможет вам достичь почти сверхспособностей для достижения ваших целей путем моделирования навыков так называемых исключительных людей. Что ж, с тех пор, в конце 70-х и 80-х, это НЛП было дискредитировано с научной точки зрения. Теперь есть новый НЛП, известный как обработка естественного языка. Концепция представляет собой область искусственного интеллекта, связанную с взаимодействием между компьютерами и человеческими языками.

Что такое «естественный язык»? Естественный язык — это то, как мы пишем или говорим в повседневной жизни. Когда вы читаете газетную статью, сообщение в социальной сети или этот технический документ, вы испытываете «естественный язык». Почему НЛП важно? Концепция НЛП касается того, как запрограммировать компьютеры для обработки больших объемов данных на естественном языке. Следует отметить, что концепция не нова. Это началось в 1950-х годах, но со всеми разработками, связанными с данными, большими данными и т. п., эта концепция все больше и больше становилась частью публикаций и контента, связанных с искусственным интеллектом (ИИ) и машинным обучением (МО).

Хотя НЛП служит корневой концепцией для ИИ и МО, я собираюсь объяснить, почему на самом деле это не так важно для наук о жизни. Начнем с не столь смелого утверждения, что язык наук о жизни совсем не естественен. Любой, кто читал клиническую статью, монографию о продукте или нормативный файл, быстро заметит, что содержание далеко от английской прозы. По существу, науки о жизни имеют свой собственный язык.

Как это влияет на то, как технологии используются в науках о жизни? Тот факт, что большинство инструментов и технологий используют НЛП, означает, что количество нерелевантного контента (шума) огромно. Попробуйте выполнить поиск в Google по любой биомедицинской концепции, и вы увидите, что более 50% результатов не имеют отношения к тому, что вы ищете. Выполните поиск или попробуйте извлечь содержимое из обзора фильма в Интернете, и это сработает. Попробуйте сделать то же самое с нормативным фармацевтическим документом или комментариями врачей в блоге в социальных сетях, и это с треском провалится. Это связано с НЛП. Это создает значительную нагрузку с точки зрения времени и энергии, затрачиваемой на попытки вручную отфильтровать и проанализировать содержимое. Я использую Google в качестве примера, но большинство инструментов для обработки данных и аналитики имеют ту же проблему. Они построены на НЛП, и поэтому большая часть данных, загружаемых в инструменты, не имеет значения. Лучшая вычислительная мощность и лучшие алгоритмы по-прежнему зависят от качества или актуальности данных. Мусор на входе, мусор на выходе.

Итак, что можно сделать, чтобы помочь тем из нас, кто занимается биологическими науками, извлечь выгоду из инструментов данных и аналитики без шума? Используйте НЛП, модифицированное для наук о жизни. Звучит просто, верно? Но для этого нужно было бы не только расширить словарный запас примерно с 10 000 английских слов до миллионов терминов наук о жизни, но и создать онтологию наук о жизни. Хм? На-что? Онтология предметной области — это то же, что грамматика для естественного языка. Онтология — это набор понятий и категорий в определенной предметной области, который показывает свойства и отношения между ними. Он определяет общее понимание структуры информации. По сути, в науках о жизни мы уже используем ряд онтологий для болезней, генов и различных других знаний. Проблема заключается в том, что большинство инструментов машинного программирования и анализа данных либо используют только одну конкретную онтологию, либо не используют вообще ни одной, и поэтому не способны использовать обработку языка биологических наук в масштабе.

Переход от НЛП к обработке языка Lifescience не только важен для того, чтобы сделать анализ данных полезным, но и необходим. Поскольку мы рассматриваем сотни инструментов и предложений продуктов, доступных сегодня для наук о жизни, мы должны требовать, чтобы эти инструменты говорили на нашем языке. Как и в случае нейролингвистического программирования (НЛП), достоинства обработки естественного языка (НЛП) окажутся бесполезными, если не принимать во внимание онтологию наук о жизни для управления более актуальной обработкой языка наук о жизни.

Первоначально опубликовано на www.innoplexus.com