Как ускорить понимание за счет уменьшения сложности контента

Существует так много необычных приложений искусственного интеллекта, но так мало людей, стремящихся решить наши большие проблемы. Подумайте, например, об образовании. Что мы на самом деле делаем для улучшения наших систем обучения? Впервые в истории доступен почти весь контент, созданный людьми. Тем не менее, лишь немногие могут получить к нему доступ.

Можем ли мы использовать технологии искусственного интеллекта, чтобы сбалансировать неравный доступ к информации?

В этом году на WebFest в ЦЕРНе я представил SYNTHIA, приложение, которое изменит образование, используя технологии искусственного интеллекта и делая контент более доступным для всех. Как? Идея состоит в том, чтобы использовать методы обработки естественного языка (NLP) для выполнения таких задач, как резюмирование текста, перефразирование, транскрипция речи в текст и многое другое. Вы можете поиграть с приложением (оно бесплатно!), Изучить его исходный код и предложить новые разработки.

Прямой путь к сокращению неравенства - это изменение баланса в образовании, и для этого нам нужно поговорить о наших проблемах. Начнем с проблемы сложности контента.

Будь проще

Одним из самых больших препятствий в процессе обучения является невозможность доступа к сложному контенту. Но что значит «сложный»?

Сложность контента может быть на разных уровнях

  • Лексическая сложность: возникает, когда документ или источник содержат редко встречающиеся слова, неизвестные получателю.
  • Синтаксическая сложность: возникает, когда источник содержит длинные предложения, которые являются трудными или неизвестными получателю.
  • Семантическая сложность: учитывающая объем базовых знаний, необходимых для понимания значения источника.

Из трех уровней семантическая сложность, вероятно, наименее изучена. Он относится к количеству «вещей», о которых мы можем говорить в данном домене, включая все объекты в домене, их атрибуты и отношения между ними.

Семантический слой более неявный, чем его синтаксическая структура, и, как следствие, его расчет труднее.

Несмотря на то, что существуют известные и мощные академические и коммерческие меры синтаксической сложности, проблема измерения семантической сложности все еще остается сложной.

Как мы можем оценить семантическую сложность? Графики!

Графы - это структура данных, широко используемая в таких областях, как компьютерные науки. Социальные сети, молекулярные структуры, финансовые транзакции, биологические сети, транспортные системы - все они являются примерами предметной области и могут быть смоделированы в виде графиков.

Графики фиксируют взаимодействия (грани) между отдельными блоками (узлами), позволяя хранить, получать доступ и анализировать реляционные знания. По этой причине они играют ключевую роль в современном машинном обучении.

Саня Š Тайнер и Иоана Хулпус разработали метод автоматической оценки концептуальной сложности текстов, используя ряд мер на основе графиков на большой базе знаний. Используя высококачественный корпус изучающих английский язык, они показывают, что графические меры отдельных текстовых концепций, а также то, как они соотносятся друг с другом в графе знаний, обладают высокой отличительной способностью при различении двух версий тот же текст.

Вывод

Если нам удастся зафиксировать сложность контента, мы будем на пути к упрощению существующей информации и сделаем ее более доступной для всех.

Упрощение имеет множество важных социальных приложений, таких как повышение доступности для людей с когнитивными нарушениями, такими как афазия, дислексия и аутизм, или для не носителей языка и детей с трудностями чтения.

При этом упрощение контента как подполя Обработка естественного языка (NLP) находится на очень ранней стадии, что приводит к отсутствию надежных источников данных и методов. Фактически, суть проблемы заключается в субъективном характере упрощения. То, что является простым или сложным для одного человека, может не подходить для другого, и даже если бы мы смогли договориться об оценке сложности, мы бы обнаружили разные уровни понимания (например, очень сложный или какой-то сложный).

Заинтересованы в этих темах? Следуйте за мной в Linkedin или Twitter