В Coursera мы используем данные, чтобы развивать наш продукт и лучше обслуживать наших учеников. Одним из примеров является наш График навыков - серия алгоритмов, объединяющих учащихся, контент и карьеру через общую валюту навыков. По сути, диаграмма отображает обширную библиотеку навыков друг с другом, с содержанием, которое их обучает, с профессиями, в которых они требуются, и с учащимися, которые имеют или хотят их. Он основан на данных со всего сайта и поддерживает ряд приложений в области обнаружения контента и не только.

В качестве примера возьмем границу обучается между узлом skill и узлом content. Он создается с помощью модели машинного обучения с функциями, которые включают такие атрибуты материала, как частота, с которой он ссылается на навык или концепции, связанные с этим навыком. Тем не менее, одна из наиболее ценных функций - это то, что учащиеся на платформе самостоятельно сообщают об обучении по мере продвижения по своему опыту. Это преимущество поддерживает несколько информационных продуктов на сайте; один - поиск на основе навыков.

Представьте себе ученика, который хочет изучить определенный инструмент или технологию, возможно, потому, что он ему нужен для работы фрилансером, или потому, что он видит, что это указано в заявке на работу, на которую он хочет подать заявку. Хотя инструменты и технологии часто преподаются на курсах на Coursera, преподаватели могут не упоминать их при описании курса. Примером может служить NumPy пакет для научных вычислений на Python. Поиск в каталоге по запросу «NumPy» вернет нулевые результаты только с использованием стандартной модели релевантности на основе сходства текста - и фактически так и было до тех пор, пока мы не создали это преимущество и не развернули его в поиске. Теперь запрос возвращает 21 совпадение курсов, по графику которых мы знаем, что учащиеся изучают NumPy. Это распространяется на целый ряд сложных навыков - от очень широкого до очень детального.

Как только мы построили инфраструктуру графа и внедрили в нее теги, сообщаемые учащимися, она превзошла то, что мы могли бы придумать самостоятельно. Например, наш первоначальный набор тегов навыков относился исключительно к сфере бизнеса, информатики и данных. Но сегодня, благодаря графику, учащиеся могут легко найти контент, который также учит мягким навыкам - даже там, где их обучают только косвенно. Например, когда учащийся вводит запрос «уверенность », ему возвращают несколько курсов по публичным выступлениям, печально известный курс Learning How to Learn , и многое другое - все это основано на обширном потоке данных, сообщаемых учащимися, которые обновляют график каждый день.

Хотя приложение для поиска на основе навыков принесло нам самую большую алгоритмическую победу в поиске, оно предполагает, что учащийся знает, чему он хочет научиться. Поскольку многие учащиеся больше сосредоточены на том, какой результат они хотят - например, на какой работе, - мы расширили график, включив отображение между карьерой и набором навыков, которые им требуются. Это основано на частоте, с которой навыки появляются в объявлениях об этой вакансии, и на тех навыках, которые мы наблюдаем у реальных учащихся на этих должностях в ходе их обучения. Вот одно из приложений: когда учащийся просматривает контент Coursera, он может фильтровать его по релевантности карьеры.

Мы можем сделать еще лучше, включив данные о каждом человеке - например, используя данные нашей платформы для тщательного измерения того, что каждый учащийся уже знает, и используя это, чтобы получить их на нужном уровне контента. Это начинается с теоретических моделей «элемент-ответ», обученных на сотнях миллионов вопросов, которые были заданы на платформе. Вкратце, модели выводят оценку сложности для каждого вопроса. Сопоставляя эти оценки с успеваемостью данного учащегося по тестам, которые он пытался выполнить, мы можем сделать вывод о его уровне в каждом из диапазонов навыков. Ниже приведен пример вывода для одного учащегося. Она относительно лучше в управлении данными, но слабее в машинном обучении. Знание этого позволяет нам, среди прочего, рекомендовать контент ML для начинающих.

Сегодня мы поделились некоторыми примерами того, как наш График навыков, построенный на обширных данных, собранных через платформу, позволяет нам развивать более четкое понимание учащихся, контента и карьеры, а при обратной связи с продуктом помогает каждому учащемуся найти правильный контент для них.

В ближайшие недели мы расскажем о других приложениях диаграммы, в том числе о том, как диаграмма позволяет нашим корпоративным клиентам получить ценную информацию в приложении под названием Skills Benchmarking.

Заинтересованы в применении науки о данных в образовании? Coursera нанимает!