У Quora 300 миллионов уникальных пользователей в месяц.

Quora стала платформой, чтобы задавать вопросы и общаться с людьми, которые делятся уникальными идеями и качественными ответами. Сейчас на Quora активны 400 000 тем, в которые люди могут вносить свой вклад. Только в США у Quora более 40 миллионов активных пользователей. Их очередь в настоящее время обрабатывает 15 000 задач в секунду для более чем 500 типов задач. Продукт основан на данных, и поэтому наука о данных является неотъемлемой частью продукта Quora и их бизнеса. Quora - относительно молодая компания (основана в 2009 году), но их практика в области Data Science и их команда Data Science очень зрелая.

Процесс собеседования

Процесс собеседования начинается с часового просмотра экрана телефона. На экране телефона есть всевозможные вопросы от машинного обучения, A / B-тестирования, дизайна и статистических выводов. После экрана телефона следует собеседование на месте, которое начинается с практического задания. Назначение начинается с набора данных и ожидает, что вы найдете некоторые решения и характеристики из набора данных. Существует также собеседование по кодированию, чтобы проверить свои навыки программирования. Финальное собеседование с менеджером по найму состоит из вопросов о дизайне высокого уровня.

Важное прочтение

На уровне управления данными и потоками Quora использует Scribe для обработки журналов (см. Ведение журналов и агрегирование в Quora), Kafka для потоков данных и Spark для управления большими данными в целом. Раньше они использовали Hadoop Map Reduce, но теперь почти все варианты использования перенесены на Spark.

Вопросы, связанные с искусственным интеллектом и наукой о данных

  • Напишите функцию для возврата наилучшего разделения для регрессора дерева решений с использованием потерь L2.
  • Выведите элемент матрицы зигзагообразно.
  • Как преодолеть переобучение?
  • На Quora есть X ответов на определенный вопрос. Как создать модель, которая использует историю просмотров пользователей для ранжирования ответов? Насколько вычислительно интенсивна эта модель?
  • Вы берете случайную переменную с нормальным распределением X ~ N (0,1) один раз в день. Какое ожидаемое количество дней потребуется, чтобы получить значение, превышающее 2?
  • Как бы вы улучшили процесс предложения «Связанные вопросы»?
  • Как вы оцениваете дизайн веб-страницы?
  • Что беспокоит тестирование A \ B?
  • Какие показатели вы можете использовать для измерения взаимодействия с пользователем?
  • В Quora добавлена ​​новая функция, как вы протестируете ее эффекты? Как вы будете проводить проверку гипотез?

Размышляя над вопросами

Команда специалистов по анализу данных в Quora - отличные граждане сообщества в области науки о данных. Они проводят бесчисленные презентации и делятся своими знаниями со всем миром. Engineering at Quora - отличное место, чтобы начать узнавать об их приключениях. Интервью очень сложные, но их команда того стоит. Хорошо продуманные знания в семантической и языковой областях, несомненно, обеспечат вам работу на одном из крупнейших в мире сайтов вопросов и ответов.

Подпишитесь на нашу рассылку Acing AI, я обещаю не спамить и БЕСПЛАТНО!



Спасибо за внимание! 😊 Если вам понравилось, проверьте, сколько раз вы можете нажать 👏 за 5 секунд. Это отличное кардио для ваших пальцев, И оно поможет другим людям увидеть историю.

Единственная мотивация этой статьи в блоге - узнать о Quora и ее технологиях, которые помогают людям вникнуть в нее. Все данные получены из общедоступных сетевых источников. Я стремлюсь сделать этот документ живым, чтобы в него всегда можно было включить любые обновления и предлагаемые изменения. Пожалуйста, оставьте соответствующий отзыв.