У Quora 300 миллионов уникальных пользователей в месяц.
Quora стала платформой, чтобы задавать вопросы и общаться с людьми, которые делятся уникальными идеями и качественными ответами. Сейчас на Quora активны 400 000 тем, в которые люди могут вносить свой вклад. Только в США у Quora более 40 миллионов активных пользователей. Их очередь в настоящее время обрабатывает 15 000 задач в секунду для более чем 500 типов задач. Продукт основан на данных, и поэтому наука о данных является неотъемлемой частью продукта Quora и их бизнеса. Quora - относительно молодая компания (основана в 2009 году), но их практика в области Data Science и их команда Data Science очень зрелая.
Процесс собеседования
Процесс собеседования начинается с часового просмотра экрана телефона. На экране телефона есть всевозможные вопросы от машинного обучения, A / B-тестирования, дизайна и статистических выводов. После экрана телефона следует собеседование на месте, которое начинается с практического задания. Назначение начинается с набора данных и ожидает, что вы найдете некоторые решения и характеристики из набора данных. Существует также собеседование по кодированию, чтобы проверить свои навыки программирования. Финальное собеседование с менеджером по найму состоит из вопросов о дизайне высокого уровня.
Важное прочтение
На уровне управления данными и потоками Quora использует Scribe для обработки журналов (см. Ведение журналов и агрегирование в Quora), Kafka для потоков данных и Spark для управления большими данными в целом. Раньше они использовали Hadoop Map Reduce, но теперь почти все варианты использования перенесены на Spark.
- Ведение журнала и агрегирование на Quora: Ведение журнала и агрегирование
- Борьба со злоупотреблениями в Интернете: Поддержание высокого качества пользовательского контента с помощью машинного обучения
- Семантическое сопоставление вопросов: Сопоставление семантических вопросов с глубоким обучением
Вопросы, связанные с искусственным интеллектом и наукой о данных
- Напишите функцию для возврата наилучшего разделения для регрессора дерева решений с использованием потерь L2.
- Выведите элемент матрицы зигзагообразно.
- Как преодолеть переобучение?
- На Quora есть X ответов на определенный вопрос. Как создать модель, которая использует историю просмотров пользователей для ранжирования ответов? Насколько вычислительно интенсивна эта модель?
- Вы берете случайную переменную с нормальным распределением X ~ N (0,1) один раз в день. Какое ожидаемое количество дней потребуется, чтобы получить значение, превышающее 2?
- Как бы вы улучшили процесс предложения «Связанные вопросы»?
- Как вы оцениваете дизайн веб-страницы?
- Что беспокоит тестирование A \ B?
- Какие показатели вы можете использовать для измерения взаимодействия с пользователем?
- В Quora добавлена новая функция, как вы протестируете ее эффекты? Как вы будете проводить проверку гипотез?
Размышляя над вопросами
Команда специалистов по анализу данных в Quora - отличные граждане сообщества в области науки о данных. Они проводят бесчисленные презентации и делятся своими знаниями со всем миром. Engineering at Quora - отличное место, чтобы начать узнавать об их приключениях. Интервью очень сложные, но их команда того стоит. Хорошо продуманные знания в семантической и языковой областях, несомненно, обеспечат вам работу на одном из крупнейших в мире сайтов вопросов и ответов.
Подпишитесь на нашу рассылку Acing AI, я обещаю не спамить и БЕСПЛАТНО!
Спасибо за внимание! 😊 Если вам понравилось, проверьте, сколько раз вы можете нажать 👏 за 5 секунд. Это отличное кардио для ваших пальцев, И оно поможет другим людям увидеть историю.
Единственная мотивация этой статьи в блоге - узнать о Quora и ее технологиях, которые помогают людям вникнуть в нее. Все данные получены из общедоступных сетевых источников. Я стремлюсь сделать этот документ живым, чтобы в него всегда можно было включить любые обновления и предлагаемые изменения. Пожалуйста, оставьте соответствующий отзыв.