В конце этого поста вы можете найти письмо с моими предложениями по наиболее полезным инструментам для улучшения вашего рабочего процесса с научными статьями.

Основное обновление (2020 г.):
Мы выпустили инструмент для визуального поиска и изучения научных работ. См. Нашу публикацию в блоге о Связанных публикациях!

Как исследователи, особенно в (чрезмерно) плодовитых областях, таких как глубокое обучение, мы часто оказываемся перегруженными огромным количеством статей, которые нужно читать и отслеживать в нашей работе. Я думаю, что одна из главных причин этого - недостаточное использование существующих инструментов и сервисов, которые призваны облегчить нашу жизнь. Другая причина - отсутствие действительно хорошего продукта, который бы отвечал всем нашим потребностям в одном интерфейсе, но это тема для другого поста.

В последнее время я попал в новое подполе машинного обучения и был крайне разочарован процессом расстановки приоритетов, чтения и управления соответствующими статьями ... В итоге я начал искать инструменты, которые помогут мне справиться с этой перегрузкой, и хочу поделиться с вами продуктами и услуги, которые я нашел. Цель состоит в том, чтобы улучшить рабочий процесс и качество жизни всех, кто работает с научными статьями.

Я сосредоточусь в основном на использовании бумаг (а не на написании) и рассмотрю:

  1. Справочные менеджеры (бумажная библиотека AKA)
  2. Социальные платформы для обмена знаниями
  3. Автоматический анализ бумаги для получения дополнительных метаданных (ключевые слова, соответствующие наборы данных, важные цитаты…)

Справочные менеджеры (бумажная библиотека AKA)

Это платформы, на которых вы можете создавать и систематизировать списки всего своего прошлого и будущего чтения, добавлять личные заметки и делиться ими с небольшой группой. Библиотеки синхронизируются с облаком, что означает, что ваши документы должны быть доступны где угодно. Подумайте goodreads, но для бумаг. Выберите один из следующих вариантов:

  1. Mendeley: Это не самый красивый продукт, но он имеет бизнес-модель freemium и поддерживает несколько платформ, включая Интернет, ПК, Mac и мобильные устройства. В дополнение к обычным бумажным заметкам вы можете напрямую комментировать и выделять PDF-файлы. Вы платите за дополнительное облачное хранилище (необходимо после нескольких сотен бумаг).
  2. Paperpile: платная подписка (бесплатной версии нет), но выглядит и ощущается современно. Очень легко импортировать туда вашу библиотеку из других сервисов. Библиотека синхронизируется с вашим собственным Google Диском, что является плюсом. На данный момент работает только в браузере Chrome.
  3. Zotero: Freemium и реализация с открытым исходным кодом, где вы платите за дополнительное облачное хранилище. Похож на Mendeley, но менее универсален.

Есть еще варианты, но это те, которые я пробовал, и все они в порядке. Если бы мне пришлось выбирать один, то это был бы Mendeley из-за универсальности платформы и условно-бесплатного режима.

Усилители ArXiv

ArXiv существует с 1991 года и в целом очень мало изменился за последнее десятилетие, в то время как объем публикаций резко увеличился [1]. Естественно, что сегодня у нас другие требования и потребности по сравнению с нашим первичным хранилищем статей. Нам нужны алгоритмы, выполняющие анализ документов, мы хотим найти код, реализующий документы, нам нужен социальный уровень, через который мы можем делиться информацией, и, возможно, мы не хотим щуриться на двухколонный PDF-файл.

Поискав в Интернете существующие решения, я нашел много таких инструментов:

Социальные слои

  1. Shortscience: платформа для обмена бумажными резюме; На данный момент более 1000 аннотаций и продолжает расти. Работает для любой бумаги с DOI (то есть больше, чем arXiv).
  2. OpenReview: прозрачный процесс рецензирования документов, который также открыт для публичных рецензий, в настоящее время доступен только для избранных конференций, таких как NIPS и ICLR. Помимо официальных обзоров, в последнее время во многих статьях наблюдаются активные обсуждения с отзывами оригинальных авторов.
  3. Scirate: добавляет кнопку Нравится (ага, scite) поверх клона arXiv. Добавляет раздел комментариев. В основном неактивны.

Найдите код реализации статей

  1. Документы с кодом: автоматически подключает документы к репозиториям github, которые их реализуют, и сортирует по звездам github. Для каждой статьи может быть несколько отдельных записей.
  2. Github pwc: минималистичный подход, который автоматически (?) Соединяет документы только с одной реализацией кода, отображаемой в виде простой таблицы.
  3. GitXiv: Совместно курируемая лента проектов. Каждый проект удобно представлен как arXiv + Github + Links + Discussion. К сожалению, этот проект больше не поддерживается.

Другой

  1. ArXiv-sanity: обновляет arXiv с помощью открытых рефератов, предварительных просмотров документов и базовых социальных и библиотечных функций. Отважная попытка связать вместе многие из вышеперечисленных идей, реализованная в свободное время Андреем Карпати. Идеи есть, но, на мой взгляд, их реализация недостаточно хороша, чтобы стать популярным инструментом для исследователей, а в прошлом году проект не был очень активным.
  2. ArXiv-vanity: отображает научные статьи из arXiv в виде адаптивных веб-страниц, поэтому вам не придется щуриться при просмотре PDF.

Бумажный поиск и анализ

  1. Ученый Google: современное место, где можно искать статьи, просматривать статистику, ссылки и ссылки, настраивать оповещения о новых статьях, отслеживая автора или статью, и поддерживать базовую библиотеку с автоматическими рекомендациями.
  2. IBM Science Summarizer: сводки создаются путем анализа содержания статей, а также их структуры, разделов, абзацев и ключевых терминов. Он не всегда работает хорошо, но постоянно совершенствуется и отлично подходит для быстрого просмотра бумаг.
  3. Семантик: семантический анализ статей с внешней агрегацией материала. Возможности включают: отображение цитат и ссылок и измерение их влияния, отображение цифр на бумаге, автоматическое создание ключевых слов (тем), анализ авторов, поиск дополнительных ресурсов в Интернете (например, связанных видео на YouTube) и предложение рекомендуемых статей.
    Отличная новая разработка при поддержке AI2. Недавно они сделали небольшую интеграцию с Paperswithcode, упомянутым выше, и с самим arXiv (!).

Инструменты для авторов

  1. Overleaf: совместный онлайн-редактор LaTeX. Подумайте о документах Google для написания статей. Очень хорошо реализовано.
  2. Authorea: подход 21-го века к совместному написанию статей в Интернете, направленный в основном на отказ от LaTeX в пользу современного редактора WYSIWYG. Поддерживает встроенный код и данные для воспроизводимости, встроенные общедоступные комментарии и другие функции, которые имеют смысл.
  3. Океан кода: облачная платформа воспроизводимости вычислений. Насколько я понимаю, вы загружаете свое исследование как код среды Jupyter, запускаете его в Интернете и воспроизводите те же графики / результаты, которые получают авторы. Вот пример (нажмите Выполнить вверху справа).

Tl; dr - мои рекомендации

Я надеюсь, что этот пост познакомил вас по крайней мере с одним сервисом, который улучшит ваш рабочий процесс.
Пожалуйста, если вы знаете какие-либо полезные инструменты, которые не были упомянуты в этом посте, поделитесь ими ниже для всеобщего блага.

[1] К октябрю 2016 года количество поданных заявок выросло до более чем 10 000 в месяц. Https://en.wikipedia.org/wiki/ArXiv,