1. Облегчение автоматического преобразования научных знаний в научные имитационные модели с помощью платформы машинного создания, калибровки и сравнения (MAGCC) (arXiv)

Автор:Чейз Кокрелл, Скотт Кристли, Гэри Ан

Аннотация. Платформа создания, сравнения и калибровки с помощью машин (MAGCC) обеспечивает машинную поддержку и автоматизацию повторяющихся важных шагов и процессов при разработке, внедрении, тестировании и использовании научных имитационных моделей. MAGCC объединяет системы для извлечения знаний с помощью обработки естественного языка или извлечения из существующих математических моделей и обеспечивает комплексный рабочий процесс, включающий в себя композицию научных моделей и генерацию кода с помощью искусственного интеллекта (ИИ). MAGCC достигает этого за счет: 1) разработки всесторонне выразительной базы знаний формального представления знаний, структурированного представления научных знаний (SSKR), которое охватывает все типы информации, необходимой для создания любой имитационной модели, 2) использования искусственно интеллектуальных логических рассуждений. система, Помощник по вычислительному моделированию (CMA), который берет информацию из SSKR и генерирует прослеживаемым образом спецификации модели для ряда методов имитационного моделирования, и 3) использование CMA для генерации исполняемого кода для имитационная модель из тех спецификаций модели. Фреймворк MAGCC можно настроить в любой научной области, и будущая работа будет включать в себя недавно разработанные системы искусственного интеллекта, генерирующие код.

2. Тестирование программ обучения нейронным сетям с прямой связью (arXiv)

Автор: Хусем Бен Брайек, Футсе Кхомх

Аннотация : В настоящее время мы наблюдаем растущие усилия по повышению производительности и надежности глубоких нейронных сетей (DNN) с целью их внедрения в системы, критически важные для безопасности, такие как беспилотные автомобили. Предлагается несколько методов тестирования для создания тестовых случаев, которые могут выявить несоответствия в поведении моделей DNN. Эти методы неявно предполагают, что программа обучения не содержит ошибок и правильно настроена. Однако удовлетворение этого предположения для новой проблемы требует значительной инженерной работы по подготовке данных, проектированию DNN, реализации программы обучения и настройке гиперпараметров, чтобы создать модель, для которой современные генераторы автоматических тестовых данных ищут поведение в крайних случаях. . Все эти этапы обучения модели могут быть подвержены ошибкам. Поэтому крайне важно обнаруживать и исправлять ошибки на всех этапах проектирования программных систем на основе DNN, а не только в результирующей модели DNN. В этой статье мы собираем каталог проблем обучения и, основываясь на их симптомах и их влиянии на поведение программы обучения, мы предлагаем практические процедуры проверки для автоматического обнаружения вышеупомянутых проблем путем непрерывной проверки того, что некоторые важные свойства обучения динамика сохраняется во время тренировки. Затем мы разрабатываем TheDeepChecker, комплексный подход к отладке на основе свойств для обучающих программ DNN. Мы оцениваем эффективность TheDeepChecker на синтетических и реальных программах DL с ошибками и сравниваем ее с Amazon SageMaker Debugger (SMD). Результаты показывают, что проверка TheDeepChecker во время выполнения свойств программы на основе DNN позволяет выявить несколько ошибок кодирования и неправильных конфигураций системы на раннем этапе и при низких затратах. Кроме того, TheDeepChecker превосходит автономную проверку правил SMD по журналам обучения с точки зрения точности обнаружения и охвата ошибок DL.

3. Воспроизводимость глубокого обучения и объяснимый ИИ (XAI) (arXiv)

Автор:А. -М. Левенти-Питц, Т. Острейх

Аннотация: В этой работе исследуется недетерминизм алгоритмов обучения глубокого обучения (DL) и его влияние на объяснимость моделей нейронных сетей (NN) с помощью примеров классификации изображений. Для обсуждения вопроса были обучены две сверточные нейронные сети (CNN) и проведено сравнение их результатов. Сравнение служит для изучения возможности создания детерминированных, надежных моделей глубокого обучения и детерминированного объяснимого искусственного интеллекта (XAI) на практике. Подробно описаны успехи и недостатки всех предпринятых здесь усилий. Исходный код полученных детерминированных моделей приведен в этой работе. Воспроизводимость индексируется как компонент этапа разработки Модели управления, предложенной ЕС в рамках их превосходства в подходе ИИ. Кроме того, воспроизводимость является требованием для установления причинно-следственной связи для интерпретации результатов моделирования и укрепления доверия к огромному расширению приложений систем ИИ. В работе рассматриваются проблемы, которые необходимо решить на пути к воспроизводимости, и пути решения некоторых из них.

4.RoPGen: на пути к надежной атрибуции авторства кода с помощью автоматического преобразования стиля кодирования (arXiv)

Автор: Чжэнь Ли, Гвеневра, Чен, Чэнь Чен, Яи Цзоу, Шоухуай Сюй

Аннотация:Атрибуция авторства исходного кода является важной проблемой, часто возникающей в таких приложениях, как криминалистика программного обеспечения, исправление ошибок и анализ качества программного обеспечения. Недавние исследования показывают, что текущие методы атрибуции авторства исходного кода могут быть скомпрометированы злоумышленниками, использующими враждебные примеры и манипулирование стилем кодирования. Это требует надежных решений проблемы атрибуции авторства кода. В этой статье мы начинаем исследование по обеспечению надежной атрибуции авторства кода на основе глубокого обучения (DL). Мы предлагаем инновационный фреймворк под названием «Генерация шаблонов надежного стиля кодирования» (RoPGen), который, по сути, изучает уникальные шаблоны стиля кодирования авторов, которыми злоумышленникам трудно манипулировать или имитировать. Основная идея состоит в том, чтобы объединить увеличение данных и увеличение градиента на этапе обучения противников. Это эффективно увеличивает разнообразие обучающих примеров, создает значимые возмущения градиентов глубоких нейронных сетей и изучает разнообразные представления стилей кодирования. Мы оцениваем эффективность RoPGen, используя четыре набора данных программ, написанных на C, C++ и Java. Экспериментальные результаты показывают, что RoPGen может значительно повысить надежность атрибуции авторства кода на основе DL, соответственно снизив в среднем 22,8% и 41,0% успеха целевых и нецелевых атак.

5. Обзор искусственного интеллекта для исходного кода: перспектива диалоговых систем (arXiv)

Автор:Эрфан Аль-Хоссами, Самира Шейх

Аннотация. В этом обзорном документе мы рассматриваем основные методы глубокого обучения, которые использовались в обработке естественного языка (NLP) и исходном коде за последние 35 лет. Далее мы представляем обзор приложений искусственного интеллекта (ИИ) для исходного кода, также известных как Code Intelligence (CI) и обработка языка программирования (PLP). Мы просматриваем более 287 публикаций и представляем таксономию CI, ориентированную на разработку программного обеспечения, помещая каждую из работ в одну категорию, описывающую, как она лучше всего помогает циклу разработки программного обеспечения. Затем мы рассмотрим область диалоговых помощников и их применение в программной инженерии и образовании. Наконец, мы подчеркиваем возможности исследований на пересечении ИИ для помощников по коду и диалогам и представляем будущие направления исследований помощников для разговоров с возможностями CI.