Как и все в наши дни, архитекторы хотят использовать машинное обучение. Они хотят, чтобы машинное обучение использовалось для проектирования зданий, упрощения работы с документацией, предоставления результатов моделирования в реальном времени и закрытия цикла обратной связи между проектированием и проектированием. К сожалению, у архитекторов есть проблема с данными.

Давай вернемся. Разве архитекторы не чувствуют, что тонут в данных? В конце концов, практика BIM (информационных моделей зданий) включает трехмерную геометрию вместе с метаданными, представляющими все, от выбора материалов до анализа окружающей среды и пространственных отношений. Можно утверждать, что проекты современной архитектуры в той же мере связаны с управлением данными, как и с проектированием чего-либо. И все же, за пределами уровня проекта, когда дело доходит до крупномасштабных усилий по компиляции архитектурных данных, ничего особенного не произошло.

В областях, где машинное обучение добилось наибольших успехов - распознавание изображений, обработка естественного языка и т. Д. - доступны многочисленные и отличные наборы данных для тестирования. Подумайте о MNIST. А в областях, где машинное обучение показывает новые перспективы, таких как распознавание и обработка трехмерных фигур, мы уже видим все более крупные наборы данных для тестирования. Наборы данных эталонных тестов способствуют прогрессу, поскольку исследователи могут систематически тестировать свои алгоритмы на соответствие существующим стандартам (даже Kaggle можно рассматривать в этом свете как способ побудить специалистов по данным продвигать свои модели дальше).

Наборы данных 3D

Рассмотрим усилия сообщества компьютерной графики по решению проблемы данных. Лишь в последние несколько лет машинное обучение на основе 3D-данных стало казаться управляемым, с новыми методами, большей вычислительной мощностью и, конечно же, лучшими данными. Теперь и TensorFlow, и PyTorch имеют модули геометрии / графики, которые содержат реализации новейших алгоритмов hot-off-the-arXiv для обучения графов и многообразий. Так что насчет данных?

Наряду с этим было предпринято несколько попыток собрать данные, которые можно использовать для развития области машинного обучения геометрических структур. Здесь усилия разделяются на две категории: наборы данных на основе графиков и наборы данных на основе геометрии или сетки. Категория, основанная на графах, уже хорошо освещена, потому что на самом деле очень много данных естественным образом закодированы в графах (социальные сети, базы данных цитирования, молекулярные структуры и т. Д.). Категория геометрии развивается медленнее, хотя в Интернете появляется все больше и больше репозиториев геометрии с открытым исходным кодом (в основном в области 3D-печати). Вот сводная таблица различных репозиториев 3D-геометрии:

ABC Dataset, в частности, представляет собой большую и открытую базу данных, состоящую из моделей САПР, взятых из общедоступной коллекции Onshape, облачного инструмента, в основном используемого для проектирования и разработки продуктов. Точно так же Thingi10K - это меньший набор данных, собранный из Thingiverse, онлайн-сервиса 3D-печати.

Архитектурные наборы данных

Хотя наборы данных для 3D-геометрии прошли долгий путь, мы можем спросить, подходят ли эти наборы данных для архитектурных исследований. Даже в геометрических задачах типы сеток, создаваемых архитекторами, обычно отличаются от сеток, созданных для целей 3D-печати или разработки продуктов. В архитектурной среде элементы сетки, такие как грани, могут представлять построенные элементы, такие как окна, двери или фасадные панели. Совпадающие точки, линии или плоскости являются обычным явлением, потому что мы можем думать о построенных структурах как о не многообразных (в качестве простого примера рассмотрим здание, представленное в виде прямоугольной призмы, разрезанной на этажи). Это заставляет меня задаться вопросом: как бы выглядел хороший набор геометрических данных для изучения архитектуры?

Конечно, было множество примеров создания моделей поэтажных планов с использованием машинного обучения. Это были интересные исследования, которые послужили хорошей площадкой для проверки вопроса о том, может ли машинное обучение быть интересным для архитекторов (ответ: да!). Но если машинное обучение действительно будет полезно архитекторам, ему нужно будет выйти за рамки планов этажей или компоновки мебели, и нам нужно будет выйти за рамки этих базовых наборов данных.

Типом набора данных, который мы могли бы рассмотреть, были бы полные модели BIM. В этом случае все геометрические соображения по-прежнему применяются вместе со слоями богатых метаданных, закодированных в модели. Следующим шагом этого процесса будет набор данных о реальных условиях, вероятно, в форме данных сканирования. И, наконец, мы могли собирать показатели производительности здания, такие как потребление энергии и т. Д., С целью сравнения их с более ранними результатами моделирования. При правильном анализе этот тип набора данных может быть невероятно мощным для предоставления информации на этапе проектирования о производительности и результатах строительства.

К сожалению, существующие наборы архитектурных данных остаются небольшими. Проект DURAARK (Долговечные архитектурные знания) был одной из попыток формализовать методологию создания обширного набора данных, состоящего из моделей BIM с наложенной на него информацией об исполнении. Акцент был сделан на долговечности архитектурных данных, а целью было долгосрочное сохранение данных на этапе проектирования, в процессе строительства, использования, ремонта и за его пределами. Хотя потенциальная польза от таких усилий очевидна, фактический набор данных, полученных в рамках этого проекта, состоит только из 49 моделей IFC. Что потребуется, чтобы собрать больше данных, чтобы действительно создать полезный набор данных для машинного обучения, анализа и других приложений?

В MESH мы недавно вели переговоры с крупной архитектурной практикой, которая хотела использовать машинное обучение для ускорения технико-экономических обоснований. Они проводили эти исследования в течение десятилетий и собрали значительный набор данных. Им было интересно подумать, может ли ML пролить свет на то, что делает здания, над которыми они работали, своими. Хотя это был бы интересный проект, мы пришли к выводу, что, несмотря на наличие тысяч подробных моделей, на самом деле у них может не хватить данных для извлечения значимых выводов. Когда их спросили, рассматривают ли они возможность объединения своих данных с данными другой фирмы, они ответили нет (больше похоже на ужасное никогда !!). Но пока фирмы не захотят открыть свои репозитории, кажется маловероятным, что наборов данных, собранных отдельными подразделениями, будет достаточно.

Архитектура и изменение климата: необходимость в дополнительных данных

Если вы еще не уверены, что нам нужны консолидированные усилия для создания более крупных, богатых и лучших наборов данных для архитектурного анализа и проектов машинного обучения, позвольте мне добавить еще одну причину: изменение климата. На секторы строительства и строительства зданий вместе взятые могут приходиться более 40% общих прямых и косвенных выбросов углерода. Чрезвычайно важно, что этот спрос на энергию растет из-за роста строительства в развивающихся странах, увеличения общей площади этажа и увеличения использования устройств, потребляющих энергию. Важно, чтобы архитекторы и отрасль AECO в более широком смысле срочно и основательно взялись за решение этой проблемы.

Как больше данных может помочь в решении проблемы изменения климата? Проще говоря, чем больше у нас данных, тем больше статистических взаимосвязей мы можем наблюдать (например, взаимосвязь между геометрией конструкции и использованием энергии) и тем более правильные решения мы можем принимать. Если мы сможем помочь архитекторам использовать эту информацию и принимать более обоснованные решения на ранних этапах планирования проекта, у нас может быть небольшая надежда на достижение некоторых из высоких целей, например, Архитектуры 2030.

Давай сделаем это вместе

Вряд ли мне кажется моим местом пытаться убедить архитекторов «все просто ладить», в конце концов, я всего лишь математик. Но со стороны, я бы хотел увидеть способ сломать небольшую разобщенность архитектурной индустрии, чтобы объединить нашу геометрию и наши модели значимым образом, чтобы сдвинуть дисциплину и землю к лучшему. , более экологичный дизайн.

Этот пост был написан как часть исследования для презентации на технологическом симпозиуме AEC в Нью-Йорке в 2019 году. Резюме наборов данных для трехмерной геометрии было вдохновлено докладом Циннан Чжоу из Adobe Research.