Обзор Microsoft Research Summit

8 min readOct 22, 2021

Сегодня как никогда существует потребность в инновационных научно-технологических прорывах, которые помогут человечеству противостоять глобальным вызовам. Это стало лейтмотивом масштабного мероприятия Microsoft Research Summit, которое прошло с 19 по 21 октября 2021 года. Обзор мероприятия дан ниже.

Виртуальная ассамблея собрала около 300 ведущих исследователей, инженеров, ученых и отраслевых экспертов, разделяющих видение Microsoft, подразумевающее решение мировых проблем с помощью интеграции опыта и цифровой трансформации.

Саммит, по задумке Microsoft, стал площадкой для демонстрации наиболее актуальных тенденций в исследованиях в области компьютерных наук, которые будут определяющими в следующем десятилетии и позднее, и того, как эти будущие трансформирующие технологические прорывы могут помочь в противостоянии самым серьезным задачам, стоящим на глобальном уровне.

Об этом говорили на одном из центральных пленарных заседаний форума с участием руководства Microsoft, в том числе, генерального директора Сатья Наделла. В течение 30 лет исследовательская команда Microsoft Research работала в разных дисциплинах, учреждениях и географических регионах, создавая новые технологии как для самой компании, так и для общества. При этом одно из наиболее важных достижений Microsoft Research- это коллаборация, «установление партнерских отношений с научно-технологическими сообществами по всему миру», как отметил в своем выступлении Наделла.

Более 150 сессий Саммита, объединенные в более двух десятков треков, были посвящены самым актуальным направлениям современных исследований, которые могут принести значительную пользу людям во всем мире, и охватывали широкий спектр тем, включая: машинное обучение, облачные вычисления, кибербезопасность, сокращение выбросов СО2, здравоохранение и биомедицину, новые форматы работы, каузальное машинное обучение.

В этом резюме Управление исследований и инноваций представляет краткий обзор некоторых исследований, которые представили участники Microsoft Research Summit, с разбивкой по направлениям.

Будущее поиска и рекомендаций

Поиск и рекомендации являются основой для многих продуктов Microsoft, таких как Microsoft 365, Microsoft Azure и Microsoft Bing. Они имеют решающее значение для растущего спектра отраслей, таких как биомедицина, розничная электронная коммерция и юриспруденция. Во время Саммита этим вопросам был посвящен отдельный трек.

Кроме решений Microsoft в этой области, связанных с универсальными настройками поиска и распознаванием потребностей пользователей, был представлен ряд продуктов сторонних разработчиков. К примеру, Техасский университет рассказал о новой системе компьютерного зрения для модной индустрии. Идея состоит в том, чтобы путем анализа большого объема мультимодальных данных показать, как культурные факторы и мировые события динамически влияют на то, что носят люди во всем мире, и подготовить соответствующие рекомендации. Принстонский университет презентовал новый эффективный инструмент обработки естественного языка DensePhrases для поиска фраз. Свои недавние разработки по интеграции NLP в поиск научных работ представил Калифорнийский университет в Беркли, который, среди прочего, по нескольким проектам сотрудничает с Microsoft Research.

Инструменты на базе ИИ для разработчиков

Microsoft придерживается широкого, сквозного взгляда на разработку программного обеспечения: оно состоит не только из написания кода и тестирования, но и из анализа кода и комплексирования доработок. Конечная цель этого процесса- предоставление высококачественного ПО клиентам. Данный трек был посвящен решениям, в которых ИИ автоматизирует большую часть утомительных рутинных задач, связанных с разработкой программного обеспечения. Такой шаг позволит избежать ошибок при их выполнении, а также повысить производительность. При этом разработчики ПО смогут сосредоточиться на творческих аспектах их работы.

В ходе трека был представлен ряд подобных решений. Инновационный ИИ-инструмент GitHub Copilot, разработанный GitHub и OpenAI, призван помочь пользователям Visual Studio Code путем автозаполнения кода: по сути, Copilot способен написать код вместо человека. Microsoft, со своей стороны, показал на мероприятии как применять IntelliCode — вспомогательное средство, используемое во время проверки кода для выделения изменений, требующих внимания. Участники сессий трека также ознакомились с примерами решений, направленных на ускоренное изучение языков программирования.

Снижение уровней выбросов СО2

В прошлом году Microsoft объявил, что намерен обеспечить экологическую безопасность своей деятельности к концу десятилетия. Тема борьбы с глобальным потеплением стала одной из ключевых на Саммите. В Microsoft убеждены, что мир должен создать экономику с нулевыми выбросами углерода к 2050 году. Это действительно планетарный вызов, проблема, которую нужно решать срочно и на глобальном уровне.

Как считают в Метеобюро США, немаловажную роль в данном процессе могут сыграть климатические модели, которые обеспечивают основу для прогнозирования рисков, руководства адаптационными решениями и установления целей по смягчению последствий. Однако для работы подобных моделей требуется на несколько порядков больше вычислительной мощности, чем обеспечивают современные системы, а, кроме того, передовые модели будут генерировать огромные объемы данных. Преодоление этих проблем и наиболее эффективное использование ограниченных людских, вычислительных и финансовых ресурсов требует нового уровня международного сотрудничества и взаимодействия.

Во всем мире предпринимаются усилия, связанные с применением вычислительной инфраструктуры и интеллектуальной огневой мощи для достижения нулевых уровней выброса СО2. Так, в китайском Университете Цинхуа разработали нейросеть DNN-CO2, которая точно прогнозирует концентрацию углекислого газа в атмосфере. В численной модели удалось устранить ошибки расчетов концентрации, связанные с различными атмосферными процессами, вызванными как антропогенными, так и природными источниками.

Национальный университет Сингапура на Саммите представил экономически эффективный подход к прогнозированию лесных пожаров в Индонезии на основе снимков ДЗЗ. Основанный на машинном обучении, метод позволяет вычислить негативный вклад пожаров в увеличение выбросов СО2.

Японский Токийский университет работает над новым способом хранения больших объемов СО2 в виде газогидрата на большой глубине. Команда разрабатывает масштабный симулятор резервуара с использованием нейронных сетей, обученных на большом количестве данных.

В самом Microsoft с помощью передовых алгоритмов исследуют пути трансформации угольных электростанций в Китае. Согласно плану, в этой стране около 4600 таких установок должны быть модернизированы в период с 2025 по 2060 год, чтобы стать полностью углеродно-нейтральными. Это довольно сложная задача, поскольку все станции разные и их модификация требует обработки больших объемов данных. В этом готовы помочь разработчики Microsoft.

Здравоохранение и биомедицина

Корпорация Майкрософт изучает и внедряет технологические достижения в сотрудничестве с партнерами по исследованиям по всему миру в области здравоохранения, биологии, биотехнологий и точной медицины. В этом треке были представлены результаты прорывных работ в этой сфере, которые были достигнуты благодаря возможностям ИИ: он совершил революцию в обработке, интерпретации и применении биологических и медицинских данных. Пожалуй, данный трек получился наиболее насыщенным на Саммите.

Команда Microsoft Research представила ряд своих достижений в сфере применения ИИ в здравоохранении и биомедицине. Так, например, многообещающее направление — это использование ИИ для ускорения открытия лекарств. В Microsoft представили два алгоритма, разработанных специально для этой цели: один прогнозирует взаимодействие между препаратом и мишенью, второй оценивает межмолекулярные взаимодействия.

В сотрудничестве с Adaptive Biotechnologies исследователи Microsoft генетически секвенировали рецепторы Т-клеток около 50 тыс доноров, в результате получив миллиарды уникальных рецепторов Т-клеток. Наличие этих генетических последовательностей поможет в диагностике заболеваний и, в конечном счете, в «чтении» иммунной истории человечества.

В Колумбийском университете реализуют проект исследования эндометриоза CitizenEndo. Ученые разработали уникальную стратегию фенотипирования этого заболевания путем мониторинга и машинного анализа данных реальных пациентов.

Выступающие в рамках сессий трека отмечали, что исследования в области вычислительной биологии и здравоохранения выигрывают от интеграции данных и унификации моделирования. Для многих приложений машинного обучения в этих областях требуется сбор больших объемов данных, что недоступно для отдельных исследовательских сообществ. Участники сошлись во мнении, что крайне важно уделить в этой сфере особое внимание созданию междисциплинарных команд и формированию комплексных навыков, совместной генерации наборов экспериментальных данных и разработке вычислительных подходов.

Будущее облачных сетей

Microsoft Research уже более десяти лет находится на переднем крае сетевых инноваций для облака в партнерстве с Azure. Вместе с тем, появление 5G создало неожиданный, беспрецедентный сдвиг для телекоммуникаций, а также для связки между телекоммуникациями и вычислениями.

Будущее закладывается в стратегии Azure of Operators (AFO), направленной на то, чтобы привести телекоммуникационную отрасль в Azure в качестве неотъемлемого компонента ее глобальной инфраструктуры. В Microsoft уверены, что сближение этих двух массивных отраслей неизбежно и что этот путь приведет к появлению новые возможностей.

Глубокое обучение и масштабные модели ИИ

Microsoft Research уделяет особое внимание повышению эффективности вычислений и обработки данных в крупных моделях. В целом, появление BERT, Turing и GPT-3 преобразовало парадигму ИИ. По мере того, как модели растут в размерах и возможностях, а спектр соответствующих приложений расширяется, их также становится все труднее развертывать и эффективно внедрять. В ходе сессий трека были представлены последние достижения в области предварительно обученных моделей, а также обсуждено будущее этого исследовательского рубежа.

Так, Университет Карнеги-Меллона предлагает решение, направленное на преодоление разрыва между обработкой естественного языка и инструментами компьютерного зрения. Исследователи пытаются решить проблему создания единой модели, которая могла бы осуществлять процессинг длинных текстовых предложений и визуальных источников, то есть мультимодальной системы, действующей как человеческий мозг.

В рамках проекта Yale Spider исследователи из Йельского университета разработали три новых набора данных для перевода предложений на естественном языке в запросы по базам данных. Spider представляет собой коллекцию из 10181 вопросов на естественном языке и 5693 соответствующих запросов к базам данных из 138 доменов.

Новые форматы работы

Пандемия изменила правила игры в трудовой сфере. То, где и когда мы работаем, как мы взаимодействуем — уже никогда не будет прежним. Виртуальные мероприятия и гибридные встречи стали неотъемлемой частью нашей работы. Новые разработки в этой области — тема этого трека. В Microsoft признают, что существующие системы для видеоконференций и обмена сообщения были не готовы принять на себя удар во время пандемии. В результате началось бурное развитие подобных платформ, таких как Microsoft Teams. Но они пока далеки от совершенства. В перспективе в технологиях смешанной и виртуальной реальности необходимо предусмотреть инструментарий для формирования уникальной роли для каждого участника процесса, как подключенного дистанционно, так и присутствующего очно.

Отдельного внимания заслуживают решения, связанные с обеспечением производительности и формированием комфортного базиса для работы в новых условиях. Например, Университет Клемсона разработал собственную методику проведения дистанционной адаптации разработчиков программного обеспечения и подготовки студентов к гибридной работе, в основе которой лежат коммуникационные цифровые инструменты.

В Microsoft отмечают, что использование гибридных рабочих сред неизбежно связано с формированием основ для сохранения целостности коллективов, включая создание новых систем оценок сотрудников, работающих дистанционно, и обеспечение вовлеченности работников через ознакомление с нормами, культурой, целями и приоритетами организации. Генерация эффективных систем гибридной работы требует синергии автоматизированных инструментов принятия решений и знаний в области социальных наук.

Обучение с подкреплением и робототехника

Ключевым исследовательским проблемам, связанным с внедрением обучения с подкреплением, был посвящен на Саммите отдельный трек. Разработки в этой сфере оказывают значительное влияние на общество через системы, которые вносят реальные и ощутимые изменения в наш мир. В Microsoft исследуют новые подходы, с том числе машинное обучение и обучение с подкреплением, которые помогут в моделировании поведения ИИ таким образом, чтобы оно было максимально похоже на человеческое.

В качестве примера можно привести проекте Microsoft Research Project Dexter, в котором изучаются возможности достижения универсальности роботизированных манипуляторов с помощью обучения с подкреплением. Исследовательская программа фокусируется на анализе обобщенных представлений визуальных, тактильных и проприоцептивных данных, а также на подходах к обучению с подкреплением и имитации, в которых в полной мере применяются эти комплексные знания вкупе с прочей информацией. Такой подход позволяет достичь практически приемлемой эффективности выборки.

Университет Торонто представил свою работу, выполненную в сотрудничестве с Microsoft Research, по созданию нейронных шахматных движков, которые могут прогнозировать поведение человека на разных уровнях мастерства. А Университет Джорджии рассказал о своем подходе к обеспечению безопасности решений обученных агентов. Исследователи для этой цели предлагают использовать новый алгоритм SAILR, в котором механизм вмешательства, основанный на функциях преимуществ, призван обеспечит безопасность агента на протяжении всего обучения и оптимизирует политику агента.

Участники трека также обсудили применение глубокого обучения для подготовки роботизированных систем для промышленного применения.

Ответственный ИИ

Проблеме несправедливости или ненадежности выводов, к которым могут приходить интеллектуальные вычислительные системы, на Саммите посвятили отдельный трек. На нем были рассмотрены исследования, связанные с созданием ответственных систем ИИ.

Команда нескольких подразделений Microsoft представила набор инструментов Responsible AI Toolbox. Он был создан с двумя намерениями: ускорить жизненный цикл разработки систем машинного обучения, в которых реализованы принципы ответственного ИИ, а также стать основой для сотрудничества при проведении соответствующих исследований. Этот набор инструментов может быть использован для оценки моделей через объектив ответственного ИИ и для анализа данных для принятия причинно-следственных решений с целью выявления действий, которые могут повлиять на результаты в реальном мире.

Кроме того, исследователи из Microsoft Research и Комитета Aether по этике ИИ разработали инструментарий Human-AI eXperience для создания ориентированных на человека технологий ИИ. Целостный подход к решению проблемы ответственности ИИ позволил сформировать систему, которая поможет создателям ИИ принимать продуманные и ориентированные на человека решения при разработке своих продуктов с помощью технических достижений в алгоритмах и моделях.

Каузальное машинное обучение

Данный трек конференции посвящен двум основным вопросам каузального машинного обучения — как машинное обучение может стать более функциональным при помощи построения причинно-следственных связей и как алгоритмы логического вывода могут стать более эластичными и применимыми при использовании машинного обучения. Также в рамках трека обсуждали проблемы приватности и безопасности данных, используемых для обучения моделей.

В рамках трека прошла панельная дискуссия о применении каузального машинного обучения с участием представителей Стэнфордского и Калифорнийского университетов, а также Университета Монреаля. В рамках этой и других дискуссий участники предположили, что каузальное машинное обучение — основа предстоящей революции в области искусственного интеллекта. Оно позволяет давать точные предсказания, предлагать эффективные решения.

Обзор Microsoft Research Summit

Written by Albert Efimoff