Google предлагает бесплатные наборы метаданных с малым количеством снимков с глубоким обучением AI и алгоритмами машинного обучения для быстрой и эффективной классификации изображений в TensorFlow и PyTorch

Технология / Google предлагает бесплатные наборы метаданных с малым количеством снимков с глубоким обучением AI и алгоритмами машинного обучения для быстрой и эффективной классификации изображений в TensorFlow и PyTorch 2 минуты чтения

Google Pixel 5?



Google имеет объявила о доступности нескольких наборов данных состоящий из разнообразных, но ограниченных естественных изображений. Поисковый гигант уверен, что общедоступные данные будут стимулировать темпы Машинное обучение и искусственный интеллект при сокращении времени, необходимого для обучения моделей ИИ на минимальном объеме данных. Google называет новую инициативу «Бесплатные метаданные», которая поможет моделям ИИ «учиться» на меньшем количестве данных. «Few-Shot AI» от компании оптимизирован для того, чтобы ИИ изучал новые классы только по нескольким репрезентативным изображениям.

Понимая необходимость быстрого обучения моделей искусственного интеллекта и машинного обучения с меньшим количеством наборов данных, Google запустил «Meta-Dataset» - небольшую коллекцию изображений, которая должна помочь уменьшить объем данных, необходимых для повышения точности алгоритмов. Компания утверждает, что, используя методы классификации изображений с несколькими снимками, модели AI и ML получат те же идеи из гораздо меньшего количества репрезентативных изображений.



Google AI анонсирует Meta-Dataset: набор данных для быстрого обучения:

Глубокое обучение для искусственного интеллекта и машинного обучения уже довольно давно растет экспоненциально. Однако основным требованием является наличие данных высокого качества, причем в больших объемах. Большие объемы данных обучения, аннотированных вручную, часто бывает трудно получить, а иногда они также могут быть ненадежными. Понимая риски больших наборов данных, Google объявил о доступности коллекции метаданных.



Через ' Мета-набор данных: набор наборов данных для обучения на нескольких примерах »(Представлены на ICLR 2020 ), Google предложил крупномасштабный и разнообразный эталонный тест для измерения компетентности различных моделей классификации изображений в реалистичной и сложной настройке нескольких кадров, предлагая структуру, в которой можно исследовать несколько важных аспектов классификации нескольких кадров. По сути, Google предлагает 10 общедоступных и бесплатных наборов данных естественных изображений. Эти наборы данных включают ImageNet, CUB-200-2011, Fungi, рукописные символы и каракули. Код общественный и включает блокнот это демонстрирует, как метаданные можно использовать в TensorFlow и PyTorch .



Классификация нескольких выстрелов выходит за рамки стандартные модели обучения и глубокого обучения . Во время тестирования требуется обобщение до совершенно новых классов. Другими словами, изображения, использованные во время тестирования, не были замечены при обучении. При классификации с несколькими выстрелами обучающий набор содержит классы, которые полностью не пересекаются с теми, которые появятся во время тестирования. Каждое тестовое задание содержит комплект поддержки из нескольких помеченных изображений, из которых модель может узнать о новых классах и непересекающемся набор запросов примеров, которые затем предлагается классифицировать.

Набор метаданных - это большой компонент, в котором обобщение модельных исследований на совершенно новые наборы данных , из которых на тренировке не было видно изображений какого-либо класса. Это вдобавок к сложной задаче обобщения для новых классов, присущей настройке обучения с несколькими выстрелами.

Как метаданные помогают глубокому обучению для моделей искусственного интеллекта и машинного обучения?

Meta-Dataset представляет собой крупнейший на сегодняшний день организованный эталонный тест для кросс-наборов данных и классификации изображений по нескольким снимкам. Он также вводит алгоритм выборки для генерации задач различных характеристик и сложности, варьируя количество классов в каждой задаче, количество доступных примеров для каждого класса, вводя дисбаланс классов и, для некоторых наборов данных, варьируя степень сходства между классы каждой задачи.



Meta-Dataset действительно представляет новые проблемы для классификации по нескольким выстрелам. Исследование Google пока носит предварительный характер, и ему предстоит многое изучить. Однако поисковый гигант заявил, что исследователи добиваются успеха. Некоторые из ярких примеров включают использование грамотно разработанных задача кондиционирование , более сложный гиперпараметрическая настройка , чтобы ' мета-базовая линия ’, Который сочетает в себе преимущества предварительного обучения и метаобучения и, наконец, использует выбор функции специализироваться на универсальном представлении для каждой задачи.

Теги гугл