Бизнес/Программирование/Вот как алгоритмы будут развиваться сами

Вот как алгоритмы будут развиваться сами

Google заимствует подход у Дарвина, чтобы совершить сейсмический скачок в области автоматического машинного обучения. Это может положить конец большинству человеческих предубеждений.

  • AutoML-Zero от Google способен создавать совершенно новые алгоритмы с нуля посредством процесса эволюции в дарвиновском стиле.
  • Ученые, работающие на технологического гиганта, считают, что этот скачок в исследованиях автоматического машинного обучения (AutoML) произведет революцию в этой области, открыв возможности машинного обучения для неспециалистов.
  • В прошлом месяце они разместили свою работу на сервере препринтов ArXiv. Это означает, что исследование еще не было рецензировано.

Машинное обучение — это сложно. Алгоритмы в конкретном случае часто либо не работают, либо работают недостаточно хорошо, что приводит к серьезной отладке. И поиск идеального алгоритма — набора правил, которым должен следовать компьютер для выполнения операции, — может оказаться непростой задачей. Вы не можете просто выбрать идеальный алгоритм, если его не существует, а некоторые решения просто непонятны человеческому разуму.

Это означает, что процесс выбора и уточнения алгоритмов итеративный и несколько монотонный. Это идеальный шторм для автоматизации.

Войдите в автоматическое машинное обучение, или AutoML, отрасль исследований, посвященную исключительно методам и процессам, которые автоматизируют машинное обучение, чтобы неспециалисты также могли воспользоваться его преимуществами.

Google считает, что команда специалистов по информатике разработала новый метод AutoML, который может автоматически генерировать наилучший алгоритм для конкретной задачи. Новое исследование изложено в документе, размещенном на сервере препринтов ArXiv. Он также был представлен в научный журнал для рассмотрения и может быть опубликован уже в июне.

Предпосылка звучит так: новая система под названием AutoML-Zero может адаптировать алгоритмы к различным типам задач и постоянно улучшать их посредством дарвиновского процесса эволюции, который уменьшает количество необходимого вмешательства человека. Поскольку люди могут привносить предвзятость в системы — и, таким образом, программировать свои собственные ограничения — это ограничивает результаты, которые вы в конечном итоге получите. Поэтому Google пытается создать сценарий, в котором компьютер может свободно перемещаться и проявлять творческий подход — или , так сказать, принимать красную и синюю таблетки.

Эстебан Реал, инженер-программист из Google Brain, Research and Machine Intelligence и ведущий автор исследования, предлагает следующую метафору:

«Предположим, ваша цель — построить дом. Если бы в вашем распоряжении были заранее построенные спальни, кухни и ванные комнаты, ваша задача была бы управляемой, но вы также ограничены комнатами, которые у вас есть в вашем инвентаре», — говорит он Popular . Механика . «Если вместо этого вы начнете с кирпичей и раствора, тогда ваша работа будет сложнее, но у вас будет больше возможностей для творчества».

Удаление людей и предвзятости

В прошлом исследования AutoML в значительной степени зависели от человеческого участия. Например, поиск нейронной архитектуры, который автоматизирует проектирование нейронной сети, как следует из его названия, опирается на сложные, созданные экспертами слои в качестве строительных блоков для новой нейронной сети. По сути, это закодированные вручную инструкции или программы, которые сообщают компьютеру, что делать.

Напротив, новый AutoML-Zero от Google использует математику, а не компоненты, разработанные человеком, в качестве строительных блоков для новых алгоритмов. Языки программирования — от COBOL до Python и Ruby on Rails — упрощают создание программы. Машины понимают числа, особенно двоичный код, а языки действуют как буфер между программистом и машиной. Таким образом, людям не нужно тратить весь день, разбивая команды на кучу 1 и 0.

Но такой выбор языка и представления в языках программирования позволяет проникнуть предвзятости, говорит Армандо Солар-Лезама, адъюнкт-профессор Массачусетского технологического института (MIT), который не имеет отношения к этой работе. Он возглавляет группу компьютерного программирования Массачусетского технологического института, которая занимается автоматизацией процесса программирования.

Солар-Лезама рассказал Popular Mechanics , что новая статья Google посвящена тому, как далеко вы можете зайти с помощью простого, основанного на математике языка, «чтобы то, что вы обнаруживаете, не было искажено вашим выбором языка». В этом случае предвзятость означает ограничение ваших возможностей.

Возвращаясь к метафоре дома Реала, представьте, что вы строите свой дом из целых комнат, и все, что вы знаете, это римский стиль. «Тогда ваш дом был бы полон колонн, атриумов и имплювий; вы не смогли бы придумать Эмпайр-стейт-билдинг или Сикстинскую капеллу», — говорит Реал. «Если вы используете кирпичи и раствор, то вы не ограничены определенным стилем».

Реал и его соавторы Чен Лян, Дэвид Со и Куок Ле признают, что в программе все еще сохраняется предвзятость, несмотря на все их усилия. Например, даже определенные математические операции, которые они выбрали, могут содержать неявную предвзятость, основанную на ранее существовавших знаниях исследователей об алгоритмах машинного обучения.

Генетические алгоритмы

Чтобы открыть новые алгоритмы, AutoML-Zero использует 100 случайных алгоритмов, созданных с помощью комбинации математических операций. Затем система прокручивает алгоритмы, чтобы найти лучшие из них, которые переходят к следующему шагу, аналогично процессу передачи людьми благоприятных генов с течением времени в игре «выживает сильнейший».

Оттуда алгоритмы выполняют какую-то задачу машинного обучения, например, идентификацию мотоциклов и грузовиков, как вы могли бы сделать в одном из тех тестов RECAPTCHA, которые проверяют, являетесь ли вы роботом. AutoML-Zero использует задачи для оценки эффективности каждого алгоритма в достижении определенной цели, а затем «мутирует» лучшие из них, чтобы начать новый раунд.

Эти новые «дочерние» алгоритмы сравниваются с исходными «родительскими» алгоритмами, чтобы увидеть, стали ли они лучше справляться с поставленной задачей. Процесс постоянно повторяется до тех пор, пока лучшие мутации не выиграют и не попадут в окончательный алгоритм.

В конце концов, система может выполнять поиск по 10 000 возможных моделей в секунду с возможностью пропускать алгоритмы, которые она уже видела. Исследователи использовали небольшой набор данных в качестве прокси для более сложных объемов информации, что сделало работу проверкой концепции.

«ЧЕМ ДЛИННЕЕ ФРАГМЕНТ КОДА, КОТОРЫЙ ВЫ ПЫТАЕТЕСЬ СГЕНЕРИРОВАТЬ, ТЕМ ЛЕГЧЕ ПРОНИКНУТЬ ОШИБКЕ».

Для этого AutoML-Zero использует так называемые генетические алгоритмы, которые существуют с 1980-х годов, но по большей части вышли из употребления, говорит Солар-Лезама. Это потому, что они обычно лучше всего работают в неструктурированных средах, «где больше ничего не работает», и они часто приводят к нечитаемому коду, который трудно реконструировать. Кроме того, они создают очень длинные фрагменты кода.

«Чем длиннее фрагмент кода, который вы пытаетесь сгенерировать, тем легче проникнуть в него ошибке», — говорит Солар-Лезама. «Это может быть разница между фрагментом кода, который делает именно то, что вы хотите, и фрагментом, который не работает, и это может быть один символ. Это общая проблема в синтезе программ».

Тем не менее, генетические алгоритмы в этом случае имеют смысл, потому что вы не хотите ограничивать возможности компьютера.

Проблема с масштабированием

Google уже разработала собственный язык программирования под названием Cloud AutoML , который упрощает обучение моделей машинного обучения с минимальным человеческим опытом. Но AutoML-Zero выглядит как шаг к еще меньшему участию человека.

Однако масштабирование этого метода будет непростой задачей, говорит Солар-Лезама. Поскольку AutoML-Zero использует арифметику, а не языки программирования более высокого порядка, нет никаких инструкций, которые помогли бы системе быстро решить проблему, с которой она столкнулась ранее. Вместо этого ему придется каждый раз изобретать велосипед, что не является оптимальным.

Чтобы решить проблему масштабирования, Солар-Лезама говорит, что исследователи могут взять на вооружение менталитет «разделяй и властвуй» в будущей работе. Отделив одну часть программы от другой, AutoML-Zero может добиться успеха. Кроме того, жизненно важно найти правильный баланс между абстрактной арифметикой в ​​качестве строительных блоков и более существенными инструкциями, которые могут выполнять больше работы, но могут привести к предвзятости.

Если Google масштабирует систему и позволит машинам действительно создавать алгоритмы, это может означать намного более быструю разработку приложений, языковой перевод, обработку видео... всего, говорит Солар-Лезама. Это может даже позволить небольшим разработчикам и малым предприятиям использовать возможности машинного обучения без необходимости нанимать или отдавать на аутсорсинг целую команду специалистов по обработке и анализу данных.

«Возможность найти алгоритм, который хорошо настроен и правильно настроен для конкретного приложения, с которым вы имеете дело… может оказаться очень полезным», — говорит он.

      КОРТНИ ЛИНДЕР, заместитель главного редактораПрежде чем присоединиться к Pop Mech, Кортни была репортером по технологиям в газете своего родного города Pittsburgh Post-Gazette.



      Ниже Вы можете высказаться по теме или оставить свои вопросы - узнайте больше информации!
      9 шагов для решения задачи разработки

      9 шагов для решения задачи разработки
      Против мнения
      Не нравится
      Нейтрально
      Нравится
      Поддерживаю
      Против мнения
      Не нравится
      Нейтрально
      Нравится
      Поддерживаю

      Как новый разработчик, я стараюсь сосредоточиться на создании лучшей работы за наименьшее количество времени. Это, ...
      Аноним - 39
      Тенденции старшего сообщества и городского планирования в 2022 году

      Тенденции старшего сообщества и городского планирования в 2022 году
      Против мнения
      Не нравится
      Нейтрально
      Нравится
      Поддерживаю
      Против мнения
      Не нравится
      Нейтрально
      Нравится
      Поддерживаю

      Ландшафт наших городов и районов формируется на основе привычек и занятий его жителей. Городские планировщики и&nbs...
      Даккар
      Против аккаунта
      Не нравится
      Нейтрально
      Нравится
      Поддерживаю
      Что происходит с вашими данными, когда вы умираете?

      Что происходит с вашими данными, когда вы умираете?
      Против мнения
      Не нравится
      Нейтрально
      Нравится
      Поддерживаю
      Против мнения
      Не нравится
      Нейтрально
      Нравится
      Поддерживаю

      Хорошая новость: ваши данные принадлежат вам. Плохие новости? Это верно только пока вы живы.Что не дает мне сп...
      Самоучка
      Против аккаунта
      Не нравится
      Нейтрально
      Нравится
      Поддерживаю
      После смерти вы можете воскреснуть в виде чат-бота. Это проблема))

      После смерти вы можете воскреснуть в виде чат-бота. Это проблема))
      Против мнения
      Не нравится
      Нейтрально
      Нравится
      Поддерживаю
      Против мнения
      Не нравится
      Нейтрально
      Нравится
      Поддерживаю

      Эксперты по этике говорят, что футуристическая технология может открыть «целую банку червей».Никто не знает, куда мы поп...
      Самоучка
      Против аккаунта
      Не нравится
      Нейтрально
      Нравится
      Поддерживаю
      person Опубликовал(а): Самоучка
      Против аккаунта
      Не нравится
      Нейтрально
      Нравится
      Поддерживаю
      Оцените статью:
      person group filter_1
      Ширина охвата темы
      0
      0
      0
      Глубина
      0
      0
      0
      Оценка автору
      0
      0
      0

      Чтобы увидеть комментарии, или написать свой, авторизуйтесь.

      ВНИМАНИЕ: факты и мнения, высказанные в этой статье, являются личным мнением автора. BeText.ru не несет никакой ответственности за точность, полноту, пригодность или достоверность любой информации в этой статье.