Пекинские инновации Центр учит роботов жить среди нас

chiny24.com 1 месяц назад

Воплотившийся ИИ не может развиваться в вакууме. В то время как большие языковые модели обучаются на текстах из Интернета, гуманоидным роботам нужны данные о физическом мире: гравитация, трение, формы и непредсказуемость человеческой среды. Пекинское городское управление экономики и информационных технологий недавно опубликовало отчет, обобщающий первые четыре месяца деятельности базы данных по сбору данных и обучению роботов в Пекинском центре инноваций гуманоидных роботов. Результаты этого новаторского проекта пролили новый свет на то, как Китай систематически приближается к решению самых больших узких мест в робототехнической промышленности - отсутствие высококачественных данных обучения.

Фабрика данных для человекоподобных машин

Расположенная в районе Шицзиншань, в индустриальном парке Шуган, учебная база занимает площадь почти 5000 квадратных метров. В настоящее время это один из крупнейших и наиболее универсальных центров такого типа в Китае. Почти 10 процентов этой площади занимает специализированная киностудия.

Результаты первых четырех месяцев работы впечатляют. Команда центра собрала более 3 миллионов записей данных внутренних исследований и разработок и сделала доступными более 300 000 записей данных с открытым исходным кодом. Это перевело на десятки тысяч часов высококачественный учебный материал, который уже передан ведущим отраслевым компаниям и научным учреждениям. По оценкам, центр способен генерировать более 6 миллионов точек данных в год, что делает их лидером страны.

Динамические сценарии вместо статических лабораторий

Самой большой проблемой в обучении роботов является так называемая «сценарная фрагментация». Реальный мир полон переменных, и робот, обученный в стерильной лаборатории, часто теряется в естественной среде. Чтобы исправить это, Пекинский центр воссоздал более 30 типичных сценариев из шести ключевых областей:

  • домой,
  • супермаркет,
  • офисы,
  • промышленности,
  • медицины и
  • здравоохранения.

Самое главное, что эти помещения не являются статическими «модельными комнатами». По мнению специалистов Центра, условия освещения, планировка объектов и маршруты передвижения людей могут быть динамически адаптированы в соответствии с потребностями обучающих алгоритмов. Это создает гибкую «фабрику данных». Например, в сценарии «детской комнаты» модель тренера (оператора) управляет роботом с помощью VR-оборудования и датчиков для поворота носка вправо. В другой зоне роботы практикуют изготовление кроватей в моделируемом доме престарелых, а в другой – укладку товаров на полки супермаркетов.

При выполнении этих действий данные в реальном времени собираются на углах соединения роботов, траектории движения, силовой силе и других физических параметрах. Сбор данных для одного простого движения требует от 300 до 1000 повторений, чтобы алгоритм мог обобщить задачу и справиться с ней в будущем в несколько иных условиях.

Борьба за качество и стандартизацию данных

На начальном этапе работы центр столкнулся с проблемой низкого качества данных — уровень квалификации составлял всего около 50 процентов. Это было связано с ошибками в перехвате движения, проблемами с освещением или неточной синхронизацией многих датчиков. Для решения этой проблемы Центр разработал и внедрил строгие стандартные процедуры сбора, маркировки и мониторинга качества данных. В результате текущий уровень соответствия и удобства использования стабилизировался более чем на 95 процентов.

Деятельность центра решает еще одну актуальную проблему отрасли: языковой барьер между разными роботами. Различные модели имеют разные сенсорные системы, степени совместной свободы и интерфейсы управления, что делает данные, собранные одним роботом, часто бесполезными для другого. Стандартизация процессов в пекинском центре позволяет осуществлять параллельный сбор данных роботами различной конструкции (сейчас в центре более 120 машин). Для малых и средних робототехнических компаний использование ресурсов центра означает экономию затрат на сбор данных не менее 50 процентов, что значительно снижает порог входа.

Третий этап развития промышленной экосистемы

В конце марта 2026 года была официально открыта третья фаза развития Пекинского центра данных о человекоподобных роботах (Embodied AI). В то же время был объявлен промышленный альянс «Beijing Shijingshan Embodied AI Data Element Industry Alliance», состоящий из более чем 40 организаций: правительственных учреждений, технологических компаний, университетов и научно-исследовательских институтов.

Этот альянс направлен на объединение ресурсов вычислений, моделирования и обработки данных. Центр больше не ограничивается поставками «сырья». Он работает над фундаментальными технологиями, такими как общая система управления движением, которая была доступна с открытым исходным кодом. Это дает исследователям и компаниям прочную стартовую базу, избегая необходимости «переосмысления». Центр также завершил первый раунд рыночного финансирования, привлек более 700 миллионов юаней (около 360 миллионов злотых) от государственных фондов и стратегических инвесторов, таких как Baidu.

Шаг к миллиону часов

Действия Пекина показывают четкую смену парадигмы. Роботизированная индустрия понимала, что конкурентное преимущество будет определяться не только идеальным механиком (аппаратным обеспечением), но прежде всего качеством «мозга» робота, обученного соответствующим данным (программному обеспечению и дате). Реальные физические данные от машин, работающих в реальном мире (так называемые данные из первых рук), незаменимы при компьютерном моделировании. К ним относится «физическая интуиция» — информация об обратной связи, трении или неожиданном вмешательстве.

Пекинский центр инноваций в области гуманоидных роботов в настоящее время преследует амбициозную цель: собрать глобально беспрецедентную базу данных о миллионах часов высококачественных учебных данных. Именно такие инициативы, сочетающие в себе огромные инвестиции в инфраструктуру, стандартизацию процессов и сотрудничество всей экосистемы, должны стать основой, на которой Китай планирует построить свое доминирование в грядущую эру интеллектуальных отечественных и сервисных машин.

Источник:

  • CCTV Новости (news.cctv.cn) — «300""人"
  • Securities Times (stcn.com) — «”国京 人”天”人”中”,”»
  • China Industry News (cinic.org.cn) — «Активистский " " " " " " " " " " " " " " " " " " " " " " " " " " " " " " " " " " " " "
  • Pandaroid News (pandaroid-info.com) - \\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\
  • Hanjoong Global Journal (hanjoongglobal.com) —
  • Рекордный Китай (recordchina.co.jp) - 中国 大の人
  • Gasgoo Auto News (autonews.gasgoo.com) — «Пекин: определение «китайской базы» индустрии гуманоидных роботов»

Лешек Б. Гласс

Электронная почта: [email protected]

© www.chiny24.com

Читать всю статью