Microsoft перетворює камеру в датчик глибини

На що проходить у Ванкувері конференції з комп'ютерної графіки SIGGRAPH група дослідників з Microsoft Research представила оригінальний спосіб перетворити просту веб-камеру або камеру смартфона в датчик глибини, аналогічний за функціональністю сенсора Kinect.

Схожий проект Google Tango підняв функціональність гаджетів на новий рівень і сильно зміцнив позиції компанії на мобільному ринку. За допомогою смартфона буквально за одну-дві хвилини стала можлива тривимірна оцифровка будь-яких об'єктів і навіть сканування приміщень. Тепер і в Microsoft знайшли спосіб навчити звичайні камери працювати в 3D.

Модифікована Microsoft LifeCam працює як датчик глибини (фото: Sean Fanello).

У сучасних камерах використовуються CMOS-матриці п'яти різних типів, але при цьому всі вони чутливі до ближнього інфрачервоного світла. Тому в них зазвичай встановлений ІК-фільтр, що зменшує засвічення.

Контролер Microsoft Kinect позбавлений такого фільтра, оскільки використовує ІК-підсвічування для визначення меж об'єктів. Їх стереоскопічну проекцію і точність розпізнавання рухів забезпечує пара сенсорів, але в більш простих задачах можна обійтися і одним.

Для демонстрації концепції група на чолі з Шоном Райаном Фанеллі (Sean Ryan Fanello) внесла зміни в конструкцію Microsoft LifeCam. Навколо об'єктива було встановлено зовнішнє кільце з ІК-світлодіодами, вбудований інфрачервоний фільтр знаходиться на відстані, а замість нього встановлено інший - блокуючий світло у видимій частині спектру.

Перетворення камери смартфона в 3D-сканер (фото: research.microsoft.com).

В результаті виконаних маніпуляцій камера обзавелася підсвічуванням, але стала працювати тільки в ІК-діапазоні. Як бачите, апаратна модифікація для цього потрібна була досить проста. Головний же секрет роботи криється в алгоритмах машинного навчання.

Бета-версія мобільного застосування інтерпретує дані від модифікованої камери на льоту, отрісовивая тривимірну модель об'єкта перед нею і фіксуючи всі його рухи.

Розробники пояснюють, що для визначення відстані використовується зміна інтенсивності відбитого світла та інших фізичних величин. Сама відображає здатність поверхонь залишається незмінною, але ефективність підсвічування падає зі збільшенням дистанції. Тому в міру руху об'єкта змінюється не тільки його кутовий розмір але і загальна яскравість.

Розпізнавання рухів зі швидкістю 220 FPS (фото: Microsoft).

Спрощено кажучи, об'єкти виглядають більш яскравими коли знаходяться ближче до масиву ІК-світлодіодів і тьмяніють у міру віддалення від них. Крім веб-камери для тестів використовувався смартфон Samsung Galaxy Nexus. Технології машинного навчання задіяли для того, щоб навчити програму відрізняти маленьку руку поблизу від великої руки на видаленні.

Поки демонстраційний екземпляр не може похвалитися «всеїдністю» через вузького спектра і єдиного сенсора. Він добре оцифровує піднесену руку, розпізнає обличчя і реагує на міміку, але програма збивається при аналізі різних предметів. Відбувається це через їх різної відбивної здатності (альбедо) і температури.

Передбачається, що нові смартфони та інші мобільні пристрої будуть оснащуватися парою камер, як мінімум одна з яких зможе виконувати функції датчика глибини.

Жестової управління на прикладі гри Fruit Ninja (фото: Microsoft).

Ключова ідея групи Райана полягає в тому, щоб забезпечити всім зацікавленим людям більш простий спосіб оцифровки в обсязі і розробки 3D-додатків. Замість установки пари дорогих спеціалізованих сенсорів така проста конструкція знизить витрати на виготовлення бюджетних версій смартфонів і інших гаджетів з підтримкою тривимірної оцифровки.

Зараз прототип здатний вимірювати руху людини зі швидкістю 220 кадрів в секунду. На конференції було продемонстровано, що такого швидкодії досить для безконтактного (жестової) управління смартфоном. Набирати текст в повітрі так поки не вийде. Однак такі дії, як прийом дзвінка, масштабування і перегортання сторінок, навігація по карті і навіть гра у Fruit Ninja відбуваються приблизно з тією ж точністю, що і при торканні екрану.

джерело

13.09.2011
Редизайн сайта
В 2011 году был проведен редизайн сайта нашей компании и его запуск в сеть Интернет. Услуги редизайна сайта и его продвижения оказала нам дизайн-студия Web Skill.
все новости
ОДО "Машиностроительный завод "БУРАН"© 2007-2011 | Все права защищены