Amazon отпугивает грабителей, Google имитирует голоса, а Snapchat возвращает в детство

Чему еще научили ИИ на этой неделе?

Maryna Hlaiboroda

Published in

Hey Machine Learning

5 min readMay 17, 2019

Смарт-динамики Amazon Echo теперь могут защищать дома от грабителей

Компания Amazon оснастила все умные динамики Echo новой функцией, которая должна обезопасить дома пользователей от проникновения в их жилища грабителей, пока те отсутствуют.

Чтобы воспользоваться функцией, которую назвали Guard, пользователю достаточно перед уходом из дома сказать «Alexa, I’m leaving», после чего динамик переходит в режим мониторинга. В этом режиме цифровой помощник анализирует все нетипичные звуки, например, звук битья стекла.

Услышав нечто подобное, ассистент отправляет пользователю уведомление с 10-секундным аудиофайлом. Если к динамику подключена видеокамера, помощник выведет на экран смартфона прямую трансляцию из дома.

Кроме этого, Guard может отпугнуть грабителей, если доверить ей управление интеллектуальным освещением дома. Так, если Alexa заподозрит что в доме есть кто-то посторонний, она начнет включать свет в отдельных комнатах, создавая видимость присутствия хозяев. При этом, помощник будет делать это не в случайном порядке, а используя паттерны поведения пользователей для более реалистичной имитации.

Также Guard может вызывать полицию. Однако эта функция доступна лишь пользователям, у которых установлена охранная сигнализация от Amazon Ring или ADT.

CNBC

В Snapchat появились фильтры, позволяющие изменить пол или стать младенцем

Социальная сеть Snapchat создала новые фильтры, базирующиеся на нейронных сетях, которые в режиме реального времени могут сделать пользователя похожим на младенца или изменить его пол на противоположный.

Первый фильтр делает человека похожим на ребенка за счет округления и увеличения щек, а также расширения глаз.

Некоторые пользователи также поэкспериментировали с героями нашумевшего сериала «Игра престолов».

StayHipp

Google представил переводчик, имитирующий голос пользователя

15 мая 2019 года технологический гигант Google представил новую сквозную модель перевода речи из одного языка на другой — Translatotron.

Разработанный инструмент функционирует не так, как большинство подобных приложений, которые сперва преобразовывают речь в текст и потом с ним взаимодействуют. Translatotron напрямую переводит голос говорящего на другой язык, за счет чего работает быстрее и с меньшим количеством ошибок. Также новая модель способна имитировать голос пользователя, сохраняя все особенности речи.

В своем блоге Google пишет, что Translatotron базируется на сетевой модели «последовательность-последовательность». Она принимает спектрограммы источника в качестве входных данных и генерирует новые спектрограммы уже на целевом языке. Это позволяет инструменту работать на порядок быстрее, с меньшей вероятностью возникновения ошибок и потерь.

Ознакомиться с примерами работы переводчика можно на странице проекта.

Engadget

Американцы автоматизировали лесопилку с помощью ИИ

Инженеры компании Lucidyne из Корваллиса, штата Орегон, разработали систему сканирования лесоматериалов GradeScan с использованием алгоритмов искусственного интеллекта для обнаружения возможных изъянов на деревянных досках.

GradeScan способна принимать древесину на скорости 56 км/ч и сканировать две доски в секунду для поиска более чем 70 дефектов, таких как сколы и следы огня. Само устройство состоит из металлического шкафа, в котором расположена вся электроника, рентгеновский дефектоскоп, конвейер и фотокамеры.

Кроме этого, система умеет определять непригодную древесину для дальнейшей обработки, а также с точностью до миллиметра выделять способ обрезки доски, чтобы сберечь как можно больше качественного материала.

Алгоритм ИИ обучали на датасете из сотен тысяч фотографий досок из 16 типов деревьев. При этом, команда из экспертов по древесине вручную оценивали и размечали все изображения.

Тестирование GradeScan показало, что его использование на 47% ускоряет процесс анализа досок и позволяет сберечь до трети качественной древесины.

NeuroHive

Полицию Нью-Йорка обвинили в злоупотреблении системой распознавания лиц

Исследователи Юридического центра Джорджтауна по вопросам конфиденциальности и технологий (CPT) опубликовали отчет, в котором было обнаружено широкое распространение злоупотребления системой распознавания лиц Департаментом полиции Нью-Йорка, включая измененные изображения и фотографии невиновных. Так, в одном из случаев, офицеры загрузили в систему распознавания лиц фотографию актера Вуди Харрельсона. По словам свидетеля, именно на него был похож подозреваемый. В результате проверки было найдено совпадение и подозреваемого задержали за мелкую кражу.

«Ставки в уголовных расследованиях слишком высоки, чтобы полагаться на ненадежные или неправильные данные», — пишет в докладе старший юрист CPT Клэр Гарви.
«К сожалению, зависимость полицейских департаментов от сомнительных фотографий кажется слишком распространенной».

В более сложных случаях программное обеспечение для редактирования изображений можно использовать для манипулирования фотографией, чтобы повысить вероятность совпадения. В одной из обучающих презентаций рекомендуется использование техники «устранения выражения лица», при которой субъект с открытым ртом редактируется в нейтральное выражение лица. Важно отметить, что это может означать вставку в изображение глаз или губ, что может непредсказуемым образом повлиять на алгоритм сопоставления.

В комментарии журналистам The Verge представитель полиции не оспаривал какие-либо конкретные претензии в отчете, но подчеркнул следственную ценность распознавания лиц.

«Полиция Нью-Йорка постоянно производит переоценку существующих процедур и в соответствии с ними пересматривает протоколы распознавания лиц», — заявил детектив Дениз Морони.
«Никто никогда не был арестован на основании одного лишь результата распознавания лица. Как и в случае с любыми уликами, всегда необходимо дальнейшее расследование для выявления вероятной причины ареста. Полиция Нью-Йорка ответственно использует технологии распознавания лиц».

Распознавание лиц стало широко используемой техникой в правоохранительных органах, хотя оно остается спорным и в значительной степени нерегулируемым. Сопутствующий отчет CPT описывает, как системы распознавания лиц в режиме реального времени были тихо внедрены в Детройте и Чикаго, в значительной степени вне поля зрения жителей.

The Verge