Очень красивый пример, где несколько технологий машинного обучения отлично сплелись и дали почти волшебный результат. Распознавание изображений и распознавание речи.
Чтение по губам кажется очень логичной задачкой в этом контексте. И, конечно, нашлись желающие ее решить. И, конечно, у них получилось. И еще одно редкое и сложное умение человека оказывается не очень-то нужным в будущем. Зато некоторые видео без звука смогут нас порадовать сюрпризами неожиданно для их создателей
Возможен ли в будущем, результат этого эксперимента стать интерфейсом для управления умным домом? Вот в чём вопрос. Ведь ИИ интеллект такой системы сможет понимать, что говорят шёпотом или в шумной комнате.
Посмотрите пример: