Технологии будущего

Забудьте о Сири: 4 способа, которыми ваш телефон станет умнее

Забудьте о Сири: 4 способа, которыми ваш телефон станет умнее

Все три основные телефонные платформы теперь имеют собственный голос. У Apple есть Siri, у Microsoft — Cortana, а у Google — несколько менее дерзкий Google Now

Эти системы позволяют решать основные задачи с помощью голосового управления. Каждый из них является своего рода виртуальным секретарем, который может отвечать на простые вопросы, открывать приложения, делать заметки и передавать сообщения. Они полезны, но они также ограничены. Они не могут делать ничего, для чего они не были запрограммированы явно, и многие задачи просто выходят за рамки их возможностей.

Тем не менее, существует ряд разрабатываемых технологий, которые значительно улучшат эти системы, и они станут коммерчески доступными уже через несколько лет. Вот пять основных способов, которыми ваш телефон станет намного умнее.

Это будет видеть то, что вы видите

За последние пять лет распознавание речи достигло огромных успехов благодаря развитию мощных нейронных сетей. Современные смартфоны могут распознавать речь с удивительной точностью (это было давно, так как Google Now неправильно меня понял), и даже могут делать такие вещи, как идентификация песен и телевизионных шоу на основе их аудио.

Это здорово — но это только начало. Люди не взаимодействуют с миром прежде всего через звук. Мы используем зрение практически для всего — и скоро наши машины тоже будут. Мы начинаем видеть дебют первых носимых дисплеев гарнитур, таких как Google Glass и Microsoft HoloLens. по сборке , который может передавать информацию со своих камер на ваш смартфон, обеспечивая богатый и всегда доступный визуальной информации. Многие наблюдатели, включая меня, ожидают, что они станут обычными в течение следующих пяти лет или около того.

Так что же может сделать ваш телефон со всеми этими данными?

Много. Google уже продемонстрировал на своем смартфоне Tango планшет что глубинная камера может определять пространственное местоположение физических объектов с чрезвычайно высокой точностью. Аналогичным образом были достигнуты некоторые удивительные достижения в области машинного зрения — например, нейронная сеть Microsoft, которая может идентифицировать отдельные породы собак , и нейронная сеть Google, которая может точно описывать содержание фотографий . Вместе эти технологии открывают целый мир приложений:

Что это за болт? Алгоритм машинного зрения знает и может заказать замену на Amazon за пять секунд. Как звали женщину, которую вы встретили в баре прошлой ночью? Возможно, вы потеряли ее карточку, но ваши очки поймали ее лицо, и вы можете найти ее на Facebook. У тебя странная родинка. Должны ли вы обратиться к врачу? Ваш телефон может взглянуть и сообщить вам. Вы продуктовый магазин: что вам нужно? Ваши очки помнят, когда вы в последний раз заглядывали в холодильник, и знаете, чего не хватает. Они могут даже дать вам указания проходить за проходом, чтобы найти отдельные предметы.

Последствия этой технологии для конфиденциальности ужасают, но подобные вещи звучат невероятно полезно.

Это будет знать, что вам нравится

Вкус может быть трудно определить. Это очень личное и может быть очень произвольным. Spotify и Netflix обходятся разработкой рекомендаций, основанных на шаблонах использования (метод, который полностью игнорирует контент), но у этого подхода есть реальные ограничения.

Будущее за алгоритмами, которые могут понимать искусство на глубоком уровне — сложные нейронные сети, которые могут научиться выбирать сложные тонкости музыки и фильмов. Это дает гораздо более глубокое понимание того, что людям нравится и что не нравится в СМИ — конкретное понимание их вкуса.

Первые ранние намеки на это начинают появляться. Например, плейлист Spotify « Discover Weekly », в котором используются такие инструменты анализа контента, чтобы рекомендовать песни, в том числе песни, которые вы обычно не слышите, потому что они слишком неясны для хорошего ранжирования в зависимости от моделей использования. Эти методы будут становиться все более мощными в будущем, и смартфон станет отличной платформой для использования этой информации.

Ищете что-то делать с друзьями? Что, если приложения на ваших телефонах могут сотрудничать, объединять информацию о ваших вкусах и выбирать фильм или концерт, который, по их мнению, вам понравится? А как насчет сайтов знакомств, которые оценивают вас на основе глубоких особенностей ваших соответствующих вкусов? А как насчет приложений, которые могут порекомендовать вам книги, потому что они их прочитали?

Возможности бесконечны, и кто-то собирается заработать на этом много денег.

Это будет болтливый

Человек : где ты сейчас?
Машина : я в глуши.
Человек : какова цель смерти?
Машина : чтобы иметь жизнь.
Человек : какова цель быть умным?
Машина : выяснить что это такое.
Человек : какова цель эмоций?
Машина : я не знаю.

Это разговор с нейронной сетью, разработанной Google , которая учится на больших текстовых базах данных без участия человека. Эта версия была обучена на нескольких старых сценариях фильма и обучена предсказывать следующее предложение в каждом разговоре, с которым столкнулась. Оказывается, если вы тренируете ИИ по сценариям фильма, все его разговоры супер драматичны.

Если вы не впечатлены, это понятно. Чатботы существуют уже давно .

Но присмотритесь. Система Google особенная в двух ключевых аспектах.

Во-первых, это очень просто с точки зрения архитектуры: это единая огромная нейронная сеть, и ей пришлось самостоятельно изучать динамику человеческого языка. Обычные чат-боты работают, используя тысячи правил, написанных вручную, чтобы реагировать на различные ситуации. Когда они повторяют ответ, это потому, что он был закодирован вручную или запомнен из конкретного примера. Сеть Google отличается. Он изучил свое поведение органически, пытаясь понять глубокую структуру человеческого письма.

Во-вторых, он отражает удивительно тонкую динамику, которой нет у других чат-ботов. Он может отвечать на вопросы здравого смысла о мире, несмотря на то, что не был явно запрограммирован на это.

Человек: кто такой скайуокер?
Машина: он герой.
Человек: кто такой Билл Клинтон?
Машина: он миллиардер.
Человек: голубой или черный?
Машина: синяя.
Человек: у кошки есть хвост?
Машина: да.
Человек: у кошки есть крыло?
Машина: нет
Человек: может ли кошка летать?
Машина: нет.
Человек: сколько ног у кошки?
Машина: четыре, я думаю.

Другая версия чат-бота, обученная журналам технической поддержки, может удивительным образом обеспечить реальную техническую поддержку. Есть спотыкания (кажется, трудно вспомнить, какую операционную систему вы используете) — но я определенно получил худшую техническую поддержку от реальных людей.

Все это является хорошим показателем того, что мы начинаем приближаться к тому моменту, когда искусственный интеллект может быть действительно разговорным. Вышеприведенная сеть может вести терпимый разговор, даже если ее цели обучения требуют от нее только следовать поверхностной структуре диалога вперед-назад.

Учитывая лучшие данные обучения и функцию вознаграждения, которая подчеркивает обмен информацией, возможности безграничны. Представьте себе версию Siri, которая может вовлечь вас в настоящую беседу, предоставить ответы и советы в ответ на вопросы, а также выполнять задачи, не требуя специального программирования для этого. Это не далеко.

Это будет хорошо читать

Еще одна технология, над которой работает Google, связана с пониманием прочитанного. Он называется « векторы мысли », и концепция на удивление проста. Вы можете извлечь «векторы мысли» из деятельности нейронной сети, в которой есть фрагмент информации, например, предложение или статья. То, что вы получаете, является непрозрачной частью информации, которая ничего не значит ни для кого, кроме сети, которая ее сгенерировала. Эта часть информации, в некотором смысле, хранит «значение» текста отдельно от того, как оно было первоначально сформулировано.

Это имеет некоторые полезные свойства. Для начала, эти векторы напоминают друг друга для предложений с аналогичными значениями. Если вы перевариваете два предложения таким образом, вы можете определить, означают ли они одно и то же. Вы также можете манипулировать ими. Используя две нейронные сети для создания «векторов мысли» из текста на разных языках, а затем обучая третью сеть, чтобы научиться отображать между ними, вы можете создать чрезвычайно мощный метод машинного перевода, который фиксирует значение текста, а не только слова в нем.

Другим потенциальным применением этого является использование этой технологии для сбора большого количества информации и ее преобразования в компактное представление, а затем генерирование сводки на основе результатов. Это может быть очень мощным для мобильных приложений.

Представьте себе, что вы можете попросить ваш телефон пойти и прочитать все, что доступно в Google по данной теме. Затем вернитесь к вам и кратко сообщите о своих выводах на естественном языке и ответьте на вопросы о результатах. Это станет реальностью очень скоро, и это будет невероятно полезно.

Телефон будущего

Телефоны в будущем, вероятно, будут сильно отличаться от телефонов сегодня. Они могут быть изогнуты. Они могут быть модульными. Вы можете взаимодействовать с ними, используя очки дополненной реальности. Однако самым важным отличием будет интеллект. Описанные здесь функции превратят наши устройства в мощных преподавателей и помощников.

В настоящее время разгорается гонка вооружений в технологии глубокого обучения. Побочным эффектом является то, что эти методы развиваются невероятно быстро, и они появятся на рынке раньше, чем вы думаете.

Вы взволнованы умными смартфонами? Обеспокоены последствиями для конфиденциальности? Дайте нам знать об этом в комментариях!

Авторы изображений: человеческий мозг от Mopic через Shutterstock

Похожие посты
Технологии будущего

Почему мой автомобильный аккумулятор продолжает умирать?

Технологии будущего

Диагностика разряженной автомобильной батареи

Технологии будущего

Apple TV против Року

Технологии будущего

Что делать, когда датчики в вашем автомобиле не работают