Category: it

Category was added automatically. Read all entries about "it".

Понимая понимание – 2

Пора с этим кончать. Все знают об этом процессе, все его понимают… только объяснить не могут. А когда мы с buriyдошли до стадии его формализации и программирования, то поняли что понять понимание задача не тривиальная.

Начнем с того что накидаем свойства этого процесса:

  1. Согласно Хокинсу понимание есть способность предсказания – пережевывали здесь;
  2. Понимание задачи – разделение ее на модули, под каждый из которых есть план решения
  3. Сопоставление: мы с вами пронумеровали анекдоты, и когда я называю номер, вы номер понимаете не так, как остальные
  4. XML формат. Или JPEG. Некоторая формализованная запись и алгоритм для ее обработки, который понимает что с ней делать
  5. Некоторая последовательность (пример выдуман):
    40
    40 градусов
    40 градусов температура
    40 градусов температура была вчера у меня
    Здесь на каждом новом шаге мы добавляем контекста, в результате понимание меняется.

 

Обобщая приведенные свойства можно сделать очевидный вывод – понимание тесно связано с контекстом. Вот моя версия:

Понимание есть процесс (одно и тоже разными словами) :

  • сопоставления объекта с контекстом
  • нахождение контекста для объекта
  • отождествление….

В общем, есть объект и есть некоторая иерархическая база знаний, где объект встречается множество раз в разных контекстах. Понимание отождествляет/сопоставляет/находит объект в базе знаний.

Для выполняемых алгоритмов контекст есть некоторый исполняемый алгоритм, который данный объект готов обработать.

Перечисленным выше свойствам определение удовлетворяет.

Сразу вопросы: что такое обучение, как наполняется база контекстами, что за иерархия и т.д.

Настройка Psi для работы с ботами

Пользователь Rain пишет о настройке клиента Psi для работы с ботами:

Psi различает тип входящих сообщений и по-умолчанию показывает их так, как определено отправителем, т.е., в данном
случае ботом. Я вот только что, в процессе написания письма посмотрел, что передается в XML двумя разными ботами при запросе / ответе.
q@clisearch.net
не указывает тип возвращаемого сообщения и Psi трактует его как одиночное, т.е., пишем мы в окне чата, а ответ возвращается совершенно в другом окне в виде отдельных сообщений. А бороться с этим можно как раз той настройкой (раз уж в боте этого указать нельзя), просто указав, чтобы все входящие сообщения расценивались, как сообщения чата. Просто для улучшения удобства использования :)

Настройка находится в "Меню - Настройки - Разное", "Принимать входящие сообщения и чаты".

Newis.brief - preview

Описание

Сервис реализован в рамках видения поиска 2.0, т.е. поиска завтрашнего для, как поиска непосредственно информации, а не ссылок на нее. Спросите Google что такое Интернет - вы получите сотни тысяч ссылок. Спросите человека - ответ будет состоять всего лишь из нескольких предложений. Данный сервис, в ответ на ваш запрос выводит вам бриф информации, связанной с запросом. Нет необходимости обходить десятки ссылок, читать множество страниц в поисках необходимых знаний.

Проект не является сервисом ответа на пользовательские вопросы, вы не получите ответа на вопрос "Кто подставил кролика Роджера?".  Это больше похоже на геренацию Вики-статьи по выбранной тематике, в тоже время сервис и не является поисковым интерфейсом к Википедии:

  1. В Википедии не найти статью на тему "рецепт омлета"
  2. Много статей в вики не окончены, а попросту содержат один абзац
  3. Статьи в вики устаревают, веб не устареет никогда

Принцип работы

В сервисе сделана попытка смоделировать процесс чтения и понимания информации человеком. По запросу пользователя выполняется "чтение" страниц, на которые ссылаются результаты индексного поиска Google, и производится выделение ключевой информации. Сервис не может функционировать самостоятельно, без поисковой машины и является надстройкой над ней.

Интерфейс

В роли сервера сейчас используется обычный ПК, поэтому нет возможности генерировать ответ в течение 30 секунд (стандартный таймаут браузера) после поступления запроса. Поэтому в качестве интерфейса на текущем этапе выбран Google Talk для возможности последовательной ассинхронной обработки запросов.


Отправляйте ваши запросы через любой Jabber клиент (например Psi или Google talk) на аккаунт newis.brief@gmail.com

Ограничения

  • Язык - английский (не принципиально, просто нужно с какого-то языка начинать, а русский здесь не самый легкий случай).
  • Отсутствие орфографических ошибок. Пока не поддерживается функция "Did you mean?", соответственно слово с ошибкой не будет распознано.
  • Не более 1 запроса подряд с 1 аккаунта. Запросы, пришедшие при наличии необработанного запроса от того же пользователя, будут удаляться.
  • Время ответа сервиса - несколько минут

Процесс

Процесс поиска необходимой информации занимает около 2 минут. С одной стороны это долго и нас оправдывает только альфа-состояние сервиса,  с другой стороны - а сколько Вам потребуется времени на ознакомление со всей информацией по запросу и выдаче краткого брифа?

За эти 2 минуты происходит следующее:

  • Сервис запрашивает около 20 веб-страниц по теме запроса
  • Производит "чтение" всех запрошенных страниц и сервис пытается "понять", что же из этого будет интересно пользователю
  • Формируется непосредственно ответ

Поскольку в режиме tech preview запущен однопотоковый сервер, время реакции сервиса увеличивается на длинну очереди.

Развитие

  1. Сохранение контекста. Возможность выполнить уточняющие запросы в рамках контекста текущих результатов.

  2. Интранет-поиск. Довольно интересно применение технологии к локальному поиску, например к корпоративному сектору. Так на запрос "Правила предоставления скидок" вы получите в Google Descktop search или Microsoft Sharepoint search не ссылку на 200-страничный документ "Операции розничной сети", а именно собранную информацию по скидкам, возможно даже расскиданную по нескольким документам.

  3. Мобильный поиск. Несмотря на весь мобильный прогресс, юзабилити телефонов в плане веб серфинга пока еще остает от  десктопных систем, и искать нужную информацию на мобильном телефоне, разгребая ссылки результатов - не самое веселое времяпровождение. Сервис позволит выжать из всей релевантной информации сухой остаток, который поместится на пару экранов телефона.

Дальнейшие шаги

  1. Выбор сервера приложений (или скорее платформы веб-сервисов) и реализация сервиса на его платформе
  2. Наполнение базы знаний
  3. Доведение времени отклика до 15 секунд
  4. Реализация веб-интерфейса