Выбрать дату в календареВыбрать дату в календаре

Страницы: Пред. 1 ... 41 42 43 44 45 46 47 48 49 50 51 След.
[ Закрыто]
 
[quote:ce60b9ba2f="Feol"]Насколько я знаю, в авиации, в критических ситуациях (и не обязательно аварийных, сложный слепой заход тот же самый) сплошь и рядом экипажу не хватает времени на речевой обмен. Тем не менее, экипаж не в ступоре, а очень даже энергично работает.[/quote:ce60b9ba2f]
Ему в этот момент вообще не до чего. ЦП загрузка 102 %! На ЯМР мозга в такие секунды мозги реально аж светятся. Это называется "пожар в шлеме" вроде бы. В этот момент не будем никого трогать конечно. Никто и не говорит про РИ в очень напряженных динамических операциях, требующие моторной памяти, мозжечка и тп. Устал уже повторять.
[ Закрыто]
 
[quote:cc0dcb14c3="Frontm"][quote:cc0dcb14c3="kost3"][quote:cc0dcb14c3="Frontm"]Использование АЦП/ЦАП для баловства с голосом пробовали ещё в 80-х на СМ'ках :D Записывали оцифрованный звук в виде слов и по мере необходимости выдавали нужное слово на ЦАП. Не прижилось - строка на мониторе удобнее. И взгляд быстрее слуха.[/quote:cc0dcb14c3]
неработающее не приживается[/quote:cc0dcb14c3]
Именно так. Глаз и руки быстрее слуха.
Можно напомнить давние споры - о стрелочных или цифровых приборах. Так вот стрелка+мозг имеет те плюсы, которых у цифры нет и не будет.
То что может мгновенно посчитать/прикинуть мозг - голосовыми тормозухами вообще не достичь[/quote:cc0dcb14c3]
Моторные реакции (на уровне мозжечка) от световых и звуковых импульсов вырабатываются одинаково. И скорость срабатывания рефлексов от слуха не ниже чем на визуальные образы. Но выше чем на тактильные.  
У каждой сигнальной системы - своя ниша.  Я просто говорю, что и глаза и руки имеют свои ограничения. (что быстрее проговорить в телефон текст на 1000 слов или набрать его тачскрином или миникейпадом? ). У голоса -свои. Утверждать что кнопко-мышастый лишен недостатков, а у голосового интерфейса все однозначно и везде плохо - неверно IMHO. Разве пример голосового поиска Вас не убеждает? Чем сложнее и интеллектуальней объект - тем больше аргументов за голосовой интерфейс. Утверждать что-то там на основании опытов 70-х - это то же самое что "паровые двигатели к каретам не приживутся - пробовали" (когда речь идет уже о форде А).
[ Закрыто]
 
[quote:e5fd3645db="Frontm"]
еврофайтер
громила
продолжать?

Нет, опишите применение голосовых команд, а не информ.сообщений.[/quote:e5fd3645db]
управление радаром, оружием, навигацией, связью, запросы к БК
а вообще - свечку не держал конечно ;)
[ Закрыто]
 
[quote:dd75e360e2="Frontm"]Использование АЦП/ЦАП для баловства с голосом пробовали ещё в 80-х на СМ'ках :D Записывали оцифрованный звук в виде слов и по мере необходимости выдавали нужное слово на ЦАП. Не прижилось - строка на мониторе удобнее. И взгляд быстрее слуха.[/quote:dd75e360e2]
неработающее не приживается
[ Закрыто]
 
[quote:cea34b5dcd="Feol"][quote:cea34b5dcd="kost3"]вот к примеру палочки для нажатия кнопок в союзе - меня просто трясет, когда это вижу. ...[/quote:cea34b5dcd]
Сейчас полно устройств, считающихся более, чем современными, где можно (для удобства) в экран палочкой (стилусом) тыкать. Все тыкают, и вроде, по большей части, не трясёт тех, кто это видит :)[/quote:cea34b5dcd]
только тычковые системы используют только как фан с убогими прикладухами. Сделать что-то полезное - увы палочный интерфейс не позволяет. С голосом все очень изменится.
[ Закрыто]
 
[quote:4787ce80a7="Feol"]Собственно, именно всем этим и объясняется, во-многом, непопулярность систем распознавания речи для персональных компьютеров и т. п. Инженерный интерес к этому появился очень давно, ресурсы в отрасли разработки ПО сейчас очень большие. Многое можно было бы сделать и, накопив опыт на фоне конкуренции, сделать довольно хорошо. Но это практически не нужно потребителям - по этому, практически ничего и нет. Вот сейчас сижу, в комнате шумно, оборудования много - помех по типу 'белого шума' полно. Начальство в соседней выгородке матом само с собой ругается ругается - ещё помеха и более сложная :). А если еще каждый разработчик будет с компом говорить, перекрикивая оборудование и начальство :)? А так, сиди себе тихонько и стучи на форум - никому не мешаешь :)[/quote:4787ce80a7]
Задачка не всем по зубам. Хороших имплементаций мало, как и точных систем, Все юзают Нюансе и другие огрызки  L&H - у них меньше 80%. Т ч юзеры недоделанное не любят - это правильно. А конфиденциальность - это конечно накладывает ограничения - не спорю.
[ Закрыто]
 
[quote:7b435cd83f="Frontm"][quote:7b435cd83f="kost3"][quote:7b435cd83f="Frontm"]Когда в лаборатории в малых сериях проиграть движок - это одно. Практическое применение выйдет гораздо дороже.[/quote:7b435cd83f]Миллион юзеров - это малая серия или как?[/quote:7b435cd83f]
Имел ввиду практику для КК и схожих с ними по сложности систем. Отдельности по стиралкам, комбайнам и дрелям для миллионов юзеров - это не комплекс где отдельностей вместе тысячи.[/quote:7b435cd83f]
еврофайтер
громила
продолжать?
[ Закрыто]
 
[quote:04a523ce56="Frontm"]
Многие не могут одновременно говорить и что-то делать руками :D
При речи не только энергозатрат и центральный проц (мозг) очень сильно загружается. На приложения остаётся меньше ресурсов.[/quote:04a523ce56]

"Болтать - не мешки ворочать" :-P
Концентрация внимания на динамических вещах - это есть. Но их в космосе - часы, а борьба с кнопками - месяцы. Да и доказано - в автомобиле навигатором лучше рулить голосом во время движения, полезешь на ходу в тачскрин - реакция замедляется в разы. Мерины вон отключают тачскрин на ходу. То есть я чего хочу сказать - руки обе на джойстиках. Не оторвать. Вторпил занят ещё чем-то. А очень надо переключиться на другой режим камеры. Лучше руки оторвать и рычажок двинуть или сказать "камера - ближний режим!" Я почему-то убежден - второе. Проверяли на САD системах. Держишь мышой объект - и голосом " присоединить", или оторваться, лезть в меню, опять искать объект, в общем производительность с голосом в среде  solidworks росла в разы. Так-то вот.
[ Закрыто]
 
[quote:9e54e03261="Frontm"]
Дешифратор потока аудиоданных где будем ставить? Сигнал с микрофона в дрель идёт, а она распознаёт ей говорят или не ей?
Или опять в центральном процессоре, а на дреЛ пойдёт конктретный бит чё ей делать? Но тогда это не управляемая дрель.
"Вась, да включи ты свою "дрель на реверс!", а включилась дрель у сказавшего"
Нагрузим на аудиоинтерфейс ещё и контекст ситуации и задачи.

В стиральных машинах-автоматах и кухонных комбайнах никто не мешает, а только ЗА управление голосом.

Когда в лаборатории в малых сериях проиграть движок - это одно. Практическое применение выйдет гораздо дороже.
.[/quote:9e54e03261]

Дешифратор вестимо, там где поток - в компе скафандра.  40 MIPS как нибудь отжалейте. Миллион юзеров - это малая серия или как?
Учет контекста см выше. А вообще очень большая тема и узкоспециальная, стараюсь как могу. На фразу "вась ..." система не отреагирует. Отдавать команды надо четко в пределах правил. Как раз в  комбайнах и др простых системах - кнопки лучше, если многовариантные меню как в некоторых стиралках тогда да.
жена "стираем шелк"
я (листая талмуд) "ага вот эту ручку на троечку,
есть" жена" отжим как-нибудь помягче"
я "ага, на 800 оборотов" ;)
[ Закрыто]
 
[quote:ab95226471="Frontm"]
Дело не в святом духе. Это распознавание по предыдущему и ожидаемым событиям, по жесту, по мимике, взгляду, по раннему опыту, скорость мозга в критической ситуации выше. И просто интуиция основанная [color=yellow]на...[/color] а не по кофейной гуще.[/quote:ab95226471]
не надо про скорость мозга. Системы поддержания растояния в авто срабатывают за 0,001 сек, человек тупит 1,5 сек минимум перед неожиданным препятствием на дороге.
Понимание и задействование визуального канала - это да, это человек лучше делает в ситуации разомкнутого мира. То бишь когда разговор может пойти о чем угодно. А при распознавании 100-1000-10000 фраз от разных дикторов на слух человек сделает немного больше ошибок , чем наша система. Проверяли.
[ Закрыто]
 
[quote:a47010c95f="Mikha"]

Вопрос в том, что вероятнее - не так кнопка или не так понятная команда. Сейчас конечно голосовое распознование работает не очень, но прогресс есть. Пример: вместо голосовых меню ("нажмите один для...") кое-где уже начали использовать систему типа "скажите чего вам надо". Естественно, первые блины были комом :) Но тем не менее.[/quote:a47010c95f]

"Один для"  - Это первое поколение, сравнение с образцом, уже не используется.
"скажите чего надо" - это голосовой поиск от гугл. Своё дело делает - но точность хромает. Неудивительно - десятки миллионов команд одномоментно.

В моём случае - десятки тысяч команд и контекст - Поймет с точностью 99,9 почти все возможные (кроме очень экзотичесих) команды для 4-5 функций дрели в повелительном наклонении. Таких вот  команд-синонимов будет  меньше тысячи по опыту. Перед этим м б надо будет сказать "дрель". Чтобы система перегрузила нужную модель диалога. Т О на верхнем уровне команды для запоминания (запомнить легко -существительные, названия объектов) ниже по дереву - команды и стартовые точки диалогов конкретного объекта. Когда в это врубишься - все просто. Для навигатора и для вебТВ прототипы уже очень даже ничего работают. Приступаем к фокус-группам. Фразопереводчик и ланчер для мобильников наши уже больше миллиона человек юзают и одни положительные отзывы! (нарицания только, если звук сломан, или "где взять лекарство?")
[ Закрыто]
 
[quote:825d990c54="Frontm"][quote:825d990c54="kost3"] IMHO гораздо приятнее - "фара - полный свет" "дрель - обратный ход". Говорю как водолаз.;)[/quote:825d990c54]
Представил таку дреЛ :D
Весь аудиоинтерфейс в дрель засунем или дрель управляется бортовым компьютером по шлейфу проводов?
А вдруг дрель сама включится когда не просили? То есть пару удобств может привести к паре последствий. И тут уже смотреть что безопаснее. Стоят ли новые опции - новых рисков[/quote:825d990c54]
чёйта?
дрель на связи со скафандром по радиоканалу, меньше кнопок - герметичность лучше.  Меньше движущихся деталей. Понятно, что все это допустят в ЛКИ только после достижения некоторого порога надежности. Все можно с малыми затратими проиграть на земле - движок уже есть, похожие вещи делаем для других применений - тч затраты размазываются. Усё в порядке.
[ Закрыто]
 
Ситуация 1:
ВКД
руки заняты инструментом типа дрель. Надо переключить фару на шлеме. В тень влетели. И переключить дрель на обратный ход.
Учитывая что согнуть руку - 10 кг, согнуть палец в перчатке - 3-5 кг. IMHO гораздо приятнее - "фара - полный свет" "дрель - обратный ход". Говорю как водолаз.;)

Ситуация 2- 2 G, нештатный звук и вращение. Второй пилот в ремнях, палочка (123.,.:"№:,-ть! не попасть!) - не лучше ли "стабилизировать вращение, статус Двигателей!" (одновременно нажимая еще несколько кнопок и руля с помощью спинного мозга)?

Ситуация 3: сплю. Тут ЖЖАХ!, Ой бл&!- руку пробило метеоритом.
"Внимание! Потеря давления в основном модуле! Приступить к эвакуации!" "Какой прогноз?" "Потеря обитаемости через 3 минуты 20 секунд, Производить наддув?" "нет" " я в шлюзовом отсеке" "основной модуль пуст, герметизируем люки? " "да".  Далее - в шлюзовом отсеке нет пульта управления станцией - а голосовая связь продолжает работать.

Ситуация 4.
фотографирую Землю.
"вызов с Земли, жена, ответить?"
"ответить"

Ситуация 5
Чиню что-то новое (не туалет) "регламент демонтажа блока а14" "отключите питание красным тумблером" "отключил" "отсоедините разъем а14-б12" "отключил" "легко постукивая кувалдой...

Понятно, что в таких ситуация хорошо иметь надежное плечо друга с отверткой. талмудом, аптечкой и тп - но у друга и свои дела есть, нет?
[ Закрыто]
 
про количество команд

В конкретный момент времени без потери точности распознается несколько десятков тысяч команд. Общий словарь системы не ограничен. Т е вообще команд м б миллионы. Поверьте - этого более чем достаточно для командной системы.

Звуковой фон от одновременной работы - не проблема, есть еще ведь и наушники. Тч космонавты еще спасибо скажут за отсечку постоянного шума станции. Да и понятно, что не предусматривается постоянное использование голоса - только когда удобнее или хочется.

Дублировать системы - старый прикол космонавтики. Ежели кнопусик далеко, а дотянуться не могу (авария не дай Бог) - лишним не будет.

В общем, дублирование, мобильность, удобство в некоторых случаях, свободные руки - это плюсы.
Ложные срабатывания - поверьте решенная проблема.
Не 100% - дык и кнопки не 100, джойстики оставим
какие еще минусы?
[ Закрыто]
 
[quote:13d76b19d4="Mikha"][quote:13d76b19d4="Frontm"][quote:13d76b19d4="Mikha"]У человека на критических операциях распознавать голосовые команды с удовлетворительной точностью и надёжностью получается)[/quote:13d76b19d4]
Это распознавание несколько иначе работает, чем у машины :D[/quote:13d76b19d4]
Но дело, думаю, всё же не (только) в святом духе :)[/quote:13d76b19d4]
Разница в понимании. Только акустики часто недостаточно даже для человека. На слух записать незнакомый язык например.
В нашем случае - понимание, это учет контекста. Система получает данные от БК, изменяет переменные умолчания в зависимости от этого и ОГРАНИЧЕНА моделями диалогов. Ограничение мира- это и есть понимание.  Т е если мы в районе графа (модели диалога) управления блоком Т научного модуля - то наш мир ограничен терминами этого объекта. В диалоге еще проще - ведет система. Человек начинает диалог стандарттизированой командой -система задает уточняющие вопросы. Типа "Поставить таймер" "таймер блока Т устанавливаем на сколько часов?" "на десять" "таймер блока Т установлен на 10 часов, сообщить об окончании работы таймера? "  " сообщить" "есть".  
Работка по прописыванию таких моделей - та еще, но вполне исполнима, кой чего автоматизируется и копипастится.
В итоге получаем (экспериментально проверено) распознавание лучше человеческого-  в машине (жигуль с откр окнами на 100 км/ч, в боулинге, шотландец (его англичане не сразу понимают).
[ Закрыто]
 
Про акустические нагрузки
Если связь работает - нам этого хватит. Вообще система распознает ЛУЧШЕ чем человек. Там много чего наворочено - и обработка сигнала и шумоподавление, и устойчивость к шумам самого движка распознавания.

Про критические операции
Это какие? Можно подробнее? Заменять джойстики движков- ни-ни! А вот палочки в союзе может пора?
IMHO 99,9 % нажатий кнопок на станции сейчас - это не критические операции. В смысле если можно сразу сказать "отставить" - ничего страшного не приключится.

Да и еще.
Стандартный цифровой интерфейс блока дешевле, чем то же самое+кнопки, рычажки и экранчик.
[ Закрыто]
 
[quote:cbdc6786ec="Mikha"]Даже не думал высмеивать.
С моей позиции айтишника мысль совершенно небезнадёжная, в итоге, думаю даже как-то так и будет - потому что это же уже развивается вовсю. Кстати, в приведённом мной примере дана неплохая идея - что команда должна начинаться кодом доступа. Дабы не было случайных срабатываний.[/quote:cbdc6786ec]
Случайных срабатываний там в принципе нет. Это система с ограниченным набором команд, если команды в модели диалога нет - то она и не распознается. Процесса перевода речи  в текст и осмысления текста там в принципе нет. Скорее речь можно вести об ошибках. Когда акустически близкие команды система путает. Лечится грамотным моделированием диалогов, грубо говоря четкими вопросами системы, ну и общим качеством распознавания. 99,9 -это одна ошибка на тысячу - можно и исправить и откатить. Не напряжёт. Если одна на десяток - тогда уже напрягает.  В качестве кода доступа выступает MACадрес гарнитуры и собственно сам голос. Верификация не 100 % но всё же. Для блокировок чего-то совсем серьезного можно и нужно использовать не только голос, но и др каналы (сетчатка, рисунок вен, отпечатки пальцев, коды). В принципе, для того чтобы активировать систему (исключить срабатывания на общение между людьми, посторонние звуки) можно использовать имя.
"Железяка"
"На связи"
"Статус СЖО станции!"
"все хорошо!, воды 75%, кислорода -80%, памперсы заканчиваются"
[ Закрыто]
 
[quote:31dda966e8="Mikha"][quote:31dda966e8="Lin"]HAL 9000 :D[/quote:31dda966e8]
Это не HAL  :)
Это вот что:
[quote:31dda966e8]- Тринадцать-девять, - произнес Андрей формулу обращения для
автомата-бытопроизводителя. - Завтрак.[/quote:31dda966e8]
;)[/quote:31dda966e8]

высмеивание и неприятие - это первая фаза - "Этого не может быть, потому что не может быть никогда" .
Подождем осмысления  :)
[ Закрыто]
 
вот к примеру палочки для нажатия кнопок в союзе - меня просто трясет, когда это вижу.
Или неужели на скафандре нет таких кнопулек, которые запаришься в перчатках жать? Или на дрели переключателей?
Или так уж комильфо бымажные талмуды листать вместо нормальной поисковой хелп-системы?
Или не запаривает к кнопкам летать вместо того , чтобы сказать "да, включи связь, отвечу сейчас" ?
Разве плохо спросить "чего у нас там дальше по регламенту?"
[ Закрыто]
 
[quote:93d7d423db="Lin"]HAL 9000 :D[/quote:93d7d423db]
нет не хал
никто не собирается отдавать РИ полный контроль, тем более над главными системами. Просто вместо клавиатуры - гарнитура. Для ответственных операций -блокировка и подтверждение, в тч полномочий. Отдать команду "взорвать станцию", "да уверен", "код доступа ХХХХХХ", "код авторизации ХХХХХХ", "решение задачи -  212", сложнее чем тупо задеть жопой переключатель :))
Страницы: Пред. 1 ... 41 42 43 44 45 46 47 48 49 50 51 След.
Журнал Новости Форум Фото Статьи Книги