Программа перевода речи в писменное изложение.

Автор Аспирант, 23 февраля 2013 г., 14:34:06

« назад - далее »

Аспирант

Ребята, существует программа перевода речи в письменную запись ?
Если существует, то она наверно не дёшево стоит ?
Где найти такую ?
Писанина очень много времени занимает.
думать быстрее, говорить медленнее, а писать ещё медленнее.

Grey

Двое смотрят в лужу.
один видит лужу, а второй отражающиеся в ней звёзды.

ALBA

Цитата: Grey от 24 февраля 2013 г., 01:29:02
Горыныч
Тут неплохое описание программы
Я как раз про это вчера знакомого спрашивала, могу привести его письмо, чтоб не упустить смысл.

ALBA

ЦитироватьОль, я сам уже лет 10 мечтаю о такой проге   
Еще в конце 90х, начале 2000х появилась программа "дракон" или "горыныч" уже не помню как точно называется, но что-то типа этого (на рутрекере она есть).

Пиарили очень громко, мол передовые секретные советские разработки и т.д.
Но на практике - её нужно очень долго приучать к своему голосу, максимум что удалось добиться после недели мучений - это набор текстов по буквам. т.е. сидишь, в скованной позе с вытянутой шеей, как идиот и ровным голосом на одинаковой громкости произносишь "Аааа", "Бэээ", "Вээээ" - чуть сменишь тональность или чуть повернешь голову или с улицы доносится звук проезжающей машины и вместо "А" у тебя печатается "жхчжж" 
Руками набирать гораздо быстрей и проще, пока её научишь - за это время можно руками книгу написать. 
Правда эта прога хорошо научилась выключать комп и запускать/закрывать проги командой голосом. Но и тут без приключений не обходилось, иногда было достаточно чихнуть, чтобы прога подумала, что это команда и выключила нафиг комп на самом интересном месте без сохранения документов 

Прошло 10 лет, а воз и ныне там. Говорят вроде бы перспективно, нужно только кое что доработать, но там в дальнейшие исследования нужно инвестировать миллионы денег, а это никому не нада, потому как коммерческого выхлопу никакого.

На английском языке такие системы вроде бы есть и довольно неплохие, но там нужно иметь очень хорошее английское произношение, чтобы прога тебя поняла.

Есть еще разработка гугл на андроидах и разработка МАК на айпадах/айфонах, но гуглевская версия может только делать голосовой поиск и набирать SMSки в том числе и на русском , но полноценные тексты набирать на ней нельзя. А айпадовская может просто с тобой поговорить, типа система искусственного интеллекта.

Голосовой поиск можешь попробовать хоть щас, правда он работает только в браузере Chrome, рядом со строкой поиска в гугле там такой микрофон - жмешь на него и говоришь, что тебе надо найти. Пока это все, что есть приличноно на русском

Grey

Заитриговала... и растроила. Я уж собрался умный дом с голосовым управлением делать :) Про программу давно знаю, но тогда я не мог с компа освещением управлять.
В общем нада будет попробовать.
Двое смотрят в лужу.
один видит лужу, а второй отражающиеся в ней звёзды.

ALBA

Цитата: Grey от 24 февраля 2013 г., 19:39:50
Заитриговала... и растроила. Я уж собрался умный дом с голосовым управлением делать :) Про программу давно знаю, но тогда я не мог с компа освещением управлять.
В общем нада будет попробовать.

Да, Сереж, Виталик программист и потому я всегда по таким вопросам с ним советуюсь

radioman

Вообще у меня был когда-то сотовик простой. Там была такая фишка - нажимаешб на кнопку и говориш - *Иванов*. И он соеденяет. В принципе, работала, но не всегда. Но там просто выбирала из памяти заранее записанное и сравнивало..

Grey

Цитата: radiomanВ принципе, работала, но не всегда.
Тоже самое
Цитироватьчуть сменишь тональность или чуть повернешь голову или с улицы доносится звук проезжающей машины и вместо "А" у тебя печатается "жхчжж"
Сложность распознования фонем. Нужна большая библиотека фонем...
Двое смотрят в лужу.
один видит лужу, а второй отражающиеся в ней звёзды.

radioman

Большую библиотеку фонем может содержать плач новорожденного.. ГЫ! ;D
Мечты об умном доме можешь пока свести к системе ифк пульта и реле времени.. :P

shadow

чуть не соглашусь, голосовое управление вполне возможно, не общение с машиной на отвлечённые темы, а управление, т.е. распознавание чёткой иерархии конечного числа известных команд, произнесённых тем же голосом, что и при обучении системы. Так работает голосовой набор в телефонах и программы управления мультимедиа в авто.

т.е. команды типа <действие> <объект управления> <место> <значение> работают давно: "включить свет в ванной", "выключить свет в прихожей", "установить температуру в гостинной 20 градусов" работать будет уже сегодня. Но это конечно не общение с ИИ, это просто голосовое управление, и если сказать "вруби свет" при отсутствии записи этой команды вас система не поймёт, пока вы не скажете заветное "включи свет в прихожей", хотя можно и "вруби свет" использовать применительно к зоне нахождения объекта )) т.е. если произнесено в прихожей, то включать именно там.

Это уже не фантастика давно.

При достаточно большом словаре синонимов и допущений, типа произнесение фразы "свет" есть триггер изменения режима освещения (был off станет on, и наоборот), добавлении синонимов "включи", "вруби", "дай" у человека незнакомого с системой и может появиться ощущение разумности системы, но в конечном счёте это будет простейший набор команд (пусть и с синонимами и значениями по умолчанию для каждой зоны), но всё же это просто команды по шаблону выше.

Grey

Цитироватьпроизнесённых тем же голосом, что и при обучении системы.
А завтра охрипнешь и будешь сидеть в тёмной и холодной комнате :)

Установил горыныча. Микрофон барахлит, плохо срабатывает.
Двое смотрят в лужу.
один видит лужу, а второй отражающиеся в ней звёзды.

radioman

К сведению - змеи, да еще Горынычи, обладают как правило скверным характером. А вдобавок наличие ТРЕХ голов автоматически означает растроение личности. Что же Вы хотите от ТАКОЙ программы, сударь? :o

*Как Вы яхту назовете, так она и поплывет!* ;)