Гласово разпознаване със Soundbooth/Premiere

Гласовото разпознаване е от функциите, които дори и веднъж да ви се наложи да използвате, ще ви спести доста време. Въпреки, че думичките “гласово разпознаване” ги асоциирам повече с достъп и някакви алгоритми свързани със сигурността на нещо, в този случай става въпрос за друго.
Soundbooth CS4, както и Premiere CS4 разпознават гласове. Функцията е Transcribe и това, което прави е да “извлича текста” от аудио/видео файл, като го записва в метадатата на файла под Speech Transcript, което автоматично го прави възможен за търсене с всякакъв софтуер, който може да претърсва метадата. Тъй като алгоритъмът не е безгрешен, колкото по-отчетлива е речта, толкова по-точна ще е транскрипцията. Ако има повече от един гласа, всички гласове се разпознават, като това по интуитивен начин се отбелязва в лога (метадатата).

Езикът по подразбиране е английски. Предполагам има възможност за добавка и на други езици, но не ми се е налагало да търся как става.
speech recognition with soundbooth

Самата транскрипция става така – отваряте файла с аудиото, което ще сваляте, след което отивате на Windows/Metadata (ctrl+7), там ще видите подменю Speech Transcript. Най-долу на това меню ще намерите бутон Transcribe… Това е бутона!
speech recognition with soundbooth

speech recognition with soundbooth

След като процеса преключи полето Speech Transcript се изпълва с текст. Текст, в който може да се търси, който може да се копира, коригира, и който може да се проследява от коя секунда точно е свален чрез движение по timeline-а на осцилограмата.
Аналогично всичко това се случва и в Premiere.

За преобразуването на сканиран текст към печатан с Acrobat може да хвърлите един поглед тук. Малко повече за метадатата тук.

Коментари

2 коментара на “Гласово разпознаване със Soundbooth/Premiere”

  1. ипотпал on February 16th, 2010 6:36 pm

    май не е далеч времето, когато Гугъл ще може да разбира текста във видео и тогава ще стане доста модерно сео-тата да използват видео за да с екласират на първите места

  2. ph1x on February 21st, 2010 6:48 pm

    И аз мисля, че това време не е далече, Nexus и iPhone така или иначе си имат speech recognition софтуер…

остави своето мнение




Приятели


my facebook account my twitter account linked_pixelmind Google add rss Add to Technorati Favorites
Get Adobe Flash playerPlugin by wpburn.com wordpress themes