Транскрибация аудио и видео в текст

Транскрибация аудио в текст

Несмотря на популяризацию видео контента, текстовый документ всегда будет выигрывать как при составлении онлайн документов, так и при наполнении сайтов. Вопреки всему, транскрибация или иными словами перевод аудио в текст, услуга востребованная по сей день.

Прочитайте эту статью, где рассказано какими способами можно воспользоваться, чтобы перевести аудио или видео в текст с наименьшими усилиями.

Транскрибация — это перевод речи в текст. Переводить можно как аудио файлы (запись на диктофоне, песни и тд.) так и видео (речи из фильмов).

Транскрибация, это довольно трудоемкий процесс. Во главе угла стоит ваше умение быстро … (сначала хотел написать «печатать», но скажите, разве в школе, мы не писали под диктовку учителя, разве это не перевод аудио в текст?) печатать и писать.

Данная профессия востребована не первый год. Современный блогин, так же не прочь воспользоваться уже раскрытой темой в каком нибудь видео, путем перевода аудио в текст.

В этой статье, разберем 6 способов как транскрибировать в текст и начнем с программ для ручной транскрибации.

Программы для перевода аудио в текст

Как мы поняли, транскрибация, это перевод речи в текст. То есть, мы должны записать все то, что нам говорят.

Для этой цели существуют как элементарные, так и профессиональные программы.

Текстовый редактор Microsoft Word

Самый банальный способ осуществить перевод аудио в текст, это воспользоваться:

  1. Запустить аудио или видео файл.
  2. Открыть текстовый редактор.
  3. Слушать и набирать текст.

Транскрибация аудио в текст в редакторе Word

Изначально, в этом разделе планировал писать про Word, но поразмыслив, решил, что подойдет любой текстовый редактор: блокнот, Word, Google Документы, LibreOffice Writer и другие. Главное, чтобы была возможность набирать текст с клавиатуры.

Банальность данного способа заключается в том, что вам придется по несколько раз прослушивать один и тот же участок аудио, если конечно вы не обладаете фантастической скоростью печатания.

И все же, этот способ имеет право на существование.

Профессиональная программа для транскрибации Express Scribe

Решили заняться переводом аудио в текст? Лучшее что можно предложить, это программа Express Scribe.

Данная программа позволяет набирать текст непосредственно работая с аудио или видео файлом в соседнем окне. Работает следующим образом:

  1. Закачиваете в саму программу аудио или видео файл.
  2. При помощи горячих клавиш, настраиваете функции воспроизведения или остановки ролика.
  3. В соседнем окне набираете текст.

Бесплатная программа перевода аудио в текст Express Scribe

Разработчики предоставляют платную и немного урезанную бесплатную версию. Как по мне, если вы не занимаетесь профессионально транскрибацией, достаточно будет бесплатной версии.

Из минусов: она на английском и русификатора нет. Хотя, интерфейс на столько понятен, что языковой барьер не должен стать преградой.

Из плюсов:

  • Для набора текста, не нужно переключаться между программами.
  • В зависимости от скорости печатания, можно подстроить под себя, скорость проигрывания записи.
  • Предусмотрено огромное количество настраиваемых горячих клавиш, которые помогут в работе с программой.
  • Имеется возможность расстановки тайм-кодов.

Скачать Express Scribe.

Плеер для расшифровщиков LossPlay

Плеер LossPlay, представляет из себя модернизированный проигрыватель аудио и видео файлов. В основе идеи функционала, был взят известный плейер Winamp.

Транскрибация происходит по следующему принципу:

  1. Запустите плеер LossPlay.
  2. Добавьте аудио или видео файл.
  3. Откройте любой текстовый редактор, в котором будем набирать текст.
  4. Начните воспроизведение файла.

Бесплатная программа перевода аудио в текст LossPlay

Чем же отличается этот способ, от способа предложенным самым первым?

По сути, да, идея та же самая. И все же есть свои нюансы. Дело в том, что при запуске аудио или видео файла, есть возможность свернуть плеер и работать только в текстовом редакторе. К плееру, можно обращаться по средством горячих клавиш, которым можно:

  • запустить воспроизведение;
  • остановить воспроизведение;
  • замедлить воспроизведение;
  • установить тайм-код;
  • и многое другое.

По заявлению разработчика, LossPlay идеально подойдет для перевода аудио в текст. Продукт, по функционалу, стоит на равное с профессиональными разработками, но имеет преимущество в меньшем расходе системных требований компьютера.

Скачать LossPlay

Бесплатные онлайн программы для перевода аудио в текст

Как уже упоминалось в статье, профессия по транскрибации, является востребованной. Безусловно, люди пытаются облегчить себе жизнь и пытаются создать онлайн программы — помощники, которые будут в автоматическом режиме, переводить аудио в текст.

Забегая вперед скажу, профессия не была бы на столько востребована, если подобные программы работали на 100%, но кое какие разработки, уже существуют и ими активно пользуются.

Настройка компьютера для транскрибации

Прежде чем начать автоматическую расшифровку в текст, нужно должным образом настроить компьютер.

В интернете достаточно статей, в которых предлагается использовать сторонние разработки по настройке аудиокарты. Возможно, для профессионалов это нужно, но по своему опыты, оказалось достаточно настроить встроенную аудиокарту должным образом.

Итак, программы по расшифровке голоса в текст, как вы уже поняли, распознают речь. Работают по принципу диктофона, в который нужно говорить.

У нас есть два варианта:

  1. Включить аудио файл и подставить к колонкам микрофон (дикость). Речь из колонок, будет попадать в онлайн программу и автоматически аудио, будет переводиться в текст.
  2. Настроить аудиокарту и подключить Стерео микшер, чтобы в онлайн программу, попадал звук из системы.

Первый вариант плох, потому что могут попадаться дополнительные отвлекающие шумы, программа их будет считывать, и в конце получится белиберда.

Во втором варианте, речь будет направляться с аудио файла, непосредственно в онлайн программу и восприниматься как есть. Кстати и в этом случае, не все гладко.

Открываем окно «Звук» в «Панели управления».

Настройка аудиокарты для транскрибации аудио и видео файлов

На вкладке «Воспроизведение», нужно установить по умолчанию то устройство, к которому подключены основные колонки.

Обратите внимание, у меня на скрине подключены и наушники (устройство связи по умолчанию) и колонки (устройство по умолчанию). Сделано это для того, чтобы я мог осуществлять транскрибацию, прослушивая файл через наушники.

Активация главных динамиков

Не знаю, может это только у меня, но если отключаю основные колонки, то звук перестает поступать в Стерео микшер и программы не могут обнаружить звуковой поток. Если кто разобрался более детально, пишите в комментариях.

Во вкладке «Запись», нас интересует «Стерео микшер», который нужно выбрать по умолчанию.

Установка стерео микшера для бесплатной транскрибации

Обратите внимание!! Если вы не видите «Стерео микшер», нажмите на пустом месте окна правой кнопкой мыши и выберите пункт «Показать отключенные устройства».

Если вам, как к примеру мне, не нужны дополнительные подключения для вывода звука, то на этом настройка закончена. В моем случае, хотел чтобы звук продолжал идти и из колонок и из наушников.

Выбираем свойства «Стерео микшер`а» и переходим во вкладку «Прослушать». Здесь, в пункте «Воспроизводить с данного устройства», выберите наушники, либо то устройство на которое нужно вывести звук.

Перенаправление звука в стерео микшере

Проделав эту процедуру, мы без сторонних программ и драйверов, настроили прием аудио для перевода в текст, через системные устройства компьютера.

Google документы

На первое место поставлю google документы. Это обычный текстовый редактор, являющийся аналогом обычного Microsoft Word.

В данном редакторе, встроена функция голосового набора текста. Именно эта функция пригодится для расшифровки аудио файла в текстовый документ.

  1. Выбираем «Инструменты» → «Голосовой ввод» (или «Ctrl» + «Shift» + «S»). Активируется микрофон и сообщение о разрешении программы доступа к микрофону компьютера (разрешите доступ не меняя параметров (должны стоять по умолчанию)).
  2. Запустите в любом плеере или на YouTube интересующий ролик.
  3. Нажимаем на микрофон в Google документах. Если все настроено верно и Google документы увидят звуковой поток, начнется перевод аудио в текст. В противном случае, появится сообщение об отсутствующем звуке.

Онлайн транскрибация аудио в текст в Google документы

Лично мое мнение, может быть оно предвзятое или субъективное, но большего, для расшифровки аудио в текст не требуется.

Плюсы:

  • Наиболее четко переводит аудио в текст, без пропусков.
  • Большой функционал для редактирования текста.

Минусы:

  • Невозможно синхронизировать аудио файл с началом расшифровки.

Голосовой блокнот Speechpad

Блокнот Spechpad, находится по адресу https://speechpad.ru/. Работает по принципу, рассказанному выше. Включается аудио запись, блокнот начинает считывать речь и переводить ее в текст.

Преимущество данного блокнота, в том, что в настройках есть функция «Запускать синхронно с записью». Как это работает:

  1. Перейдите на сайт блокнота (кстати, чтобы не читать портянку текста, зарегистрируйтесь на их сайте).
  2. Нажимаем «Транскрибация».

Активация функции Транскрибация в голосовом блокноте Speechpad

  1. Панель «Транскрибация», выбираем интересующий медиа тип. В моем случае «Youtube video».
  2. В поле «Id файл для проигрывания», добавляем код видео с YouTube (к примеру, для адреса https://www.youtube.com/watch?v=Xihpth5vmmM, код Xihpth5vmmM).
  3. Устанавливаем флажок «Запустить синхронно с записью».
  4. Нажимаем «Включить запись».

Онлайн преобразование аудио в текст в блокноте Speechpad

Запустится ролик с ютуба, а Speechpad сразу начнет транскрибацию, переводя аудио в текст.

Плюсы:

  • Синхронизация аудио файла с расшифровкой текста.
  • Регулировщик скорости воспроизведения.
  • Огромное количество настроек.

Минусы:

  • При переносе переведенной части текста к основному блоку, пропускаются некоторые слова.

Онлайн расшифровщик Dictation.io

Расшифровщик аудио Dictation.io, можно найти по адресу https://dictation.io/speech.

Как по мне, это аналог предыдущего голосового блокнота, разработанный Google. В глаза сразу бросается отсутствие изобилия кнопочек.

Для запуска транскрибации, достаточно запустить аудио файл и нажать кнопку «Start». По окончанию ролика, скопируйте результат в текстовый редактор для работы с ним.

Расшифровка аудио в текст в Dictation

Плюсы:

  • Синхронизация аудио файла с началом расшифровки текста.
  • Копирование результата, производится по нажатию на одну клавишу.
  • Имеется огромное количество настроек.

Минусы:

  • Пока что не замечены.

Результаты онлайн перевода аудио в текст

В заключении к разделу, хотелось бы показать работу представленных онлайн программ — переводчиков аудио в текст. Для этого был взят одинаковый отрезок из сказки про трех поросят и вот что получилось.

Google документы

В далекие времена жили на свете 3 поросенка, они жили вместе со своей мамой в маленьком домике однажды пришла пора им покинуть момента, когда мама свинья подозвала их к себе и сказала.дорогие мои дети пришло время для вас выйти в большой мир и дети и начнете жить собственной жизнью, но не забывайте, что бы вы ни делали, делайте это на совесть вот лучший способ выжить.3 поросенка, ласково попрощались с мамой и отправились в путь.через какое то время они набрели на полено подходящего для того, чтобы построить домики.самый младший из поросят решил строить дом из соломы

Голосовой блокнот Speechpad

В далекие времена жили на свете 3 поросенка они жили вместе со своей мамой в маленьком домике однажды пришла пора им покинуть мамино тогда мама свинья подозвала к себе и сказала дорогие мои дети пришло время для вас выйти в большой мир и дети и начнете жить собственной жизнью но не забывайте что бы вы ни делали делайте это на совесть вот лучший способ выжить 3 поросенка ласковый попрощались с мамой и отправились в путь через какое то время они набрели на полено подходящими для того чтобы построить домики самый младший из поросят решил строить дом из соломы

Онлайн расшифровщик Dictation.io

3 поросенка времена жили на свете 3 поросенка, они жили вместе со своей мамой в маленьком домике однажды пришла пора им покинуть мамино тогда мама свинья подозвала к себе и сказала. дорогие мои дети пришло время для вас выйти в большой мир и дети и начнете жить собственной жизнью но не забывайте что бы вы ни делали делайте это на совести вот лучший способ выжить 3 поросенка ласково попрощались с мамой и отправились в путь через какое то время они набрели на поле но подходящего для того чтобы построить домики самый младший из поросят решил строить дом из соломы

Главная проблема всех трех программ, отсутствие знаков препинания, но это решается путем редактирования полученной портянки текста.

Способы ускорить работу над расшифровкой

Имея огромный опыт в наборе текстов, для себя сделал следующие выводы как можно ускорить расшифровку аудио в текст.

  1. При уменьшении скорости воспроизведения ролика, транскрибация производится с наименьшими ошибками.
  2. Набирая текст вручную, идеально подходит схема: прослушал → запомнил → записал. Эта схема позволит не откладывать редактирование на потом, а сделать все сразу.
  3. Использование команд, помогающих добавлять часть текста. Представим себе, что в тексте, часто попадается слово «Транскрибация», добавляем его в команду и при помощи горящих клавиш выводим в нужных местах.
  4. Не важно набираете в ручную или при помощи онлайн программ, все правки и корректировки делам в самом конце.

Пользуйтесь материалом статьи. Надеюсь он будет полезен в вашей работе. Остались вопросы? Продолжим общение в комментариях.

Один комментарий к “Транскрибация аудио в текст”
  1. 1. Хорошо описано подключение стерео Микшера.
    2.Опробовал блокнот Spechpad по работе с аудиофайлом!
    3.Dictation.io с аудиофайлом работает, а вот Прослушивание голоса (начитывание) почему-то пока не пошло.
    Спасибо! Нашел для себя кое-что новое!

Добавить комментарий